Chào mừng đến với AI News, bản tin của Infinity News cho ngày 29 tháng 11 năm 2025.
Trong số này: Anthropic phát hành Claude Opus 4.5, OpenAI và Perplexity ra mắt shopping agents mới, Google thách thức sự thống trị chip của Nvidia, một nghiên cứu mới dự đoán AI có thể tăng gấp đôi tăng trưởng năng suất Mỹ, và tòa án chặn OpenAI sử dụng “Cameo” trong ứng dụng Sora.
Tuần này trong 60 giây
Anthropic phát hành Claude Opus 4.5, tuyên bố vị trí hàng đầu trong lập trình
Anthropic đã chính thức ra mắt Claude Opus 4.5, định vị nó là mô hình hàng đầu thế giới cho software engineering, agentic workflows và computer use. Mô hình mới đạt kỷ lục 80.9% trên SWE-bench Verified, vượt qua Sonnet 4.5 (77.2%), GPT-5.1 của OpenAI (76.3%) và Gemini 3 Pro (76.2%). Infinity News đã kiểm tra mô hình kỹ lưỡng trong bài viết blog mới nhất về Claude Opus 4.5. Chúng ta cũng sẽ xem xét kỹ hơn về bản phát hành này trong phần Phân tích chuyên sâu bên dưới.
OpenAI và Perplexity ra mắt trợ lý mua sắm
Đúng lúc cho mùa lễ hội, OpenAI và Perplexity đã phát hành các công cụ mua sắm chuyên dụng. Perplexity ra mắt trải nghiệm mới cho người dùng Mỹ kết hợp khám phá đàm thoại với thanh toán tức thì được cung cấp bởi PayPal. Trong khi đó, OpenAI giới thiệu shopping research trong ChatGPT, một tính năng được cung cấp bởi phiên bản chuyên biệt của GPT-5 mini tạo ra các buyer’s guides chi tiết, cá nhân hóa thay vì danh sách sản phẩm đơn giản. Cả hai bản phát hành đều báo hiệu sự chuyển dịch rõ ràng từ kết quả tìm kiếm chung chung sang agentic decision support trong bán lẻ trực tuyến. Chúng ta sẽ khám phá xu hướng này trong phần Phân tích chuyên sâu.
Google thách thức sự thống trị của Nvidia khi Meta quan tâm đến TPUs
Cổ phiếu Nvidia giảm 4% sau báo cáo rằng Meta đang cân nhắc sử dụng Tensor Processing Units (TPUs) tùy chỉnh của Google cho các data centers của mình vào năm 2027. Sự chuyển đổi tiềm năng này làm nổi bật xu hướng đang tăng lên trong các gã khổng lồ công nghệ để đa dạng hóa supply chains và giảm sự phụ thuộc vào Nvidia. Google đã nổi lên như một đối thủ đáng kể với các TPUs của mình có giá từ một nửa đến một phần mười so với các GPU Nvidia tương đương. Khả năng của Google đã được chứng minh bằng cách training mô hình Gemini 3 state-of-the-art mới hoàn toàn trên silicon nội bộ.
Nghiên cứu mới của Anthropic dự đoán AI có thể tăng gấp đôi tăng trưởng năng suất lao động Mỹ
Anthropic đã phát hành một phân tích kinh tế mới [1] dựa trên 100.000 cuộc hội thoại Claude ẩn danh, ước tính rằng AI thế hệ hiện tại có thể tăng cường tăng trưởng năng suất lao động Mỹ 1.8% hàng năm trong thập kỷ tới. Nghiên cứu phát hiện rằng Claude giảm thời gian hoàn thành tác vụ cá nhân trung bình 80%. Báo cáo lưu ý rằng các lợi ích thực hiện sẽ phụ thuộc nhiều vào tỷ lệ áp dụng và tái cấu trúc tổ chức.
Tòa án chặn OpenAI sử dụng thương hiệu “Cameo” trong Sora
Một thẩm phán liên bang Mỹ đã cấp lệnh hạn chế tạm thời ngăn OpenAI sử dụng thuật ngữ “cameo” cho các tính năng trong trình tạo video AI của mình, Sora. Phán quyết xuất phát từ một vụ kiện của Cameo, nền tảng video celebrity, lập luận rằng tính năng của OpenAI để chèn nhân vật vào videos vi phạm thương hiệu của họ. Trong khi OpenAI lập luận rằng không có thực thể đơn lẻ nào nên sở hữu từ phổ biến này, lệnh cấm vẫn có hiệu lực cho đến ngày 22 tháng 12. Một phiên điều trần được lên lịch cho ngày 19 tháng 12 để xác định xem hạn chế có trở thành vĩnh viễn hay không.
- Gemini 3 Pro là gì? Các Tính năng mới trong Gemini 3
- Google Gemini 3 ra mắt giúp Nvidia xoa dịu lo ngại về bong bóng AI
- Google Gemini 3 không chỉ là mô hình AI dẫn đầu - nó đang viết lại cả hạ tầng AI
- Top 7 công cụ tạo video bằng AI tốt nhất & có video hướng dẫn
- Claude Opus 4.5 là gì? Tính năng mới, thử nghiệm và Benchmark của Claude Opus 4.5
- Top 10 mô hình tạo video AI tốt nhất năm 2026
Phân tích chuyên sâu tin tức tuần này
Những điều quan trọng cần biết về Claude Opus 4.5
Anthropic phát hành Claude Opus 4.5 tuần này, định vị nó là mô hình hàng đầu cho coding và agentic workflows. Trong khi bạn có thể tìm thấy tổng quan tốt trong blog thông báo chính thức và blog kiểm tra thực hành của Infinity News, trong bản tin này chúng ta sẽ tập trung vào những gì quan trọng để biết về mô hình mới này.
Giảm giá 67%: từ $15/$75 xuống $5/$25
Việc phát hành Claude Opus 4.5 giới thiệu một điều chỉnh đáng kể về cấu trúc chi phí của mô hình. Anthropic đã hạ giá API cho mô hình flagship của mình từ $15 mỗi triệu input tokens và $75 mỗi triệu output tokens xuống $5 và $25, tương ứng. Việc giảm 67% này nhằm làm cho Opus trở thành một tùy chọn khả thi cho các enterprise workflows high-volume thay vì chỉ các tác vụ chuyên biệt, low-volume.
Ngoài ra, Anthropic đã loại bỏ các usage caps cụ thể cho Opus đối với các developers sử dụng Claude Code, giải quyết các hạn chế trước đây đôi khi làm gián đoạn các phiên coding dài hơn.
Tỷ lệ thành công prompt injection vẫn đáng lo ngại cao

Trong khi Opus 4.5 cho thấy khả năng kháng prompt injection attacks được cải thiện so với các frontier models khác, bối cảnh bảo mật rộng hơn vẫn đầy thách thức.
Các benchmarks chỉ ra rằng jailbreaking models để vượt qua safety guardrails hoặc hijack agentic sessions vẫn là một threat vector dai dẳng trên toàn ngành, với một số mô hình cho thấy tỷ lệ thành công tấn công cao tới 92% trên các bài kiểm tra cụ thể.
Điều này đặc biệt liên quan khi các developers ngày càng triển khai các “computer use” agents tương tác với browsers và file systems. Gần đây Infinity News đã phát triển một hướng dẫn nhanh về các best practices để sử dụng AI browsers một cách an toàn giúp bạn điều hướng những rủi ro này.
Phản ứng người dùng hỗn hợp
Người dùng đang ăn mừng việc giảm giá 3x và làm nổi bật khả năng abstract reasoning mạnh mẽ của mô hình. Trên các benchmarks như ARC-AGI-2, một bài kiểm tra fluid intelligence, Opus 4.5 đạt điểm 37.6%, vượt trội đáng kể so với các mô hình trước đó. Nó thường xuyên được trích dẫn như một lựa chọn mạnh cho deep logic, complex refactoring và các backend tasks nơi độ chính xác là ưu tiên.
Ngược lại, một số testers độc lập đã báo cáo ma sát trong thực thi cơ bản. Người dùng đã ghi nhận các vấn đề với các tác vụ “last mile”, như xử lý file không ổn định và code outputs vô tình bao gồm văn bản đàm thoại. Ngoài ra, người dùng đã báo cáo sự không nhất quán của nền tảng, tạo ra sự không chắc chắn về độ tin cậy của mô hình cho triển khai liên tục.
AI Shopping 101: Quá khứ, hiện tại, tương lai
Tuần này, OpenAI và Perplexity ra mắt shopping agents mới, tham gia Amazon và Google trong một cuộc đua ngày càng gay gắt để định nghĩa tương lai của e-commerce. Trong phần này, chúng ta khám phá cách mua sắm trực tuyến đã phát triển, agent nào phù hợp nhất với nhu cầu hiện tại của bạn và AI shopping có thể trông như thế nào năm năm kể từ bây giờ.
Mua sắm trực tuyến từ Web 1.0 đến generative AI

Để hiểu chúng ta đang đi đâu, hữu ích khi nhìn vào cách trải nghiệm người dùng đã thay đổi trong vài thập kỷ qua:
Web 1.0 (1995-2005): Catalogs tĩnh, tìm kiếm theo từ khóa cơ bản, thanh toán thủ công Web 2.0 (2005-2020): Đề xuất được cá nhân hóa, reviews người dùng, one-click checkout Era Generative AI (2020-nay): Đàm thoại discovery, nghiên cứu do AI hỗ trợ, instant checkout
Không phải tất cả AI shopping agents đều được xây dựng giống nhau
Trong khi mục tiêu tương tự, các agents “Big 4” có điểm mạnh riêng biệt phù hợp cho các loại shoppers khác nhau. Đây là hướng dẫn nhanh bạn có thể tham khảo:
Cho hiệu quả hệ sinh thái: Amazon Rufus Tốt nhất nếu bạn đã sâu trong hệ sinh thái Prime. Rufus sử dụng cross-platform memory (biết thói quen Kindle hoặc Audible của bạn) để tinh chỉnh đề xuất và cung cấp các tính năng agentic như tự động mua items ở một mức giá đặt hoặc số hóa danh sách mua sắm viết tay.
Cho nghiên cứu chuyên sâu: ChatGPT Lý tưởng cho ra quyết định phức tạp. Nó xuất sắc trong việc tạo các buyer’s guides có cấu trúc so sánh đánh đổi và thông số kỹ thuật, trích dẫn các nguồn đáng tin cậy để giảm hallucinations. Nó cũng đang tích hợp nhanh “Instant Checkout” cho các merchants Shopify và Etsy.
Cho tốc độ không thiên vị: Perplexity (kết hợp với Comet Browser) Được thiết kế cho mua hàng không ma sát. Nó tập trung vào “khuyến nghị không thiên vị, ưu tiên nhu cầu” vượt qua clutter được tài trợ. Với tính năng “Instant Buy” được cung cấp bởi PayPal, người dùng có thể checkout trực tiếp trong chat.
Cho tìm kiếm visual/local: Google Gemini Lựa chọn hàng đầu cho người dùng visual và tính khả dụng local. Sử dụng “Shopping Graph” khổng lồ của Google với 50 tỷ listings, nó hỗ trợ các truy vấn multimodal (như video search) và cung cấp kiểm tra inventory local thời gian thực.
AI shopping năm 2030
Khi chúng ta nhìn về năm 2030, bối cảnh bán lẻ có thể sẽ được định nghĩa bởi agentic commerce, một thị trường McKinsey dự đoán có thể đạt $5 nghìn tỷ.
Sự chuyển dịch này sẽ di chuyển vượt xa các tương tác chat đơn giản đến các giao dịch Agent-to-Agent (A2A) tự động, nơi AI cá nhân của bạn đàm phán trực tiếp với AI của nhà bán lẻ để xử lý returns hoặc bundle discounts.
Để làm điều này hoạt động an toàn, ngành đang xây dựng infrastructure tiêu chuẩn. Chúng ta đang thấy sự trỗi dậy của các protocols như Agentic Commerce Protocol (ACP) và Agent Payment Protocol (AP2), được thiết kế để chuẩn hóa cách các agents nhận dạng chính họ và thực hiện thanh toán một cách an toàn.
Tuy nhiên, quá trình chuyển đổi này sẽ không suôn sẻ. Gần đây Infinity News đã đề cập đến cuộc chiến lớn đầu tiên của agentic economy, một tranh chấp báo trước các trận chiến pháp lý sắp tới.
Use cases trong ngành
DHL triển khai Agentic AI để tự động hóa giao tiếp logistics
DHL Supply Chain đã bắt đầu tích hợp AI agents để xử lý giao tiếp vận hành, bao gồm lên lịch hẹn và điều phối tài xế qua điện thoại và email. Trong khi một nghiên cứu Horvath gần đây chỉ ra rằng 60% các công ty logistics vẫn bị đình trệ trong các chuyển đổi hệ thống legacy, quan hệ đối tác của DHL với HappyRobot chứng minh cách agentic AI có thể giải phóng nhân viên khỏi các tác vụ điều phối lặp đi lặp lại và cải thiện thời gian phản hồi trong môi trường vận chuyển high-volume.
AI phát hiện các dấu hiệu stress mãn tính trong các CT scans thường quy
Các nhà nghiên cứu tại Johns Hopkins Medicine đã phát triển một mô hình deep learning xác định stress mãn tính bằng cách đo thể tích tuyến thượng thận trong các CT scans ngực thường quy. Không giống như các xét nghiệm cortisol dao động, biomarker có nguồn gốc từ AI này cung cấp một thước đo ổn định về tải stress tích lũy và đã được liên kết với rủi ro cao hơn về suy tim và tử vong. Với hàng chục triệu CT scans được thực hiện hàng năm, công cụ này cung cấp một phương pháp có thể mở rộng để phân tầng rủi ro tim mạch mà không yêu cầu xét nghiệm bệnh nhân bổ sung hoặc phơi nhiễm bức xạ.
SAM 3 của Meta cung cấp năng lượng cho giám sát động vật hoang dã nguy cấp
Conservation X Labs và Florida Fish and Wildlife Conservation Commission đang sử dụng Segment Anything Model 3 (SAM 3) mới của Meta để bảo vệ sư tử núi Florida đang bị đe dọa. Bằng cách sử dụng khả năng của mô hình để theo dõi các objects và behaviors qua text prompts trong video, các nhà nghiên cứu giờ có thể tự động hóa phát hiện các bệnh thần kinh như feline leukomyelopathy trong cảnh quay bẫy camera. Sáng kiến này được hỗ trợ bởi việc phát hành SA-FARI, một dataset mã nguồn mở chứa hơn 10.000 videos động vật hoang dã được chú thích để thúc đẩy giám sát sinh thái dựa trên AI.
Quote
“Thành công lớn nhất tôi có với tư cách là một nhà lãnh đạo là đầu tư vào con người, không phải vào ý tưởng. Ý tưởng không trở nên thành công nếu bạn không có những người tốt trong đội.”
— Bilal Zia, Head of Data Science & Analytics tại DuoLingo
Tóm lại: Tuần này đánh dấu một bước ngoặt quan trọng trong cả AI coding (với Opus 4.5) và e-commerce (với sự ra mắt của các shopping agents). Trong khi giá của AI giảm mạnh và khả năng tăng vọt, các thách thức về bảo mật và độ tin cậy vẫn là mối quan tâm quan trọng. Tương lai của mua sắm trực tuyến đang nhanh chóng chuyển từ tìm kiếm sang agentic decision-making – một xu hướng có thể định hình lại toàn bộ ngành bán lẻ trước năm 2030.
Nguồn trích dẫn:
1. https://www.anthropic.com/research/estimating-productivity-gains


