Chào mừng bạn đến với AI New, bản tin của Infinity News cho ngày 7 tháng 12 năm 2025.
Tuần này trong 60 giây
Amazon ra mắt dòng mô hình Nova 2 và chip Trainium3
Amazon vừa công bố dòng mô hình Nova 2 do chính hãng phát triển, giới thiệu bốn phiên bản mới: Nova 2 Lite tiết kiệm chi phí, Nova 2 Pro cho tác vụ suy luận phức tạp, Nova 2 Sonic với khả năng speech-to-speech, và Nova 2 Omni đa phương thức. Cùng với các mô hình này, AWS giới thiệu Nova Forge – dịch vụ cho phép doanh nghiệp huấn luyện “Novellas” tùy chỉnh bằng dữ liệu độc quyền của riêng họ. Về mặt phần cứng, công ty phát hành chip Trainium3 công nghệ 3-nanometer và hệ thống UltraServer, mà theo AWS tuyên bố nhanh gấp 4 lần và tiết kiệm năng lượng hơn 40% so với thế hệ trước. Trong phần Phân Tích Chuyên Sâu, Infinity News sẽ khám phá chiến lược hệ sinh thái AI của Amazon một cách toàn diện hơn.

Mistral phát hành dòng mô hình Mistral 3 với trọng số mở
Mistral AI công bố ra mắt Mistral 3, một họ mô hình mới bao gồm Mistral Large 3 khổng lồ với 675 tỷ tham số và ba phiên bản Ministral nhỏ hơn (3B, 8B, và 14B). Các mô hình này được phát hành dưới dạng open-weight (trọng số mở), có nghĩa là các tham số mô hình cốt lõi được công khai để nhà phát triển có thể tải xuống, kiểm tra, chạy và tinh chỉnh trên hạ tầng của riêng họ thay vì chỉ truy cập qua API. Trong khi mô hình lớn nhắm đến các khối lượng công việc doanh nghiệp, các phiên bản Ministral nhỏ hơn được tối ưu hóa đặc biệt để chạy local trên phần cứng tiêu dùng như laptop và thiết bị edge. Infinity News đã phân tích chi tiết về bản phát hành mới nhất này trong blog về Mistral 3.
Kling AI và Runway phát hành các mô hình video hiệu suất cao mới
Kling vừa tung ra hai mô hình video chất lượng cao với giá cả phải chăng, dẫn đầu bởi Kling O1. Mô hình thống nhất này giải quyết các điểm nghẽn lớn trong quy trình làm việc bằng cách duy trì nhận diện nhân vật xuyên suốt các cảnh quay và cho phép chỉnh sửa video trong cùng một quy trình tạo. Điều này đi kèm với Kling 2.6, bổ sung âm thanh đồng bộ cho hiệu ứng âm thanh và đối thoại lồng tiếng môi trong một lần xử lý duy nhất. Cũng được phát hành trong tuần này là Runway Gen 4.5, tập trung vào tính chân thực vật lý bằng cách cải thiện logic va chạm và trọng lượng đối tượng, đạt được xếp hạng hàng đầu trên các benchmark cộng đồng về độ trung thực hình ảnh.
Gemini 3 Deep Think ra mắt cho người đăng ký Ultra
Google đã triển khai Gemini 3 Deep Think cho người đăng ký Google AI Ultra trong ứng dụng Gemini. Được thiết kế cho các thử thách toán học và logic phức tạp, mô hình này sử dụng suy luận song song nâng cao để khám phá nhiều giả thuyết đồng thời. Theo báo cáo, nó đạt được điểm số dẫn đầu ngành trên các benchmark khắt khe, đạt 41.0% trên Humanity’s Last Exam (không dùng công cụ) và 45.1% trên ARC-AGI-2 (với thực thi code). Chế độ mới này được xây dựng dựa trên kiến trúc của các biến thể Gemini 2.5 Deep Think gần đây đạt tiêu chuẩn huy chương vàng tại Kỳ thi Olympic Toán học Quốc tế.
EU điều tra Meta về việc chặn chatbot AI đối thủ trên WhatsApp
Liên minh Châu Âu đã mở cuộc điều tra chống độc quyền về thay đổi chính sách của Meta mà Infinity News đã từng nêu bật trong The Median trước đó, việc chặn các chatbot AI đối thủ hoạt động trên WhatsApp. Trong khi các doanh nghiệp sử dụng AI cho dịch vụ khách hàng vẫn không bị ảnh hưởng, hạn chế này nhắm cụ thể vào các bot đa năng như ChatGPT, làm dấy lên lo ngại của các cơ quan quản lý rằng Meta đang lợi dụng vị thế thống trị để loại bỏ đối thủ cạnh tranh. Meta đã bác bỏ các cáo buộc là “vô căn cứ”, lập luận rằng các bot bên thứ ba làm quá tải hạ tầng của họ. Tuy nhiên, công ty hiện đối mặt với nguy cơ bị phạt lên đến 10% doanh thu toàn cầu hàng năm nếu cuộc điều tra xác nhận vi phạm luật cạnh tranh.
Phân tích chuyên sâu về tin tức trong tuần
Amazon lặng lẽ xây dựng một hệ sinh thái AI hoàn chỉnh như thế nào
Cho đến nay, Amazon đã định vị mình là nhà cung cấp hạ tầng trung lập, sẵn sàng lưu trữ các mô hình của bên thứ ba từ các đối tác như Anthropic và Cohere thông qua Amazon Bedrock.
Tuy nhiên, với các thông báo từ hội nghị re:Invent tuần này, công ty rõ ràng đã xoay trục sang tích hợp dọc (vertical integration), chuyển từ vai trò host trung lập sang một đối thủ cạnh tranh full-stack.
Bằng cách ra mắt silicon độc quyền của riêng mình (Trainium3), một họ mô hình frontier mới (Nova 2), và quy trình làm việc agentic end-to-end (Nova Act), Amazon giờ đây đang cạnh tranh trực tiếp với chính các đối tác (Anthropic) và nhà cung cấp (NVIDIA) của mình.
Tầng phần cứng (chip Trainium)
AWS đã giới thiệu Trainium3, chip AI thế hệ tiếp theo được xây dựng bằng công nghệ sản xuất tiên tiến tương tự như các bộ xử lý cao cấp mới nhất. Trong khi chip này mang lại sự gia tăng đáng kể về tốc độ xử lý thô, vai trò chiến lược chính của nó là cung cấp một lựa chọn thay thế tiết kiệm chi phí cho GPU NVIDIA – tiêu chuẩn công nghiệp.
Bằng cách triển khai silicon độc quyền, AWS giảm sự phụ thuộc vào các nhà cung cấp phần cứng bên ngoài. Điều này cho phép họ kiểm soát chuỗi cung ứng của riêng mình, đóng vai trò như một biện pháp phòng ngừa trước tình trạng thiếu hụt thường xuyên ảnh hưởng đến thị trường chip rộng lớn hơn.
Tích hợp dọc ở tầng phần cứng cho phép AWS quản lý chi phí cơ bản của điện toán. Việc kiểm soát này là yếu tố then chốt cho phép định giá thấp hơn một cách quyết liệt cho các mô hình Nova 2 mới.
Các chip mới tiết kiệm năng lượng hơn 40% so với thế hệ trước. Chúng được triển khai trong UltraServers – hệ thống liên kết 144 chip thành một đơn vị duy nhất. Thiết kế này cho phép ngay cả những mô hình AI lớn nhất cũng được lưu trữ hoàn toàn trong bộ nhớ, tăng tốc đáng kể thời gian xử lý.
Tầng mô hình (Nova 2)
Với việc phát hành dòng Nova 2, Amazon đang tăng gấp đôi đặt cược vào chiến lược mô hình do chính hãng phát triển. Vượt xa khả năng của thế hệ đầu tiên, dòng sản phẩm mới này có khả năng cạnh tranh về cả hiệu suất lẫn giá cả.
Nova 2 Lite là mô hình nhanh, tiết kiệm chi phí cho các tác vụ khối lượng lớn, có khả năng extended thinking mới – tự động điều chỉnh chi phí tính toán dựa trên độ phức tạp của truy vấn.
Nova 2 Pro nhắm đến tầng flagship cho suy luận và coding. Với giá $1.25 cho mỗi triệu input token, nó ngang bằng với mức giá quyết liệt của OpenAI nhưng thấp hơn đáng kể so với Claude 4.5 Sonnet ($3.00/1M), định vị mình như lựa chọn thân thiện với ngân sách cho khối lượng công việc doanh nghiệp.
Nova 2 Omni giới thiệu kiến trúc đa phương thức thống nhất có khả năng tạo “bất kỳ sang bất kỳ” (any-to-any), xử lý text, video và audio một cách tự nhiên. Đối với ngành dịch vụ khách hàng, Nova 2 Sonic cung cấp khả năng speech-to-speech độ trễ thấp, được thiết kế để xử lý các cuộc hội thoại tự nhiên, có thể ngắt quãng mà không có độ trễ thường thấy khi ghép nối các mô hình phiên âm và âm thanh riêng biệt.
Ngoài tích hợp doanh nghiệp, người dùng Mỹ có thể thử nghiệm chatbot Nova trực tiếp trong ứng dụng chính thức.

Tầng tùy chỉnh (Nova Forge)
Fine-tuning truyền thống thường buộc phải đánh đổi: khi một mô hình học dữ liệu doanh nghiệp ngách, nó có thể mất đi khả năng suy luận tổng quát. Để giải quyết vấn đề này, Amazon giới thiệu Nova Forge, cho phép các công ty đưa dữ liệu độc quyền của họ vào cùng với các bộ dữ liệu được tuyển chọn của Amazon ngay trong quá trình huấn luyện.
Kết quả là một “Novella” – một mô hình tùy chỉnh giữ được trí thông minh nền tảng trong khi thành thạo kiến thức lĩnh vực cụ thể. Tuy nhiên, việc tùy chỉnh sâu này đi kèm với một sự đánh đổi chiến lược: không giống như các API wrapper thông thường, một Novella là tài sản đặc biệt gắn chặt với hạ tầng AWS, tạo ra vendor lock-in đáng kể.
Tầng agent (Nova Act)
Thành phần cuối cùng của hệ sinh thái dọc của Amazon là Nova Act, một dịch vụ agentic được hỗ trợ bởi phiên bản tùy chỉnh của mô hình Nova 2 Lite. Nova Act cho phép nhà phát triển xây dựng các agent có thể điều hướng website và thực thi tác vụ bằng cách kết hợp ngôn ngữ tự nhiên và code Python.
Dịch vụ này được thiết kế để phù hợp với quy trình làm việc hiện có của nhà phát triển. Người dùng có thể tạo nguyên mẫu agent trong playground trực tuyến, debug chúng trực tiếp trong IDE, và triển khai lên hạ tầng AWS.
Lý do cho tích hợp dọc
Xây dựng mô hình thông minh nhất thế giới là mục tiêu di động (và có lẽ là mục tiêu sai ngay từ đầu). Amazon đang đặt cược rằng chiến thắng dài hạn thực sự nằm ở việc xây dựng hệ sinh thái hữu ích, đáng tin cậy và tiết kiệm chi phí nhất để hoàn thành công việc thực tế.
Bằng cách tích hợp dọc toàn bộ stack (kiểm soát chi phí với chip Trainium3 độc quyền, cung cấp trí thông minh chuyên biệt qua các mô hình Nova 2, và công nghiệp hóa quy trình làm việc với các agent Nova Act), Amazon có thể đi xa trong cuộc đua AI dài hạn.
Các trường hợp sử dụng trong ngành
Chatbot AI Rufus của Amazon thúc đẩy doanh số trong Black Friday
Trợ lý mua sắm AI của Amazon, Rufus, đã ảnh hưởng đáng kể đến hành vi mua hàng trong Black Friday, với các phiên mua hàng tăng vốt 100% so với 30 ngày trước đó, vượt xa mức tăng trưởng 20% ở các phiên không dùng AI. Việc áp dụng này phù hợp với sự chuyển dịch rộng lớn hơn của ngành hướng tới thương mại hỗ trợ bởi AI, khi Adobe Analytics báo cáo tăng 805% lưu lượng AI đến các trang bán lẻ Mỹ so với cùng kỳ năm trước. Người mua sắm sử dụng các công cụ AI này đặc biệt quyết đoán hơn, với tỷ lệ chuyển đổi từ lưu lượng AI cao hơn 38% so với nguồn không dùng AI.
AlphaFold giúp các nhà khoa học thiết kế cây trồng chịu nhiệt tốt hơn
Các nhà khoa học tại Đại học Michigan State đang sử dụng AlphaFold để bảo vệ cây trồng chủ lực khỏi nóng lên toàn cầu bằng cách ổn định enzyme quang hợp quan trọng GLYK, thường bị phân hủy ở nhiệt độ cao. Bằng cách dự đoán cấu trúc enzyme (chưa từng được xác định thực nghiệm), các nhà nghiên cứu đã xác định các vòng lặp linh hoạt bị hỏng khi nhiệt độ tăng và thay thế chúng bằng các phần cứng nhắc từ một loại tảo ưa nhiệt được tìm thấy trong suối nước nóng núi lửa. Enzyme lai kết quả vẫn ổn định ở nhiệt độ lên đến 65°C, mang lại một phương pháp mới đầy hứa hẹn để bảo vệ mùa màng trước các đợt nóng trong tương lai.
Nvidia đưa khả năng chain-of-thought vào xe tự lái
Tại NeurIPS, Nvidia công bố DRIVE Alpamayo-R1, mô hình suy luận quy mô công nghiệp mở đầu tiên trên thế giới được thiết kế để đưa khả năng chain-of-thought vào xe tự hành. Xe tự hành từ lâu đã gặp khó khăn với các trường hợp biên vi tế, chẳng hạn như phản ứng với một quả bóng lăn ra đường. Để giải quyết vấn đề này, ngành công nghiệp ô tô hiện đang áp dụng suy luận chain-of-thought vào lập kế hoạch đường đi của xe. Sử dụng các mô hình suy luận mới của NVIDIA, xe giờ đây có thể phân tích các tình huống phức tạp từng bước để tạo ra quỹ đạo an toàn. Cách tiếp cận này đã mở rộng ra ngoài đường phố, với các công ty robotics như Figure AI, 1X và Gatik sử dụng các mô hình nền tảng này để huấn luyện thế hệ robot hình người và hệ thống tự động tiếp theo.


