Bối cảnh: Tại sao GPT-5.2 ra mắt nhanh đến vậy?
Mới chỉ một tháng kể từ khi GPT-5.1 ra mắt. Nhưng một tháng là khoảng thời gian dài trong thế giới AI. Trong khoảng thời gian đó, Google phát hành Gemini 3 — chiếm vị trí đầu trên hầu hết các benchmark test được theo dõi nhiều nhất, và Anthropic phát hành Claude Opus 4.5 — một lần nữa dẫn đầu bảng xếp hạng về software engineering.
OpenAI muốn định vị mình là công ty có khả năng mang lại giá trị kinh doanh tốt nhất. Nhưng sau khi tụt hạng trên các leaderboard quan trọng, có thể họ lo ngại mất người dùng hoặc thậm chí khách hàng enterprise. Theo các báo cáo, áp lực đó đã kích hoạt một “code red” và thúc đẩy đội ngũ tăng tốc phát hành GPT-5.2.
Trong bài viết này, Infinity News sẽ giúp bạn hiểu mọi thứ được công bố cùng với GPT-5.2, bao gồm những gì doanh nghiệp có thể đạt được từ ba mô hình mới — hiện đang được triển khai trong ChatGPT cho tất cả người dùng trả phí và đã có sẵn trong API.
Có gì mới trong GPT-5.2?
GPT-5.2 mang đến những cải tiến cụ thể và có mục tiêu về reasoning, memory, và tool use. Theo cách đóng khung của OpenAI, những cải tiến này chuyển hóa thành workflow doanh nghiệp tốt hơn và ít điểm thất bại hơn trong công việc của bạn. Mỗi mô hình trong ba mô hình của dòng này có cách tiếp cận khác nhau để mang lại giá trị đó.
GPT-5.2 Instant
GPT-5.2 Instant ưu tiên độ trễ thấp và thời gian phản hồi nhanh. Nó được định vị là “con ngựa kéo” hàng ngày để lấy thông tin, soạn thảo, và dịch thuật. Đây là mô hình mà hầu hết mọi người sẽ tương tác theo mặc định, và lợi thế của nó là throughput thay vì độ sâu. Nói cách thực tế, nó lấp đầy khoảng trống khi bạn cần câu trả lời nhanh hoặc automation nhẹ mà không phải trả tiền cho reasoning nặng hơn.
GPT-5.2 Thinking
GPT-5.2 Thinking tích hợp khả năng extended reasoning cho phép mô hình làm việc qua các vấn đề phức tạp từng bước một trước khi đưa ra phản hồi.
Trên các benchmark nội bộ của OpenAI, đây là mô hình đạt đỉnh mới về knowledge-work, coding, và các tác vụ long-context, đặc biệt khi nó có thể sử dụng công cụ như spreadsheet và presentation.
Đây là nỗ lực của OpenAI tạo ra một engine knowledge-work đa năng, và đây là mô hình bạn chọn khi độ chính xác cải thiện với suy nghĩ có chủ đích. Với nhiều tổ chức, đây sẽ là lựa chọn cho phân tích, workflow nhiều bước, và các tác vụ agentic.
GPT-5.2 Pro
Đây là flagship, và nó được xây dựng với khách hàng enterprise trong tâm trí.
Đây cũng là tùy chọn đắt nhất trong lineup vì nó nhắm vào các kịch bản high-stakes nơi những cải thiện incremental về chất lượng reasoning, độ chính xác thực tế, và giải quyết vấn đề trừu tượng biện minh cho chi phí per-token cao hơn.
Pro được nhắm đến cho sử dụng trong môi trường nơi lỗi có chi phí cao, và nơi các đội ngũ cần một mô hình có thể duy trì coherence qua các context rất dài. Đây là mô hình có thể được sử dụng trong các hệ thống hỗ trợ ra quyết định, lập kế hoạch phức tạp, và bất kỳ workload nào mà độ tin cậy quan trọng ngang với khả năng raw.
GPT-5.2 có sẵn khi nào?
GPT-5.2 đã đang được triển khai. OpenAI chính thức ra mắt mô hình vào ngày 11 tháng 12 năm 2025, với các gói ChatGPT trả phí được truy cập trước, và khả năng tiếp tục mở rộng qua các khu vực và nền tảng. Người dùng có thể truy cập cả ba mô hình GPT-5.2 trực tiếp trong ChatGPT, và developer có thể sử dụng chúng thông qua OpenAI API qua các endpoint Responses và Chat Completions.
Benchmarks GPT-5.2
Bản phát hành GPT-5.1 đáng chú ý là ít kết quả benchmark vì nó tập trung vào trải nghiệm người dùng. Không ngạc nhiên khi GPT-5.2 đang cố gắng chỉnh lại hướng đi bằng cách tập trung nhiều hơn vào kết quả.
Thực hiện các nhiệm vụ và công việc
GDPval là kết quả benchmark được highlight nhiều nhất trong bản phát hành mới. Nhưng nó chỉ mới được giới thiệu trên arxiv vào đầu tháng 10 năm 2025, nên việc highlight kết quả benchmark này tiết lộ nhiều về bản chất của bản phát hành.
GDPval là bài test về các tác vụ mà chuyên gia làm việc thực hiện trong công việc hàng ngày của họ, như xây dựng báo cáo và làm presentation. Các câu hỏi test được chọn từ 44 nghề nghiệp qua 9 ngành công nghiệp đóng góp hàng đầu cho GDP Hoa Kỳ. Điều này bao gồm mọi thứ từ y tá đến data scientist đến giáo sư đại học. Các tác vụ yêu cầu sản phẩm công việc thực, như spreadsheet, sổ cái kế toán, video, và presentation.

Lập trình
Benchmark được highlight nhiều thứ hai trong bản phát hành này là SWE-Bench Pro, một eval software engineering khó mà GPT-5.2 đạt 55.6%. SWE-Bench Pro yêu cầu giải quyết các issue long-horizon từ các repo thực, các vấn đề liên quan đến những thứ như thực hiện thay đổi nhiều file.
Bạn có thể đã nghe về SWE-bench Verified, là phiên bản dễ hơn của bài test. Trên bài này, GPT-5.2 đạt 80%. Để so sánh, Infinity News gần đây đã báo cáo rằng Claude Opus 4.5 đạt 80.9% trên bài test này, nên hai mô hình gần như tương đương.
Suy luận trong bối cảnh dài
GPT-5.2 cho thấy hiệu suất tuyệt vời trên một benchmark khác gọi là MRCR v2, viết tắt của Multi-Round Coreference Resolution (phiên bản 2). Nó đạt gần như điểm hoàn hảo, mà OpenAI muốn chúng ta hiểu nghĩa là có thể sử dụng GPT-5.2 để làm việc với tài liệu dài.

Đáng ghi nhận, nó đạt độ chính xác gần như hoàn hảo lên đến 256k token. Đó là khoảng hai trăm nghìn từ, gần bằng kích thước một cuốn tiểu thuyết.
Đánh giá, kiểm tra các khả năng mới của GPT-5.2
OpenAI tự tin khẳng định rằng GPT-5.2 mang đến những cải tiến lớn về intelligence, long-context understanding, agentic tool-calling, và vision. Qua các bài test thực tế, chúng ta có thể rút ra một số kết luận:
Long-context understanding hoạt động ấn tượng. Mô hình có thể nhớ và truy xuất chi tiết nhỏ bị chôn sâu trong tài liệu dài — không phải bằng cách đoán pattern mà bằng sự lưu giữ thực sự. Nếu GPT-5.2 có thể nhớ một công thức bữa tối thoáng qua trong tiểu thuyết 90 trang, nó có thể theo dõi biến trong codebase, điều khoản trong hợp đồng, hoặc chi tiết tài chính trong báo cáo 200 trang.
Agentic tool-calling cho thấy tiềm năng lớn nhưng có giới hạn thực tế. Với các tác vụ có nguồn dữ liệu sạch và truy cập mở (như tìm kiếm căn hộ trên các trang web công khai), GPT-5.2 có thể navigate, filter, trích xuất, và tổng hợp thông tin một cách tự động. Tuy nhiên, khi đối mặt với dữ liệu offline, phân mảnh, paywall, hoặc bị khóa đằng sau authentication — mô hình có thể nhận ra rào cản và đề xuất bước tiếp theo, nhưng không thể vượt qua chúng. Đây là lý do OpenAI tập trung vào business use case, nơi dữ liệu thường có cấu trúc và truy cập được tốt hơn.
Vision vẫn là điểm cần cải thiện. Trong bài test Sudoku, GPT-5.2 giải được puzzle nhưng vô tình thay đổi một số số cho sẵn — không phải lỗi reasoning mà là breakdown về vision và fidelity khi chuyển đổi hình ảnh sang dữ liệu có cấu trúc.
Tóm lại: GPT-5.2 thể hiện bước tiến rõ ràng về long-context và agentic capability, đặc biệt trong môi trường enterprise có dữ liệu có cấu trúc. Nhưng đừng kỳ vọng nó giải quyết mọi thứ — giới hạn của mô hình thường phản ánh giới hạn của dữ liệu và hệ thống mà nó tương tác, không phải năng lực reasoning của chính nó.
Chi phí GPT-5.2 và API Access
Các bài test ở trên cho thấy những gì bạn có thể làm bên trong ChatGPT, nhưng sự linh hoạt thực sự đến khi bạn chuyển sang API, nơi bạn kiểm soát reasoning effort, token budget, và tool integration của riêng mình.
Cả ba mô hình đều có sẵn ngay bây giờ thông qua Responses API và Chat Completions API của OpenAI:
| Mô hình | API model string |
|---|---|
| GPT-5.2 Instant | gpt-5.2-chat-latest |
| GPT-5.2 Thinking | gpt-5.2 |
| GPT-5.2 Pro | gpt-5.2-pro |
Pricing:
Với GPT-5.2 Thinking: $1.75 per million input token và $14 per million output token cho mô hình Thinking cơ bản, nhưng có giảm giá 90% trên cached input.
GPT-5.2 Pro: Mô hình top-tier đắt hơn nhiều: $21 input, $168 output.
Hai bổ sung cho power user: một setting reasoning effort 1xhigh1 và một endpoint /compact mở rộng context window hiệu quả cho các workflow chạy dài.
GPT-5.2 vs Đối thủ
Hãy xem GPT-5.2 so sánh với các bản phát hành gần đây khác như thế nào:
GPT-5.2 vs Gemini 3
Gemini 3 phát hành giữa tháng 11, đã crush điểm số trên nhiều benchmark test được theo dõi nhiều nhất. Nó giữ vị trí đầu trên Humanity’s Last Exam, và nó cũng đánh bại GPT-5.2 Pro trên GPQA Diamond, nhưng chỉ một chút (93.8% vs. 93.2%).
Sự tăng hiệu suất lớn của Gemini có lẽ phản ánh những cải tiến trong cả triển khai mixture-of-experts và hạ tầng training. Gemini 3 sử dụng token-level sparse routing, và nó được train trên hạ tầng TPU tùy chỉnh của Google. Nơi GPT-5.2 đang làm tốt bây giờ là trên các benchmark công việc chuyên nghiệp như GDPval và các eval enterprise tool-calling. Đây là nơi OpenAI rõ ràng đã tập trung nỗ lực của mình.
GPT-5.2 vs Claude Opus 4.5
Claude Opus 4.5 phát hành cuối tháng 11, đi theo con đường khác. Anthropic tập trung vào những gì họ gọi là “hybrid reasoning” — kết hợp extended thinking với baseline intelligence mạnh hơn — và kết quả là một mô hình xuất sắc về software engineering và các tác vụ open-ended. Trên SWE-bench Verified, Opus 4.5 đạt 80.9%, chỉ cao hơn một chút so với 80% của GPT-5.2.
Nơi các mô hình phân kỳ là về style: Opus 4.5 có xu hướng phản hồi dài hơn, có tính deliberative hơn, trong khi GPT-5.2 Thinking nhấn mạnh tool use và structured output như spreadsheet và presentation. Cho coding agent và complex refactor, chúng thực sự ngang ngửa; cho enterprise workflow liên quan đến slide và báo cáo, OpenAI đang đặt cược GPT-5.2 có lợi thế.
Kết luận từ Infinity News
Cũng có nhiều sự chú ý vào kết quả benchmark GPT, và chắc phải có nhiều áp lực tại OpenAI để deliver. Một tháng trước, bản phát hành GPT-5.1 bị che mờ bởi Gemini 3. Bây giờ, trong bản phát hành GPT-5.2, OpenAI rơi vào vị trí thứ hai sát nút với Gemini 3 trên GPQA và vị trí thứ hai sát nút với Claude Opus 4.5 trên SWE-Bench Verified, điều chắc hẳn gây frustrating cho đội ngũ.
OpenAI thay vào đó đã highlight hiệu suất cao trên GDPval và SWE-Bench Pro, nhưng bài test trước, đặc biệt, còn mù mờ so với các tiêu chuẩn ngành chiếm headline. Người ta có thể nghĩ rằng OpenAI đang cố kể một câu chuyện chiến thắng mà không gây chú ý đến các leaderboard mà họ đang thua.
Nhưng cuộc đua siêu sát nút, và các công ty này vẫn còn nhiều không gian để chứng minh mình. Một điều Infinity News sẽ theo dõi đặc biệt là cách các mô hình mới hoạt động trên benchmark ARC-AGI-3 sắp tới, hiện đang được phát triển.
Câu hỏi thường gặp về GPT 5.2
Điều gì thúc đẩy việc triển khai GPT-5.2 nhanh bất thường?
Bản phát hành được tăng tốc của GPT-5.2 được thúc đẩy bởi áp lực cạnh tranh từ Gemini 3 của Google và các mô hình mới nổi khác. OpenAI nhằm nhanh chóng thu hẹp khoảng cách hiệu suất, đặc biệt trong các lĩnh vực như reasoning, memory, và tool usage, để duy trì vị thế của mình trong bối cảnh AI ngày càng cạnh tranh.
GPT-5.2 có hoàn toàn thay thế GPT-5.1 và các mô hình cũ hơn không?
Không, GPT-5.1 sẽ vẫn có sẵn cùng với GPT-5.2 trong thời gian tới. Điều này cho phép người dùng chuyển đổi dần dần, duy trì quyền truy cập vào các mô hình legacy trong khi thích nghi với những cải tiến mới trong GPT-5.2.
Các cải tiến trong GPT-5.2 ảnh hưởng đến người dùng hàng ngày (không phải enterprise) như thế nào?
Với người dùng hàng ngày, GPT-5.2 nâng cao tốc độ phản hồi và độ chính xác, đặc biệt trong việc xử lý các cuộc hội thoại dài và lưu giữ ngữ cảnh. Những cải tiến này nhằm cung cấp trải nghiệm liền mạch và đáng tin cậy hơn, ngay cả ngoài các workflow enterprise.
Có tính năng safety hoặc content-control mới nào gắn với bản phát hành GPT-5.2 không?
Cùng với các cải tiến hiệu suất, GPT-5.2 giới thiệu các cập nhật liên tục cho các tính năng safety, như content filtering được nâng cao và các user control được tinh chỉnh hơn. OpenAI cũng đang chuẩn bị cho các cập nhật tương lai, bao gồm một “adult mode” được lên kế hoạch cho các tương tác được kiểm soát hơn.



