Tổng quan
OpenAI đã phát hành GPT-5.1 trong tuần này, nhấn mạnh trải nghiệm người dùng hơn là tăng khả năng thô và không có các bảng benchmark (chuẩn đánh giá) hoặc biểu đồ hiệu suất thông thường. Sự thay đổi này phản ánh một số động lực ngành rộng hơn: Người dùng đã trở nên hoài nghi với các lần ra mắt quá cường điệu, và OpenAI đang chọn dẫn đầu bằng các cải tiến về khả năng sử dụng thay vì các benchmark cạnh tranh.
Những điểm chính từ thông báo:
- GPT-5.1 tách thành hai mô hình phối hợp, một được tinh chỉnh cho tốc độ (GPT-5.1 Instant), mô hình kia cho suy luận (GPT-5.1 Thinking)
- Giới thiệu định tuyến tự động (automatic routing) chọn động giữa chúng dựa trên yêu cầu của bạn
- Các mô hình mới cung cấp các điều khiển cá nhân hóa mở rộng, mang lại cho người dùng nhiều cách chi tiết hơn để định hình cách ChatGPT nghe và hành xử
- Các tính năng này dựa trên cách tiếp cận UX-first (trải nghiệm người dùng trước) mà OpenAI đã thiết lập với việc thống nhất mô hình của GPT-5
Điều hơi khác thường về bản phát hành này là bao nhiêu trong số đó có vẻ như đang sửa các vấn đề từ GPT-5: làm theo hướng dẫn tốt hơn, phản hồi rõ ràng hơn với ít biệt ngữ hơn, điều khiển giọng điệu thực sự bám chặt. Đó là lời nhắc nhở rằng ngay cả các bản phát hành hàng đầu cũng có thể vận chuyển với các góc nhám.
Có gì mới trong GPT-5.1?
Với bản phát hành này, OpenAI đang tổ chức lại cách GPT-5 hoạt động. Nó đang tách GPT-5.1 thành hai mô hình:
GPT-5.1 Instant: Mô hình nhanh và thân thiện
GPT-5.1 Instant là phiên bản phản hồi nhanh của gia đình GPT-5.1, được thiết kế cho các trường hợp sử dụng hàng ngày và hội thoại. Nó xử lý các nhiệm vụ yêu cầu tương tác nhanh, trôi chảy, chẳng hạn như soạn thảo tin nhắn, tóm tắt văn bản hoặc trả lời các câu hỏi đơn giản.
GPT-5.1 Instant ưu tiên độ trễ thấp (low latency) và chất lượng phản hồi nhất quán, tạo ra câu trả lời với độ trễ tối thiểu trong khi duy trì ngôn ngữ rõ ràng, liên quan đến ngữ cảnh.
GPT-5.1 Thinking: Mô hình tập trung suy luận
GPT-5.1 Thinking là đối tác tập trung vào suy luận. Nó được xây dựng cho các nhiệm vụ hưởng lợi từ phân tích sâu hơn hoặc logic nhiều bước. Nó tự động điều chỉnh thời gian phản hồi của mình tùy thuộc vào độ phức tạp của yêu cầu, mất nhiều thời gian hơn khi cần suy luận cẩn thận hoặc giải quyết vấn đề có cấu trúc.
Biến thể này dành cho công việc kỹ thuật hoặc phân tích hơn, như lập trình, giải thích dữ liệu hoặc lập kế hoạch có cấu trúc. Về cơ bản, điều này phù hợp nhất cho nơi khả năng đánh giá, kết nối và tổng hợp thông tin của mô hình quan trọng hơn tốc độ.
Định tuyến tự động giữa các mô hình
Một đổi mới hữu ích nhất cho người dùng GPT-5.1 không chỉ là có hai mô hình, mà là bạn không phải chọn giữa chúng. GPT-5.1 bao gồm một hệ thống định tuyến tự động phân tích từng yêu cầu và chỉ đạo nó đến mô hình nào phù hợp hơn cho nhiệm vụ.
Cách hoạt động:
- Các truy vấn đơn giản như “tóm tắt email này” hoặc “thời tiết như thế nào?” đi đến Instant để phản hồi nhanh
- Các yêu cầu phức tạp hơn như “gỡ lỗi mã này” hoặc “phân tích tập dữ liệu này để tìm xu hướng” được định tuyến đến Thinking để phân tích sâu hơn
Hệ thống đưa ra quyết định này một cách minh bạch ở hậu trường, cân bằng tốc độ, chất lượng và chi phí tính toán mà không yêu cầu lựa chọn mô hình thủ công. Tất nhiên, bạn vẫn có thể chọn mô hình bạn muốn sử dụng với bộ chọn mô hình.
Các cải tiến khác trong GPT-5.1
Ngoài hai mô hình bổ sung và định tuyến tự động, có một số cải tiến đáng chú ý khác, hầu hết áp dụng cho cả hai biến thể.
Suy luận thích ứng (Adaptive Reasoning)
Trong khi định tuyến quyết định mô hình nào sử dụng (Instant so với Thinking), suy luận thích ứng kiểm soát bao nhiêu nỗ lực tính toán mà mỗi mô hình dành cho một yêu cầu nhất định.
Thay vì sử dụng thời gian phản hồi cố định, cả GPT-5.1 Instant và GPT-5.1 Thinking hiện điều chỉnh độ sâu suy luận của chúng dựa trên độ phức tạp của nhiệm vụ. Họ dành ít thời gian hơn cho các câu hỏi nhanh và nhiều hơn cho các câu hỏi nhiều bước hoặc phân tích.
Kết quả:
- Instant cảm thấy nhanh hơn mà không mất độ chính xác trên các nhiệm vụ đơn giản
- Thinking trở nên thận trọng và kiên trì hơn khi giải quyết các lời nhắc khó
Các benchmark nội bộ của OpenAI nhấn mạnh sự thay đổi thời gian suy nghĩ này. So với GPT-5, GPT-5.1 Thinking nhanh hơn khoảng gấp đôi trên các nhiệm vụ dễ nhất và chậm hơn khoảng gấp đôi trên các nhiệm vụ khó nhất.
Điều này có nghĩa là GPT-5.1 đang tự động phân bổ thời gian suy luận của mình và tập trung nỗ lực vào nơi quan trọng nhất—một hệ thống tối ưu hóa hai lớp trong đó định tuyến chọn mô hình đúng, sau đó suy luận thích ứng hiệu chỉnh mức độ nỗ lực trong mô hình đó.

Cải thiện làm theo hướng dẫn
GPT-5.1 hiện giải thích hướng dẫn một cách đáng tin cậy hơn, ngay cả trong các trường hợp cụm từ mơ hồ. Trong thực tế, điều đó có nghĩa là tuân thủ rõ ràng hơn các ràng buộc như “cho tôi 140 ký tự” hoặc “định dạng dưới dạng bảng”, với ít lỗi off-by-one hoặc bỏ qua bộ hạn định hơn.
Cải tiến này là kết quả trực tiếp của hệ thống suy luận thích ứng được mô tả ở trên. Bởi vì mô hình hiện có thể đánh giá khi nào cần dành nhiều thời gian xử lý lời nhắc trước khi phản hồi, nó nắm bắt các sắc thái và ràng buộc mà các phiên bản trước đó có thể đã bỏ qua. Kết quả là sự liên kết sắc nét hơn giữa những gì người dùng yêu cầu và những gì mô hình cung cấp.
Kiểm soát giọng điệu và phong cách được cá nhân hóa
Trước khi đi vào các tùy chọn tùy chỉnh, đáng chú ý là GPT-5.1 ấm áp hơn và đàm thoại hơn theo mặc định, độc lập với bất kỳ cài đặt nào bạn điều chỉnh. OpenAI nói rằng điều này phản ánh phản hồi của người dùng rằng AI nên “thú vị để nói chuyện”, không chỉ có khả năng.
Vì vậy, cả Instant và Thinking đã được tinh chỉnh để cảm thấy tự nhiên hơn và ít giống robot hơn trong các phản hồi cơ bản của chúng.
Về tùy chỉnh:
Trong GPT-5, cá nhân hóa tồn tại dưới bảng điều khiển Custom Instructions (Hướng dẫn tùy chỉnh) quen thuộc. Bạn có thể đưa cho mô hình các gợi ý về tính cách (“Be witty”, “Sound like Gen Z”) hoặc chọn từ các cài đặt sẵn kiểu chip như Chatty hoặc Straight Shooting. Nó hoạt động OK, nhưng các thay đổi chỉ áp dụng cho các cuộc trò chuyện mới, và mô hình đôi khi bỏ qua các thay đổi giọng điệu giữa cuộc trò chuyện.
GPT-5.1 tổ chức lại điều này thành một trung tâm Cá nhân hóa đầy đủ:
- Các cài đặt sẵn đã được đổi tên thành 8 lựa chọn mới: Default (Mặc định), Professional (Chuyên nghiệp), Friendly (Thân thiện), Candid (Thẳng thắn), Quirky (Kỳ quặc), Efficient (Hiệu quả), Nerdy (Mọt sách), và Cynical (Hoài nghi)
- Chúng hiện áp dụng ngay lập tức trên tất cả các cuộc trò chuyện đang hoạt động
- OpenAI đã thêm các thanh trượt thử nghiệm cho phép bạn tinh chỉnh độ ấm áp (warmth) và độ ngắn gọn (concision), và thậm chí cả tần suất emoji
- Mô hình cũng có thể phát hiện khi bạn yêu cầu thay đổi giọng điệu (“Can you be more direct?”) và chủ động đề nghị điều chỉnh giọng điệu của nó


Cải thiện hiệu suất trong lập trình và toán học
Mặc dù OpenAI không dẫn đầu bằng các bảng benchmark trong thông báo, họ đã đề cập đến một cải tiến cụ thể với GPT-5.1 Instant. Bởi vì nó hiện có suy luận thích ứng, nó cho thấy những cải thiện đáng kể trong các đánh giá kỹ thuật như AIME 2025 và Codeforces.
Chúng tôi không có quyền truy cập vào các con số cụ thể hoặc so sánh với hiệu suất của GPT-5, vì vậy khó để đánh giá những cải tiến này có ý nghĩa như thế nào trong thực tế. Nhưng thực tế là Instant hiện có thể “suy nghĩ” theo yêu cầu là một thay đổi kiến trúc đáng chú ý.
Thử nghiệm GPT-5.1 thực tế
Để xem các cải tiến này hoạt động như thế nào trong thực tế, tác giả đã thử nghiệm GPT-5.1 trên một số lĩnh vực chính mà OpenAI nêu bật trong bản phát hành.
Kiểm tra suy luận thích ứng
Kiểm tra liệu GPT-5.1 có thực sự điều chỉnh thời gian suy nghĩ dựa trên độ phức tạp của nhiệm vụ hay không. Đưa ra cả một bài toán đơn giản và một câu hỏi xác suất nhiều bước.
Câu hỏi đơn giản: “15% của 240 là gì?”
- Kết quả trả về gần như ngay lập tức

Câu hỏi phức tạp: “Tôi có một túi với 5 viên bi đỏ và 3 viên bi xanh. Tôi rút 2 viên bi không thay thế. Xác suất để ít nhất một viên là đỏ là bao nhiêu? Hiển thị công việc của bạn từng bước.”
- Nhiệm vụ suy luận phức tạp cho thấy chỉ báo “suy nghĩ” có thể nhìn thấy và mất nhiều thời gian hơn

Sự khác biệt rất rõ ràng. GPT-5.1 rõ ràng dành nhiều nỗ lực hơn cho nhiệm vụ cần nó.
Kiểm tra độ rõ ràng phản hồi
OpenAI tuyên bố rằng GPT-5.1 Thinking tạo ra các phản hồi với ít biệt ngữ hơn. Để kiểm tra điều này, yêu cầu cả GPT-5 và GPT-5.1 giải thích một khái niệm kinh doanh:
Lời nhắc: “Giải thích LTV và nó liên quan như thế nào đến churn. Tôi không quen thuộc với các số liệu SaaS.”
Kết quả GPT-5: Nhảy thẳng vào các công thức và sử dụng các từ viết tắt không xác định như “ARPU” (Average Revenue Per User – Doanh thu trung bình mỗi người dùng) mà không giải thích, giả định người đọc sẽ biết nó có nghĩa là gì.

Kết quả GPT-5.1: Phù hợp hơn nhiều với lời nhắc. Nó đưa ra một giải thích rõ ràng dựa trên ngữ cảnh.

Cải thiện làm theo hướng dẫn
Một trong những tuyên bố của OpenAI là GPT-5.1 tốt hơn trong việc tuân theo các ràng buộc cụ thể. Kiểm tra với lời nhắc này:
Lời nhắc: “Viết mô tả sản phẩm cho tai nghe chống ồn trong chính xác 50 từ.”
GPT-5: Hơi quá kịch tính, và số từ thực sự là 49 thay vì 50

GPT-5.1: Xử lý nhiệm vụ đáng tin cậy hơn. Giọng điệu cảm thấy giống mô tả sản phẩm hơn, và chính xác 50 từ.

Cá nhân hóa giọng điệu
Để đánh giá các điều khiển cá nhân hóa mới, chạy cùng một câu hỏi qua nhiều cài đặt sẵn giọng điệu.
Lời nhắc: “Tôi quan tâm đến việc thiết lập một hệ sinh thái bể cá tự duy trì yêu cầu can thiệp tối thiểu. Loài và thiết lập nào sẽ hoạt động tốt nhất?”
Kết quả với 3 cài đặt sẵn:
Professional (Chuyên nghiệp): Đi thẳng vào vấn đề và khá bằng phẳng. Trực tiếp, không có bất kỳ điều gì rườm rà.

Candid (Thẳng thắn): Trực tiếp và khuyến khích. Đây là một sự thay đổi đáng chú ý từ Professional, và trong khi vẫn trực tiếp, sự lựa chọn từ và phong cách hơi bình thường hơn là rõ ràng.

Quirky (Kỳ quặc): Chắc chắn là từ đúng ở đây. Nó vui tươi hơn nhiều so với hai ví dụ khác, với nhiều ‘trí tưởng tượng’ hơn.

Khi nào GPT-5.1 có sẵn?
GPT-5.1 đã bắt đầu tung ra và đã có sẵn cho nhiều người dùng, bắt đầu với người dùng trả phí trên các gói ChatGPT Plus, Pro và Business, cũng như những người dùng trên gói Go. Các tài khoản Enterprise và Education nhận được chuyển đổi truy cập sớm bảy ngày trước khi bản cập nhật trở thành mặc định.
Nếu bạn chưa thấy GPT-5.1 trong bộ chọn mô hình của mình, đừng lo lắng. Quyền truy cập đang đến theo đợt trong vài ngày sau khi ra mắt. OpenAI đang làm điều này theo cách này để giữ hiệu suất ổn định.
Sau khi quá trình tung ra hoàn tất, GPT-5.1 sẽ hoàn toàn thay thế GPT-5 làm mô hình tiêu chuẩn, mặc dù các phiên bản cũ hơn sẽ vẫn có sẵn trong “legacy models” (các mô hình kế thừa) trong ba tháng để người dùng có thể so sánh chúng cạnh nhau.
API
Bản cập nhật cũng mở rộng đến API, cũng đang tung ra. Theo Sam Altman trong một bài đăng trên X, GPT-5.1 thực sự hiện có sẵn trong API với cùng mức giá với mô hình trước đó:
- GPT-5.1 Instant sẽ xuất hiện dưới dạng
gpt-5.1-chat-latest - GPT-5.1 Thinking sẽ được cung cấp dưới dạng
gpt-5.1
Cả hai đều hỗ trợ suy luận thích ứng ngay từ đầu.
System card và cập nhật an toàn
Cùng với bản phát hành, OpenAI đã công bố một phụ lục cho system card GPT-5 của mình chi tiết các biện pháp bảo vệ mới, phương pháp đánh giá và điều chỉnh tinh chỉnh được giới thiệu trong GPT-5.1.
Công ty nói rằng các bản cập nhật này tập trung vào việc cải thiện độ tin cậy thực tế, giảm sự quá tự tin và tinh chỉnh cách mô hình xử lý các yêu cầu mơ hồ hoặc nhạy cảm.
Trong khi GPT-5.1 kế thừa cùng một kiến trúc liên kết như GPT-5, nó kết hợp các tập dữ liệu tinh chỉnh mở rộng và các hệ thống giám sát nhằm hiệu chỉnh tốt hơn độ sâu suy luận đối với độ nhạy cảm của chủ đề.
Kết luận
Trong khi GPT-5.1 trông giống như một bản cập nhật nhỏ hơn bình thường trên giấy tờ, nó có thể là một bản cập nhật có ý nghĩa hơn trong thực tế. Thay vì đại tu mô hình hàng đầu, OpenAI đã tinh chỉnh cảm giác sử dụng nó, mang lại phản hồi nhanh hơn và kiểm soát nhiều hơn về giọng điệu và tính cách.
Đó là một cải tiến im lặng nhưng hữu hình đối với cách ChatGPT suy nghĩ, nói chuyện và phản hồi.
Câu hỏi là liệu cách tiếp cận tập trung vào UX này có tiếp tục hay không. Nếu GPT-5.1 là một bản xem trước chiến lược phát hành của OpenAI về phía trước, chúng ta nên mong đợi nhiều bản cập nhật lặp đi lặp lại cải thiện trải nghiệm hàng ngày thay vì các bước nhảy khả năng thu hút tiêu đề.
Đối với người dùng, điều đó thực sự có thể tốt hơn. Các cải tiến gia tăng thường quan trọng hơn điểm benchmark lớn tiếp theo.
Câu hỏi thường gặp
Tại sao tôi không thấy GPT-5.1 trong bộ chọn mô hình? OpenAI thường giới thiệu các mô hình mới theo đợt. Một số người dùng Plus, Pro và Team thấy GPT-5.1 trong dropdown của họ sớm; những người khác sẽ có nó trong những ngày hoặc tuần tới.
Tại sao có một bản phát hành dần dần? OpenAI nói rằng bản phát hành dần dần này nhằm giữ hiệu suất ổn định khi việc sử dụng tăng lên.
GPT-5.1 có sẵn trong API không? Chưa, nhưng cả GPT-5.1 Instant và GPT-5.1 Thinking sẽ có sẵn cho API trong tuần này. GPT-5.1 Instant sẽ được thêm dưới dạng gpt-5.1-chat-latest. GPT-5.1 Thinking sẽ được phát hành dưới dạng gpt-5.1 trong API.



2 Bình luận
Pingback: Grok 4.1 là gì? Các tính năng mới của Grok 4.1 | Infinity News
Pingback: Gemini 3 Pro là gì? Các Tính năng mới trong Gemini 3 | Infinity News