GPT-5.6 thử nghiệm bí mật lan truyền: ChatGPT biến đổi thông minh, người dùng thử nghiệm vượt mặt Fable 5

ChatGPT Người dùng tuần này đồng loạt báo cáo chất lượng phản hồi tăng vọt, thời gian phản hồi rõ ràng kéo dài, gây ra những đồn đoán sôi nổi về thử nghiệm bí mật của OpenAI cho thế hệ mô hình tiếp theo GPT-5.6. Từ việc tạo ra trò chơi 3D chỉ với một cú nhấp đến mô phỏng robot, nhiều nhà phát triển đã đăng tải so sánh thực tế trên nền tảng X, khẳng định “5.5 Pro đã âm thầm được thay thế bằng 5.6”. Theo truyền thông, việc ra mắt chính thức có thể diễn ra sớm nhất vào ngày 25 tháng 6, nhưng OpenAI vẫn giữ im lặng cho đến nay.
(Thông tin tiền đề: Phó trưởng bộ phận của Google Gemini, Noam Shazeer, rời khỏi công ty để gia nhập OpenAI)
(Bổ sung bối cảnh: Phiên bản Mythos mới của Anthropic đã hoàn thành huấn luyện, Sonnet 5 dự kiến ra mắt trong tuần này)

Nội dung bài viết

Chuyển đổi

  • Người dùng đồng loạt báo cáo: phản hồi chậm lại, chất lượng tăng vọt
  • Rò rỉ chi tiết xuất hiện: Juice Value tăng cao, cập nhật ngày kiến thức cắt đứt
  • Im lặng của OpenAI và các kỷ lục “phát hành âm thầm” trong quá khứ
  • Đằng sau việc thúc đẩy mô hình mới: GLM-5.2 bắt kịp, Anthropic bị kiểm soát xuất khẩu

Tuần này, người dùng ChatGPT đột nhiên phát hiện ra một điều, chất lượng hội thoại dường như đã khác. Không chỉ là cảm nhận cá nhân nhỏ lẻ, mà là hàng loạt phản hồi từ các nhà phát triển, nhà sáng tạo, tổ chức đánh giá, đều hướng về một điểm chung: có khả năng OpenAI đang thử nghiệm bí mật mô hình mới.

Nhà phát triển Anshu Chimala đã đăng tải video so sánh trên nền tảng X vào thứ Năm, thể hiện sự khác biệt về chất lượng trang đích tạo ra chỉ với một lệnh gợi ý, và khẳng định: “Well well well, tôi chính là người may mắn được trải nghiệm sớm GPT-5.6 Pro.” Một nhà phát triển khác, Dobroslav Radosavljevič, cũng đăng bài trên X nói rằng, trong quá trình sử dụng mô hình trong Codex, “cảm giác hoàn toàn khác với 5.5”, và phần bình luận chia thành hai phe: một bên tin tưởng tuyệt đối, một bên còn hoài nghi.

Người dùng đồng loạt báo cáo: phản hồi chậm lại, chất lượng tăng vọt

Điểm chung rõ ràng nhất là về thời gian. Nhà phát triển Conor Dart đã thực hiện một thử nghiệm, dùng một lệnh gợi ý duy nhất để tạo ra một trò chơi trình duyệt 3D có tích hợp động cơ vật lý và điều khiển camera, mất hơn một giờ đồng hồ, trong khi GPT-5.5 Pro thường chỉ mất khoảng 10 phút. Anh viết: “Chưa hoàn hảo, nhưng chỉ với một lệnh gợi ý mà đạt được mức này, thật sự ấn tượng.”

Những người trong giới AI, như Chetas Lua, cũng báo cáo tình trạng tương tự trên nền tảng X: khi thử nghiệm mô phỏng robot, thời gian phản hồi kéo dài đến 20-40 phút, gọi đó là “tốc độ chưa từng thấy kể từ khi GPT-5.5 ra mắt”. Anh còn nói thẳng: “GPT-5.6 Pro trong thử nghiệm 3D liên tục vượt trội hơn Fable 5 của Anthropic.”

Tuy nhiên, không phải tất cả các thử nghiệm đều diễn ra theo chiều hướng tiêu cực. Nhà đánh giá tiêu chuẩn AI, Chris, đã dùng cùng một lệnh tạo tàu vũ trụ để thử nghiệm hai mô hình: mô hình được cho là GPT-5.6 Pro chạy mất 87 phút, còn GPT-5.5 Extra High chỉ mất 34 phút 42 giây. Anh phân tích: “Như tôi đã nói trước đó, GPT-5.6 là một nâng cấp dần dần, ổn định so với 5.5, không phải là ‘sát thủ’ của Fable. Có thể sẽ thắng thua trong một số tiêu chuẩn, nhưng nhìn chung không vượt trội rõ rệt.”

Rò rỉ chi tiết xuất hiện: Juice Value tăng cao, cập nhật ngày kiến thức cắt đứt

Khi các cuộc thảo luận trở nên sôi động hơn, nhiều thông tin rò rỉ bắt đầu xuất hiện. Người rò rỉ Pankaj Kumar đã liệt kê chi tiết nhiều thay đổi về thông số kỹ thuật: ngày kiến thức cắt đứt được đẩy tới tháng 12 năm 2025; người thử nghiệm gọi là “Juice Value” – độ mạnh của khả năng suy luận – được truyền đạt là từ 768 nâng lên 960; khả năng tạo ra thiết kế SVG và 3D vượt trội trong một số nhiệm vụ so với Fable 5. Dù nguồn tin chưa được OpenAI xác nhận, nhưng các mô tả từ nhiều tài khoản đều thống nhất cao: khả năng suy luận mạnh mẽ hơn, giao diện người dùng chưa hoàn thiện, cùng với mã dự kiến “Kindle-Alpha”.

Chuyên gia trong lĩnh vực AI, Leo, trích dẫn thông tin ẩn danh đăng bài cho biết, GPT-5.6 “hiện đang được thử nghiệm bí mật trên một số tài khoản Pro, khi người dùng chọn GPT-5.5 Pro, thực tế đang chạy phiên bản 5.6”, và dự đoán ngày ra mắt chính thức là 25 tháng 6 (thứ Năm).

Im lặng của OpenAI và các kỷ lục “phát hành âm thầm” trong quá khứ

Đây không phải lần đầu OpenAI chọn cách “ra mắt trước, không thông báo”. Quá trình ra mắt GPT-4.5, OpenAI cũng đã chọn thay thế mô hình mà không có bất kỳ lời giới thiệu nào, đến khi người dùng phát hiện ra sự khác biệt mới xác nhận một cách âm thầm. Chiến lược phát hành stealth này một mặt giúp công ty thu thập dữ liệu thực tế mà không gây chú ý quá mức, mặt khác cho phép họ dễ dàng quay lại nếu gặp vấn đề, tránh khủng hoảng truyền thông.

Khác với cách của Anthropic, các phiên bản mô hình của họ thường có lịch trình rõ ràng từ huấn luyện đến ra mắt, còn OpenAI ngày càng thích “làm rồi tính”. Giám đốc khoa học Jakub Pachocki được cho là đã nói trong cuộc họp nội bộ rằng, mô hình mới là bước tiến ý nghĩa so với GPT-5.5, nhưng theo báo cáo của The Information, nội dung này chỉ dừng lại ở đó, chưa xác nhận bất kỳ thử nghiệm A/B hay lịch trình ra mắt nào.

Đáng chú ý, trang Decrypt đã gửi câu hỏi đến OpenAI về vấn đề này, nhưng chưa nhận được phản hồi trước thời hạn.

Đằng sau việc thúc đẩy mô hình mới: GLM-5.2 bắt kịp, Anthropic bị kiểm soát xuất khẩu

Nếu OpenAI thực sự đang đẩy nhanh việc ra mắt thế hệ mô hình hàng đầu mới, thì đó là do áp lực cạnh tranh rất lớn. Mô hình mã nguồn mở của Trung Quốc, GLM-5.2, chỉ thua Claude Opus 4.8 đúng 1 điểm trong bài kiểm tra FrontierSWE, đồng thời đã vượt qua GPT-5.5. Chỉ số này, đánh giá khả năng của AI Agent trong các nhiệm vụ phức tạp kéo dài nhiều giờ, đang trở thành tiêu chuẩn mới để đo lường năng lực thực sự của các mô hình.

Trong khi đó, phe của Anthropic lại rơi vào tình cảnh tự gây khó khăn. Các mô hình chủ lực Mythos 5 và Fable 5 bị gỡ xuống do lệnh kiểm soát xuất khẩu của chính phủ Mỹ ban hành ngày 12 tháng 6, vì một lỗ hổng jailbreak gây tranh cãi. Điều này không chỉ tạo ra khoảng trống trên thị trường các mô hình cao cấp, mà còn tạo cơ hội cho OpenAI, nếu có thể ra mắt GPT-5.6 trước khi Anthropic giải quyết vấn đề xuất khẩu, để lấp đầy khoảng trống đó.

Trong khi đó, tờ Wall Street Journal đưa tin OpenAI đang xem xét giảm giá cho nhà phát triển và doanh nghiệp, nhằm chuẩn bị cho đợt IPO kép sắp tới. Cạnh tranh ngày càng gay gắt, chiến tranh giá cả có thể bùng nổ, và thời điểm ra mắt mô hình mới sẽ ảnh hưởng lớn đến câu chuyện huy động vốn của OpenAI.

Dù cộng đồng đồn đoán rầm rộ thế nào, chỉ có chính thức từ OpenAI mới xác nhận được sự tồn tại của GPT-5.6. Tuy nhiên, các nhà giao dịch trên thị trường dự đoán như Polymarket đã không muốn chờ đợi, và đến cuối tuần, giá hợp đồng dự đoán GPT-5.6 ra mắt từ ngày 22 đến 28 tháng 6 đã tăng vọt lên 89%.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim