Tìm hiểu chi tiết về OpenAI o3 và o4-mini

  • OpenAI đã ra mắt o3 và o4-mini ngày 16.04.2025, là các thế hệ mới thuộc dòng mô hình suy luận (reasoning model), phát triển từ o1 (công bố 12.09.2024).

  • o3 gồm 2 biến thể: o3 (chuẩn) và o3-mini (tối ưu hiệu năng và chi phí, gồm mini-low, mini-medium, mini-high – phân biệt theo cấp độ suy luận).

  • o4-mini cũng gồm 2 biến thể: o4-mini (chuẩn) và o4-mini-high (cấp độ suy luận cao nhất, giải quyết vấn đề phức tạp hơn).

  • Khác biệt chính với các AI tạo sinh trước đó: o3, o4-mini sử dụng simulated reasoning – cho phép mô hình “dừng lại để tự phản tư” giúp tư duy sâu, phân tích ngữ cảnh, giải quyết các bài toán khó hơn.

  • Đột phá lớn về an toàn: công nghệ deliberative alignment, cho phép mô hình tự phân tích, đánh giá mức độ an toàn nội dung dựa trên chính sách và thông số kỹ thuật an toàn, giảm sai sót khi từ chối nội dung hợp lệ và nhận diện ý đồ ẩn.

  • Tư duy hình ảnh (visual reasoning): không chỉ “nhìn” ảnh mà còn trực tiếp thao tác, phân tích, chỉnh sửa (xoay, zoom, cắt, kết hợp) để giải các bài toán đa phương thức (multimodal) như đọc biểu đồ, xử lý bản vẽ tay.

  • Khả năng tự kiểm chứng thông tin giúp hạn chế ảo giác (hallucination).

  • Tích hợp khả năng dùng tool trực tiếp trong chế độ Agent (web browse, chạy code Python, thao tác file, tạo ảnh), chọn chiến lược dùng tool tự động để giải quyết vấn đề nhiều bước.

  • Điểm benchmark vượt trội: o3 đạt 88,9% trên kỳ thi toán AIME 2025, o4-mini đạt 92,7%. Khả năng lập trình: o3 đạt 69,1% (SWE-bench Verified), o4-mini đạt 68,1%. Trả lời câu hỏi khoa học Ph.D. (GPQA Diamond): o3 đạt 83,3%, o4-mini 81,4%.

  • Người dùng ChatGPT Plus/Pro/Team được dùng cả o3 và o4-mini (thay cho o1, o3-mini). ChatGPT Free dùng o4-mini qua lựa chọn ‘Think’. API có giá o3: 10 USD/1.000.000 token đầu vào, 40 USD/1.000.000 token đầu ra; o4-mini: 1,10 USD (input), 4,40 USD (output).

  • Không tồn tại o2 vì lý do bản quyền (O2 là tên hãng viễn thông ở Anh).

📌 OpenAI o3 và o4-mini thể hiện bước tiến vượt bậc về suy luận (simulated reasoning), an toàn (deliberative alignment), tư duy hình ảnh, và tích hợp tool Agent. Điểm toán AIME đến 92,7%, lập trình 68%. Dự kiến thay đổi lớn trong ứng dụng AI tạo sinh thế hệ mới.

 

https://www.techtarget.com/whatis/feature/OpenAI-o3-explained-Everything-you-need-to-know

Không có file đính kèm.

14

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo