OpenAI ra mắt mô hình AI mới o1 với khả năng suy luận vượt trội

• OpenAI vừa ra mắt mô hình AI mới có tên o1, được phát triển nội bộ với tên mã "Strawberry". Đây là mô hình đầu tiên trong dòng mô hình "suy luận" của OpenAI, đánh dấu bước tiến quan trọng hướng tới mục tiêu phát triển trí tuệ nhân tạo giống con người.

• o1 có khả năng thực hiện các tác vụ suy luận phức tạp hơn, bao gồm giải quyết các bài toán khó và lập trình. Mô hình dành nhiều thời gian hơn để "suy nghĩ" trước khi đưa ra câu trả lời, sử dụng phương pháp "chuỗi suy luận" để xử lý các truy vấn theo từng bước, tương tự cách con người giải quyết vấn đề.

• Có 2 phiên bản: o1-preview và o1-mini (nhỏ hơn, rẻ hơn). Người dùng ChatGPT Plus và Team có thể truy cập ngay, Enterprise và Edu sẽ có quyền truy cập vào đầu tuần tới. OpenAI dự định sẽ cung cấp quyền truy cập o1-mini cho tất cả người dùng miễn phí của ChatGPT trong tương lai.

Chi phí sử dụng o1 qua API rất cao: 15 USD/1 triệu token đầu vào và 60 USD/1 triệu token đầu ra, gấp 3-4 lần so với GPT-4o. Điều này có thể gây khó khăn cho các nhà phát triển muốn tích hợp mô hình vào ứng dụng của họ.

• o1 được huấn luyện bằng phương pháp học tăng cường, sử dụng thuật toán tối ưu hóa và tập dữ liệu huấn luyện mới tập trung vào khả năng suy luận. Mô hình được "thưởng" khi đưa ra câu trả lời đúng và "phạt" khi sai, giúp nó học cách "suy nghĩ" trước khi trả lời thông qua một chuỗi suy luận riêng tư.

• Trong bài kiểm tra Olympic Toán quốc tế, o1 giải đúng 83% bài toán so với 13% của GPT-4o. Trong cuộc thi lập trình Codeforces, o1 đạt thứ hạng 89%. OpenAI cho biết phiên bản tiếp theo của mô hình này sẽ có khả năng tương đương với sinh viên tiến sĩ trong các nhiệm vụ đánh giá chuẩn về vật lý, hóa học và sinh học.

o1 có khả năng "tự kiểm chứng" bằng cách dành thời gian xem xét tất cả các khía cạnh của một câu hỏi trước khi trả lời. Điều này giúp mô hình giảm thiểu tình trạng "ảo giác" (hallucination) - tạo ra thông tin sai lệch một cách tự tin.

• Tuy nhiên, o1 vẫn còn một số hạn chế: chậm hơn (có thể mất hơn 10 giây để trả lời một số câu hội), chưa có khả năng duyệt web hay xử lý file/hình ảnh, và vẫn có thể bịa đặt thông tin trong một số trường hợp.

Giao diện của o1 được thiết kế để tạo ra ảo giác về quá trình suy nghĩ giống con người, sử dụng các cụm từ như "Tôi tò mò về", "Tôi đang suy nghĩ về" và "Để tôi xem". Tuy nhiên, OpenAI nhấn mạnh rằng mô hình không thực sự "suy nghĩ" như con người.

Các đối thủ cạnh tranh như Google DeepMind cũng đang nghiên cứu phương pháp tương tự để cải thiện độ chính xác của mô hình AI. Điều này cho thấy cuộc đua phát triển AI có khả năng suy luận đang ngày càng trở nên gay gắt.

OpenAI dự định tiếp tục phát triển các phiên bản o1 có thể suy luận trong nhiều giờ, ngày hoặc tuần để nâng cao hơn nữa khả năng này. Công ty cũng đang xem xét việc cho phép mô hình thực hiện các hành động tự chủ, hướng tới mục tiêu tạo ra các hệ thống AI có thể đưa ra quyết định và hành động thay mặt cho con người.

📌 OpenAI ra mắt mô hình AI o1 mới với khả năng suy luận vượt trội, giải được 83% bài toán Olympic Toán quốc tế và đạt thứ hạng 89% trong cuộc thi lập trình Codeforces. Tuy nhiên, chi phí sử dụng cao gấp 3-4 lần GPT-4o và vẫn còn một số hạn chế cần khắc phục. o1 đánh dấu bước tiến quan trọng trong việc phát triển AI có khả năng suy luận giống con người, mở ra tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực.

https://techcrunch.com/2024/09/12/openai-unveils-a-model-that-can-fact-check-itself/

https://www.theverge.com/2024/9/12/24242439/openai-o1-model-reasoning-strawberry-chatgpt

https://fortune.com/2024/09/12/openai-new-ai-model-strawberry-o1-chatgpt/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo