• OpenAI vừa ra mắt dòng mô hình AI mới - OpenAI o1, với khả năng suy luận vượt trội so với các phiên bản trước.
• Điểm nổi bật của o1 là được thiết kế để dành nhiều thời gian suy nghĩ hơn trước khi đưa ra phản hồi, khắc phục hạn chế về khả năng suy luận và nhận thức ngữ cảnh của các mô hình cũ như GPT-4o.
• o1 có thể thực hiện các tác vụ phức tạp và giải quyết các vấn đề khó hơn trong khoa học, lập trình và toán học.
• Gia đình mô hình o1 bao gồm o1 preview với kiến thức rộng và khả năng suy luận cao, và o1-mini nhỏ gọn hơn, nhanh và tiết kiệm chi phí hơn.
• Về hiệu năng, o1 đạt điểm cao ở mức 89% trong các câu hỏi lập trình cạnh tranh và vượt qua độ chính xác của con người ở trình độ tiến sĩ trong các bài kiểm tra vật lý, sinh học và hóa học.
• o1 có ngữ cảnh 128K và thời điểm dừng kiến thức là tháng 10/2023.
• Hiện o1 preview có sẵn trên ChatGPT Plus và API cho nhà phát triển ở cấp độ 5. Trên ChatGPT, o1 preview giới hạn 30 tin nhắn/tuần và o1 mini 50 tin nhắn/tuần.
• Về giá, o1 đắt hơn đáng kể so với GPT-4o:
- o1: $15/1 triệu token đầu vào, $60/1 triệu token đầu ra
- o1-mini: $3/1 triệu token đầu vào, $12/1 triệu token đầu ra
- GPT-4o: $2,5/1 triệu token đầu vào, $10/1 triệu token đầu ra
• So với GPT-4o, o1 cho kết quả vượt trội trong các bài kiểm tra suy luận phức tạp. Ví dụ trong kỳ thi Olympic Toán quốc tế, o1 đạt 83% điểm trong khi GPT-4o chỉ đạt 13%.
• o1 cũng đạt điểm cao hơn trong các bài kiểm tra an toàn, cho thấy khả năng tuân thủ các quy tắc an toàn tốt hơn.
• So với Claude 3.5 Sonnet, o1 có khả năng suy luận tốt hơn nhưng ngữ cảnh thấp hơn (128K so với 500K của Claude for Enterprise).
• OpenAI dự kiến sẽ bổ sung thêm các tính năng như duyệt web, tải file và hình ảnh để o1 hữu ích hơn với mọi người dùng.
📌 OpenAI o1 đánh dấu bước tiến quan trọng trong phát triển AI với khả năng suy luận vượt trội, đặc biệt trong giải quyết vấn đề phức tạp. Tuy nhiên, với mức giá cao gấp 6 lần GPT-4o, người dùng cần cân nhắc kỹ để chọn mô hình phù hợp nhất với nhu cầu sử dụng cụ thể của mình.
https://blog.getbind.co/2024/09/13/openai-o1-vs-gpt-4o-is-it-worth-paying-6x-more/