OpenAI ChatGPT 2024-09-13 05:57:51

OpenAI ra mắt mô hình AI mới o1 với khả năng suy luận vượt trội

• OpenAI vừa ra mắt mô hình AI mới có tên o1, được phát triển nội bộ với tên mã "Strawberry". Đây là mô hình đầu tiên trong dòng mô hình "suy luận" của OpenAI, đánh dấu bước tiến quan trọng hướng tới mục tiêu phát triển trí tuệ nhân tạo giống con người.

• o1 có khả năng thực hiện các tác vụ suy luận phức tạp hơn, bao gồm giải quyết các bài toán khó và lập trình. Mô hình dành nhiều thời gian hơn để "suy nghĩ" trước khi đưa ra câu trả lời, sử dụng phương pháp "chuỗi suy luận" để xử lý các truy vấn theo từng bước, tương tự cách con người giải quyết vấn đề.

• Có 2 phiên bản: o1-preview và o1-mini (nhỏ hơn, rẻ hơn). Người dùng ChatGPT Plus và Team có thể truy cập ngay, Enterprise và Edu sẽ có quyền truy cập vào đầu tuần tới. OpenAI dự định sẽ cung cấp quyền truy cập o1-mini cho tất cả người dùng miễn phí của ChatGPT trong tương lai.

• Chi phí sử dụng o1 qua API rất cao: 15 USD/1 triệu token đầu vào và 60 USD/1 triệu token đầu ra, gấp 3-4 lần so với GPT-4o. Điều này có thể gây khó khăn cho các nhà phát triển muốn tích hợp mô hình vào ứng dụng của họ.

• o1 được huấn luyện bằng phương pháp học tăng cường, sử dụng thuật toán tối ưu hóa và tập dữ liệu huấn luyện mới tập trung vào khả năng suy luận. Mô hình được "thưởng" khi đưa ra câu trả lời đúng và "phạt" khi sai, giúp nó học cách "suy nghĩ" trước khi trả lời thông qua một chuỗi suy luận riêng tư.

• Trong bài kiểm tra Olympic Toán quốc tế, o1 giải đúng 83% bài toán so với 13% của GPT-4o. Trong cuộc thi lập trình Codeforces, o1 đạt thứ hạng 89%. OpenAI cho biết phiên bản tiếp theo của mô hình này sẽ có khả năng tương đương với sinh viên tiến sĩ trong các nhiệm vụ đánh giá chuẩn về vật lý, hóa học và sinh học.

• o1 có khả năng "tự kiểm chứng" bằng cách dành thời gian xem xét tất cả các khía cạnh của một câu hỏi trước khi trả lời. Điều này giúp mô hình giảm thiểu tình trạng "ảo giác" (hallucination) - tạo ra thông tin sai lệch một cách tự tin.

• Tuy nhiên, o1 vẫn còn một số hạn chế: chậm hơn (có thể mất hơn 10 giây để trả lời một số câu hội), chưa có khả năng duyệt web hay xử lý file/hình ảnh, và vẫn có thể bịa đặt thông tin trong một số trường hợp.

• Giao diện của o1 được thiết kế để tạo ra ảo giác về quá trình suy nghĩ giống con người, sử dụng các cụm từ như "Tôi tò mò về", "Tôi đang suy nghĩ về" và "Để tôi xem". Tuy nhiên, OpenAI nhấn mạnh rằng mô hình không thực sự "suy nghĩ" như con người.

• Các đối thủ cạnh tranh như Google DeepMind cũng đang nghiên cứu phương pháp tương tự để cải thiện độ chính xác của mô hình AI. Điều này cho thấy cuộc đua phát triển AI có khả năng suy luận đang ngày càng trở nên gay gắt.

• OpenAI dự định tiếp tục phát triển các phiên bản o1 có thể suy luận trong nhiều giờ, ngày hoặc tuần để nâng cao hơn nữa khả năng này. Công ty cũng đang xem xét việc cho phép mô hình thực hiện các hành động tự chủ, hướng tới mục tiêu tạo ra các hệ thống AI có thể đưa ra quyết định và hành động thay mặt cho con người.

📌 OpenAI ra mắt mô hình AI o1 mới với khả năng suy luận vượt trội, giải được 83% bài toán Olympic Toán quốc tế và đạt thứ hạng 89% trong cuộc thi lập trình Codeforces. Tuy nhiên, chi phí sử dụng cao gấp 3-4 lần GPT-4o và vẫn còn một số hạn chế cần khắc phục. o1 đánh dấu bước tiến quan trọng trong việc phát triển AI có khả năng suy luận giống con người, mở ra tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực.

https://techcrunch.com/2024/09/12/openai-unveils-a-model-that-can-fact-check-itself/

https://www.theverge.com/2024/9/12/24242439/openai-o1-model-reasoning-strawberry-chatgpt

https://fortune.com/2024/09/12/openai-new-ai-model-strawberry-o1-chatgpt/

Không có file đính kèm.

Nguồn tham khảo

154

Thảo luận

12,345 Fans 12,345 Followers 12,345 Subscribers

Tin phổ biến

AI coding assistant

Cursor AI - IDE thay thế VS Code với trợ lý AI tích hợp

AI giáo dục

UNESCO ra mắt 2 khung năng lực AI mới cho học sinh và giáo viên

AI giáo dục

Khung năng lực AI cho giáo viên của UNESCO

AI so sánh

OpenAI hay tự xây dựng: so sánh chi phí thực tế của việc tự lưu trữ các mô hình ngôn ngữ lớn

Apple joins AI fray with release of model framework

The AI skills gap is becoming incredibly troubling for companies everywhere

AI doanh nghiệp

10 use-case hàng đầu của AI trong kinh doanh

AI so sánh

Phân tích chuyên sâu về RAG, AI Agents và Agentic RAG

AI kiến thức-khóa học

Hướng dẫn toàn diện về lập trình AI với Cursor cho người mới bắt đầu

The AI Frenzy, Fed Meets, Hunter Biden: Your Sunday US Briefing

TAG

AI giáo dục AI sinh-y-duoc AI nghệ thuật AI pháp lý-quản trị-chủ quyền AI models AI xã hội AI prompts AI kiến thức-khóa học AI công nghiệp-lĩnh vực AI edge AI viễn thông AI tools AI chính phủ AI cybersecurity AI so sánh AI đạo đức AI tips AI market AI quân sự AI an toàn-an ninh-techwar AI việc làm AI doanh nghiệp OpenAI ChatGPT AI môi trường-năng lượng AI skill-talent AI & công nghệ khác AI nghiên cứu AI chips-hardware-compute AI vs con người AI coding assistant AI mở-nguồn mở AI năng suất AI startup-M&A AI tương lai AI báo chí AI data AI bản quyền AI PC AI riêng tư AI deepfake-ảo giác-ANTT AI ảnh-video-music-âm thanh AI minh bạch AI nhỏ AI nông nghiệp-thực phẩm AI ngân hàng-tài chính AI giao thông AI smartphone AI robotics-auto-agents AI consumer devices AI manufacturing AI benchmark Telecom AI thành công-thất bại Digital Semi-Cloud-DC-Green HTS STI FAQ

SongAI

Tin nóng

OpenAI ra mắt mô hình AI mới o1 với khả năng suy luận vượt trội

Thảo luận

Follow Us

Tin phổ biến

TAG