Sam Altman: OpenAI sắp tung mô hình AI trọng số mở đối đầu trực tiếp với DeepSeek và Meta

  • Sam Altman đã tiết lộ trên nền tảng X rằng OpenAI sẽ phát hành một mô hình ngôn ngữ trọng số mở mạnh mẽ với khả năng lập luận trong những tháng tới.

  • Altman cho biết công ty đã cân nhắc việc phát hành mô hình trọng số mở từ lâu, và "giờ đây cảm thấy điều này quan trọng cần thực hiện".

  • Động thái này một phần là phản ứng trước thành công vang dội của mô hình R1 từ công ty Trung Quốc DeepSeek, cũng như sự phổ biến của các mô hình Llama của Meta.

  • OpenAI có thể cảm thấy cần chứng minh khả năng huấn luyện mô hình mới với chi phí thấp hơn, khi mô hình của DeepSeek được cho là đã được huấn luyện với chi phí chỉ bằng một phần nhỏ so với hầu hết các mô hình AI lớn khác.

  • Clement Delangue, đồng sáng lập và CEO của HuggingFace - công ty chuyên về lưu trữ các mô hình AI mở, nhận xét: "Đây là tin tuyệt vời. Với DeepSeek, mọi người đang nhận ra sức mạnh của trọng số mở."

  • Hiện tại, OpenAI cung cấp AI thông qua chatbot và đám mây. Các mô hình trọng số mở như R1, Llama có thể được tải xuống miễn phí và chỉnh sửa.

  • "Trọng số" của mô hình đề cập đến các giá trị bên trong mạng nơ-ron lớn được thiết lập trong quá trình huấn luyện. Các mô hình trọng số mở có chi phí sử dụng thấp hơn và có thể được điều chỉnh cho các trường hợp nhạy cảm, như xử lý thông tin tuyệt mật.

  • Steven Heidel, thành viên đội ngũ kỹ thuật tại OpenAI, đã chia sẻ lại thông báo của Altman và bổ sung: "Chúng tôi sẽ phát hành một mô hình năm nay mà bạn có thể chạy trên phần cứng của riêng mình."

  • OpenAI cũng đã đăng một trang web mời các nhà phát triển đăng ký truy cập sớm vào mô hình sắp tới. Altman cho biết công ty sẽ tổ chức các sự kiện cho nhà phát triển với các nguyên mẫu ban đầu của mô hình mới trong những tuần tới.

  • Meta là công ty AI lớn đầu tiên theo đuổi cách tiếp cận mở hơn, phát hành phiên bản đầu tiên của Llama vào tháng 7/2023. Hiện có ngày càng nhiều mô hình AI trọng số mở.

  • Một số nhà nghiên cứu lưu ý rằng Llama và một số mô hình khác không minh bạch như có thể vì dữ liệu huấn luyện và các chi tiết khác vẫn được giữ bí mật. Meta cũng áp đặt giấy phép giới hạn khả năng kiếm lợi nhuận từ các ứng dụng và công cụ được xây dựng bằng Llama.

📌 OpenAI sẽ phát hành mô hình AI trọng số mở vào mùa hè 2025, đáp ứng thành công của DeepSeek và áp lực từ Meta. Mô hình này sẽ cho phép người dùng chạy trên phần cứng riêng, mang lại chi phí thấp hơn và khả năng tùy chỉnh cho các ứng dụng nhạy cảm.

 

https://www.wired.com/story/openai-sam-altman-announce-open-source-model/

 

Sam Altman nói OpenAI sẽ phát hành mô hình AI "Open Weight" vào mùa hè này

Thông tin này được đưa ra sau thành công vang dội của DeepSeek và áp lực ngày càng tăng từ các đối thủ như Meta.

Sam Altman hôm nay tiết lộ rằng OpenAI sẽ phát hành một mô hình trí tuệ nhân tạo open weight trong những tháng tới.

"Chúng tôi rất vui mừng được phát hành một mô hình ngôn ngữ open-weight mạnh mẽ với khả năng lập luận trong những tháng tới," Altman viết trên X.

Altman cho biết trong bài đăng rằng công ty đã suy nghĩ về việc phát hành một mô hình open weight từ lâu, đồng thời bổ sung rằng "giờ đây việc này cảm thấy quan trọng phải làm."

Động thái này một phần là phản ứng với thành công vang dội của mô hình R1 từ công ty Trung Quốc DeepSeek, cũng như sự phổ biến của các mô hình Llama của Meta.

OpenAI cũng có thể cảm thấy cần phải chứng tỏ rằng họ có thể đào tạo mô hình mới với chi phí thấp hơn, vì mô hình của DeepSeek được cho là đã được đào tạo với chi phí chỉ bằng một phần nhỏ so với hầu hết các mô hình AI lớn.

"Đây là tin tuyệt vời," Clement Delangue, đồng sáng lập và CEO của HuggingFace, một công ty chuyên về lưu trữ các mô hình AI mở, nói với WIRED. "Với DeepSeek, mọi người đang nhận ra sức mạnh của open weights."

OpenAI hiện cung cấp AI của mình thông qua một chatbot và thông qua đám mây. R1, Llama và các mô hình open weight khác có thể được tải xuống miễn phí và sửa đổi. Weights của một mô hình đề cập đến các giá trị bên trong một mạng nơ-ron lớn—thứ được thiết lập trong quá trình đào tạo. Các mô hình open weight rẻ hơn để sử dụng và cũng có thể được điều chỉnh cho các trường hợp sử dụng nhạy cảm, như xử lý thông tin có độ bảo mật cao.

Steven Heidel, một thành viên của đội ngũ kỹ thuật tại OpenAI, đã đăng lại thông báo của Altman và bổ sung rằng "chúng tôi đang phát hành một mô hình trong năm nay mà bạn có thể chạy trên phần cứng của riêng mình."

Hôm nay OpenAI cũng đăng một trang web mời các nhà phát triển đăng ký truy cập sớm vào mô hình sắp tới. Altman cho biết trong bài đăng của mình rằng công ty sẽ tổ chức các sự kiện cho các nhà phát triển với các nguyên mẫu ban đầu của mô hình mới trong những tuần tới.

Meta là công ty AI lớn đầu tiên theo đuổi một cách tiếp cận mở hơn, phát hành phiên bản đầu tiên của Llama vào tháng 7 năm 2023. Ngày càng có nhiều mô hình AI open weight hiện có sẵn. Một số nhà nghiên cứu lưu ý rằng Llama và một số mô hình khác không minh bạch như chúng có thể bởi vì dữ liệu đào tạo và các chi tiết khác vẫn được giữ bí mật. Meta cũng áp đặt một giấy phép giới hạn khả năng của các công ty khác trong việc kiếm lợi từ ứng dụng và công cụ được xây dựng bằng Llama.

Cập nhật 31/3/25 4:21 EST: Bài viết này đã được cập nhật với bình luận từ Clement Delangue, đồng sáng lập và CEO của HuggingFace.

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo