LLM nguồn mở 'thực sự' đầu tiên từ AI2 để thúc đẩy 'sự thay đổi quan trọng' trong phát triển AI
- Viện Nghiên cứu AI Allen (AI2), do đồng sáng lập Microsoft, Paul Allen, thành lập, đã giới thiệu OLMo, mô hình ngôn ngữ lớn và framework mã nguồn mở đầu tiên, như một lựa chọn thay thế cho các mô hình hiện hành hạn chế và đóng, góp phần vào sự chuyển biến quan trọng trong phát triển AI.
- OLMo không chỉ bao gồm mã mô hình và trọng số mà còn cung cấp mã đào tạo, dữ liệu đào tạo và các bộ công cụ đánh giá, phát hành dưới giấy phép được chấp nhận bởi sáng kiến mã nguồn mở (OSI) và tất cả mã, trọng số, và checkpoint trung gian được phát hành dưới Giấy phép Apache 2.0.
- Sự ra đời của OLMo diễn ra trong bối cảnh AI mã nguồn mở/khoa học mở đang đạt được tiến bộ đáng kể so với các LLM độc quyền như GPT-4 của OpenAI và Claude của Anthropic, nhưng vẫn đối mặt với chỉ trích từ một số nhà nghiên cứu và nhà hoạch định chính sách.
- Framework OLMo cung cấp một bộ công cụ phát triển AI "hoàn toàn mở" cho công chúng, bao gồm dữ liệu đào tạo đầy đủ, mã đào tạo, trọng số mô hình và đánh giá, nhằm mục đích cho phép các nhà nghiên cứu nghiên cứu khoa học của LLM một cách đầy đủ và khoa học.
- Cộng đồng AI mã nguồn mở hoan nghênh sự ra mắt của OLMo, với Jonathan Frankle từ MosaicML và Databricks mô tả sự kiện này là "Bước nhảy vọt lớn cho khoa học mở" và Yann LeCun từ Meta nhấn mạnh tầm quan trọng của mô hình nền tảng mở trong việc thúc đẩy đổi mới và phát triển trong lĩnh vực AI tạo sinh.
📌 Sự giới thiệu OLMo bởi Viện Nghiên cứu AI Allen (AI2) là một bước ngoặt quan trọng trong lĩnh vực AI, mở ra hướng đi mới cho sự phát triển AI mã nguồn mở, tạo điều kiện cho việc nghiên cứu và phát triển AI một cách minh bạch và toàn diện. Với việc cung cấp không chỉ mã mô hình và trọng số mà còn bao gồm mã đào tạo, dữ liệu đào tạo và bộ công cụ đánh giá, đánh dấu sự khác biệt so với các mô hình đóng như GPT-4 của OpenAI và Claude của Anthropic. OLMo mở ra cơ hội cho các nhà nghiên cứu nghiên cứu khoa học của LLM một cách đầy đủ và khoa học, hướng tới mục tiêu tạo ra thế hệ AI tiếp theo an toàn và đáng tin cậy.