• HyperWrite, công ty khởi nghiệp AI do Matt Shumer đồng sáng lập, vừa công bố Reflection 70B - mô hình ngôn ngữ lớn (LLM) mới dựa trên Llama 3.1-70B Instruct nguồn mở của Meta.
• Reflection 70B nổi bật với kỹ thuật tự sửa lỗi mới và hiệu suất vượt trội trong các bài kiểm tra của bên thứ ba như MMLU và HumanEval.
• Mô hình sử dụng kỹ thuật "reflection tuning", cho phép nó phát hiện lỗi trong lập luận của chính mình và sửa chữa trước khi đưa ra phản hồi cuối cùng.
• Reflection 70B giới thiệu các token đặc biệt mới để lập luận và sửa lỗi, giúp tương tác với mô hình dễ dàng hơn theo cách có cấu trúc.
• Mô hình đặc biệt hữu ích cho các tác vụ đòi hỏi độ chính xác cao, vì nó tách quá trình lập luận thành các bước riêng biệt để cải thiện độ chính xác.
• Reflection 70B hiện có sẵn để tải xuống qua kho lưu trữ mã AI Hugging Face, và quyền truy cập API sẽ được cung cấp thông qua nhà cung cấp dịch vụ GPU Hyperbolic Labs.
• HyperWrite đang phát triển Reflection 405B, một mô hình lớn hơn và mạnh mẽ hơn, dự kiến ra mắt vào tuần tới và có thể vượt trội so với các mô hình nguồn đóng hàng đầu hiện nay.
• Glaive, một startup chuyên tạo bộ dữ liệu cho các trường hợp sử dụng cụ thể, đã đóng góp quan trọng vào thành công của Reflection 70B bằng cách tạo dữ liệu tổng hợp.
• Quá trình đào tạo Reflection 70B mất tổng cộng 3 tuần, với 5 lần lặp lại mô hình và sử dụng bộ dữ liệu hoàn toàn tùy chỉnh được xây dựng bằng hệ thống tạo dữ liệu tổng hợp của Glaive.
• HyperWrite, trước đây có tên là Otherside AI, được thành lập vào năm 2020 bởi Matt Shumer và Jason Kuperberg. Công ty đã huy động được 2,8 triệu USD trong vòng gọi vốn gần đây nhất vào tháng 3/2023.
• Sản phẩm chính của HyperWrite là một trợ lý viết AI có hơn 2 triệu người dùng tính đến tháng 11/2023.
• Việc phát hành Reflection 70B đánh dấu một cột mốc quan trọng cho AI nguồn mở, cung cấp cho các nhà phát triển và nhà nghiên cứu một công cụ mạnh mẽ có khả năng cạnh tranh với các mô hình độc quyền.
📌 Reflection 70B, mô hình AI nguồn mở mới từ HyperWrite, vượt trội so với các đối thủ trong nhiều bài kiểm tra. Với khả năng tự sửa lỗi độc đáo, nó hứa hẹn thay đổi cục diện AI nguồn mở. Mô hình lớn hơn, Reflection 405B, sắp ra mắt có thể vượt qua cả GPT-4.
https://venturebeat.com/ai/meet-the-new-most-powerful-open-source-ai-model-in-the-world-hyperwrites-reflection-70b/