Anthropic tung ra Claude 3.5 Haiku - Mô hình AI siêu tốc với cửa sổ ngữ cảnh khổng lồ 200.000 token

- Anthropic chính thức triển khai mô hình Claude 3.5 Haiku đến tất cả người dùng thông qua chatbot Claude trên web và ứng dụng di động

- Mô hình này trước đây chỉ giới hạn cho các nhà phát triển qua API của Anthropic từ tháng 10/2024

- Theo tổ chức Artificial Analysis, Claude 3.5 Haiku có độ trễ thấp hơn trung bình, mất 0,80 giây để nhận token đầu tiên, tốc độ đầu ra đạt 65,1 token mỗi giây

- Đặc điểm nổi bật:
  + Cửa sổ ngữ cảnh 200.000 token, vượt trội hơn GPT-4 và GPT-4o của OpenAI (128.000 token)
  + Khả năng phân tích hình ảnh và tệp đính kèm
  + Tích hợp với Claude Artifacts, thanh bên tương tác để tinh chỉnh nội dung AI
  + Có thể lập trình trò chơi Pong trong chưa đầy một phút

- Hạn chế:
  + Không hỗ trợ duyệt web
  + Không tạo được hình ảnh
  + Giới hạn tin nhắn hàng ngày với tài khoản miễn phí

- Chi phí sử dụng:
  + API: 0,80 USD/triệu token đầu vào và 4 USD/triệu token đầu ra
  + Gói Claude Pro: 20 USD/tháng, cho phép sử dụng gấp 5 lần gói miễn phí
  + Tiết kiệm chi phí qua bộ nhớ đệm (giảm 90%) và Message Batches API (giảm 50%)

- Hiệu suất:
  + Đạt 40,6% điểm trong bài kiểm tra SWE-bench Verified
  + Vượt trội nhiều mô hình lớn hơn trong các tác vụ yêu cầu tốc độ và trí thông minh

📌 Claude 3.5 Haiku là mô hình AI tạo sinh nhanh nhất của Anthropic với cửa sổ ngữ cảnh 200.000 token, chi phí từ 0,80 USD/triệu token đầu vào. Mô hình này vượt trội trong xử lý dữ liệu lớn, phân tích tài liệu tài chính và tạo nội dung từ thông tin ngữ cảnh dài.

https://venturebeat.com/ai/claude-3-5-haiku-chatbot-now-generally-available

 

Anthropic Chính Thức Phát Hành Claude 3.5 Haiku: Nhanh Hơn, Linh Hoạt Hơn

Tác giả: Carl Franzen | Ngày 12 tháng 12, 2024

Anthropic vừa chính thức triển khai mô hình Claude 3.5 Haiku đến mọi người dùng thông qua chatbot Claude trên web và ứng dụng di động. Trước đây, mô hình này chỉ giới hạn cho các nhà phát triển sử dụng qua API kể từ khi ra mắt vào tháng 10 năm 2024.

Claude 3.5 Haiku thu hút sự chú ý nhờ khả năng vượt trội so với các mô hình lớn hơn trên các tiêu chuẩn quan trọng, trong khi vẫn duy trì mức giá cạnh tranh. Đây là mô hình nhanh nhất và hiệu quả nhất trong danh mục sản phẩm của Anthropic, phù hợp cho các tác vụ thời gian thực như xử lý tập dữ liệu lớn, phân tích tài liệu tài chính, và tạo kết quả từ các ngữ cảnh dài.


Hiệu năng ấn tượng và ứng dụng thực tiễn

Khả năng mạnh mẽ

  • Cửa sổ ngữ cảnh lớn: Với dung lượng 200.000 token, Claude 3.5 Haiku có thể xử lý thông tin đầu vào dài hơn đáng kể so với GPT-4 (128.000 token).
  • Phân tích đa phương tiện: Người dùng có thể phân tích hình ảnh và tệp đính kèm, hỗ trợ tốt cho các quy trình làm việc phức tạp.
  • Tích hợp với Artifacts: Tính năng này cho phép chỉnh sửa nội dung AI theo thời gian thực và thậm chí chạy các ứng dụng hoàn chỉnh.

Ví dụ: Claude 3.5 Haiku đã tạo một phiên bản trò chơi Pong có thể chơi được chỉ trong chưa đầy một phút.


Hạn chế

  • Không hỗ trợ duyệt web hoặc tạo hình ảnh, điều mà các đối thủ như OpenAI GPT-4o và GPT-4 cung cấp.
  • Một số lỗi nhỏ vẫn còn tồn tại, chẳng hạn như thất bại trong “Bài kiểm tra Strawberry,” khi không xác định được tất cả các chữ "R" trong từ "strawberry."

Chi phí và quyền truy cập

Gói miễn phí

Claude 3.5 Haiku có thể sử dụng miễn phí trên chatbot Claude, nhưng giới hạn số lượng tin nhắn hàng ngày tùy thuộc vào lưu lượng máy chủ.

  • Người dùng miễn phí có thể gửi khoảng 10 trao đổi (20 tin nhắn vào và ra) trước khi đạt giới hạn, và hạn mức này sẽ được đặt lại mỗi ngày.

Gói Claude Pro

  • Chi phí: $20/tháng.
  • Quyền lợi:
    • Tăng gấp 5 lần mức sử dụng miễn phí.
    • Quyền truy cập ưu tiên trong giờ cao điểm.
    • Sử dụng các tính năng mới và mô hình nâng cao như Claude 3 Opus.

API Claude 3.5 Haiku

  • Chi phí: $0,80 mỗi triệu token đầu vào và $4 mỗi triệu token đầu ra.
  • Các tính năng tiết kiệm như prompt caching (giảm 90% chi phí) và Message Batches API (giảm 50% chi phí) giúp giảm chi phí đáng kể cho nhà phát triển.

Hiệu năng so sánh

Claude 3.5 Haiku đạt:

  • 40,6% trên SWE-bench Verified, một tiêu chuẩn mã hóa quan trọng, vượt qua nhiều mô hình công khai lớn hơn.
  • Tốc độ xử lý: 0,80 giây để nhận token đầu tiên và 65,1 token mỗi giây.

Mặc dù không phải nhanh nhất trên mọi tiêu chuẩn, Claude 3.5 Haiku vẫn nổi bật nhờ khả năng xử lý hiệu quả và linh hoạt với chi phí hợp lý.


Kết luận

Claude 3.5 Haiku mang đến sự kết hợp giữa khả năng phân tích mạnh mẽ, tốc độ cao, và chi phí phải chăng. Tuy nhiên, hạn chế như không hỗ trợ duyệt web hay tạo hình ảnh và giới hạn tin nhắn hàng ngày có thể là trở ngại với một số người dùng.

Dù vậy, với các tính năng như Artifacts, khả năng xử lý dữ liệu dài, và tích hợp API hiệu quả, Claude 3.5 Haiku là lựa chọn mạnh mẽ cho các tác vụ đòi hỏi tốc độ và độ chính xác. Người dùng hiện có thể trải nghiệm trực tiếp Claude 3.5 Haiku qua chatbot Claude trên web và ứng dụng di động.

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo