Tại sao không thể chỉ có một mô hình AI duy nhất thống trị thị trường?

• Tốc độ ra mắt các mô hình AI mới đang tăng chóng mặt khi bước vào năm 2025, với những công bố liên tục về các tiêu chuẩn và điểm chuẩn mới

Từ 18 tháng trước, đa số doanh nghiệp chỉ sử dụng một mô hình AI duy nhất. Hiện nay, xu hướng đã đảo ngược hoàn toàn

• Các công ty đang né tránh phụ thuộc vào một nhà cung cấp duy nhất vì AI đã trở thành công nghệ cốt lõi trong chiến lược dài hạn

• Nhiều nhà cung cấp mô hình vẫn cho rằng AI sẽ là thị trường "người thắng độc tôn", dẫn đến cuộc đua GPU với số lượng tham số huấn luyện tăng theo cấp số nhân

Mô hình ngôn ngữ đang trở thành hàng hóa theo 2 khía cạnh:
  - Các mô hình ngày càng có thể thay thế lẫn nhau
  - Chuyên môn nghiên cứu để tạo ra mô hình đang phân tán và dễ tiếp cận hơn

• Tuy nhiên, sự "hàng hóa hóa" diễn ra không đồng đều:
  - Các khả năng cốt lõi có thể thay thế từ GPT-4 đến Mistral Small
  - Ở các trường hợp biên, mô hình có xu hướng chuyên môn hóa (code, lập luận, toán học)

• Deepseek-V2.5 mạnh hơn GPT-4 trong lập trình C# dù nhỏ hơn và rẻ hơn 50 lần

Định tuyến đóng vai trò quan trọng - giúp chuyển truy vấn đến mô hình phù hợp nhất, tận dụng mô hình rẻ hơn khi có thể

Các mô hình hàng đầu thế giới đều là bộ định tuyến, sử dụng kiến trúc Mixture of Expert để định tuyến cho các mô hình con chuyên biệt

📌 Thị trường AI sẽ không bị thống trị bởi một mô hình duy nhất mà phát triển theo hướng đa dạng và chuyên môn hóa. Deepseek-V2.5 là ví dụ điển hình khi mạnh hơn GPT-4 trong lập trình C# dù nhỏ hơn và rẻ hơn 50 lần. Sự phân mảnh này tạo ra thị trường hiệu quả, thúc đẩy đổi mới và giảm thiểu chi phí.

 

https://venturebeat.com/ai/despite-heated-ai-arms-race-were-in-for-a-multi-modal-future/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo