- Cuộc đua AI đang nóng lên khi số lượng và chất lượng các mô hình AI Trung Quốc đang tăng lên, thách thức vị trí dẫn đầu của Mỹ, đồng thời khoảng cách hiệu suất giữa các mô hình hàng đầu đang thu hẹp.
- Theo bảng xếp hạng Chatbot Arena, mô hình xếp hạng cao nhất chỉ vượt trội hơn 5% so với mô hình xếp hạng thứ 10 vào đầu năm 2025, giảm từ mức 12% vào đầu năm 2024.
- Báo cáo chỉ số AI tạo sinh 2025 được công bố bởi Viện AI lấy con người làm trung tâm tại Đại học Stanford, California.
- Các mô hình AI tạo sinh vẫn đang phát triển lớn hơn về số lượng biến ra quyết định, sức mạnh tính toán và dữ liệu huấn luyện. Tuy nhiên, các nhà phát triển cũng đang chứng minh rằng các mô hình nhỏ gọn hơn có thể đạt hiệu suất tương đương.
- Nhờ thuật toán tốt hơn, một mô hình hiện đại có thể đạt hiệu suất tương đương với mô hình lớn gấp 100 lần cách đây 2 năm.
- Ngành công nghiệp hiện sản xuất gần 90% các mô hình AI đáng chú ý vào năm 2024, tăng từ mức dưới 20% trước năm 2006, đánh dấu sự đảo ngược so với thời kỳ đầu khi học viện là chủ đạo.
- Mỹ vẫn là nhà sản xuất hàng đầu với 40 mô hình đáng chú ý vào năm 2024, so với 15 của Trung Quốc và 3 của châu Âu.
- Lợi thế của Mỹ về chất lượng mô hình đã biến mất. Năm 2023, các mô hình hàng đầu của Trung Quốc kém hơn mô hình hàng đầu của Mỹ gần 20 điểm phần trăm trong bài kiểm tra MMLU, nhưng đến cuối năm 2024, khoảng cách này đã giảm xuống chỉ còn 0,3 điểm phần trăm.
- Có sự gia tăng đáng ngạc nhiên về số lượng và hiệu suất của các mô hình "trọng số mở" như DeepSeek và LLaMa của Facebook. Khoảng cách hiệu suất giữa các hệ thống đóng và mở đã giảm từ 8% đầu năm 2024 xuống chỉ còn 1,7% đầu năm 2025.
- Năng lượng sử dụng để huấn luyện một mô hình AI hàng đầu hiện đang tăng gấp đôi hàng năm; tài nguyên tính toán tăng gấp đôi mỗi 5 tháng; và bộ dữ liệu huấn luyện tăng gấp đôi kích thước mỗi 8 tháng.
- Mô hình nhỏ nhất đạt điểm trên 60% trong bài kiểm tra MMLU năm 2022 sử dụng 540 tỷ tham số, nhưng đến năm 2024, một mô hình đạt cùng điểm số chỉ với 3,8 tỷ tham số.
- Chi phí để đạt điểm trên 60% trong MMLU đã giảm từ khoảng 20 USD/triệu token vào tháng 11/2022 xuống còn 7 cent/triệu token vào tháng 10/2024.
- Hiệu quả năng lượng của phần cứng AI cải thiện khoảng 40% hàng năm.
- Mặc dù có những cải tiến đáng kể, AI tạo sinh vẫn gặp vấn đề như thiên kiến ngầm và xu hướng "ảo giác" - tạo ra thông tin sai lệch.
📌 Cuộc đua AI 2025 đang diễn ra khốc liệt với khoảng cách hiệu suất giữa các mô hình hàng đầu thu hẹp còn 5%. Trung Quốc đã bắt kịp Mỹ, chỉ còn kém 0,3 điểm phần trăm. Năm 2024 chứng kiến sự đột phá của các mô hình nhỏ, với chi phí giảm từ 20 USD xuống chỉ còn 7 cent/triệu token.
https://www.nature.com/articles/d41586-025-01033-y
#NATURE
07 Tháng 4 năm 2025
Báo cáo tình hình ngành cũng cho thấy năm 2024 là năm đột phá cho các mô hình nhỏ gọn cạnh tranh với những "gã khổng lồ".
Tác giả: Nicola Jones
Cuộc đua trí tuệ nhân tạo (AI) đang nóng lên: số lượng và chất lượng các mô hình AI hiệu năng cao của Trung Quốc đang tăng lên thách thức vị trí dẫn đầu của Mỹ, và khoảng cách hiệu suất giữa các mô hình hàng đầu đang thu hẹp, theo báo cáo tình hình ngành thường niên.
Báo cáo nhấn mạnh rằng khi AI tiếp tục cải thiện nhanh chóng, không công ty nào đang vượt lên trước. Trên Bảng xếp hạng Chatbot Arena, nơi người dùng bình chọn về hiệu suất của các chatbot khác nhau, mô hình xếp hạng cao nhất đạt điểm cao hơn khoảng 12% so với mô hình xếp hạng thứ mười vào đầu năm 2024, nhưng chỉ cao hơn 5% vào đầu năm 2025 (xem 'Tất cả cùng nhau'). "Đường biên giới ngày càng cạnh tranh — và ngày càng đông đúc," báo cáo cho biết.
Báo cáo Chỉ số Trí tuệ Nhân tạo 2025 được công bố hôm nay bởi Viện AI Lấy Con người làm Trung tâm tại Đại học Stanford ở California.
Tất cả cùng nhau. Biểu đồ đường thể hiện điểm số Chatbot Arena của Google, OpenAI, DeepSeek, xAI, Anthropic, Meta và Mistral AI từ tháng 1 năm 2024. Các mô hình AI hàng đầu thế giới đang hội tụ về hiệu suất, được đo lường bằng điểm số ưa thích của con người đối với câu trả lời từ chatbot của các nhà cung cấp khác nhau. Nguồn: Báo cáo Chỉ số AI 2025
Chỉ số cho thấy các mô hình AI tạo sinh nổi bật, trung bình, vẫn đang phát triển lớn hơn, bằng cách sử dụng nhiều biến ra quyết định hơn, nhiều sức mạnh tính toán hơn và các bộ dữ liệu huấn luyện lớn hơn. Nhưng các nhà phát triển cũng đang chứng minh rằng các mô hình nhỏ hơn, gọn hơn có khả năng làm được những điều tuyệt vời. Nhờ vào các thuật toán tốt hơn, một mô hình hiện đại hiện có thể đạt được hiệu suất tương đương với một mô hình lớn hơn 100 lần cách đây hai năm. "Năm 2024 là năm đột phá cho các mô hình AI nhỏ hơn," chỉ số cho biết.
Bart Selman, nhà khoa học máy tính tại Đại học Cornell ở Ithaca, New York, người không tham gia viết báo cáo Chỉ số, nói rằng thật tốt khi thấy những nỗ lực tương đối nhỏ, chi phí thấp như DeepSeek của Trung Quốc chứng minh họ có thể cạnh tranh được. "Tôi dự đoán chúng ta sẽ thấy một số đội nhóm cá nhân với năm người, hai người, nghĩ ra một số ý tưởng thuật toán mới sẽ làm thay đổi tình hình," ông nói. "Điều đó tốt. Chúng ta không muốn thế giới chỉ được điều hành bởi một số công ty lớn."
Báo cáo cho thấy phần lớn các mô hình AI nổi bật hiện nay được phát triển bởi ngành công nghiệp hơn là học thuật: một sự đảo ngược của tình hình vào đầu những năm 2000, khi mạng lưới neural và AI tạo sinh chưa phát triển. Ngành công nghiệp sản xuất dưới 20% mô hình AI nổi bật trước năm 2006, nhưng 60% trong năm 2023 và gần 90% trong năm 2024, báo cáo cho biết.
Hoa Kỳ tiếp tục là nhà sản xuất hàng đầu các mô hình nổi bật, phát hành 40 mô hình trong năm 2024, so với 15 của Trung Quốc và 3 của châu Âu. Nhưng nhiều khu vực khác đang tham gia cuộc đua, bao gồm Trung Đông, Mỹ Latinh và Đông Nam Á.
Và vị trí dẫn đầu trước đây của Mỹ về chất lượng mô hình đã biến mất, báo cáo bổ sung. Trung Quốc, nơi sản xuất nhiều ấn phẩm và bằng sáng chế AI nhất, hiện đang phát triển các mô hình phù hợp với sự cạnh tranh của Mỹ về hiệu suất. Trong năm 2023, các mô hình hàng đầu của Trung Quốc tụt hậu so với mô hình hàng đầu của Mỹ gần 20 điểm phần trăm trong bài kiểm tra Hiểu biết Ngôn ngữ Đa nhiệm vụ Quy mô lớn (MMLU), một chuẩn phổ biến cho các mô hình ngôn ngữ lớn. Tuy nhiên, tính đến cuối năm 2024, sự dẫn đầu của Mỹ đã giảm xuống còn 0.3 điểm phần trăm.
"Khoảng năm 2015, Trung Quốc đã đặt mình vào con đường trở thành một nhân tố hàng đầu trong AI, và họ đã làm điều đó thông qua đầu tư vào giáo dục," Selman nói. "Chúng ta đang thấy điều đó bắt đầu được đền đáp."
Lĩnh vực này cũng chứng kiến sự gia tăng đáng ngạc nhiên về số lượng và hiệu suất của các mô hình 'trọng số mở' như DeepSeek và LLaMa của Facebook. Người dùng có thể tự do xem các tham số mà các mô hình này học được trong quá trình đào tạo và sử dụng để đưa ra dự đoán, mặc dù các chi tiết khác, chẳng hạn như mã đào tạo, có thể vẫn được giữ bí mật. Ban đầu, các hệ thống đóng, trong đó không có yếu tố nào trong số này được tiết lộ, vượt trội hơn đáng kể, nhưng khoảng cách hiệu suất giữa các đối thủ hàng đầu trong các danh mục này thu hẹp xuống còn 8% vào đầu năm 2024, và chỉ còn 1.7% vào đầu năm 2025.
"Điều này chắc chắn tốt cho bất kỳ ai không có khả năng xây dựng một mô hình từ đầu, đó là rất nhiều công ty nhỏ và học giả," Ray Perrault, nhà khoa học máy tính tại SRI, một viện nghiên cứu phi lợi nhuận ở Menlo Park, California, và đồng giám đốc của báo cáo cho biết. OpenAI ở San Francisco, California, công ty đã phát triển chatbot ChatGPT, dự định phát hành một mô hình trọng số mở trong vài tháng tới.
Sau khi ChatGPT ra mắt công chúng vào năm 2022, các nhà phát triển đã tập trung phần lớn năng lượng vào việc làm cho hệ thống tốt hơn bằng cách làm cho chúng lớn hơn. Xu hướng đó vẫn tiếp tục, báo cáo chỉ số cho biết: năng lượng được sử dụng để đào tạo một mô hình AI hàng đầu điển hình hiện đang tăng gấp đôi hàng năm; lượng tài nguyên tính toán được sử dụng cho mỗi mô hình đang tăng gấp đôi cứ sau 5 tháng; và các bộ dữ liệu đào tạo đang tăng gấp đôi kích thước cứ sau 8 tháng.
Tuy nhiên, các công ty cũng đang phát hành các mô hình nhỏ rất có khả năng. Ví dụ, mô hình nhỏ nhất đạt điểm cao hơn 60% trên MMLU vào năm 2022 sử dụng 540 tỷ tham số; đến năm 2024, một mô hình đạt được điểm số tương tự với chỉ 3.8 tỷ tham số. Các mô hình nhỏ hơn đào tạo nhanh hơn, đưa ra câu trả lời nhanh hơn và sử dụng ít năng lượng hơn so với các mô hình lớn hơn. "Nó giúp ích cho mọi thứ," Perrault nói.
Một số mô hình nhỏ hơn có thể mô phỏng hành vi của các mô hình lớn hơn, Selman nói, hoặc tận dụng các thuật toán và phần cứng tốt hơn so với các hệ thống cũ hơn. Chỉ số báo cáo rằng hiệu quả năng lượng trung bình của phần cứng được sử dụng bởi các hệ thống AI cải thiện khoảng 40% hàng năm. Nhờ những tiến bộ như vậy, chi phí để đạt được điểm số chỉ hơn 60% trên MMLU đã giảm mạnh, từ khoảng 20 USD cho mỗi triệu token (các bit từ được tạo ra bởi các mô hình ngôn ngữ) vào tháng 11 năm 2022 xuống còn 7 cent cho mỗi triệu token vào tháng 10 năm 2024.
Mặc dù có những cải tiến đáng kể trên một số bài kiểm tra chuẩn phổ biến, chỉ số nhấn mạnh rằng AI tạo sinh vẫn gặp phải những vấn đề như thiên kiến ngầm và xu hướng 'ảo giác', hoặc đưa ra thông tin sai lệch. "Các mô hình này làm tôi ấn tượng theo nhiều cách, nhưng cũng kinh hoàng theo những cách khác," Selman nói. "Tôi ngạc nhiên khi thấy chúng mắc những lỗi rất cơ bản."