AI agent thất bại tới 70–98%: Bong bóng AI đang sắp vỡ?

 

  • Từ khi ChatGPT ra đời cuối năm 2022, vốn đầu tư mạo hiểm vào AI tăng vọt, đạt 131,5 tỷ USD trong năm 2024, tăng 52% so với 2023. Trong quý IV/2024, hơn 50% vốn đầu tư toàn cầu đổ vào AI.

  • Một phần lớn số tiền này rót vào "AI agents" – phần mềm tự động thực hiện các tác vụ phức hợp thay con người – được quảng bá là sẽ "thay thế công việc trí tuệ" và "thay đổi tận gốc mô hình doanh nghiệp".

  • Tuy nhiên, theo nghiên cứu từ Đại học Carnegie Mellon (tháng 5/2025), AI agent tốt nhất – Gemini 2.5 Pro của Google – vẫn thất bại tới 70% khi xử lý các nhiệm vụ văn phòng thực tế.

  • Nếu tính cả các nhiệm vụ hoàn thành một phần, tỷ lệ thất bại của Gemini vẫn lên tới 61,7%. Các agent khác còn kém hơn:

    • GPT-4o (OpenAI): thất bại 91,4%

    • Llama-3.1-405b (Meta): thất bại 92,6%

    • Nova-Pro-v1 (Amazon): thất bại 98,3%

  • Gartner dự đoán hơn 40% dự án AI agent doanh nghiệp sẽ bị hủy trước năm 2027 do chi phí vượt tầm kiểm soát, giá trị kinh doanh mơ hồ và rủi ro bảo mật cao.

  • Hiện tượng "agent washing" – gắn mác AI agent lên sản phẩm cũ để ăn theo trào lưu – đang lan rộng. Ví dụ: tính năng “Intelligence” trên iPhone 16 (Apple) đang bị kiện tập thể; Delphia bị phạt 225.000 USD vì quảng cáo sai về "chuyên gia tài chính AI".

  • Dù có hàng ngàn AI agent được tuyên bố đang hoạt động toàn cầu, Gartner ước tính chỉ khoảng 130 là thực sự tồn tại.

  • Giới chuyên gia ví von cơn sốt AI hiện nay giống "Web3" trước đây – nơi các startup blockchain huy động vài tỷ USD/quý – nhưng lần này tầm ảnh hưởng lớn hơn, khi một công ty AI có thể huy động 10 tỷ USD chỉ trong một vòng gọi vốn.

  • Không như Web3, AI hiện được hậu thuẫn bởi cả Phố Wall, truyền thông chính thống và chính phủ Mỹ. Điều này khiến nền kinh tế Mỹ có thể gắn chặt với số phận của AI.

  • Nếu kỳ vọng vượt xa năng lực thật sự, bong bóng AI có thể vỡ và kéo theo hậu quả kinh tế toàn cầu nghiêm trọng, lâu dài.

📌 Các AI agent đang thất bại ở mức báo động, với GPT-4o thất bại 91,4% và Amazon Nova-Pro-v1 tới 98,3%. Trong số hàng ngàn sản phẩm, chỉ khoảng 130 là “thật”. Dưới lớp vỏ hào nhoáng là rủi ro vỡ bong bóng công nghệ trị giá hàng trăm tỷ USD, có thể kéo theo hệ lụy nghiêm trọng cho nền kinh tế toàn cầu.

https://futurism.com/ai-agents-failing-industry

Không có file đính kèm.

18

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo