AI đã vượt qua con người ở 7/8 nhiệm vụ kỹ thuật

  • Khoảng cách giữa khả năng suy luận của AI và con người đang thu hẹp nhanh chóng, đặc biệt trong các nhiệm vụ kỹ thuật như phân loại hình ảnh, toán học nâng cao và lý luận hình ảnh.

  • Dữ liệu từ báo cáo Stanford AI Index 2025 cho thấy AI đã vượt qua hoặc tiệm cận hiệu suất con người ở 7/8 nhiệm vụ kỹ thuật được kiểm tra, bao gồm: phân loại hình ảnh, lý luận hình ảnh, đọc hiểu mức trung bình, hiểu ngôn ngữ tiếng Anh, hiểu ngôn ngữ đa nhiệm, toán học trình độ thi đấu, câu hỏi khoa học trình độ tiến sĩ và hiểu/lý luận đa phương thức.

  • Phân loại hình ảnh: AI tiến bộ vượt bậc từ 89,15% (2012) lên 102,85% (2018), vượt qua mốc 100% của con người từ năm 2016.

  • Lý luận hình ảnh: AI tăng từ 80,09% (2016) lên 86,49% (2017), tiếp tục thu hẹp khoảng cách với con người.

  • Đọc hiểu mức trung bình: Năm 2017, AI đã đạt 82,35% so với chuẩn con người.

  • Toán học trình độ thi đấu và các nhiệm vụ khoa học nâng cao: AI đạt hiệu suất gần hoặc vượt chuẩn con người trong những năm gần đây.

  • Nhiệm vụ duy nhất AI chưa vượt qua con người là hiểu và lý luận đa phương thức (multimodal), tức xử lý và suy luận trên nhiều định dạng như hình ảnh, biểu đồ, sơ đồ.

  • Năm 2024, mô hình o1 của OpenAI đạt 78,2% trên benchmark MMMU (chuẩn con người là 82,6%), chỉ còn kém 4,4 điểm phần trăm và có tỷ lệ ảo giác thấp nhất trong các mô hình AI.

  • So với cuối năm 2023, Google Gemini chỉ đạt 59,4% trên cùng benchmark, cho thấy tốc độ cải thiện vượt bậc của AI trong thời gian ngắn.

  • Các mô hình AI hàng đầu như ChatGPT, Gemini đang liên tục nâng cao hiệu suất, vượt qua con người ở hầu hết các nhiệm vụ kỹ thuật tiêu chuẩn.

📌 AI đã vượt qua con người ở 7/8 nhiệm vụ kỹ thuật, chỉ còn thua ở hiểu đa phương thức với khoảng cách 4,4 điểm phần trăm. Tốc độ cải thiện của AI cực kỳ nhanh, minh chứng qua việc o1 của OpenAI đạt 78,2% trong năm 2024, tăng mạnh so với Gemini cuối 2023.

 

https://www.visualcapitalist.com/visualizing-ai-vs-human-performance-in-technical-tasks/

Không có file đính kèm.

8

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo