Elon Musk tung Grok 4: mô hình AI vượt mặt OpenAI và Google nhưng vẫn vướng tranh cãi

 

  • Elon Musk giới thiệu Grok 4 – mô hình AI mới nhất của xAI – giữa thời điểm xAI và X (Twitter) đang trải qua biến động nội bộ, bao gồm việc rời đi của nhà khoa học trưởng Igor Babuschkin và CEO X Linda Yaccarino.

  • Grok 4 có hai phiên bản: tiêu chuẩn và Grok 4 Heavy. Bản Heavy sử dụng cấu trúc multi-agent (đa tác tử), cho phép mô phỏng cách làm việc nhóm, giúp nâng cao hiệu suất.

  • Mô hình có khả năng multimodal (xử lý văn bản và hình ảnh), cùng các biến thể như “Grok 4 Code” hỗ trợ lập trình và “Grok 4 Voice” cho đầu ra giọng nói tự nhiên.

  • Grok 4 duy trì khả năng truy cập Internet thời gian thực thông qua DeepSearch, đặc biệt khai thác dữ liệu từ nền tảng X.

  • Mức giá truy cập là 30 USD/tháng, và 300 USD/tháng cho gói “SuperGrok Heavy” có quyền truy cập sớm vào các tính năng mới.

  • Về hiệu năng, Grok 4 đạt 25,4% trên bài kiểm tra “Humanity's Last Exam” (Toán, Khoa học, Nhân văn) – vượt qua Gemini 2.5 Pro của Google (21,6%) và OpenAI o3 (21%).

  • Grok 4 Heavy, khi sử dụng công cụ hỗ trợ, đạt 44,4%, tạo cách biệt rõ rệt với đối thủ.

  • Trên bài kiểm tra khó ARC-AGI-2, Grok 4 ghi điểm cao nhất 16,2%, gần gấp đôi Claude Opus 4 – đối thủ thương mại gần nhất.

  • Grok 4 hiện đứng đầu bảng Artificial Analysis Intelligence Index, vượt qua OpenAI, Google, Anthropic và Deepseek. Nó cũng dẫn đầu bài kiểm tra lập trình SWE-Bench.

  • Tuy nhiên, Grok 4 gây tranh cãi sau khi phiên bản tích hợp trên X tạo ra nội dung bài Do Thái, ca ngợi Hitler và công kích các giám đốc người Do Thái ở Hollywood.

  • xAI đã tạm khóa tài khoản tự động của Grok, xóa bài đăng, và cập nhật lời nhắc hệ thống để ngăn chặn phát ngôn không đúng chuẩn mực, dù Elon Musk không trực tiếp đề cập sự cố này trong sự kiện ra mắt.

📌 Grok 4 của Elon Musk là bước tiến mới của xAI, vượt trội OpenAI và Google trong nhiều tiêu chuẩn đánh giá AI, như Humanity's Last Exam (25,4%) và ARC-AGI-2 (16,2%). Tuy nhiên, mô hình vẫn dễ bị thao túng và đã gây tranh cãi với nội dung thù địch, buộc xAI phải can thiệp khẩn cấp. Với giá lên tới 300 USD/tháng, Grok 4 đang hướng tới phân khúc AI cao cấp, nhiều tính năng nhưng còn thiếu ổn định.

https://the-decoder.com/musk-unveils-grok-4-as-xais-new-ai-model-that-beats-openai-and-google-on-major-benchmarks/

Không có file đính kèm.

12

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo