Yann LeCun, nhà khoa học trưởng AI của Meta, tuyên bố trong buổi nói chuyện tại NVIDIA GTC 2025 rằng ông không còn quan tâm đến mô hình ngôn ngữ lớn (LLM).
LeCun coi LLM là công nghệ định hướng sản phẩm đang đạt đến giới hạn, hiện chủ yếu do các nhóm sản phẩm xử lý với những cải tiến nhỏ thông qua việc bổ sung dữ liệu, tăng năng lực tính toán và sử dụng dữ liệu tổng hợp.
Ông đã chuyển trọng tâm sang 4 lĩnh vực mà ông cho là nền tảng hơn cho trí thông minh máy móc: hiểu biết về thế giới vật lý, bộ nhớ liên tục, lập luận và lập kế hoạch.
LeCun quan tâm đến "mô hình thế giới" - hệ thống tạo ra biểu diễn nội bộ về môi trường vật lý để có thể lập luận và dự đoán. Ông giải thích rằng con người đều có mô hình thế giới trong tâm trí, cho phép chúng ta thao tác suy nghĩ.
Nhà khoa học này phê phán sự phụ thuộc hiện tại vào dự đoán token - nền tảng hoạt động của LLM. Theo ông, token mang tính rời rạc và việc đào tạo hệ thống dự đoán token chính xác là không thể, khiến phương pháp này không đủ để hiểu dữ liệu đa chiều và liên tục như video.
Ông chỉ ra rằng mọi nỗ lực nhằm tạo ra hệ thống hiểu thế giới hoặc xây dựng mô hình tinh thần về thế giới bằng cách đào tạo để dự đoán video ở cấp độ pixel đều đã thất bại.
Thay vào đó, LeCun đề xuất "kiến trúc dự đoán nhúng kết hợp" (joint embedding predictive architectures) là hướng tiếp cận đầy hứa hẹn hơn, cho phép dự đoán trong không gian biểu diễn trừu tượng thay vì không gian đầu vào thô.
Ông mô tả phương pháp mà hệ thống quan sát trạng thái hiện tại của thế giới, tưởng tượng một hành động, sau đó dự đoán trạng thái tiếp theo - một thành phần cốt lõi của việc lập kế hoạch.
LeCun cũng chỉ trích các hệ thống AI tác nhân hiện tại phụ thuộc vào việc tạo ra nhiều chuỗi token và chọn cái tốt nhất, ví nó như việc "viết chương trình mà không biết cách viết" và "hoàn toàn vô vọng".
Ông tỏ ra hoài nghi trước những tuyên bố ngày càng tăng về sự xuất hiện sắp tới của trí tuệ nhân tạo tổng quát (AGI) hoặc trí tuệ nhân tạo lớn (AMI).
📌 Yann LeCun đã chuyển hướng từ LLM sang các nền tảng cơ bản hơn cho AI: mô hình thế giới, lập luận và lập kế hoạch. Ông chỉ trích phương pháp dự đoán token hiện tại, đề xuất kiến trúc dự đoán nhúng kết hợp như một giải pháp hứa hẹn hơn.
https://analyticsindiamag.com/ai-news-updates/im-not-so-interested-in-llms-anymore-says-yann-lecun/