- LBM (Large behavior models) là công nghệ mới nổi kết hợp AI tạo sinh với khả năng quan sát và học hỏi hành vi, giúp robot thực hiện các nhiệm vụ phức tạp
- LBM khác với LLM ở chỗ không chỉ dựa vào ngôn ngữ tự nhiên mà còn tích hợp đa phương thức (multimodal) bao gồm: văn bản, hình ảnh, âm thanh và video
- Một ví dụ điển hình về ứng dụng LBM là robot nấu ăn có thể:
+ Quan sát cách con người thao tác
+ Học hỏi phong cách nấu nướng cá nhân
+ Tương tác bằng ngôn ngữ tự nhiên
+ Thực hiện các thao tác phức tạp như cắt rau, điều chỉnh nhiệt độ
- Ưu điểm của LBM so với lập trình robot truyền thống:
+ Không cần lệnh phức tạp
+ Học hỏi linh hoạt qua quan sát
+ Tương tác tự nhiên với người dùng
+ Tích hợp được nhiều dạng dữ liệu
- Thách thức cần giải quyết:
+ Đảm bảo AI nhận diện đúng hành vi cần học
+ Tránh sao chép sai lầm từ hành vi quan sát
+ Xây dựng hàng rào bảo vệ an toàn
+ Phát triển khung pháp lý phù hợp
- Dự án nghiên cứu tiên phong về LBM từ TRI đã chứng minh khả năng robot học các kỹ năng mới chỉ trong vài giờ, mở ra tiềm năng to lớn cho robot đa năng trong tương lai
📌 LBM là bước tiến mới trong AI, kết hợp AI tạo sinh với khả năng học hỏi hành vi. Công nghệ này giúp robot thông minh hơn, tự nhiên hơn trong tương tác. Tuy nhiên cần giải quyết các thách thức về an toàn và pháp lý trước khi ứng dụng rộng rãi.
https://www.forbes.com/sites/lanceeliot/2024/11/10/large-behavior-models-surpass-large-language-models-to-create-ai-that-walks-and-talks/