Claude 3.5 Sonnet có thể điều khiển máy tính như người thật

• Anthropic vừa công bố Claude 3.5 Sonnet - mô hình AI đầu tiên có khả năng sử dụng máy tính trong phiên bản beta công khai

• AI này có các khả năng cơ bản:
- Quan sát màn hình máy tính
- Di chuyển con trỏ chuột
- Nhấp vào các nút
- Nhập văn bản qua bàn phím ảo

• Hiện đã có nhiều công ty lớn áp dụng Claude 3.5 Sonnet như Asana, Canva, Cognition, DoorDash, Replit và The Browser Company

Cách thức hoạt động:
- AI xem các ảnh chụp màn hình
- Tính toán số pixel dọc và ngang để xác định vị trí di chuyển con trỏ
- Thực hiện các lệnh chuột dựa trên phân tích hình ảnh

• Kết quả benchmark:
- Đạt 14,9% trong bài kiểm tra OSWorld
- Cao gấp đôi so với mô hình AI tốt thứ 2 (7,7%)
- Vẫn thấp hơn nhiều so với khả năng con người (70-75%)

• Hạn chế hiện tại:
- Chưa thể thực hiện các tác vụ phức tạp như kéo cửa sổ hay zoom màn hình
- Có thể bỏ sót một số thông báo và hành động
- Vẫn đang trong giai đoạn thử nghiệm

• Claude 3.5 Sonnet hiện có sẵn qua:
- API của Anthropic
- Amazon Bedrock
- Google Cloud's Vertex AI

📌 Claude 3.5 Sonnet là mô hình AI tiên phong cho phép tương tác với máy tính như người dùng thực. Dù chỉ đạt 14,9% hiệu suất so với con người nhưng đã vượt xa các đối thủ. Anthropic cam kết sẽ cải thiện tốc độ và độ tin cậy trong tương lai.

https://www.zdnet.com/article/anthropics-latest-ai-model-can-use-a-computer-just-like-you-mistakes-and-all/#ftag=RSSbaffb68

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo