Vai trò bất ngờ của ảnh chụp màn hình trong việc nâng cấp AI trợ lý

  • AI hiện nay hiểu thông tin rất tốt nhưng gặp khó khăn trong việc biết thông tin nào quan trọng đối với người dùng.

  • Ảnh chụp màn hình trở thành phương thức lưu trữ dữ liệu kỹ thuật số phổ biến và linh hoạt nhất; chỉ cần vài thao tác, người dùng có thể lưu, chia sẻ mọi thứ trên màn hình.

  • Johnny Bree (Fabric) nhấn mạnh tính di động và đa dụng của ảnh chụp màn hình so với các định dạng dữ liệu khác.

  • Ảnh chụp màn hình truyền đạt tín hiệu "đây là điều tôi quan tâm", rất hữu ích cho AI khi xác định thông tin giá trị.

  • Người dùng kiểm soát dữ liệu tốt hơn bằng cách chọn thông tin nào muốn AI ghi nhớ, thay vì cung cấp quyền truy cập không giới hạn như giải pháp Microsoft Recall.

  • Công nghệ nhận diện ký tự quang học (OCR) kết hợp AI giúp nhận diện không chỉ văn bản mà còn cả nguồn, logo, màu sắc đặc trưng để xác định ngữ cảnh bên trong ảnh.

  • Google Pixel Screenshots và ứng dụng Essential Space có thể tự động tạo nhắc nhở, gợi ý nghe nhạc, lưu thẻ lên ví điện tử dựa trên thông tin trong ảnh chụp màn hình.

  • Mike Choi phát triển Camp, chuyển ảnh chụp thành “card” với thông tin liên quan như địa điểm, bản đồ, bản nhạc ngay lập tức.

  • Tương lai, AI sẽ tự động phân loại, gợi ý hành động dựa vào ảnh chụp màn hình mà không cần tương tác thủ công.

  • Thách thức lớn: phân biệt loại thông tin cần lưu giữ lâu dài hay chỉ tạm thời, tránh làm "nhiễu loạn" dữ liệu cá nhân.

  • Hãng như Google, Nothing tận dụng lợi thế thiết bị để thu thập thêm bối cảnh (đường link, vị trí, thời gian) khi chụp màn hình, tăng hiệu suất AI nhưng phải cân bằng với quyền riêng tư.

  • Dẫn chứng: Essential Space tự động nhắc mua vé khi người dùng chụp thông tin về sự kiện ca nhạc; Pixel đề xuất lưu thông tin ID hoặc vé lên ứng dụng Ví.

  • Bản chất của agentic AI là tận dụng hành động tự nhiên như chụp màn hình để xây dựng hệ thống trí tuệ cá nhân hóa liền mạch và thông minh hơn.

📌 Ảnh chụp màn hình đang dần trở thành “ngôn ngữ” giao tiếp mạnh mẽ giữa người dùng và AI trợ lý. Ứng dụng AI có thể nhận diện, phân loại, gợi ý hành động dựa trên dữ liệu ảnh chụp màn hình. Tuy nhiên, việc cân bằng giữa sự tiện dụng, hiệu quả cá nhân hóa và quyền riêng tư vẫn là bài toán lớn cần giải quyết.

 

https://www.theverge.com/ai-artificial-intelligence/650809/screenshots-apps-ai-pixel-nothing

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo