Sóng AI-Tri thức tinh gọn về AI & digital

CEO Anthropic thừa nhận chưa ai thực sự hiểu cách AI hoạt động - điều chưa từng có trong lịch sử công nghệ

CEO Anthropic, Dario Amodei, thẳng thắn thừa nhận ngành AI hiện chưa ai thực sự hiểu cách AI hoạt động ở mức chi tiết, kể cả nhóm sáng tạo ra AI.
Amodei công bố kế hoạch phát triển công cụ "MRI cho AI" trong 10 năm tới nhằm bóc tách cơ chế vận hành nội tại của AI, đồng thời phát hiện và ngăn chặn các rủi ro khó lường.
Ông lấy ví dụ: Khi AI tạo sinh tóm tắt tài liệu tài chính, con người không hiểu rõ tại sao AI lại chọn từ ngữ này thay vì từ khác, hoặc vì sao AI đôi lúc mắc lỗi dù thường xuyên chính xác.
Theo Amodei, sự thiếu hiểu biết này là điều chưa từng có trong lịch sử phát triển công nghệ – các ngành khác (ví dụ điện, internet) đều có thể giải thích nguyên lý hoạt động cơ bản, còn AI thì không.
Từ cuối năm 2020, Dario và em gái Daniela rời OpenAI do lo ngại thiếu an toàn, lập Anthropic để tập trung phát triển AI an toàn, có thể kiểm soát và hiểu sâu cấu trúc bên trong.
Gần đây, Anthropic thực hiện thử nghiệm: nhóm "red team" cố tình chèn vấn đề sai lệch vào mô hình AI, các "blue team" được giao nhiệm vụ phát hiện vấn đề này, nhiều đội thành công nhờ dùng công cụ phân tích interpretability.
Amodei cảnh báo: AI mạnh mẽ sẽ quyết định vận mệnh loài người, cần phải hiểu rõ cơ chế nội tại trước khi AI thay đổi toàn diện kinh tế, xã hội và tương lai.
Trong bối cảnh AI tạo sinh và AI tổng quát ngày càng mạnh, lý do chính để Anthropic tồn tại là khám phá và kiểm soát các rủi ro tiềm ẩn có thể chưa từng nhìn thấy.

📌 CEO Anthropic Dario Amodei xác nhận chưa ai hiểu chi tiết cách AI vận hành; công ty đang phát triển công cụ MRI cho AI để bóc tách nội tại, đã thử nghiệm phát hiện lệch lạc mô hình thành công. Cảnh báo, AI có thể thay đổi kinh tế và xã hội nếu con người không kiểm soát kịp thời.

https://futurism.com/anthropic-ceo-admits-ai-ignorance

SongAI

Tin nóng

CEO Anthropic thừa nhận chưa ai thực sự hiểu cách AI hoạt động - điều chưa từng có trong lịch sử công nghệ

Thảo luận

Follow Us

Tin phổ biến

TAG