AI vs con người 2024-07-23 23:41:13

Nghiên cứu của MIT: Con người càng kỳ vọng nhiều vào LLM thì có thể càng thất vọng lớn

• Các nhà nghiên cứu từ MIT đã phát triển một khung đánh giá mới cho các mô hình ngôn ngữ lớn (LLM), tập trung vào sự phù hợp giữa LLM và niềm tin của con người về khả năng của chúng.

• Nghiên cứu giới thiệu "hàm tổng quát hóa của con người" - một mô hình về cách con người cập nhật niềm tin về khả năng của LLM sau khi tương tác với nó.

• Kết quả cho thấy khi LLM không phù hợp với hàm tổng quát hóa của con người, người dùng có thể quá tự tin hoặc thiếu tự tin về việc triển khai nó, dẫn đến thất bại không mong muốn.

• Các mô hình có khả năng cao hơn thường hoạt động kém hơn các mô hình nhỏ hơn trong các tình huống quan trọng do sự không phù hợp này.

• Nghiên cứu bao gồm một cuộc khảo sát với gần 19.000 ví dụ về cách con người tổng quát hóa hiệu suất của LLM trên 79 nhiệm vụ đa dạng.

• Kết quả cho thấy con người khá giỏi trong việc dự đoán liệu một người khác có trả lời đúng câu hỏi liên quan hay không, nhưng kém hơn nhiều khi tổng quát hóa về hiệu suất của LLM.

• Người tham gia có xu hướng cập nhật niềm tin về LLM nhiều hơn khi nó trả lời sai so với khi trả lời đúng.

• Họ cũng có xu hướng tin rằng hiệu suất của LLM trên các câu hỏi đơn giản ít ảnh hưởng đến hiệu suất trên các câu hỏi phức tạp hơn.

• Trong các tình huống mà người dùng đặt nhiều trọng số hơn vào các phản hồi không chính xác, các mô hình đơn giản hơn vượt trội so với các mô hình rất lớn như GPT-4.

• Một lý do có thể giải thích tại sao con người kém hơn trong việc tổng quát hóa cho LLM là do tính mới lạ của chúng - con người có ít kinh nghiệm tương tác với LLM hơn so với tương tác với người khác.

• Các nhà nghiên cứu hy vọng bộ dữ liệu của họ có thể được sử dụng làm chuẩn để so sánh hiệu suất của LLM liên quan đến hàm tổng quát hóa của con người.

• Nghiên cứu nhấn mạnh tầm quan trọng của việc tính đến hàm tổng quát hóa của con người trong quá trình phát triển và cập nhật LLM với phản hồi của con người.

📌 Nghiên cứu của MIT cho thấy niềm tin của con người về LLM ảnh hưởng đáng kể đến hiệu suất và triển khai. Khảo sát với 19.000 ví dụ trên 79 nhiệm vụ chỉ ra sự khác biệt giữa cách con người và LLM tổng quát hóa kiến thức, nhấn mạnh tầm quan trọng của việc điều chỉnh LLM phù hợp với kỳ vọng của người dùng.

https://news.mit.edu/2024/large-language-models-dont-behave-like-people-0723

#MIT

Không có file đính kèm.

Nguồn tham khảo

122

Thảo luận

12,345 Fans 12,345 Followers 12,345 Subscribers

Tin phổ biến

AI coding assistant

Cursor AI - IDE thay thế VS Code với trợ lý AI tích hợp

AI giáo dục

UNESCO ra mắt 2 khung năng lực AI mới cho học sinh và giáo viên

AI giáo dục

Khung năng lực AI cho giáo viên của UNESCO

AI so sánh

OpenAI hay tự xây dựng: so sánh chi phí thực tế của việc tự lưu trữ các mô hình ngôn ngữ lớn

Apple joins AI fray with release of model framework

The AI skills gap is becoming incredibly troubling for companies everywhere

AI doanh nghiệp

10 use-case hàng đầu của AI trong kinh doanh

AI so sánh

Phân tích chuyên sâu về RAG, AI Agents và Agentic RAG

AI kiến thức-khóa học

Hướng dẫn toàn diện về lập trình AI với Cursor cho người mới bắt đầu

The AI Frenzy, Fed Meets, Hunter Biden: Your Sunday US Briefing

TAG

AI giáo dục AI sinh-y-duoc AI nghệ thuật AI pháp lý-quản trị-chủ quyền AI models AI xã hội AI prompts AI kiến thức-khóa học AI công nghiệp-lĩnh vực AI edge AI viễn thông AI tools AI chính phủ AI cybersecurity AI so sánh AI đạo đức AI tips AI market AI quân sự AI an toàn-an ninh-techwar AI việc làm AI doanh nghiệp OpenAI ChatGPT AI môi trường-năng lượng AI skill-talent AI & công nghệ khác AI nghiên cứu AI chips-hardware-compute AI vs con người AI coding assistant AI mở-nguồn mở AI năng suất AI startup-M&A AI tương lai AI báo chí AI data AI bản quyền AI PC AI riêng tư AI deepfake-ảo giác-ANTT AI ảnh-video-music-âm thanh AI minh bạch AI nhỏ AI nông nghiệp-thực phẩm AI ngân hàng-tài chính AI giao thông AI smartphone AI robotics-auto-agents AI consumer devices AI manufacturing AI benchmark Telecom AI thành công-thất bại Digital Semi-Cloud-DC-Green HTS STI FAQ

SongAI

Tin nóng

Nghiên cứu của MIT: Con người càng kỳ vọng nhiều vào LLM thì có thể càng thất vọng lớn

Thảo luận

Follow Us

Tin phổ biến

TAG