AI vs con người 2024-09-04 05:56:11

Thử nghiệm của chính phủ Úc cho thấy AI kém hơn con người trong việc tóm tắt thông tin

• Chính phủ Úc đã tiến hành một cuộc thử nghiệm về khả năng tóm tắt tài liệu của AI so với con người.

• Cuộc thử nghiệm do Amazon thực hiện cho Ủy ban Chứng khoán và Đầu tư Úc (ASIC), sử dụng các bài nộp cho một cuộc điều tra.

• Mô hình AI tạo sinh được chọn là Llama2-70B nguồn mở của Meta.

• AI được yêu cầu tóm tắt 5 bài nộp từ một cuộc điều tra của quốc hội về các công ty kiểm toán và tư vấn, tập trung vào các đề cập đến ASIC, khuyến nghị và tham chiếu đến quy định.

• 10 nhân viên ASIC cũng được giao cùng nhiệm vụ với các yêu cầu tương tự.

• Một nhóm đánh giá viên đã đánh giá mù các bản tóm tắt của cả người và AI về tính mạch lạc, độ dài, tham chiếu ASIC, tham chiếu quy định và xác định khuyến nghị.

• Kết quả cho thấy bản tóm tắt của con người vượt trội hơn AI trên mọi tiêu chí và mọi bài nộp, đạt điểm 81% so với 47% của máy móc.

• Con người đặc biệt vượt trội trong việc xác định các tham chiếu đến tài liệu ASIC trong văn bản dài, một nhiệm vụ được coi là "cực kỳ khó" đối với loại AI này.

• Các đánh giá viên nhận xét rằng bản tóm tắt của AI thường bỏ sót trọng tâm, sắc thái và bối cảnh; bao gồm thông tin không chính xác hoặc bỏ sót thông tin liên quan; đôi khi tập trung vào các điểm phụ hoặc đưa ra thông tin không liên quan.

• 3 trong số 5 đánh giá viên đã đoán được rằng họ đang xem xét nội dung do AI tạo ra.

• Phản hồi chung của các đánh giá viên là bản tóm tắt của AI có thể phản tác dụng và tạo thêm công việc do cần phải kiểm tra sự thật và tham khảo các bài nộp gốc.

• Báo cáo đề cập đến một số hạn chế và bối cảnh của nghiên cứu này, bao gồm việc mô hình được sử dụng đã bị thay thế bởi một mô hình có khả năng cao hơn.

• Amazon đã cải thiện hiệu suất của mô hình bằng cách tinh chỉnh các lời nhắc và đầu vào, cho thấy vẫn có thể cải thiện thêm.

• Báo cáo bày tỏ sự lạc quan rằng một ngày nào đó máy móc có thể thực hiện tốt nhiệm vụ này.

• Tuy nhiên, cuộc thử nghiệm cho thấy khả năng phân tích và đánh giá thông tin một cách phê phán của con người vẫn chưa thể bị AI vượt qua.

• Kết luận của báo cáo là AI tạo sinh nên được coi là công cụ hỗ trợ chứ không phải thay thế các nhiệm vụ của con người.

📌 Thử nghiệm của chính phủ Úc cho thấy AI kém hơn con người trong việc tóm tắt thông tin, đạt 47% so với 81% của người. AI bỏ sót trọng tâm, sắc thái và có thể tạo thêm công việc. Kết luận là AI nên hỗ trợ chứ không thay thế con người.

https://www.crikey.com.au/2024/09/03/ai-worse-summarising-information-humans-government-trial/

Không có file đính kèm.

Nguồn tham khảo

160

Thảo luận

12,345 Fans 12,345 Followers 12,345 Subscribers

Tin phổ biến

AI coding assistant

Cursor AI - IDE thay thế VS Code với trợ lý AI tích hợp

AI giáo dục

UNESCO ra mắt 2 khung năng lực AI mới cho học sinh và giáo viên

AI giáo dục

Khung năng lực AI cho giáo viên của UNESCO

AI so sánh

OpenAI hay tự xây dựng: so sánh chi phí thực tế của việc tự lưu trữ các mô hình ngôn ngữ lớn

Apple joins AI fray with release of model framework

The AI skills gap is becoming incredibly troubling for companies everywhere

AI doanh nghiệp

10 use-case hàng đầu của AI trong kinh doanh

AI so sánh

Phân tích chuyên sâu về RAG, AI Agents và Agentic RAG

AI kiến thức-khóa học

Hướng dẫn toàn diện về lập trình AI với Cursor cho người mới bắt đầu

The AI Frenzy, Fed Meets, Hunter Biden: Your Sunday US Briefing

TAG

AI giáo dục AI sinh-y-duoc AI nghệ thuật AI pháp lý-quản trị-chủ quyền AI models AI xã hội AI prompts AI kiến thức-khóa học AI công nghiệp-lĩnh vực AI edge AI viễn thông AI tools AI chính phủ AI cybersecurity AI so sánh AI đạo đức AI tips AI market AI quân sự AI an toàn-an ninh-techwar AI việc làm AI doanh nghiệp OpenAI ChatGPT AI môi trường-năng lượng AI skill-talent AI & công nghệ khác AI nghiên cứu AI chips-hardware-compute AI vs con người AI coding assistant AI mở-nguồn mở AI năng suất AI startup-M&A AI tương lai AI báo chí AI data AI bản quyền AI PC AI riêng tư AI deepfake-ảo giác-ANTT AI ảnh-video-music-âm thanh AI minh bạch AI nhỏ AI nông nghiệp-thực phẩm AI ngân hàng-tài chính AI giao thông AI smartphone AI robotics-auto-agents AI consumer devices AI manufacturing AI benchmark Telecom AI thành công-thất bại Digital Semi-Cloud-DC-Green HTS STI FAQ

SongAI

Tin nóng

Thử nghiệm của chính phủ Úc cho thấy AI kém hơn con người trong việc tóm tắt thông tin

Thảo luận

Follow Us

Tin phổ biến

TAG