Ngành AI đối mặt khủng hoảng thiếu dữ liệu, tiến bộ có thể chậm lại

- Demis Hassabis, chuyên gia AI hàng đầu tại Google DeepMind cảnh báo chatbot sẽ không tiếp tục cải thiện nhanh như những năm gần đây

- Nguyên nhân chính: các công ty công nghệ đang cạn kiệt nguồn dữ liệu từ internet để huấn luyện mô hình ngôn ngữ lớn

- Databricks, công ty dữ liệu AI, đang huy động gần 10 tỷ USD - vòng gọi vốn tư nhân lớn nhất từ trước đến nay cho một startup

- Sam Altman (OpenAI), Dario Amodei (Anthropic) và Jensen Huang (Nvidia) vẫn lạc quan về tiến bộ của AI trong tương lai

- Năm 2020, Jared Kaplan công bố "Quy luật mở rộng" cho thấy mô hình ngôn ngữ lớn trở nên mạnh mẽ hơn khi phân tích nhiều dữ liệu hơn

- Các công ty như OpenAI, Google và Meta đã đua nhau thu thập dữ liệu internet, đôi khi bỏ qua chính sách công ty và pháp luật

- Giải pháp mới đang được nghiên cứu: cho phép mô hình ngôn ngữ lớn học từ thử nghiệm và sai lầm của chính mình, tạo ra "dữ liệu tổng hợp"

- OpenAI vừa ra mắt hệ thống OpenAI o1 được xây dựng theo phương pháp này

- Phương pháp mới chỉ hiệu quả trong lĩnh vực toán học và lập trình, nơi có sự phân biệt rõ ràng giữa đúng và sai

- Meta đang cân nhắc về tính khả thi của AI trong tương lai do lượng tiền đầu tư lớn vào ngành này

📌 Ngành AI đang đối mặt với bài toán cạn kiệt dữ liệu huấn luyện từ internet. Dù có vòng gọi vốn kỷ lục 10 tỷ USD cho Databricks, các chuyên gia như Demis Hassabis cảnh báo về sự chậm lại trong tiến bộ AI, buộc phải tìm phương pháp mới như dữ liệu tổng hợp.

 

https://www.nytimes.com/2024/12/19/technology/artificial-intelligence-data-openai-google.html

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo