AI sẽ không cạn kiệt dữ liệu: bài học từ lịch sử ngành dầu mỏ

• Nhiều người đang đặt câu hỏi liệu bong bóng AI có sắp vỡ hay không, khi giá cổ phiếu của các công ty công nghệ lớn chưa thể lấy lại đỉnh cao giữa năm. Tuy nhiên, lịch sử cho thấy đầu tư vào công nghệ mới có thể mang lại lợi nhuận lớn trong dài hạn, như trường hợp của Amazon.

• Một số người hoài nghi cho rằng AI sẽ sớm gặp phải bức tường do thiếu dữ liệu để huấn luyện. Tuy nhiên, tác giả cho rằng điều này không đúng và so sánh dữ liệu với dầu mỏ.

Giống như dầu mỏ, dữ liệu cũng có độ khó và chi phí khai thác khác nhau. Khi giá dầu tăng cao, các nhà sản xuất được khuyến khích sử dụng các phương pháp đắt đỏ hơn để khai thác nguồn dự trữ mới. Điều tương tự cũng xảy ra với dữ liệu.

• Hiện tại, khoảng 96-99,8% dữ liệu trực tuyến không thể truy cập được bởi các công cụ tìm kiếm. Ngoài ra, phần lớn tài liệu in chưa được số hóa và có rất nhiều thông tin chưa được thu thập.

Khi các mô hình AI thông minh hơn cho phép ứng dụng rộng rãi hơn, sẽ có động lực mạnh mẽ để khai thác các nguồn dữ liệu đắt đỏ hơn. Điều này đang thúc đẩy sự phát triển của ngành công nghiệp dữ liệu huấn luyện mới.

• Các công ty và tổ chức phi lợi nhuận có thể tận dụng cơ hội này để kiếm lợi từ dữ liệu độc quyền của họ. OpenAI đã chi hàng trăm triệu USD để cấp phép dữ liệu huấn luyện.

Cuộc cạnh tranh về dữ liệu chất lượng cao có thể ảnh hưởng đến chính trị giữa các siêu cường. Các quy định về quyền riêng tư ở châu Âu có thể cản trở sự phát triển AI, trong khi Trung Quốc có lợi thế về dữ liệu nhờ hệ thống giám sát rộng rãi.

• Các kỹ thuật mới như tạo dữ liệu tổng hợp và tự học có thể giảm sự phụ thuộc của ngành AI vào lượng lớn dữ liệu. Tuy nhiên, trong ngắn hạn, bong bóng thị trường AI có thể vỡ trước khi AI đủ thông minh để đáp ứng kỳ vọng cao.

📌 AI sẽ không cạn kiệt dữ liệu nhờ khả năng khai thác nguồn dữ liệu mới và phát triển kỹ thuật học hiệu quả hơn. Mặc dù có thể có bong bóng ngắn hạn, tiềm năng dài hạn của AI vẫn rất lớn, tương tự như ngành dầu mỏ đã liên tục vượt qua dự đoán về cạn kiệt nguồn cung.

https://time.com/7006382/ai-training-data-oil/

#TIME

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo