- Hiện nay, số lượng mô hình ngôn ngữ lớn (LLM) đang vượt xa số lượng các ứng dụng và tiện ích mở rộng dựa trên chúng.
- Các mô hình này có kích thước đa dạng, từ khiêm tốn đến đồ sộ, nhưng chỉ một số ít công ty thực sự có thể xây dựng được ứng dụng hữu hình từ chúng.
- Ví dụ, có hàng trăm nghìn mô hình ngôn ngữ trên Hugging Face Leaderboard, nhưng mọi người chỉ thử nghiệm khả năng của chúng rồi chuyển sang mô hình mới nhất.
- Falcon, một trong những mô hình nguồn mở lớn nhất, khi ra mắt đã được nhiều nhà phát triển thử nghiệm và ca ngợi, nhưng sau đó họ nhận ra Llama 2 của Meta tốt hơn nhiều.
- Sự dư thừa của các mô hình ngôn ngữ nền tảng mà không có sự đổi mới nào thêm vào hiện được gọi là "ô nhiễm LLM".
- Naveen Rao, Phó Chủ tịch AI tạo sinh tại Databricks, cho rằng phần lớn các công ty mô hình nền tảng sẽ thất bại nếu không làm tốt hơn OpenAI.
- Ankush Sabharwal từ CoRover.ai cho rằng không cần xây dựng thêm các mô hình nền tảng khi đã có những mô hình hoạt động cho các trường hợp sử dụng.
- Cần nhấn mạnh nhiều hơn vào các ứng dụng thực tế và giải quyết vấn đề trong thế giới thực với LLM, thay vì chỉ tập trung vào năng lực kỹ thuật.
- Các công ty sẽ không sử dụng cùng một LLM, nhưng cũng cần xác định chính xác các trường hợp sử dụng trước khi xây dựng nhiều mô hình bằng các ngôn ngữ khác nhau.
📌 Kỷ nguyên "ô nhiễm LLM" đã đến với vô số mô hình ngôn ngữ lớn được tạo ra nhưng thiếu ứng dụng thực tế. Các công ty cần tập trung vào việc giải quyết vấn đề và tạo ra giá trị, thay vì chỉ đua nhau xây dựng các mô hình mới mà không có sự khác biệt hoặc lợi ích rõ ràng. Việc đo lường tác động của AI đến khả năng áp dụng cũng cần được đẩy mạnh song song.
https://analyticsindiamag.com/we-are-entering-an-era-of-llm-pollution/