DeepSeek, công ty khởi nghiệp Trung Quốc, đã xếp hạng thứ 12 trong danh sách 50 công ty đổi mới nhất thế giới năm 2025.
Trong tháng 12/2024 và tháng 1/2025, DeepSeek đã tung ra hai mô hình AI tiên tiến yêu cầu ít sức mạnh tính toán và vốn đầu tư hơn nhiều so với các công ty AI phương Tây, làm lung lay niềm tin rằng Hoa Kỳ dẫn đầu thế giới về AI.
Các mô hình tạo sinh thường tiêu thụ nhiều bộ nhớ và sức mạnh tính toán khi xử lý vấn đề vì phải "ghi nhớ" nhiều thông tin ngữ cảnh. DeepSeek đã phát minh cách nén một phần dữ liệu này, giảm khối lượng công việc cho GPU trong cả quá trình đào tạo mô hình và tạo sinh nội dung.
Với lệnh cấm từ Hoa Kỳ ngăn DeepSeek tiếp cận GPU Nvidia mạnh nhất, công ty đã đổi mới các phương pháp kỹ thuật đã biết để đạt được hiệu quả tiết kiệm sức mạnh GPU.
Nghiên cứu của DeepSeek cải tiến kiến trúc "mixture-of-experts" (hỗn hợp chuyên gia) chia mô hình ngôn ngữ lớn thành các phân đoạn chứa kiến thức chuyên biệt.
Công ty cũng phát minh cách hiệu quả hơn để dạy mô hình nhỏ hơn của họ, DeepSeek-R1, cách lập luận. Các nhà nghiên cứu cung cấp một lượng dữ liệu học tăng cường tương đối nhỏ (câu hỏi và câu trả lời được tạo bởi mô hình lớn hơn DeepSeek-V3, cùng với "quá trình suy nghĩ") cho R1.
Nhóm nghiên cứu sau đó đưa ra cho mô hình một loạt vấn đề để giải quyết và thưởng cho nó bằng mã đặc biệt cho các câu trả lời tốt. Cuối cùng, R1 bắt đầu "suy nghĩ" về các con đường hứa hẹn nhất dẫn đến câu trả lời thuận lợi và phần thưởng.
Thay vì giữ bí mật những đột phá trong nghiên cứu, DeepSeek đã chia sẻ phương pháp của mình thông qua các bài báo nghiên cứu và cung cấp mã nguồn mở cho các mô hình để người khác sử dụng và điều chỉnh.
Thông điệp của công ty: các mô hình ngôn ngữ lớn tiên tiến đang trở thành bí mật công khai, thúc đẩy sự phát triển của cộng đồng AI toàn cầu.
Mặc dù đối mặt với sự cạnh tranh gay gắt từ các phòng lab AI khác, cách tiếp cận chia sẻ kiến thức của DeepSeek đã tạo ra tác động đáng kể đến cộng đồng AI.
📌 DeepSeek đã chứng minh rằng ngay cả với hạn chế về tiếp cận GPU mạnh nhất, vẫn có thể tạo ra mô hình AI hiệu quả bằng đổi mới kỹ thuật. Thành công của công ty Trung Quốc này thách thức vị thế dẫn đầu của Mỹ trong lĩnh vực AI và thúc đẩy phong trào chia sẻ kiến thức nguồn mở.
https://www.fastcompany.com/91270727/deepseek-most-innovative-companies-2025
Danh sách 50 công ty đổi mới sáng tạo nhất thế giới năm 2025:
https://www.fastcompany.com/most-innovative-companies/list