Lộ diện "Kỳ nhân AI" của Trung Quốc: DeepSeek vượt mặt ChatGPT chỉ với 10 nhân sự

- DeepSeek, phòng thí nghiệm AI tại Hàng Châu (Trung Quốc) vừa công bố mô hình R1 với chi phí thấp hơn nhiều so với ChatGPT, khiến giới công nghệ Mỹ phải chú ý

- Ngày 20/1/2025, Liang Wenfeng (Lương Văn Phong) - người sáng lập DeepSeek được mời tham dự hội thảo với Thủ tướng Trung Quốc Lý Cường để góp ý cho dự thảo báo cáo chính phủ

- Ứng dụng của DeepSeek đã vươn lên vị trí số 1 trên bảng xếp hạng ứng dụng miễn phí iPhone tại cả Trung Quốc và Mỹ, vượt qua ChatGPT

- Liang Wenfeng tốt nghiệp ngành AI tại Đại học Chiết Giang, đồng sáng lập quỹ đầu tư High-Flyer năm 2016 và thành lập DeepSeek vào tháng 5/2023

- DeepSeek hiện chỉ có dưới 10 nhân viên, một thành viên đã được Xiaomi chiêu mộ vào tháng 12/2024

- Liang tin rằng bản chất trí tuệ con người nằm ở ngôn ngữ, và AI giống người có thể được phát triển từ các mô hình ngôn ngữ lớn

- Ông nhấn mạnh tầm quan trọng của nghiên cứu cơ bản dù lợi nhuận ngắn hạn thấp, và tin rằng đổi mới sáng tạo cần không gian tự do, ít can thiệp

- Về nhân tài, Liang cho rằng kỹ năng nền tảng, sáng tạo và đam mê quan trọng hơn kinh nghiệm, và nhân tài hàng đầu ở Trung Quốc đang bị đánh giá thấp

- Ông nhận định khoảng cách thực sự giữa AI Trung Quốc và Mỹ không phải 1-2 năm mà là khoảng cách giữa sáng tạo và bắt chước

📌 DeepSeek với đội ngũ dưới 10 người đã tạo ra mô hình R1 cạnh tranh với ChatGPT, dẫn đầu thị trường ứng dụng tại Mỹ-Trung. Liang Wenfeng theo đuổi nghiên cứu dài hạn về AGI, tin vào sức mạnh sáng tạo và nhân tài Trung Quốc để đưa quốc gia này thoát khỏi vị thế người đi sau trong lĩnh vực AI.

https://news.cgtn.com/news/2025-01-27/Behind-China-s-rising-AI-startup-DeepSeek-Who-is-Liang-Wenfeng--1AvkPM0cqXK/p.html

 

Đằng sau sự trỗi dậy của startup AI DeepSeek tại Trung Quốc: Liang Wenfeng là ai?
Công nghệ
18:32, 27/1/2025
Zhao Chenchen

, Cập nhật 21:41, 27/1/2025

Lời của biên tập viên: Trong lĩnh vực trí tuệ nhân tạo (AI), Liang Wenfeng và sản phẩm sáng tạo của ông, DeepSeek, đang nổi lên như một “lực lượng bí ẩn từ phương Đông.” CGTN đang sản xuất một loạt bài về AI nhằm khám phá sức mạnh của đổi mới sáng tạo và tác động toàn cầu của nó. Trong bài viết này, chúng tôi đưa bạn đến hậu trường để tìm hiểu về con người đằng sau DeepSeek, tư tưởng và hành trình của ông.

Một phòng thí nghiệm trí tuệ nhân tạo đặt tại Hàng Châu, tỉnh Chiết Giang ở miền đông Trung Quốc, đã khiến Thung lũng Silicon xôn xao với việc ra mắt mô hình tiên tiến của họ, được huấn luyện với chi phí chỉ bằng một phần nhỏ so với các mô hình phổ biến như ChatGPT của OpenAI. Thành tựu này đã thu hút sự chỉ trích từ nhiều chuyên gia AI trực tuyến, những người mô tả nó là “một bước đi ngược lại” với nỗ lực của Hoa Kỳ nhằm kiềm chế tham vọng công nghệ cao của Trung Quốc.

DeepSeek, được sáng lập bởi quản lý quỹ đầu tư Liang Wenfeng, đã ra mắt mô hình R1 vào thứ Hai tuần trước, kèm theo một bài nghiên cứu chi tiết giải thích cách huấn luyện một mô hình học tăng cường quy mô lớn (RL) mà không cần dựa vào bước tinh chỉnh có giám sát (SFT) ban đầu.

Chỉ trong vài ngày, ứng dụng của DeepSeek đã vươn lên đứng đầu bảng xếp hạng ứng dụng miễn phí trên iPhone tại cả Trung Quốc và Hoa Kỳ, vượt qua ChatGPT, vốn từng thống trị trước đó.

Việc phát hành mô hình R1 của DeepSeek đã làm dấy lên cuộc tranh luận sôi nổi ở Thung lũng Silicon về việc liệu các công ty AI của Hoa Kỳ, bao gồm Meta và OpenAI, có thể duy trì lợi thế công nghệ của họ hay không.

Trong khi đó, Liang trở thành tâm điểm thảo luận tại Trung Quốc. Tuần trước, ông được mời tham dự một hội thảo tại Bắc Kinh, nơi Thủ tướng Trung Quốc Lý Cường lắng nghe ý kiến và đề xuất từ các chuyên gia, doanh nhân, và đại diện từ nhiều lĩnh vực khác nhau—bao gồm giáo dục, khoa học, văn hóa, y tế và thể thao—về bản dự thảo báo cáo công tác chính phủ.

Về Liang Wenfeng

Liang Wenfeng tốt nghiệp Đại học Chiết Giang với bằng về trí tuệ nhân tạo. Năm 2016, ông đồng sáng lập quỹ đầu tư định lượng High-Flyer, nhanh chóng được công nhận nhờ việc sử dụng các chiến lược giao dịch dựa trên AI. Đến năm 2021, High-Flyer đã hoàn toàn tích hợp AI vào hoạt động của mình, sử dụng các mô hình học máy để dự đoán xu hướng thị trường và đưa ra các quyết định đầu tư dựa trên dữ liệu.

Tháng 5/2023, Liang thực hiện một bước đi táo bạo khi thành lập DeepSeek, tập trung nghiên cứu AI nhằm thúc đẩy lĩnh vực trí tuệ nhân tạo tổng quát (AGI). Khác với các doanh nghiệp truyền thống theo đuổi lợi nhuận, DeepSeek được hình thành như một nền tảng cho nghiên cứu cơ bản dài hạn, nơi mà sự tò mò dẫn dắt những bước tiến quan trọng trong AI.

Liang Wenfeng luôn giữ thái độ kín tiếng, chỉ nhận phỏng vấn với Anyong, một thương hiệu phụ của 36Kr, một trang truyền thông công nghệ thương mại của Trung Quốc, vào các năm 2023 và 2024. Dưới đây là các đoạn dịch từ những cuộc phỏng vấn này, hé lộ một phần triết lý và tầm nhìn của ông.

'Chủ nghĩa dài hạn' của DeepSeek

Đối với Liang, DeepSeek giống như một dự án phụ hoặc sở thích, được thúc đẩy bởi sự tò mò sâu sắc và cam kết với nghiên cứu cơ bản. Ông thừa nhận rằng nghiên cứu cơ bản thường mang lại lợi nhuận thấp trong ngắn hạn, nhưng ông bị cuốn hút bởi thách thức trong việc khám phá các lĩnh vực phức tạp như tài chính và tiềm năng của trí tuệ nhân tạo tổng quát (AGI). Liang tập trung vào việc hiểu bản chất của trí tuệ con người và các quá trình cơ bản hình thành nên nó, tin rằng việc khám phá như vậy rất quan trọng mặc dù không có lợi ích thương mại ngay lập tức.

“Bản chất của trí tuệ con người có thể chính là ngôn ngữ; suy nghĩ của con người có thể là một quá trình ngôn ngữ. Bạn nghĩ rằng bạn đang suy nghĩ, nhưng thực ra có thể bạn chỉ đang dệt nên ngôn ngữ trong tâm trí. Điều này có nghĩa là trí tuệ nhân tạo giống con người (AGI) có thể được sinh ra từ các mô hình ngôn ngữ lớn.”

“Vào thời điểm đó, chúng tôi đã thử nghiệm nhiều kịch bản khác nhau và cuối cùng chọn lĩnh vực tài chính đủ phức tạp. Trí tuệ nhân tạo tổng quát có thể là một trong những thử thách khó khăn tiếp theo. Vì vậy, đối với chúng tôi, đây là câu hỏi làm thế nào để làm được, chứ không phải tại sao phải làm.”

“Nếu nhất định phải tìm một lý do thương mại, thì có lẽ sẽ không có lý do nào, vì nó không đáng. Từ góc độ kinh doanh, nghiên cứu cơ bản có tỷ lệ hoàn vốn đầu tư rất thấp.”


Nhân tài và xây dựng đội ngũ

Hồ sơ LinkedIn của DeepSeek cho thấy công ty này có một đội ngũ dưới 10 người. Một thành viên trong nhóm được cho là đã được Lei Jun (Lôi Quân) của Xiaomi mời sang phát triển AI vào tháng 12/2024. Liang tin vào việc phát hiện nhân tài trong nước.

“Nếu theo đuổi mục tiêu ngắn hạn, tìm những người có kinh nghiệm sẵn có là lựa chọn đúng. Nhưng nếu nhìn xa hơn, kinh nghiệm không còn quá quan trọng; kỹ năng nền tảng, sự sáng tạo và đam mê quan trọng hơn. Từ góc độ này, ở Trung Quốc có không ít ứng viên phù hợp.”

“Vì chúng tôi đang làm những việc khó khăn nhất. Điều hấp dẫn nhất với nhân tài hàng đầu chắc chắn là giải quyết các vấn đề khó khăn nhất thế giới. Trên thực tế, nhân tài hàng đầu tại Trung Quốc đang bị đánh giá thấp. Vì đổi mới sáng tạo mang tính cốt lõi ở cấp độ xã hội còn quá ít, nên họ không có cơ hội được nhận ra. Khi chúng tôi làm việc với những vấn đề khó khăn nhất, điều đó trở thành sức hút với họ.”


Về đổi mới sáng tạo

Đổi mới sáng tạo đòi hỏi tự do và không gian để thử nghiệm và mắc lỗi. Liang lưu ý rằng đổi mới thường xuất hiện một cách tự nhiên, chứ không phải được lên kế hoạch hay giảng dạy.

“Chúng tôi rút ra rằng, đổi mới cần sự can thiệp và quản lý ở mức tối thiểu, để mỗi người có không gian tự do và cơ hội thử nghiệm, sai lầm. Đổi mới thường tự xuất hiện, không phải do sắp đặt, càng không phải do giảng dạy mà có.”

Đổi mới sáng tạo là một quá trình tốn kém và kém hiệu quả, đôi khi đi kèm với lãng phí. Vì vậy, chỉ khi nền kinh tế phát triển đến một mức độ nhất định, đổi mới mới có thể nảy sinh. Khi còn nghèo hoặc trong những ngành không dựa vào đổi mới, chi phí và hiệu quả là yếu tố rất quan trọng. Hãy nhìn OpenAI, họ đã tiêu tốn rất nhiều tiền để đạt được vị trí hiện tại.”


Về vai trò của Trung Quốc trong phát triển AI

Liang tin rằng Trung Quốc không thể mãi ở vị trí đi sau trong lĩnh vực AI. Trong các cuộc phỏng vấn, ông nhấn mạnh sự cần thiết phải chuyển từ mô phỏng sang sáng tạo và xây dựng hệ sinh thái công nghệ riêng của Trung Quốc.

“Chúng tôi thấy rằng AI của Trung Quốc không thể mãi ở vị trí đi theo. Chúng ta thường nói rằng AI của Trung Quốc và Mỹ có khoảng cách một hoặc hai năm, nhưng khoảng cách thực sự là giữa sáng tạo và mô phỏng. Nếu điều này không thay đổi, Trung Quốc mãi mãi chỉ là người đi sau. Vì vậy, một số hướng đi mang tính khám phá là không thể tránh khỏi.”

“Sự dẫn đầu của NVIDIA không chỉ là nỗ lực của một công ty, mà là kết quả của cả cộng đồng công nghệ và ngành công nghiệp phương Tây. Họ có thể nhìn thấy xu hướng công nghệ thế hệ tiếp theo và có một lộ trình rõ ràng. Sự phát triển AI của Trung Quốc cũng cần một hệ sinh thái như vậy. Nhiều con chip nội địa không phát triển được cũng vì thiếu cộng đồng công nghệ hỗ trợ, chỉ dựa vào thông tin thứ cấp. Vì thế, Trung Quốc nhất định cần có những người đứng ở tuyến đầu của công nghệ.”

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo