- DeepSeek, phòng thí nghiệm AI tại Hàng Châu (Trung Quốc) vừa công bố mô hình R1 với chi phí thấp hơn nhiều so với ChatGPT, khiến giới công nghệ Mỹ phải chú ý
- Ngày 20/1/2025, Liang Wenfeng (Lương Văn Phong) - người sáng lập DeepSeek được mời tham dự hội thảo với Thủ tướng Trung Quốc Lý Cường để góp ý cho dự thảo báo cáo chính phủ
- Ứng dụng của DeepSeek đã vươn lên vị trí số 1 trên bảng xếp hạng ứng dụng miễn phí iPhone tại cả Trung Quốc và Mỹ, vượt qua ChatGPT
- Liang Wenfeng tốt nghiệp ngành AI tại Đại học Chiết Giang, đồng sáng lập quỹ đầu tư High-Flyer năm 2016 và thành lập DeepSeek vào tháng 5/2023
- DeepSeek hiện chỉ có dưới 10 nhân viên, một thành viên đã được Xiaomi chiêu mộ vào tháng 12/2024
- Liang tin rằng bản chất trí tuệ con người nằm ở ngôn ngữ, và AI giống người có thể được phát triển từ các mô hình ngôn ngữ lớn
- Ông nhấn mạnh tầm quan trọng của nghiên cứu cơ bản dù lợi nhuận ngắn hạn thấp, và tin rằng đổi mới sáng tạo cần không gian tự do, ít can thiệp
- Về nhân tài, Liang cho rằng kỹ năng nền tảng, sáng tạo và đam mê quan trọng hơn kinh nghiệm, và nhân tài hàng đầu ở Trung Quốc đang bị đánh giá thấp
- Ông nhận định khoảng cách thực sự giữa AI Trung Quốc và Mỹ không phải 1-2 năm mà là khoảng cách giữa sáng tạo và bắt chước
📌 DeepSeek với đội ngũ dưới 10 người đã tạo ra mô hình R1 cạnh tranh với ChatGPT, dẫn đầu thị trường ứng dụng tại Mỹ-Trung. Liang Wenfeng theo đuổi nghiên cứu dài hạn về AGI, tin vào sức mạnh sáng tạo và nhân tài Trung Quốc để đưa quốc gia này thoát khỏi vị thế người đi sau trong lĩnh vực AI.
https://news.cgtn.com/news/2025-01-27/Behind-China-s-rising-AI-startup-DeepSeek-Who-is-Liang-Wenfeng--1AvkPM0cqXK/p.html
Đằng sau sự trỗi dậy của startup AI DeepSeek tại Trung Quốc: Liang Wenfeng là ai?
Công nghệ
18:32, 27/1/2025
Zhao Chenchen
, Cập nhật 21:41, 27/1/2025
Lời của biên tập viên: Trong lĩnh vực trí tuệ nhân tạo (AI), Liang Wenfeng và sản phẩm sáng tạo của ông, DeepSeek, đang nổi lên như một “lực lượng bí ẩn từ phương Đông.” CGTN đang sản xuất một loạt bài về AI nhằm khám phá sức mạnh của đổi mới sáng tạo và tác động toàn cầu của nó. Trong bài viết này, chúng tôi đưa bạn đến hậu trường để tìm hiểu về con người đằng sau DeepSeek, tư tưởng và hành trình của ông.
Một phòng thí nghiệm trí tuệ nhân tạo đặt tại Hàng Châu, tỉnh Chiết Giang ở miền đông Trung Quốc, đã khiến Thung lũng Silicon xôn xao với việc ra mắt mô hình tiên tiến của họ, được huấn luyện với chi phí chỉ bằng một phần nhỏ so với các mô hình phổ biến như ChatGPT của OpenAI. Thành tựu này đã thu hút sự chỉ trích từ nhiều chuyên gia AI trực tuyến, những người mô tả nó là “một bước đi ngược lại” với nỗ lực của Hoa Kỳ nhằm kiềm chế tham vọng công nghệ cao của Trung Quốc.
DeepSeek, được sáng lập bởi quản lý quỹ đầu tư Liang Wenfeng, đã ra mắt mô hình R1 vào thứ Hai tuần trước, kèm theo một bài nghiên cứu chi tiết giải thích cách huấn luyện một mô hình học tăng cường quy mô lớn (RL) mà không cần dựa vào bước tinh chỉnh có giám sát (SFT) ban đầu.
Chỉ trong vài ngày, ứng dụng của DeepSeek đã vươn lên đứng đầu bảng xếp hạng ứng dụng miễn phí trên iPhone tại cả Trung Quốc và Hoa Kỳ, vượt qua ChatGPT, vốn từng thống trị trước đó.
Việc phát hành mô hình R1 của DeepSeek đã làm dấy lên cuộc tranh luận sôi nổi ở Thung lũng Silicon về việc liệu các công ty AI của Hoa Kỳ, bao gồm Meta và OpenAI, có thể duy trì lợi thế công nghệ của họ hay không.
Trong khi đó, Liang trở thành tâm điểm thảo luận tại Trung Quốc. Tuần trước, ông được mời tham dự một hội thảo tại Bắc Kinh, nơi Thủ tướng Trung Quốc Lý Cường lắng nghe ý kiến và đề xuất từ các chuyên gia, doanh nhân, và đại diện từ nhiều lĩnh vực khác nhau—bao gồm giáo dục, khoa học, văn hóa, y tế và thể thao—về bản dự thảo báo cáo công tác chính phủ.
Liang Wenfeng tốt nghiệp Đại học Chiết Giang với bằng về trí tuệ nhân tạo. Năm 2016, ông đồng sáng lập quỹ đầu tư định lượng High-Flyer, nhanh chóng được công nhận nhờ việc sử dụng các chiến lược giao dịch dựa trên AI. Đến năm 2021, High-Flyer đã hoàn toàn tích hợp AI vào hoạt động của mình, sử dụng các mô hình học máy để dự đoán xu hướng thị trường và đưa ra các quyết định đầu tư dựa trên dữ liệu.
Tháng 5/2023, Liang thực hiện một bước đi táo bạo khi thành lập DeepSeek, tập trung nghiên cứu AI nhằm thúc đẩy lĩnh vực trí tuệ nhân tạo tổng quát (AGI). Khác với các doanh nghiệp truyền thống theo đuổi lợi nhuận, DeepSeek được hình thành như một nền tảng cho nghiên cứu cơ bản dài hạn, nơi mà sự tò mò dẫn dắt những bước tiến quan trọng trong AI.
Liang Wenfeng luôn giữ thái độ kín tiếng, chỉ nhận phỏng vấn với Anyong, một thương hiệu phụ của 36Kr, một trang truyền thông công nghệ thương mại của Trung Quốc, vào các năm 2023 và 2024. Dưới đây là các đoạn dịch từ những cuộc phỏng vấn này, hé lộ một phần triết lý và tầm nhìn của ông.
Đối với Liang, DeepSeek giống như một dự án phụ hoặc sở thích, được thúc đẩy bởi sự tò mò sâu sắc và cam kết với nghiên cứu cơ bản. Ông thừa nhận rằng nghiên cứu cơ bản thường mang lại lợi nhuận thấp trong ngắn hạn, nhưng ông bị cuốn hút bởi thách thức trong việc khám phá các lĩnh vực phức tạp như tài chính và tiềm năng của trí tuệ nhân tạo tổng quát (AGI). Liang tập trung vào việc hiểu bản chất của trí tuệ con người và các quá trình cơ bản hình thành nên nó, tin rằng việc khám phá như vậy rất quan trọng mặc dù không có lợi ích thương mại ngay lập tức.
Hồ sơ LinkedIn của DeepSeek cho thấy công ty này có một đội ngũ dưới 10 người. Một thành viên trong nhóm được cho là đã được Lei Jun (Lôi Quân) của Xiaomi mời sang phát triển AI vào tháng 12/2024. Liang tin vào việc phát hiện nhân tài trong nước.
Đổi mới sáng tạo đòi hỏi tự do và không gian để thử nghiệm và mắc lỗi. Liang lưu ý rằng đổi mới thường xuất hiện một cách tự nhiên, chứ không phải được lên kế hoạch hay giảng dạy.
Liang tin rằng Trung Quốc không thể mãi ở vị trí đi sau trong lĩnh vực AI. Trong các cuộc phỏng vấn, ông nhấn mạnh sự cần thiết phải chuyển từ mô phỏng sang sáng tạo và xây dựng hệ sinh thái công nghệ riêng của Trung Quốc.