Tiểu sử ấn tượng của Lương Văn Phong, nhà sáng lập DeepSeek

 
  • Liang Wenfeng sinh năm 1985 tại làng Mililing, Quảng Đông, con trai cô giáo tiểu học, xuất thân nghèo khó. Khi sinh ra, GDP đầu người Trung Quốc chỉ khoảng 300 USD.

  • Năm 2002, đạt thủ khoa kỳ thi đại học toàn khu vực Trạm Giang. Vào học Đại học Chiết Giang danh giá, nơi từng đào tạo nhiều tỷ phú công nghệ.

  • Chuyên ngành kỹ thuật điện tử, sau đó học lên thạc sĩ về machine vision, tốt nghiệp năm 2010 với đề tài về thuật toán theo dõi vật thể cho camera. Kết hợp cùng bạn học Xu Jin, người sau này trở thành đồng sáng lập.

  • Từ năm 2008, bắt đầu giao dịch chứng khoán bằng thuật toán, dùng 80.000 nhân dân tệ và đạt mức sinh lời hơn 100% mỗi năm suốt 7 năm, trở thành tỷ phú.

  • Năm 2015, cùng Xu Jin sáng lập High-Flyer Quant, quỹ giao dịch định lượng hàng đầu Trung Quốc, quản lý trên 100 tỷ nhân dân tệ. Năm 2021, đầu tư 1 tỷ nhân dân tệ xây trung tâm tính toán với 10.000 card đồ họa Nvidia.

  • Đối mặt kiểm soát từ các cơ quan chức năng, High-Flyer chuyển hướng nghiên cứu AI, lập phòng thí nghiệm AI năm 2019. Đầu 2023, DeepSeek tách ra hoạt động độc lập, tập trung phát triển LLM (mô hình ngôn ngữ lớn).

  • DeepSeek gây sốc giới công nghệ với model nguồn mở V3 và model lập luận R1, khiến các đối thủ lớn trong và ngoài nước phải dừng phát triển mô hình riêng như 01.AI của Lý Khai Phục.

  • DeepSeek thu hút hơn 100 nhà khoa học trẻ, phát triển nhanh nhờ hiệu quả chi phí, mô hình nguồn mở. Được các tập đoàn lớn như Alibaba, Tencent tìm cách tích hợp vào sản phẩm.

  • Lương kiệm lời, không xuất hiện trên mạng xã hội và hiếm khi phát biểu công khai. Từ chối tiếp xúc báo chí, nhà đầu tư, và cả các quan chức địa phương.

  • DeepSeek thúc đẩy làn sóng ứng dụng AI trên toàn Trung Quốc, dù vẫn gặp khó khăn về nguồn chip tiên tiến do Mỹ hạn chế xuất khẩu.

  • Mục tiêu tham vọng của Lương là đạt tới AGI (AI tổng quát), tin rằng LLM là con đường khả thi nhất.

  • Câu chuyện vươn lên của Lương trở thành đề tài truyền cảm hứng cho học sinh, xuất hiện trên áp phích tại trường cấp hai nơi từng học, là hình mẫu về kiên trì, nỗ lực và đổi mới.

📌 Lương Văn Phong từ làng quê nghèo đã trở thành tỷ phú, nhà sáng lập DeepSeek – start-up AI nguồn mở gây rúng động thế giới khi vượt qua Big Tech Mỹ trong lĩnh vực AI lý luận. DeepSeek thu hút hơn 100 nhà khoa học, mô hình nguồn mở hiệu quả giúp giảm chi phí, kéo theo làn sóng ứng dụng AI khắp Trung Quốc dù vẫn đối mặt thách thức chip Mỹ.

 

 
https://www.scmp.com/tech/tech-trends/article/3307072/gifted-student-ai-hero-deepseeks-founder-liang-wenfeng-inspires-nation
 

Từ học sinh xuất sắc đến anh hùng AI, nhà sáng lập DeepSeek Liang Wenfeng truyền cảm hứng cho cả dân tộc

Xuất thân từ một làng quê hẻo lánh ở miền nam Trung Quốc, Liang Wenfeng đã vươn lên từ nguồn gốc khiêm tốn để trở thành một cái tên nổi tiếng

Coco Feng tại Mililing, tỉnh Guangdong

Đăng ngày: 11:00 sáng, 19/4/2025

Không lâu trước đây, ít người ở Trung Quốc từng nghe nói về Mililing, một ngôi làng yên tĩnh nằm trong một góc hẻo lánh của tỉnh Guangdong phía nam. Nhưng mọi thứ đã thay đổi vào đầu năm nay khi hàng trăm du khách đến mỗi ngày để bày tỏ lòng kính trọng đối với Liang Wenfeng, nhà sáng lập 40 tuổi của công ty khởi nghiệp trí tuệ nhân tạo (AI) DeepSeek, người đã nổi lên như một anh hùng khi mang lại cho đất nước lợi thế trong cuộc cạnh tranh công nghệ với Mỹ.

Người dân trong làng, nhiều người có cùng họ Liang, đã dựng quầy gần nhà thời thơ ấu của ông để bán đồ lưu niệm và đồ uống, bao gồm nước mía zhuangyuan - một sự tri ân đến danh hiệu cổ xưa dành cho những người đứng đầu kỳ thi khoa cử triều đình. Giống như Liang, nhiều học giả trong quá khứ đã vươn lên từ xuất thân khiêm tốn để đạt được danh tiếng và sự giàu có thông qua sự xuất sắc về trí tuệ.

Kể từ khi DeepSeek gây chấn động cho cả Thung lũng Silicon và Phố Wall với mô hình lập luận mạnh mẽ vào tháng 1, Liang đã trở thành một trong những nhân vật có ảnh hưởng nhất của Trung Quốc, tương tự như các nhà khoa học hạt nhân và tên lửa của những năm 1950 và 1960, những người đã giúp thúc đẩy lợi thế chiến lược của quốc gia. Trên toàn cầu, Liang được xem như một doanh nhân công nghệ đáng gờm, với tiềm năng làm lu mờ các nhà lãnh đạo Mỹ như nhà sáng lập OpenAI Sam Altman và định hình lại sự cạnh tranh Mỹ-Trung.

"Trung Quốc không thể luôn là người đi sau," Liang nói trong một cuộc phỏng vấn với cơ quan truyền thông Trung Quốc 36Kr vào năm 2024.

Một người bán hàng kể với phóng viên Post rằng Liang đã trở về làng trong dịp Tết Nguyên đán vào cuối tháng 1, có cảnh sát vũ trang đi cùng, nhấn mạnh tầm quan trọng then chốt của ông đối với đất nước.

Một quầy bán nước mía zhuangyuan tại làng Mililing. Ảnh: Coco Feng

Khi Liang được sinh ra bởi một giáo viên tiểu học vào năm 1985, Trung Quốc vẫn chưa thoát khỏi cái bóng của nền kinh tế kế hoạch. Nước này có tổng sản phẩm quốc nội (GDP) đầu người là 300 USD, dịch vụ tài chính hạn chế và không có thị trường chứng khoán. Mililing vẫn còn là một cộng đồng nông thôn truyền thống nơi mọi người dường như đều biết nhau.

Trong một bản tin quyên góp địa phương, có ghi nhận rằng "Wenfeng" đã đóng góp 3.000 nhân dân tệ (41 USD) để hỗ trợ người cao tuổi Trung Quốc, cùng với hơn 100 người dân làng khác có cùng họ, theo một báo cáo đầu tháng này từ tờ báo Hàn Quốc Chosun Ilbo. Đây là một truyền thống bộ tộc phổ biến trên khắp đất nước. Năm ngoái, thông tin cho thấy Zhang Yiming, nhà sáng lập công ty mẹ của TikTok là ByteDance, đã quyên góp 2 triệu nhân dân tệ cho một đền thờ tổ tiên ở làng Kongfu thuộc tỉnh Fujian ở đông nam.

Liang đã xuất sắc trong hệ thống giáo dục công của Trung Quốc, vốn nhấn mạnh vào toán học và vật lý. Vào năm 2002, năm Trung Quốc ghi nhận GDP đầu người đạt 1.150 USD sau khi gia nhập Tổ chức Thương mại Thế giới một năm trước đó, chàng trai 17 tuổi đã đạt điểm cao nhất trong kỳ thi đại học quốc gia ở khu vực Zhanjiang của Guangdong.

Thành tích học tập xuất sắc đã giúp ông được nhận vào trường Đại học Zhejiang danh tiếng ở Hangzhou, thủ phủ bên hồ của tỉnh Zhejiang phía đông, nơi Jack Ma 38 tuổi đang phấn đấu phát triển công ty khởi nghiệp thương mại điện tử mang tên Alibaba.

Lớp 1999 tại bộ phận trung học cơ sở của Trường Trung học Số 1 Wuchuan. Liang Wenfeng ngồi ở hàng trên cùng, thứ 6 từ phải sang. Ảnh: Coco Feng

Đại học Zhejiang được cho là cạnh tranh với Đại học Thanh Hoa và Đại học Bắc Kinh trong việc sản sinh ra các tỷ phú. Cựu sinh viên bao gồm Colin Huang Zheng, nhà sáng lập gã khổng lồ mua sắm trực tuyến PDD Holdings, có tài sản cá nhân ước tính 34 tỷ USD. Sự bùng nổ kinh tế của Trung Quốc vào đầu những năm 2000 đã tạo ra nhiều câu chuyện đi lên từ nghèo khó, nhấn mạnh sức mạnh chuyển đổi của công nghệ trong một nền kinh tế thị trường phát triển nhanh chóng.

Liang học kỹ thuật điện tử và tham gia chương trình sau đại học ba năm về thị giác máy tính vào năm 2007. Ông tốt nghiệp vào năm 2010 với luận văn về thuật toán theo dõi đối tượng cho máy ảnh. Trong bài báo, ông đã cảm ơn người hướng dẫn và 5 bạn cùng lớp. Một trong số họ, Xu Jin, đã trở thành đối tác kinh doanh thân thiết, tương tự như sự hợp tác của Zhang với bạn cùng phòng đại học Liang Rubo, người đồng sáng lập ByteDance.

Thời gian của Liang ở Hangzhou trùng với một thời kỳ phấn khích kinh tế, biến động thị trường chứng khoán, và việc áp dụng nhanh chóng các công nghệ internet bắt nguồn từ sự phổ biến của điện thoại thông minh.

Mặc dù bằng cấp danh giá mang lại nhiều cơ hội việc làm trả lương cao, Liang đã chọn con đường riêng. Thực tập là bắt buộc trong một số chương trình học. Liang là người duy nhất trong nhóm thực tập yêu cầu không đến văn phòng công ty, theo một người trực tiếp tham gia, người từ chối nêu tên.

Sau khi tốt nghiệp, Liang chuyển đến Chengdu, thủ phủ của tỉnh Sichuan phía tây nam, nổi tiếng với lối sống nhẹ nhàng. Tại đó, ông làm việc trên một dự án sử dụng thuật toán cho giao dịch chứng khoán, lấy cảm hứng từ nhà đầu tư quỹ đầu cơ Mỹ huyền thoại James Simons. Liang đã viết lời tựa cho phiên bản tiếng Trung của tiểu sử Simons, tự tin khẳng định rằng sẽ có cách phát triển các mô hình có thể dự đoán giá cả.

Vào năm 2015, Liang đồng sáng lập High-Flyer Quant với Xu. Một bài đăng tuyển dụng ban đầu đã gợi ý về thành công của Liang: bài đăng nói rằng vào năm 2008, một "ông L" bắt đầu giao dịch cổ phiếu bằng thuật toán với khoản đầu tư ban đầu là 80.000 nhân dân tệ; trong 7 năm tiếp theo, ông đã đạt được lợi nhuận hàng năm trên 100% để trở thành tỷ phú.

High-Flyer nhanh chóng nổi lên như một trong bốn quỹ giao dịch lượng tử hàng đầu của Trung Quốc, với tài sản quản lý vượt quá 100 tỷ nhân dân tệ khi các nhà đầu tư tranh nhau gửi tiền cho Liang. Dòng chảy nguồn lực đã cho phép ông xây dựng một trung tâm điện toán khổng lồ để phân tích dữ liệu và lựa chọn cổ phiếu.

Vào năm 2021, High-Flyer đã đầu tư 1 tỷ nhân dân tệ để phát triển một trung tâm điện toán được trang bị 10.000 card đồ họa Nvidia, công ty cho biết.

Tuy nhiên, thành công mang đến thách thức. Giao dịch lượng tử, mặc dù được chấp nhận, bị các cơ quan quản lý Trung Quốc nhìn nhận với sự hoài nghi, khiến Liang lo sợ sự giám sát, theo một nguồn tin gần gũi với công ty. Vào năm 2022, High-Flyer đã giảm tài sản quản lý bằng cách trả lại tiền cho các nhà đầu tư và mua cổ phiếu trong thời điểm thị trường suy thoái.

Khi nguồn lực điện toán của High-Flyer vượt quá nhu cầu giao dịch hàng ngày, Liang đã chuyển hướng nỗ lực sang nghiên cứu AI. Vào năm 2019, ông thành lập một phòng thí nghiệm AI. Đầu năm 2023, chỉ vài tháng sau khi OpenAI ra mắt ChatGPT, ông đã chuyển phòng thí nghiệm thành một tổ chức độc lập có tên DeepSeek, tập trung vào phát triển mô hình ngôn ngữ lớn (LLM).

Giữa bối cảnh LLM đông đúc, DeepSeek nổi lên như một nhà đổi mới thực sự, làm lu mờ cả các công ty công nghệ lớn và vô số công ty khởi nghiệp. Việc phát hành mô hình cơ sở V3 mã nguồn mở vào tháng 12 và mô hình lập luận R1 vào tháng 1 đã cách mạng hóa thị trường AI trong nước. Lee Kai-fu, nhà sáng lập và CEO của công ty khởi nghiệp 01.AI, đã nói trong một cuộc phỏng vấn với Post vào tháng 3 rằng công ty của ông đã ngừng phát triển các mô hình riêng trước thành công của DeepSeek.

DeepSeek, công ty thuê hơn 100 nhà khoa học trẻ, đang ở vị thế đạt được nhiều bước đột phá hơn nữa. Với việc nâng cấp gần đây của V3, công ty khởi nghiệp đã thể hiện cam kết tiến bộ kỹ thuật mặc dù đã đạt được danh tiếng sớm.

"Đội ngũ DeepSeek đang cải thiện sản phẩm của họ, đồng thời giữ sự phô trương ở mức tối thiểu có thể," Petri Kuittinen, giảng viên công nghệ thông tin và truyền thông tại Đại học Khoa học Ứng dụng Häme ở Phần Lan cho biết.

Các mô hình của DeepSeek cũng tiết kiệm chi phí và mã nguồn mở, cung cấp một giải pháp thay thế khả thi cho các mô hình phát triển ở Mỹ. Điều này trái ngược với OpenAI, mặc dù có tên như vậy, nhưng hoạt động với mô hình mã nguồn đóng và giữ bí mật các đổi mới, Kuittinen nói.

Mặc dù có nhiều lời khen ngợi, Liang vẫn giữ hồ sơ thấp. Sự xuất hiện đáng chú ý duy nhất của ông là tại một hội thảo cấp cao do Chủ tịch Trung Quốc Tập Cận Bình chủ trì vào tháng 2. Liang không phát biểu, không giống như những người tham dự khác như nhà sáng lập Huawei Technologies Ren Zhengfei và nhà sáng lập Xiaomi Lei Jun, theo một video từ Đài Truyền hình Trung ương Trung Quốc.

Liang từ chối lời mời phát biểu tại Hội nghị Thượng đỉnh Hành động về AI ở Paris trong cùng tháng và nhiều lần từ chối các yêu cầu phỏng vấn, ngay cả khi hàng loạt phóng viên tụ tập bên ngoài trụ sở của DeepSeek trong một tòa nhà văn phòng cao cấp ở Hangzhou. Nguồn tin cho biết ông cũng từ chối các cuộc gặp với các nhà đầu tư tiềm năng và quan chức chính quyền địa phương.

Đáng chú ý, Liang không có sự hiện diện trên mạng xã hội công khai, một thành tích phi thường ngay cả theo tiêu chuẩn của các doanh nhân công nghệ Trung Quốc kín tiếng. Bằng chứng duy nhất về sự tham gia của ông vào DeepSeek là tên ông xuất hiện trong các bài báo nghiên cứu do công ty khởi nghiệp công bố. Sự kín tiếng của ông tương phản rõ rệt với Altman, người tích cực quảng bá sản phẩm của OpenAI trên toàn cầu.

Sự nổi lên của Liang làm phức tạp vấn đề cho Altman, thúc đẩy OpenAI đánh giá lại chiến lược mã nguồn mở và vị thế thị trường, theo Kevin Zhou, nhà sáng lập tổ chức truyền thông công nghệ Pandaily và tác giả của tiểu sử đầu tiên bằng tiếng Trung về Altman. Altman đã nói đầu tháng này trên X rằng OpenAI sẽ phát hành "một mô hình ngôn ngữ mã nguồn mở mạnh mẽ với khả năng lập luận trong những tháng tới".

Liang dự đoán năm ngoái rằng các nhà phát triển mô hình AI khác cuối cùng sẽ vượt qua OpenAI, ngay cả khi nhà sản xuất ChatGPT giữ sản phẩm của mình ở dạng mã nguồn đóng.

Với những tiến bộ trong kỹ thuật như kiến trúc "hỗn hợp chuyên gia" và sự chú ý tiềm ẩn đa đầu, DeepSeek đã giảm đáng kể chi phí đào tạo AI. Quan trọng hơn, các mô hình của công ty được phát triển bởi các nhà khoa học Trung Quốc. Công ty khởi nghiệp đã thúc đẩy làn sóng quốc gia trong việc áp dụng công nghệ AI trên các lĩnh vực khác nhau. Mặc dù DeepSeek không thể đáp ứng tất cả nhu cầu, các gã khổng lồ công nghệ Trung Quốc, bao gồm Alibaba và Tencent Holdings, đều háo hức tích hợp các mô hình của DeepSeek vào sản phẩm của riêng họ.

"Đổi mới không chỉ là kỹ thuật; nó còn mang tính chiến lược," Sujan Sarkar, đồng sáng lập AITools.xyz, một trang web theo dõi độ phổ biến của các dịch vụ AI, cho biết.

Tuy nhiên, DeepSeek, hoạt động giống như một phòng thí nghiệm hơn là một công ty truyền thống, đang đối mặt với những thách thức ngày càng tăng trong việc duy trì đà phát triển. Kỳ vọng rất cao cho mô hình tiếp theo của công ty, tuy nhiên công ty gặp khó khăn với việc tiếp cận hạn chế đối với các chip tiên tiến từ Mỹ.

"Liệu nó có thể hoàn toàn thoát khỏi quy luật mở rộng không?" một nguồn tin gần gũi với các nhà phát triển tại DeepSeek hỏi, đề cập đến nguyên tắc rằng dữ liệu đào tạo lớn hơn và tham số mô hình nâng cao trí thông minh của mô hình. "Câu trả lời vẫn chưa được biết."

Liang đã nói rằng mục tiêu cuối cùng của DeepSeek là đạt được trí tuệ nhân tạo tổng quát (AGI), một giai đoạn mà AI có thể phù hợp hoặc vượt quá khả năng nhận thức của con người. "LLM sở hữu một số đặc điểm sơ bộ của AGI và có khả năng là con đường duy nhất dẫn đến AGI," ông nói. "Chúng tôi sẽ bắt đầu từ đây và làm việc với thị giác sau."

Mặc dù vẫn chưa rõ liệu DeepSeek có thể tiếp tục đổi mới hay không, Liang, người được đào tạo hoàn toàn ở Trung Quốc, đã trở thành nguồn cảm hứng cho thế hệ trẻ của quốc gia.

Câu chuyện của Liang được trưng bày trong một áp phích tại trường tiểu học của ông, cho biết ông bắt đầu học toán cấp đại học trong thời gian học trung học cơ sở. Tại Trường Trung học Số 1 Wuchuan, nơi Liang học trong sáu năm, học sinh chọn giữa các hướng khoa học và nghệ thuật ở lớp 10, với 20 trong số 28 lớp ở lớp 11 tập trung vào các môn khoa học như toán học, vật lý và hóa học.

Giáo viên thường trích dẫn Liang như một ví dụ động viên cho học sinh chăm chỉ. Về phần học sinh viết bài luận như một phần của kỳ thi văn học Trung Quốc năm nay, nhiều em nói rằng chắc chắn sẽ sử dụng nhà sáng lập DeepSeek như một ví dụ để minh họa các chủ đề về sự kiên trì, cống hiến và vượt qua nghịch cảnh.

 

From gifted student to AI hero, DeepSeek’s founder Liang Wenfeng inspires a nation

 
Hailing from an obscure village in southern China, Liang Wenfeng has risen from humble roots to become a household name
 
Coco Fengin Mililing, Guangdong Province
Not long ago, few people in China had heard of Mililing, a sleepy village nestled in a remote corner of southern Guangdong province. But things changed earlier this year when hundreds of visitors arrived every day to pay homage to Liang Wenfeng, the 40-year-old founder of the artificial intelligence (AI) start-up DeepSeek, who has emerged as a hero for giving his country an edge in its tech rivalry with the US.
Villagers, many sharing the surname Liang, set up stalls near his childhood home to sell souvenirs and drinks, including zhuangyuan sugar cane juice – an homage to the ancient title given to top scorers of the imperial examination. Like Liang, many past scholars had risen from humble beginnings to achieve fame and fortune through sheer intellectual excellence.
Since DeepSeek shocked Silicon Valley and Wall Street alike with its powerful reasoning model in January, Liang has become one of China’s most influential figures, akin to the nuclear and rocket scientists of the 1950s and 1960s, who helped advance the nation’s strategic advantages. Globally, Liang is viewed as a formidable technology entrepreneur, with the potential to overshadow US leaders like OpenAI founder Sam Altman and reshape the US-China rivalry.
“China can’t always be a follower,” Liang said in an interview with Chinese media outlet 36Kr in 2024.
A vendor told a Post reporter that Liang returned to the village during the Lunar New Year in late January, accompanied by armed police officers, highlighting his critical importance to the country.
When Liang was born to a primary school teacher in 1985, China had yet to emerge from the shadow of a planned economy. It had a gross domestic product (GDP) per capita of US$300, limited financial services and no stock market. Mililing still remains a traditional rural community where everyone seems to know each other.
In a local donation bulletin, it was noted that “Wenfeng” contributed 3,000 yuan (US$41) to support China’s elderly, alongside over 100 other villagers with the same surname, according to a report earlier this month from South Korean newspaper Chosun Ilbo. It is a tribal tradition common across the country. Last year, it emerged that Zhang Yiming, founder of TikTok’s parent company ByteDance, had donated 2 million yuan to an ancestral temple in Kongfu village in Fujian province in the southeast.
Liang excelled in China’s public education system, which emphasises maths and physics. In 2002, the year China recorded a GDP per capita of US$1,150 after joining the World Trade Organization a year earlier, the then 17-year-old achieved the highest score in the national university entrance exam in the Zhanjiang region of Guangdong.
His stellar academic performance led to enrolment at the prestigious Zhejiang University in Hangzhou, the lakeside capital of east Zhejiang province, where a 38-year-old Jack Ma was struggling to grow his e-commerce start-up called Alibaba.
Zhejiang University is believed to rival Tsinghua University and Peking University in producing billionaires. Alumni include Colin Huang Zheng, founder of online shopping giant PDD Holdings, whose personal wealth is estimated at US$34 billion. China’s economic boom in the early 2000s fostered numerous rags-to-riches stories, underscoring the transformative power of technology in a rapidly growing market economy.
Liang studied electronics engineering and entered a three-year postgraduate programme in machine vision in 2007. He graduated in 2010 with a thesis on an object-tracking algorithm for cameras. In the paper, he thanked his tutor and five classmates. One of them, Xu Jin, became a close business partner, mirroring Zhang’s collaboration with his university roommate Liang Rubo, who co-founded ByteDance.
Liang’s time in Hangzhou coincided with an era of economic exuberance, stock market fluctuations, and the rapid adoption of internet technologies stemming from the proliferation of smartphones.
Despite his prestigious degree leading to many well-paying job opportunities, Liang chose to forge his own path. Internships are mandatory in some degree programmes. Liang was the only person in his intern group who requested not to go to the corporate office, according to a person with direct involvement, who declined to be named.
After graduation, Liang moved to Chengdu, the capital of southwest Sichuan province known for its laid-back lifestyle. There, he worked on a project using algorithms for stock trading, inspired by the legendary American hedge fund investor James Simons. Liang wrote a preface for the Chinese version of Simons’ biography, confidently asserting that there would be a way to develop models that can predict prices.
In 2015, Liang co-founded High-Flyer Quant with Xu. An early recruitment post hinted at Liang’s success: it said that in 2008, a “Mr L” started to trade stocks using algorithms with an initial investment of 80,000 yuan; over the next seven years, he achieved over 100 per cent annual returns to become a billionaire.
High-Flyer quickly rose to prominence as one of China’s top four quantum trading funds, with assets under management exceeding 100 billion yuan as investors clamoured to entrust their funds to Liang. The influx of resources allowed him to build a massive computing centre for data analysis and stock selection.
In 2021, High-Flyer invested 1 billion yuan to develop a computing centre equipped with 10,000 Nvidia graphics cards, the company said.
However, success brought challenges. Quantum trading, while tolerated, is viewed with scepticism by Chinese regulators, leading Liang to fear scrutiny, according to a source close to the company. In 2022, High-Flyer reduced its assets under management by returning funds to investors and made stock purchases during a market downturn.
As High-Flyer’s computing resources surpassed daily trading needs, Liang redirected efforts towards AI research. In 2019, he established an AI lab. In early 2023, just months after OpenAI’s launch of ChatGPT, he transformed the lab into an independent entity called DeepSeek, focusing on large language model (LLM) development.
Amid a crowded LLM landscape, DeepSeek emerged as a true innovator, overshadowing both major tech firms and a bevy of start-ups. Its release of the open-source V3 foundation model in December and the R1 reasoning model in January revolutionised the domestic AI market. Lee Kai-fu, founder and CEO of the start-up 01.AI, said in an interview with the Post in March that his company had stopped developing its own models in view of DeepSeek’s success.
DeepSeek, which employs over 100 young scientists, is poised for more breakthroughs. With its recent upgrade of V3, the start-up has shown a commitment to technical advancement despite having achieved early fame.
“The DeepSeek team is improving their products, while keeping the hype as minimal as possible,” said Petri Kuittinen, a lecturer of information and communication technology at Häme University of Applied Sciences in Finland.
DeepSeek’s models are also cost-effective and open-source, providing a viable alternative to US-developed models. This was in stark contrast with OpenAI, which, despite its name, operated with a closed-source model and kept innovations secret, Kuittinen said.
Despite the accolades, Liang maintains a low profile. His only notable appearance was at a high-profile symposium chaired by Chinese President Xi Jinping in February. Liang did not speak, unlike other attendees such as Huawei Technologies founder Ren Zhengfei and Xiaomi founder Lei Jun, according to a video from China Central Television.
 
Liang declined invitations to speak at the AI Action Summit in Paris in the same month and repeatedly turned down interview requests, even as hordes of reporters gathered outside DeepSeek’s headquarters in a high-end office building in Hangzhou. Sources said he also rejected meetings with potential investors and local government officials.
Remarkably, Liang has no public social media presence, an extraordinary feat even by the standards of reclusive Chinese tech entrepreneurs. The only evidence of his involvement in DeepSeek is his name appearing in research papers published by the start-up. His reticence sharply contrasts with Altman, who actively promotes OpenAI’s products globally.
Liang’s emergence complicates matters for Altman, prompting OpenAI to re-evaluate its open-source strategy and market positioning, according to Kevin Zhou, founder of tech media outlet Pandaily and author of the first Chinese-language biography of Altman. Altman said earlier this month on X that OpenAI would release “a powerful new open-weight language model with reasoning in the coming months”.
Liang predicted last year that other AI model developers would eventually surpass OpenAI, even if the ChatGPT maker kept its products closed-source.
With advances in techniques like the “mixture-of-experts” architecture and multi-head latent attention, DeepSeek has significantly reduced AI training costs. More importantly, its models are developed by Chinese scientists. The start-up has fuelled a national rush to adopt AI technologies across various sectors. Even though DeepSeek is unable to meet all demands, Chinese tech giants, including Alibaba and Tencent Holdings, are eager to integrate DeepSeek’s models into their own products.
“The innovation isn’t just technical; it’s also strategic,” said Sujan Sarkar, co-founder of AITools.xyz, a website that tracks the popularity of AI services.
However, DeepSeek, which operates more like a lab than a traditional company, faces growing challenges in maintaining its momentum. Expectations are high for its next model, yet the company struggles with restricted access to advanced chips from the US.
“Can it completely break away from the scaling law?” asked a source close to developers at DeepSeek, referring to the principle that larger training data and model parameters enhance a model’s intelligence. “The answer remains unknown.”
Liang has said that DeepSeek’s ultimate goal is to achieve artificial general intelligence (AGI), a stage where AI can match or exceed human cognitive abilities. “LLMs possess some preliminary characteristics of AGI and are likely the only path to AGI,” he said. “We’ll start here and work on vision later.”
While it remains to be seen if DeepSeek can continue to innovate, Liang, who was fully educated in China, has already become an inspiration for the nation’s younger generation.
Liang’s story is featured in a poster at his primary school, which said he began studying university-level maths during middle school. At Wuchuan No 1 Middle School, where Liang studied for six years, pupils choose between the science and arts streams in 10th grade, with 20 out of 28 classes in the 11th grade focusing on science subjects like maths, physics and chemistry.
Teachers frequently cite Liang as a motivational example for diligent students. As for the students writing essays as part of their Chinese literature exams this year, many said they would surely use the DeepSeek founder as an example to illustrate themes of perseverance, dedication and overcoming adversity.

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo