Ấn Độ đặt mục tiêu phát triển mô hình ngôn ngữ lớn (LLM) nội địa, kỳ vọng tạo ra đột phá tương tự Trung Quốc với DeepSeek, mô hình chi phí thấp nhưng hiệu quả cao.
Chính phủ đã phân bổ 10.372 crore rupee (~1,25 tỷ USD) cho IndiaAI Mission, nhằm cung cấp hạ tầng tính toán, đào tạo kỹ năng và hỗ trợ startup AI.
Tuy nhiên, đào tạo LLM cần khối lượng dữ liệu khổng lồ, năng lực tính toán mạnh và chi phí đầu tư lớn – vượt quá ngân sách hiện có của Ấn Độ.
DeepSeek đã tiêu tốn hơn 1,3 tỷ USD, trong khi các tập đoàn lớn như Microsoft và Google đầu tư tới 80 tỷ USD/năm vào AI, tạo nên khoảng cách rất lớn.
Dù có nhiều tài năng, Ấn Độ đối mặt với chảy máu chất xám và hệ sinh thái học thuật thiếu đầu tư khiến nghiên cứu AI gặp khó.
Rào cản lớn nhất là dữ liệu: phần lớn nội dung web công khai hiện nay thiên về tiếng Anh, trong khi Ấn Độ đa ngôn ngữ, nhưng người dùng vẫn duyệt web bằng tiếng Anh.
Các nước đơn ngữ như Trung Quốc, Hàn Quốc, Nhật Bản có lợi thế khi dữ liệu nội địa tập trung hơn, giúp LLM phản ánh văn hóa và ngôn ngữ tốt hơn.
Một số startup như Sarvam AI (LLM 2 tỷ tham số, hỗ trợ 11 ngôn ngữ) và Karya (trả tiền cho người dùng để thu âm ngôn ngữ mẹ đẻ) đang cố gắng lấp đầy khoảng trống dữ liệu này.
Krutrim AI (hậu thuẫn bởi Ola) tận dụng tài xế làm “công nhân dữ liệu”, đóng góp vào hệ sinh thái ngôn ngữ bản địa.
Chính phủ cũng phát triển nền tảng dữ liệu riêng, nhưng chưa rõ nguồn, cách làm sạch và gắn nhãn dữ liệu sẽ thực hiện như thế nào.
Nhiều chuyên gia như Nandan Nilekani (sáng lập Infosys) từng nghi ngờ hiệu quả chi phí của LLM, nhưng sau thành công của DeepSeek, ông công nhận rằng việc xây dựng LLM với 50 triệu USD là khả thi.
Tuy nhiên, ông vẫn nhấn mạnh rằng thay vì xây dựng một LLM duy nhất, nên đầu tư vào hạ tầng, điện toán và AI cloud, từ đó tạo điều kiện để thị trường tư nhân và học thuật cùng phát triển mô hình AI.
Bài học từ các lĩnh vực như không gian và viễn thông – nơi Ấn Độ đạt thành công nhờ chi phí thấp và sáng tạo cục bộ – vẫn là động lực, nhưng AI đòi hỏi quy mô và hệ sinh thái lớn hơn rất nhiều.
Thách thức chính là làm sao để AI vừa rẻ, vừa hữu dụng cho người dân Ấn Độ, không chỉ là đuổi kịp mô hình phương Tây.
📌 Ấn Độ đặt nhiều kỳ vọng vào mô hình AI nội địa như DeepSeek, nhưng đối mặt với rào cản lớn về dữ liệu ngôn ngữ, hạ tầng tính toán và tài chính. Dù có các startup như Sarvam, Karya và Krutrim dẫn đầu, Ấn Độ vẫn cần chiến lược dài hạn để xây dựng hệ sinh thái AI toàn diện – nơi chính phủ, học thuật và thị trường tư nhân cùng hợp lực tạo đột phá.
https://www.thehindu.com/sci-tech/technology/ai-is-india-falling-behind/article69359080.ece
Premium
Thành công của DeepSeek tại Trung Quốc đã thắp lên hy vọng tạo ra một LLM nội địa; các nhà hoạch định chính sách đã trích dẫn những tiến bộ chi phí thấp của Ấn Độ trong thám hiểm vũ trụ như một ví dụ về tiềm năng tìm ra bước đột phá tương tự trong AI, nhưng con đường phía trước là một chặng đường khó khăn.
Cập nhật - 05/05/2025 08:47 tối IST
Aroon Deep
Tại Ấn Độ, bước tiến quan trọng trong việc tạo ra một LLM nội địa có thể là một chặng đường khó khăn, mặc dù đó là điều mà chính phủ và các công ty khởi nghiệp đang mong muốn đạt được.
Chính phủ Ấn Độ và một nhóm các công ty khởi nghiệp đã đặt mục tiêu tạo ra một mô hình ngôn ngữ lớn (LLM) AI nền tảng bản địa, tương tự như ChatGPT của OpenAI, Gemini của Google và Llama của Meta. AI nền tảng, hay LLM, là các hệ thống được huấn luyện thủ công có thể tạo ra các phản hồi cho các truy vấn. Việc huấn luyện chúng đòi hỏi lượng dữ liệu lớn và sức mạnh tính toán khổng lồ, hai nguồn lực dồi dào trên internet và trong không gian mạng của các quốc gia phương Tây.
Tại Ấn Độ, bước tiến quan trọng trong việc tạo ra một LLM nội địa có thể là một chặng đường khó khăn, mặc dù đó là điều mà chính phủ và các công ty khởi nghiệp đang mong muốn đạt được. Hy vọng đặc biệt tăng cao sau thành công của DeepSeek. Công ty Trung Quốc này, với chi phí thấp hơn nhiều so với các công ty công nghệ phương Tây, đã có thể huấn luyện một mô hình "suy luận" (reasoning) - mô hình đưa ra phản hồi sau một loạt các bước suy luận logic được hiển thị cho người dùng dưới dạng trừu tượng và thường có thể đưa ra các phản hồi tốt hơn nhiều. Các nhà hoạch định chính sách đã trích dẫn những tiến bộ chi phí thấp của Ấn Độ trong thám hiểm vũ trụ và viễn thông như một ví dụ quan trọng về tiềm năng đạt được một bước đột phá tương tự, và sớm.
LLM và mô hình ngôn ngữ nhỏ (SLM) thường được biên soạn bằng cách cô đọng khối lượng lớn dữ liệu văn bản, thường được thu thập từ web, và "huấn luyện" hệ thống thông qua một mạng nơ-ron. Mạng nơ-ron là một mô hình học máy bắt chước cách thức hoạt động của bộ não con người bằng cách liên kết nhiều mảnh thông tin và truyền qua các "lớp" nút cho đến khi một đầu ra, dựa trên nhiều tương tác trong các lớp ẩn, tạo ra một phản hồi chấp nhận được.
Mạng nơ-ron đã là một bước đột phá to lớn trong học máy và trong nhiều năm đã là nền tảng của các dịch vụ như kiểm duyệt mạng xã hội tự động, dịch máy, hệ thống đề xuất trên các dịch vụ như YouTube và Netflix, và nhiều công cụ thông minh kinh doanh.
Trong khi học sâu và phát triển học máy tăng mạnh vào những năm 2010, nghiên cứu cơ bản đã có một số phát triển quan trọng, chẳng hạn như "cơ chế chú ý" (attention mechanism), một khung xử lý ngôn ngữ tự nhiên hiệu quả giúp các nhà phát triển có cách phân tích một câu thành các thành phần, cho phép hệ thống máy tính đến gần hơn với việc "hiểu" một đầu vào không phải là một đoạn mã. Ngay cả khi công nghệ này không hoàn toàn dựa trên bất kỳ loại trí thông minh thực sự nào, nó vẫn là một bước nhảy vọt về khả năng học máy.
Transformer, dựa trên những tiến bộ này, là bước đột phá quan trọng đã mở đường cho các LLM như ChatGPT. Một bài báo năm 2017 của các nhà nghiên cứu tại Google đã trình bày kiến trúc transformer, lần đầu tiên đưa ra lý thuyết về việc huấn luyện LLM trên đơn vị xử lý đồ họa (GPU), đã trở thành yếu tố quan trọng cho toàn bộ ngành công nghệ chuyển hướng sang AI.
Phải mất khá nhiều thời gian trước khi OpenAI bắt đầu thực hiện những phát hiện của bước tiến này theo cách mà công chúng có thể chứng kiến. Mô hình đầu tiên của ChatGPT được phát hành hơn năm năm sau bài báo của các nhà nghiên cứu Google, vì một lý do đã nổi lên như một cơn đau đầu thương mại cho các công ty muốn tận dụng AI và cho các quốc gia muốn xây dựng khả năng của họ: chi phí.
Chỉ riêng việc huấn luyện mô hình chính đầu tiên, ChatGPT 3.5, đã tốn hàng triệu đô la, chưa kể đến cơ sở hạ tầng trung tâm dữ liệu. Với việc thiếu thương mại hóa ngay lập tức, loại chi phí này nhất thiết là một canh bạc dài hạn, loại mà chỉ một công ty công nghệ lớn, hoặc các nhà đầu tư mạo hiểm giàu có, mới có thể tài trợ trong trung hạn.
Tuy nhiên, kết quả rất đáng kinh ngạc. Cuộc bùng nổ AI tạo sinh bắt đầu một cách nghiêm túc sau mô hình công khai đầu tiên của ChatGPT, thể hiện những tiến bộ kỹ thuật tích lũy trong học máy cho đến khi phát hành. Bài kiểm tra Turing, một chuẩn mực có thể được vượt qua bởi một máy phản hồi một truy vấn đủ giống với con người, không còn là một cách hữu ích để nhìn vào các mô hình AI mới.
Một cuộc đua chóng mặt theo sau để tung ra các mô hình nền tảng tương tự từ các công ty khác đã làm việc trên công nghệ này. Các công ty như Google, vào năm 2022, đã chạy các mô hình của họ như LaMDA. Mô hình này đã xuất hiện trên tin tức khi một nhà phát triển nổi tiếng tại công ty đã công khai (và không có căn cứ) tuyên bố rằng chatbot này gần như có ý thức. Công ty đã tránh phát hành mô hình khi họ làm việc về an toàn và chất lượng.
Tuy nhiên, cuộc đua AI tạo sinh đã thay đổi mọi thứ, với mỗi công ty được định vị tốt nhất để làm việc trên các mô hình như vậy dưới áp lực to lớn từ nhà đầu tư và công chúng để cạnh tranh. Từ việc giữ LaMDA hạn chế cho thử nghiệm nội bộ, Google đã nhanh chóng triển khai một phiên bản công khai, có tên Bard, sau đó đổi tên thành Gemini, và thay thế sản phẩm Google Assistant trên điện thoại Android của nhiều người dùng bằng mô hình AI này. Ngày nay, Gemini cung cấp nửa tá mô hình cho các nhu cầu khác nhau và triển khai mô hình AI vào công cụ tìm kiếm và bộ công cụ năng suất của mình.
Microsoft cũng không khác: nhà sản xuất Windows đã triển khai chatbot CoPilot của riêng mình, tận dụng tích hợp với các sản phẩm Office của mình và dành riêng một nút để gọi chatbot trên các PC mới. Các công ty như Amazon và hàng loạt công ty khởi nghiệp nhỏ hơn khác cũng bắt đầu đưa ra sản phẩm của họ cho công chúng sử dụng, chẳng hạn như Mistral của Pháp và PerplexityAI, công ty sau tìm cách đưa khả năng genAI vào tìm kiếm. Một bước đột phá về tạo hình ảnh dựa trên công nghệ tương tự cũng nở rộ trong bối cảnh này, với các dịch vụ như Dall-E mở đường để tạo ra những hình ảnh trông thực tế.
Các công ty trong ngành của Ấn Độ đã thể hiện sự nhiệt tình sớm trong việc tận dụng AI, như các công ty toàn cầu đã làm, để xem công nghệ có thể tăng năng suất và tăng tiết kiệm như thế nào. Giống như phần còn lại của thế giới, các công cụ tạo văn bản đã có thể tăng khả năng của nhân viên để thực hiện các nhiệm vụ thường xuyên và phần lớn việc áp dụng AI của doanh nghiệp xoay quanh việc tăng tốc hàng ngày như vậy. Tuy nhiên, đã có những câu hỏi về tư duy phản biện khi ngày càng nhiều nhiệm vụ được tự động hóa, và nhiều công ty vẫn chưa thấy một lượng giá trị lớn từ sự tăng trưởng này.
Tuy nhiên, sự say mê xung quanh các mô hình AI vẫn chưa chết, khi hàng trăm tỷ đô la được lên kế hoạch đầu tư vào việc thiết lập cơ sở hạ tầng tính toán để huấn luyện và chạy các mô hình này. Tại Ấn Độ, Microsoft đang thuê luật sư bất động sản ở mỗi Vùng lãnh thổ Liên bang và Tiểu bang để đàm phán và lấy được các mảnh đất để xây dựng trung tâm dữ liệu. Quy mô của các khoản đầu tư được lên kế hoạch là một canh bạc lớn về tính khả thi tài chính của các mô hình AI.
Đây là một phần lý do tại sao tiềm năng của những tiến bộ như DeepSeek đã thu hút sự chú ý. Công ty có trụ sở tại Quảng Châu này đã có thể huấn luyện các mô hình tiên tiến nhất - có khả năng "nghiên cứu sâu" và suy luận - với một phần nhỏ so với khoản đầu tư của các gã khổng lồ phương Tây.
Việc giảm chi phí đã dẫn đến mức độ quan tâm rất lớn về việc liệu Ấn Độ có thể sao chép thành công này hay, ít nhất, xây dựng trên nó. Năm ngoái, trước khi thành tựu của DeepSeek được công nhận toàn cầu, Chính phủ Liên bang đã dành 10.372 crore rupee cho Sứ mệnh IndiaAI, trong nỗ lực thúc đẩy nhiều công việc hơn của các công ty khởi nghiệp trong lĩnh vực này. Sứ mệnh được thiết kế theo mô hình đối tác công-tư và nhằm cung cấp năng lực tính toán, nuôi dưỡng kỹ năng AI trong giới trẻ, và giúp các nhà nghiên cứu làm việc trên các dự án liên quan đến AI.
Sau khi tiết kiệm chi phí của DeepSeek được chú ý, chính phủ đã triển khai thành phần năng lực tính toán của sứ mệnh và mời các đề xuất để tạo ra một mô hình AI nền tảng tại Ấn Độ. Các đơn đăng ký đã được mời trên cơ sở liên tục mỗi tháng, và Bộ trưởng Công nghệ thông tin Liên bang Ashwini Vaishnaw nói rằng ông hy vọng Ấn Độ sẽ có mô hình nền tảng của mình vào cuối năm.
Một số nhà hoạch định chính sách đã lập luận rằng có một "yếu tố tự hào" liên quan đến diễn ngôn xung quanh việc xây dựng một mô hình nền tảng trong nước, Tanuj Bhojwani, cho đến gần đây là người đứng đầu People + AI, đã nói trong một podcast Parley gần đây với The Hindu. "Người dân chúng tôi có tham vọng, và muốn có mô hình riêng," ông Bhojwani nói, chỉ ra thành tựu của Ấn Độ trong thám hiểm vũ trụ và viễn thông, những ví dụ nổi bật về kỳ tích kỹ thuật đạt được với chi phí thấp.
Tất nhiên, có những chi phí tiền tệ gắn liền với việc huấn luyện một mô hình nền tảng thậm chí sau DeepSeek: ông Bhojwani đề cập đến ước tính rằng việc mua phần cứng và các lần huấn luyện trước đó của DeepSeek đã vượt quá 1,3 tỷ đô la, một khoản tiền lớn hơn toàn bộ phân bổ của Sứ mệnh IndiaAI. "Các công ty công nghệ lớn đang đầu tư 80 tỷ đô la một năm vào cơ sở hạ tầng," ông Bhojwani chỉ ra, đưa quy mô của quỹ đầu tư Ấn Độ vào viễn cảnh. "Chính phủ không đặt cược tập trung đó. Chúng tôi đang lấy nguồn lực rất khan hiếm mà chúng tôi có và chúng tôi đang làm mỏng nó hơn nữa."
Pranesh Prakash, người sáng lập Trung tâm về Internet và Xã hội, Ấn Độ, khẳng định rằng việc xây dựng một mô hình AI nền tảng là quan trọng. "Điều quan trọng là có những người có thể xây dựng các mô hình nền tảng và cũng có những người có thể xây dựng trên các mô hình nền tảng để triển khai và xây dựng ứng dụng," ông Prakash nói. "Chúng tôi cần có người ở Ấn Độ có thể áp dụng bản thân vào mọi phần của việc xây dựng AI."
Cũng có một lập luận rằng một AI trong nước sẽ tăng cường chủ quyền mạng của Ấn Độ. Ông Prakash đã bác bỏ khái niệm này, vì nhiều LLM tiên tiến nhất - thậm chí cả cái được xuất bản bởi DeepSeek - là mã nguồn mở, cho phép các nhà nghiên cứu trên toàn thế giới lặp lại từ một mô hình hiện có và xây dựng trên tiến bộ mới nhất mà không phải tự mình lặp lại các bước đột phá.
Ngoài rào cản đầu tư, còn có giới hạn tiềm năng: "Chi tiêu 200 đô la một tháng để thay thế một công nhân con người có thể là khả thi ở Hoa Kỳ, nhưng ở Ấn Độ, đó là những gì công nhân con người đang được trả ngay từ đầu," ông Bhojwani chỉ ra. Hiện tại vẫn chưa rõ liệu các bước đột phá tự động hóa có thể có sẽ bao giờ đáng giá đủ để thay thế một số lượng đáng kể công nhân con người.
Ngay cả đối với các công ty Ấn Độ tìm cách tạo ra và bán các mô hình AI, kinh nghiệm của chúng ta trong thời đại phần mềm của những thập kỷ trước cho thấy một động lực chính có thể hạn chế những khát vọng như vậy: "Nếu chúng ta tin rằng chúng ta sẽ tạo ra một mô hình Ấn Độ với nội dung ngôn ngữ địa phương, bạn đang tự giới hạn mình trên đầu gối vì thị trường doanh nghiệp Ấn Độ tổng thể sẽ mua AI nhỏ hơn nhiều," ông Bhojwani nói, chỉ ra rằng ngay cả các gã khổng lồ phần mềm Ấn Độ cũng bán phần lớn dịch vụ của họ ở Hoa Kỳ, nơi vẫn là thị trường chính cho phần lớn ngành công nghệ.
Tuy nhiên, các mệnh lệnh tài chính không phải là tất cả. Sự tập trung của chính phủ Ấn Độ vào các sáng kiến như Bhashini - sử dụng mạng nơ-ron để hỗ trợ dịch ngôn ngữ Ấn Độ - tiết lộ một mong muốn tận dụng các mô hình AI ở quy mô lớn như Aadhaar hoặc UPI. Mặc dù chưa rõ có bao nhiêu ý chí chính trị và đầu tư sẽ cuối cùng nuôi dưỡng những tham vọng đó, tuy nhiên, như CEO Microsoft Satya Nadella đã chỉ ra trong một cuộc phỏng vấn gần đây, nếu tiềm năng của AI trên toàn ngành "thực sự mạnh mẽ như người ta nghĩ, nhà nước sẽ không ngồi yên và chờ đợi các công ty tư nhân."
Trong khi Ấn Độ có một nguồn nhân tài lớn, nó phải chịu đựng việc di cư vĩnh viễn của những bộ óc nghiên cứu hàng đầu trong tất cả các lĩnh vực, một động lực có thể làm chậm các bước đột phá trong AI. Hệ sinh thái học thuật cũng đã bị thiếu vốn, điều mà hạn chế nghiêm trọng nguồn lực ngay cả đối với những người đang ở lại trong nước để làm việc trên những vấn đề này.
Rào cản lớn nhất có thể không phải là rào cản đầu tư, hoặc thậm chí là tiềm năng thương mại hóa các khoản đầu tư. Rào cản có thể là dữ liệu.
Hầu hết LLM và SLM đều dựa vào một lượng dữ liệu khổng lồ, và nếu dữ liệu không khổng lồ, thì ít nhất nó phải là dữ liệu chất lượng cao đã được sắp xếp và gắn nhãn cho đến khi nó có thể sử dụng được để huấn luyện một mô hình nền tảng. Đối với nhiều gã khổng lồ công nghệ được tài trợ tốt, dữ liệu có sẵn công khai trên web là một nguồn phong phú. Điều này có nghĩa là hầu hết các mô hình đã nghiêng về tiếng Anh vì đó là ngôn ngữ được nói rộng rãi nhất trên thế giới, và do đó được đại diện rất nhiều trong nội dung công khai.
Ngay cả những xã hội đơn ngữ như Trung Quốc, Hàn Quốc và Nhật Bản cũng có thể thoát khỏi lượng dữ liệu mà họ có thể có được, vì đây là những xã hội đơn ngữ nơi người dùng internet chủ yếu sử dụng internet - và tham gia vào các cuộc thảo luận trực tuyến - bằng ngôn ngữ của họ. Điều này cung cấp cho các nhà sản xuất LLM một nền tảng phong phú để tùy chỉnh các mô hình cho cảm nhận, phong cách và cuối cùng là nhu cầu địa phương.
Ấn Độ không có đủ dữ liệu này. Vivekanand Pani, đồng sáng lập Reverie Language Technologies, đã làm việc với các công ty công nghệ trong nhiều thập kỷ để thúc đẩy người dùng sử dụng web bằng ngôn ngữ của họ. Hầu hết người dùng Ấn Độ, ngay cả những người nói rất ít tiếng Anh, điều hướng điện thoại và internet của họ bằng tiếng Anh, thích nghi với hệ sinh thái kỹ thuật số. Trong khi dịch máy có thể đóng vai trò như một cầu nối giữa tiếng Anh và các ngôn ngữ Ấn Độ, đây là một công nghệ "chuyển đổi", ông Pani nói, và không phải là một công nghệ tạo sinh, như LLM. "Chúng tôi chưa giải quyết được vấn đề đó, và chúng tôi vẫn không sẵn sàng giải quyết nó," ông Pani nói với The Hindu trong một cuộc phỏng vấn gần đây, đề cập đến việc khiến nhiều người Ấn Độ hơn sử dụng web bằng các ngôn ngữ Ấn Độ.
Tuy nhiên, một số công ty vẫn đang cố gắng. Sarvam, một công ty có trụ sở tại Bengaluru, đã công bố vào tháng 10 năm ngoái rằng họ đã phát triển một LLM 2 tỷ tham số với hỗ trợ cho 10 ngôn ngữ cộng với tiếng Anh: Bengali, Gujarati, Hindi, Marathi, Malayalam, Kannada, Odia, Tamil, Telugu và Punjabi. Công ty cho biết họ "đã cung cấp năng lượng cho các tác nhân AI tạo sinh và các ứng dụng khác." Sarvam đã làm điều này trên chip NVIDIA đang được các công ty công nghệ lớn săn đón để xây dựng các trung tâm dữ liệu khổng lồ cho AI trên khắp thế giới.
Sau đó là Karya, công ty có trụ sở tại Bengaluru đã trả tiền cho người dùng để đóng góp các mẫu giọng nói bằng tiếng mẹ đẻ của họ, dần dần cung cấp dữ liệu cho các mô hình AI trong tương lai hy vọng sẽ hoạt động tốt với các ngôn ngữ địa phương. Công ty đã thu hút sự chú ý toàn cầu - bao gồm cả bìa tạp chí TIME - cho những nỗ lực của mình để lấp đầy thiếu hụt dữ liệu.
"Ấn Độ có 22 ngôn ngữ chính thức và vô số phương ngữ," Sứ mệnh IndiaAI đã nói trong một bài đăng vào tháng 7 năm ngoái. "Một LLM cụ thể của Ấn Độ có thể nắm bắt tốt hơn sắc thái của ngôn ngữ, văn hóa và bối cảnh Ấn Độ so với các mô hình tập trung toàn cầu, có xu hướng nắm bắt nhiều cảm xúc và bối cảnh phương Tây hơn."
Krutrim AI, được hỗ trợ bởi nền tảng đi chung xe Ola, đang cố gắng một nỗ lực tương tự, bằng cách tận dụng các tài xế trên nền tảng Ola để trở thành "người lao động dữ liệu". Sứ mệnh IndiaAI tự nó đang lên kế hoạch xuất bản một nền tảng bộ dữ liệu, mặc dù chi tiết về dữ liệu này sẽ đến từ đâu và nó đã được làm sạch và gắn nhãn như thế nào vẫn chưa được công bố.
""Tôi nghĩ rằng chúng ta cần suy nghĩ nhiều hơn về dữ liệu không chỉ như một nguồn lực và đầu vào cho AI, mà như một hệ sinh thái," Astha Kapoor, đồng sáng lập Viện Aapti, nói với The Hindu trong một cuộc phỏng vấn. "Có các cơ sở hạ tầng xã hội xung quanh dữ liệu, như những người thu thập nó, gắn nhãn nó, và v.v." Công việc của bà Kapoor tiết lộ một câu hỏi chính: tại sao bạn cần tất cả dữ liệu này, và tôi nhận được gì để đổi lại? Do đó, những người mà dữ liệu là về họ, và những người bị ảnh hưởng bởi dữ liệu, phải được tham gia vào quá trình quản trị.
Và sau đó là những câu hỏi khó chịu đã nảy sinh trong quá trình thu thập hàng loạt nội dung tiếng Anh đã nuôi dưỡng các mô hình đầu tiên: ngay cả khi sự thay thế công việc có thể bị loại trừ (và nó còn lâu mới rõ ràng rằng nó có thể), có những câu hỏi về quyền sở hữu dữ liệu, bồi thường, quyền của những người mà dữ liệu của họ đang được sử dụng, và quyền lực của các công ty đang tích lũy chúng, sẽ phải được đối mặt đầy đủ. Đây là một quá trình còn lâu mới ổn định ngay cả đối với các mô hình tiên phong.
Cuối cùng, một trong những ý kiến xác định về các mô hình nền tảng đến từ Nandan Nilekani vào tháng 12 năm ngoái, khi nhà sáng lập Infosys bác bỏ hoàn toàn ý tưởng này chỉ dựa trên chi phí. "Các mô hình nền tảng không phải là cách sử dụng tiền tốt nhất của bạn," ông Nilekani đã nói trong một cuộc trao đổi với các nhà báo. "Nếu Ấn Độ có 50 tỷ đô la để chi tiêu, nên sử dụng số đó để xây dựng năng lực tính toán, cơ sở hạ tầng và điện toán đám mây AI. Đây là những nguyên liệu thô và động cơ của trò chơi này."
Sau khi DeepSeek giảm mạnh những chi phí đó, ông Nilekani thừa nhận rằng một bước đột phá LLM nền tảng thực sự có thể đạt được đối với nhiều công ty: "rất nhiều" công ty có thể chi 50 triệu đô la cho nỗ lực này, ông nói.
Nhưng ông vẫn tiếp tục nhấn mạnh trong các phát biểu công khai sau đó rằng AI cuối cùng phải có giá rẻ trên toàn bộ, và hữu ích cho người dân Ấn Độ ở mọi nơi. Đó là một tiêu chuẩn vẫn chưa có trên đường chân trời, trừ khi chi phí giảm mạnh hơn, và Ấn Độ cũng thấy sự mở rộng quy mô của cơ sở hạ tầng trong nước và các hệ sinh thái hỗ trợ công việc này.
"Tôi nghĩ câu hỏi thực sự cần đặt ra không phải là liệu chúng ta có nên thực hiện nỗ lực Hercules để xây dựng một mô hình nền tảng hay không," ông Bhojwani nói, "mà là hỏi: đâu là những khoản đầu tư chúng ta nên thực hiện để môi trường nghiên cứu, sự đổi mới, các nhà đầu tư thị trường tư nhân, v.v., tất cả cùng nhau và điều phối theo cách để tạo ra - ở đâu đó từ một phòng thí nghiệm hoặc từ một công ty tư nhân - một mô hình ngôn ngữ lớn nền tảng?"