MIT: 5 xu hướng nóng nhất trong AI năm 2025 sẽ định hình tương lai

- Xu hướng AI năm 2025 nổi bật với nhiều công nghệ đột phá.
- Trò chơi ảo tạo sinh (generative virtual playgrounds) hứa hẹn phát triển mạnh mẽ.
- Mô hình ngôn ngữ lớn với khả năng "lập luận" (reasoning) sẽ cải thiện độ chính xác.
- AI trong khoa học sẽ thúc đẩy tốc độ khám phá tự nhiên, nổi bật nhất là AlphaFold trong nghiên cứu protein.
- Các công ty AI ngày càng gần gũi với an ninh quốc gia, tạo ra cơ hội mới trong hợp tác công nghệ.
- Nvidia sẽ phải đối mặt với sự cạnh tranh ngày càng tăng từ các công ty chip khác như Amazon và AMD.

- Trò chơi ảo tạo sinh đang trở thành xu hướng mới, nơi mà các mô hình như Genie của Google DeepMind có thể chuyển đổi hình ảnh thành môi trường game tương tác.
- Năm 2024 đã chứng kiến sự phát triển mạnh mẽ trong video tạo sinh, điều này tạo tiền đề cho các trải nghiệm game 3D hoàn toàn mới.
- Mô hình ngôn ngữ lớn mới của OpenAI (o1 và o3) được thiết kế để "lập luận", cải thiện khả năng giải quyết các vấn đề phức tạp.
- Google DeepMind giới thiệu Mariner, một trợ lý AI có thể tìm kiếm công thức nấu ăn và xử lý các tác vụ một cách logic.
- AI đang gia tăng trong lĩnh vực khoa học, với sự công nhận của Nobel về công cụ AlphaFold, mở ra hướng đi mới cho nghiên cứu protein.
- Các dự án mã nguồn mở như LeMaterial từ Hugging Face đang hỗ trợ nghiên cứu vật liệu hiệu quả hơn.
- Cập nhật về hợp tác an ninh quốc gia, nhiều công ty AI như OpenAI đang hướng tới việc làm việc với quân đội Mỹ.
- Nvidia phải đối mặt với sự cạnh tranh từ các công ty chip lớn khác, tạo ra một thị trường đa dạng và cạnh tranh hơn trong ngành công nghệ AI.

📌 AI năm 2025 sẽ chứng kiến sự bùng nổ của trò chơi ảo và mô hình ngôn ngữ "lập luận". Nghiên cứu khoa học với AI như AlphaFold sẽ tiếp tục đột phá, trong khi hợp tác giữa các công ty AI và quân đội gia tăng. Nvidia sẽ phải cạnh tranh với nhiều đối thủ mới.

 

https://www.technologyreview.com/2025/01/08/1109188/whats-next-for-ai-in-2025/

#MIT

Điều gì tiếp theo cho AI vào năm 2025
Bạn đã biết rằng các agent (tác nhân AI) và các mô hình ngôn ngữ nhỏ hơn là những điều lớn tiếp theo. Dưới đây là 5 xu hướng nóng khác bạn nên chú ý trong năm nay.

Bởi James O'Donnell, Will Douglas Heaven, Melissa Heikkilä
Ngày 8 tháng 1 năm 2025

Trong vài năm qua, chúng tôi đã thử dự đoán điều gì sẽ đến tiếp theo trong lĩnh vực AI. Đây là một trò chơi đầy mạo hiểm, bởi ngành này thay đổi quá nhanh. Nhưng chúng tôi đã có vài lần đoán trúng, nên chúng tôi tiếp tục làm điều đó một lần nữa.

Chúng tôi đã làm tốt đến đâu vào năm ngoái?
4 xu hướng nóng mà chúng tôi dự đoán vào năm 2024 bao gồm cái mà chúng tôi gọi là chatbot tùy chỉnh—các ứng dụng trợ lý tương tác được hỗ trợ bởi các mô hình ngôn ngữ lớn đa phương thức (đúng: khi đó chúng tôi chưa biết, nhưng thực ra chúng tôi đang nói về cái mà hiện giờ mọi người gọi là agent, thứ nóng nhất trong AI hiện tại); video tạo sinh (đúng: ít công nghệ nào phát triển nhanh như công nghệ này trong 12 tháng qua, với việc OpenAI và Google DeepMind ra mắt các mô hình tạo video hàng đầu, Sora và Veo, chỉ cách nhau một tuần vào tháng 12 vừa qua); và các robot đa dụng hơn có thể thực hiện một loạt nhiệm vụ rộng hơn (đúng: những lợi ích từ các mô hình ngôn ngữ lớn tiếp tục lan tỏa đến các phần khác của ngành công nghệ, và robot nằm trong danh sách hàng đầu).

Chúng tôi cũng dự đoán rằng thông tin sai lệch do AI tạo ra trong các cuộc bầu cử sẽ xuất hiện khắp nơi, nhưng may thay, dự đoán này sai. Dù năm qua có nhiều điều đáng lo ngại, nhưng deepfake chính trị lại hiếm khi xuất hiện.

Vậy điều gì sẽ đến trong năm 2025?
Chúng tôi sẽ bỏ qua những điều hiển nhiên: bạn có thể tin rằng agent và các mô hình ngôn ngữ nhỏ gọn, hiệu quả hơn sẽ tiếp tục định hình ngành công nghiệp. Thay vào đó, đây là 5 dự đoán thay thế từ nhóm AI của chúng tôi:

1. Các sân chơi ảo tạo sinh

Nếu năm 2023 là năm của hình ảnh tạo sinh và năm 2024 là năm của video tạo sinh—thì điều gì sẽ tiếp theo? Nếu bạn đoán là các thế giới ảo tạo sinh (hay còn gọi là trò chơi điện tử), thì bạn xứng đáng nhận một cú đập tay ăn mừng!

Chúng ta đã có một cái nhìn nhỏ về công nghệ này vào tháng 2, khi Google DeepMind công bố một mô hình tạo sinh có tên Genie, có thể biến một hình ảnh tĩnh thành một trò chơi platform cuộn ngang 2D mà người chơi có thể tương tác. Đến tháng 12, công ty ra mắt Genie 2, một mô hình có thể tạo ra cả một thế giới ảo từ một hình ảnh khởi đầu.

Các công ty khác cũng đang phát triển công nghệ tương tự. Vào tháng 10, các startup AI là Decart và Etched tiết lộ một bản hack không chính thức của Minecraft, trong đó mỗi khung hình của trò chơi được tạo ra ngay lập tức trong khi bạn chơi. Và World Labs, một startup do Fei-Fei Li—người tạo ra ImageNet, bộ dữ liệu ảnh khổng lồ khởi đầu cho sự bùng nổ học sâu—đồng sáng lập, đang xây dựng cái gọi là "mô hình thế giới lớn", hay LWMs (large world models).

Một ứng dụng rõ ràng là trò chơi điện tử. Có một sắc thái vui nhộn trong những thử nghiệm đầu tiên này, và các mô phỏng 3D tạo sinh có thể được sử dụng để khám phá các ý tưởng thiết kế cho các trò chơi mới, biến một bản phác thảo thành một môi trường có thể chơi ngay lập tức. Điều này có thể dẫn đến các loại trò chơi hoàn toàn mới.

Nhưng công nghệ này cũng có thể được sử dụng để huấn luyện robot. World Labs muốn phát triển cái gọi là trí thông minh không gian—khả năng để máy móc diễn giải và tương tác với thế giới hàng ngày. Tuy nhiên, các nhà nghiên cứu robot lại thiếu dữ liệu thực tế chất lượng cao để huấn luyện công nghệ này. Việc tạo ra vô số thế giới ảo và thả các robot ảo vào đó để học hỏi qua thử nghiệm và sai lầm có thể giúp bù đắp cho điều này.

—Will Douglas Heaven

2. Các mô hình ngôn ngữ lớn có khả năng “lập luận”

Sự phấn khích hoàn toàn có cơ sở. Khi OpenAI công bố o1 vào tháng 9, họ đã giới thiệu một cách tiếp cận hoàn toàn mới trong cách các mô hình ngôn ngữ lớn (LLM) hoạt động. Hai tháng sau, công ty tiếp tục đưa cách tiếp cận đó tiến xa hơn với o3—một mô hình có thể sẽ định hình lại công nghệ này mãi mãi.

Hầu hết các mô hình, bao gồm GPT-4 hàng đầu của OpenAI, chỉ đưa ra câu trả lời đầu tiên mà chúng nghĩ đến. Đôi khi câu trả lời đúng, đôi khi không. Nhưng các mô hình mới của công ty được huấn luyện để xử lý câu trả lời một cách từng bước, chia nhỏ các vấn đề khó thành một chuỗi các vấn đề đơn giản hơn. Khi một cách tiếp cận không hiệu quả, chúng sẽ thử cách khác. Kỹ thuật này, được gọi là “lập luận” (chúng tôi hiểu rõ từ này đầy tranh cãi như thế nào), có thể làm cho công nghệ này chính xác hơn, đặc biệt là trong các bài toán toán học, vật lý và logic.

Kỹ thuật này cũng rất quan trọng đối với các agent (tác nhân AI).

Vào tháng 12, Google DeepMind tiết lộ một agent duyệt web thử nghiệm mới mang tên Mariner. Trong một bản demo xem trước mà công ty thực hiện cho MIT Technology Review, Mariner dường như bị mắc kẹt. Megha Goel, một quản lý sản phẩm của công ty, đã yêu cầu agent tìm một công thức làm bánh quy Giáng sinh giống với hình ảnh mà cô đã cung cấp. Mariner tìm thấy một công thức trên web và bắt đầu thêm các nguyên liệu vào giỏ hàng trực tuyến của Goel.

Rồi nó bị dừng lại; không thể xác định được loại bột nào cần chọn. Goel quan sát khi Mariner giải thích các bước của mình trong một cửa sổ chat: “Agent nói, ‘Tôi sẽ sử dụng nút Quay lại (Back) của trình duyệt để quay lại công thức.’”

Đây là một khoảnh khắc đáng chú ý. Thay vì rơi vào bế tắc, agent đã chia nhỏ nhiệm vụ thành các hành động riêng biệt và chọn một hành động có thể giải quyết vấn đề. Việc nhận ra cần nhấn nút Quay lại nghe có vẻ cơ bản, nhưng đối với một bot không có trí thông minh thực sự, điều này chẳng khác gì khoa học tên lửa. Và cách tiếp cận đã thành công: Mariner quay lại công thức, xác nhận loại bột cần dùng, và tiếp tục hoàn thành giỏ hàng cho Goel.

Google DeepMind cũng đang phát triển một phiên bản thử nghiệm của Gemini 2.0, mô hình ngôn ngữ lớn mới nhất của hãng, sử dụng cách tiếp cận giải quyết vấn đề theo từng bước này, được gọi là Gemini 2.0 Flash Thinking.

Nhưng OpenAI và Google chỉ là phần nổi của tảng băng. Nhiều công ty đang xây dựng các mô hình ngôn ngữ lớn sử dụng các kỹ thuật tương tự, giúp chúng tốt hơn trong nhiều loại nhiệm vụ, từ nấu ăn đến lập trình. Hãy chuẩn bị tinh thần cho một năm đầy những bàn luận về “lập luận” (chúng tôi biết, chúng tôi biết) trong năm nay.

—Will Douglas Heaven


3. Thời kỳ bùng nổ của AI trong khoa học

Một trong những ứng dụng thú vị nhất của AI là đẩy nhanh quá trình khám phá trong các ngành khoa học tự nhiên. Có lẽ minh chứng rõ ràng nhất cho tiềm năng của AI trong lĩnh vực này đã xuất hiện vào tháng 10 năm ngoái, khi Viện Hàn lâm Khoa học Hoàng gia Thụy Điển trao giải Nobel Hóa học cho Demis Hassabis và John M. Jumper từ Google DeepMind vì đã phát triển công cụ AlphaFold, có thể giải quyết vấn đề gấp protein, và David Baker vì đã tạo ra các công cụ giúp thiết kế các protein mới.

Xu hướng này được kỳ vọng sẽ tiếp tục trong năm tới, với việc xuất hiện thêm các bộ dữ liệu và mô hình được thiết kế đặc biệt để khám phá khoa học. Protein là một mục tiêu hoàn hảo cho AI vì lĩnh vực này có sẵn các bộ dữ liệu tuyệt vời để huấn luyện các mô hình AI.

Hiện tại, cuộc đua đang diễn ra để tìm ra lĩnh vực đột phá tiếp theo. Một lĩnh vực tiềm năng là khoa học vật liệu. Meta đã phát hành các bộ dữ liệu và mô hình khổng lồ có thể giúp các nhà khoa học sử dụng AI để khám phá các vật liệu mới nhanh hơn nhiều. Vào tháng 12, Hugging Face cùng với startup Entalpic đã ra mắt LeMaterial, một dự án mã nguồn mở nhằm đơn giản hóa và tăng tốc nghiên cứu về vật liệu. Dự án đầu tiên của họ là một bộ dữ liệu thống nhất, làm sạch và chuẩn hóa các bộ dữ liệu vật liệu nổi bật nhất.

Các nhà phát triển mô hình AI cũng đang háo hức quảng bá các sản phẩm tạo sinh của họ như những công cụ hỗ trợ nghiên cứu cho các nhà khoa học. OpenAI đã để các nhà khoa học thử nghiệm mô hình o1 mới nhất của mình để xem nó có thể hỗ trợ họ trong nghiên cứu như thế nào. Kết quả rất đáng khích lệ.

Có được một công cụ AI hoạt động giống như một nhà khoa học là một trong những giấc mơ của ngành công nghệ. Trong một bản tuyên ngôn xuất bản vào tháng 10 năm ngoái, Dario Amodei, người sáng lập Anthropic, đã nhấn mạnh khoa học, đặc biệt là sinh học, là một trong những lĩnh vực chính mà AI mạnh mẽ có thể hỗ trợ. Amodei suy đoán rằng trong tương lai, AI có thể không chỉ là một phương pháp phân tích dữ liệu mà còn trở thành một "nhà sinh học ảo" thực hiện tất cả các nhiệm vụ mà các nhà sinh học thực sự làm.

Chúng ta vẫn còn rất xa để đạt đến viễn cảnh này. Nhưng trong năm tới, có thể chúng ta sẽ chứng kiến những bước tiến quan trọng hướng tới điều đó.

—Melissa Heikkilä

4. Các công ty AI ngày càng gắn bó hơn với an ninh quốc gia

Có rất nhiều tiền để kiếm được từ các công ty AI sẵn sàng cung cấp công cụ cho giám sát biên giới, thu thập thông tin tình báo và các nhiệm vụ an ninh quốc gia khác.

Quân đội Mỹ đã khởi động một số sáng kiến thể hiện sự háo hức trong việc áp dụng AI, từ chương trình Replicator—lấy cảm hứng từ cuộc chiến ở Ukraine, cam kết chi 1 tỷ USD cho các máy bay không người lái cỡ nhỏ—đến đơn vị Artificial Intelligence Rapid Capabilities Cell, nơi đưa AI vào mọi lĩnh vực từ ra quyết định trên chiến trường đến hậu cần. Các quân đội châu Âu cũng đang chịu áp lực phải tăng cường đầu tư vào công nghệ, xuất phát từ lo ngại rằng chính quyền Donald Trump sẽ cắt giảm tài trợ cho Ukraine. Những căng thẳng gia tăng giữa Đài Loan và Trung Quốc cũng khiến các nhà hoạch định quân sự đau đầu.

Trong năm 2025, các xu hướng này sẽ tiếp tục là cơ hội lớn cho các công ty công nghệ quốc phòng như Palantir, Anduril, và các công ty khác, những công ty hiện đang tận dụng dữ liệu quân sự mật để huấn luyện các mô hình AI.

Nguồn vốn dồi dào của ngành công nghiệp quốc phòng cũng sẽ thu hút các công ty AI chính thống tham gia. Vào tháng 12, OpenAI thông báo hợp tác với Anduril trong một chương trình tiêu diệt máy bay không người lái, hoàn tất sự thay đổi chính sách kéo dài 1 năm của họ, từ việc không làm việc với quân đội sang một lập trường khác. OpenAI giờ đây gia nhập hàng ngũ của Microsoft, Amazon, và Google, những công ty đã làm việc với Lầu Năm Góc trong nhiều năm.

Các đối thủ khác trong ngành AI, những công ty đang chi hàng tỷ USD để huấn luyện và phát triển các mô hình mới, sẽ chịu áp lực lớn hơn trong năm 2025 để suy nghĩ nghiêm túc về doanh thu. Có thể họ sẽ tìm thấy đủ khách hàng phi quân sự sẵn sàng trả giá cao cho các agent AI có thể xử lý các nhiệm vụ phức tạp, hoặc từ các ngành công nghiệp sáng tạo muốn chi tiêu cho các công cụ tạo sinh hình ảnh và video.

Tuy nhiên, họ cũng sẽ ngày càng bị cám dỗ để tham gia giành các hợp đồng béo bở từ Lầu Năm Góc. Hãy chờ đợi các công ty vật lộn với việc liệu làm việc cho các dự án quốc phòng có mâu thuẫn với giá trị cốt lõi của họ hay không. Lý do mà OpenAI đưa ra cho việc thay đổi lập trường là “các nền dân chủ nên tiếp tục dẫn đầu trong phát triển AI,” công ty viết, lập luận rằng việc cung cấp các mô hình của mình cho quân đội sẽ thúc đẩy mục tiêu đó. Trong năm 2025, chúng ta sẽ chứng kiến những công ty khác đi theo hướng này.

—James O’Donnell


5. Nvidia gặp phải sự cạnh tranh đáng kể

Trong phần lớn thời kỳ bùng nổ AI hiện nay, nếu bạn là một startup công nghệ muốn thử sức phát triển một mô hình AI, Jensen Huang chính là người bạn cần tìm. Là CEO của Nvidia, công ty giá trị nhất thế giới, Huang đã giúp Nvidia trở thành nhà lãnh đạo không thể tranh cãi trong lĩnh vực chip được sử dụng để huấn luyện các mô hình AI cũng như thực hiện các tác vụ suy luận (inferencing) khi các mô hình này được sử dụng.

Một số yếu tố có thể thay đổi điều đó vào năm 2025. Đầu tiên, các đối thủ lớn như Amazon, Broadcom, AMD, và các công ty khác đang đầu tư mạnh vào các chip mới, và có những dấu hiệu ban đầu cho thấy các sản phẩm này có thể cạnh tranh sát sao với Nvidia—đặc biệt trong lĩnh vực suy luận, nơi vị thế dẫn đầu của Nvidia kém vững chắc hơn.

Số lượng ngày càng tăng của các startup cũng đang tấn công Nvidia từ một góc độ khác. Thay vì cố gắng cải tiến nhỏ lẻ trên các thiết kế của Nvidia, các startup như Groq đang đặt cược táo bạo vào những kiến trúc chip hoàn toàn mới, mà với đủ thời gian, hứa hẹn mang lại hiệu quả hoặc khả năng huấn luyện tốt hơn. Trong năm 2025, các thử nghiệm này vẫn sẽ ở giai đoạn đầu, nhưng có khả năng một đối thủ nổi bật sẽ thay đổi giả định rằng các mô hình AI hàng đầu chỉ phụ thuộc vào chip của Nvidia.

Cơ sở của sự cạnh tranh này là cuộc chiến địa chính trị về chip vẫn sẽ tiếp diễn. Cho đến nay, cuộc chiến này dựa trên 2 chiến lược. Một mặt, phương Tây tìm cách hạn chế xuất khẩu sang Trung Quốc các loại chip hàng đầu và các công nghệ để sản xuất chúng. Mặt khác, các nỗ lực như Đạo luật CHIPS của Mỹ nhằm thúc đẩy sản xuất chất bán dẫn trong nước.

Donald Trump có thể sẽ gia tăng các biện pháp kiểm soát xuất khẩu và đã hứa áp đặt mức thuế khổng lồ đối với bất kỳ hàng hóa nào nhập khẩu từ Trung Quốc. Trong năm 2025, các mức thuế như vậy sẽ đưa Đài Loan—quốc gia mà Mỹ phụ thuộc rất nhiều thông qua nhà sản xuất chip TSMC—trở thành trung tâm của các cuộc chiến thương mại. Điều này là vì Đài Loan đã tuyên bố sẽ giúp các công ty Trung Quốc di dời sang hòn đảo để tránh các mức thuế dự kiến. Điều đó có thể thu hút thêm sự chỉ trích từ Trump, người đã bày tỏ sự thất vọng với việc Mỹ chi tiêu để bảo vệ Đài Loan trước Trung Quốc.

Hiện vẫn chưa rõ những yếu tố này sẽ diễn ra như thế nào, nhưng điều đó chỉ càng thúc đẩy các nhà sản xuất chip giảm sự phụ thuộc vào Đài Loan, vốn là mục đích chính của Đạo luật CHIPS. Khi các khoản đầu tư từ dự luật bắt đầu được sử dụng, năm tới có thể mang lại bằng chứng đầu tiên cho thấy liệu nó có thực sự thúc đẩy sản xuất chip trong nước hay không.

—James O’Donnell

 

What’s next for AI in 2025
You already know that agents and small language models are the next big things. Here are five other hot trends you should watch out for this year.

By James O'Donnellarchive pageWill Douglas Heavenarchive pageMelissa Heikkiläarchive page
January 8, 2025
For the last couple of years we’ve had a go at predicting what’s coming next in AI. A fool’s game given how fast this industry moves. But we’re on a roll, and we’re doing it again.

How did we score last time round? Our four hot trends to watch out for in 2024 included what we called customized chatbots—interactive helper apps powered by multimodal large language models (check: we didn’t know it yet, but we were talking about what everyone now calls agents, the hottest thing in AI right now); generative video (check: few technologies have improved so fast in the last 12 months, with OpenAI and Google DeepMind releasing their flagship video generation models, Sora and Veo, within a week of each other this December); and more general-purpose robots that can do a wider range of tasks (check: the payoffs from large language models continue to trickle down to other parts of the tech industry, and robotics is top of the list). 

We also said that AI-generated election disinformation would be everywhere, but here—happily—we got it wrong. There were many things to wring our hands over this year, but political deepfakes were thin on the ground. 


So what’s coming in 2025? We’re going to ignore the obvious here: You can bet that agents and smaller, more efficient, language models will continue to shape the industry. Instead, here are five alternative picks from our AI team.

1. Generative virtual playgrounds 
If 2023 was the year of generative images and 2024 was the year of generative video—what comes next? If you guessed generative virtual worlds (a.k.a. video games), high fives all round.

""
We got a tiny glimpse of this technology in February, when Google DeepMind revealed a generative model called Genie that could take a still image and turn it into a side-scrolling 2D platform game that players could interact with. In December, the firm revealed Genie 2, a model that can spin a starter image into an entire virtual world.

Other companies are building similar tech. In October, the AI startups Decart and Etched revealed an unofficial Minecraft hack in which every frame of the game gets generated on the fly as you play. And World Labs, a startup cofounded by Fei-Fei Li—creator of ImageNet, the vast data set of photos that kick-started the deep-learning boom—is building what it calls large world models, or LWMs.

One obvious application is video games. There’s a playful tone to these early experiments, and generative 3D simulations could be used to explore design concepts for new games, turning a sketch into a playable environment on the fly. This could lead to entirely new types of games. 

But they could also be used to train robots. World Labs wants to develop so-called spatial intelligence—the ability for machines to interpret and interact with the everyday world. But robotics researchers lack good data about real-world scenarios with which to train such technology. Spinning up countless virtual worlds and dropping virtual robots into them to learn by trial and error could help make up for that.   

—Will Douglas Heaven

2. Large language models that “reason”

""

The buzz was justified. When OpenAI revealed o1 in September, it introduced a new paradigm in how large language models work. Two months later, the firm pushed that paradigm forward in almost every way with o3—a model that just might reshape this technology for good.

 

Most models, including OpenAI’s flagship GPT-4, spit out the first response they come up with. Sometimes it’s correct; sometimes it’s not. But the firm's new models are trained to work through their answers step by step, breaking down tricky problems into a series of simpler ones. When one approach isn’t working, they try another. This technique, known as “reasoning” (yes—we know exactly how loaded that term is), can make this technology more accurate, especially for math, physics, and logic problems.

It’s also crucial for agents.

 

In December, Google DeepMind revealed an experimental new web-browsing agent called Mariner. In the middle of a preview demo that the company gave to MIT Technology Review, Mariner seemed to get stuck. Megha Goel, a product manager at the company, had asked the agent to find her a recipe for Christmas cookies that looked like the ones in a photo she’d given it. Mariner found a recipe on the web and started adding the ingredients to Goel’s online grocery basket.

 

Then it stalled; it couldn’t figure out what type of flour to pick. Goel watched as Mariner explained its steps in a chat window: “It says, ‘I will use the browser’s Back button to return to the recipe.’”

 

 

It was a remarkable moment. Instead of hitting a wall, the agent had broken the task down into separate actions and picked one that might resolve the problem. Figuring out you need to click the Back button may sound basic, but for a mindless bot it’s akin to rocket science. And it worked: Mariner went back to the recipe, confirmed the type of flour, and carried on filling Goel’s basket.

 

Google DeepMind is also building an experimental version of Gemini 2.0, its latest large language model, that uses this step-by-step approach to problem solving, called Gemini 2.0 Flash Thinking.

 

But OpenAI and Google are just the tip of the iceberg. Many companies are building large language models that use similar techniques, making them better at a whole range of tasks, from cooking to coding. Expect a lot more buzz about reasoning (we know, we know) this year.

 

—Will Douglas Heaven

 

3. It’s boom time for AI in science

""

One of the most exciting uses for AI is speeding up discovery in the natural sciences. Perhaps the greatest vindication of AI’s potential on this front came last October, when the Royal Swedish Academy of Sciences awarded the Nobel Prize for chemistry to Demis Hassabis and John M. Jumper from Google DeepMind for building the AlphaFold tool, which can solve protein folding, and to David Baker for building tools to help design new proteins.

 

Expect this trend to continue next year, and to see more data sets and models that are aimed specifically at scientific discovery. Proteins were the perfect target for AI, because the field had excellent existing data sets that AI models could be trained on.

 

The hunt is on to find the next big thing. One potential area is materials science. Meta has released massive data sets and models that could help scientists use AI to discover new materials much faster, and in December, Hugging Face, together with the startup Entalpic, launched LeMaterial, an open-source project that aims to simplify and accelerate materials research. Their first project is a data set that unifies, cleans, and standardizes the most prominent material data sets.

 

AI model makers are also keen to pitch their generative products as research tools for scientists. OpenAI let scientists test its latest o1 model and see how it might support them in research. The results were encouraging.

 

Having an AI tool that can operate in a similar way to a scientist is one of the fantasies of the tech sector. In a manifesto published in October last year, Anthropic founder Dario Amodei highlighted science, especially biology, as one of the key areas where powerful AI could help. Amodei speculates that in the future, AI could be not only a method of data analysis but a “virtual biologist who performs all the tasks biologists do.” We’re still a long way away from this scenario. But next year, we might see important steps toward it.

 

—Melissa Heikkilä

4. AI companies get cozier with national security

""

There is a lot of money to be made by AI companies willing to lend their tools to border surveillance, intelligence gathering, and other national security tasks.

 

The US military has launched a number of initiatives that show it’s eager to adopt AI, from the Replicator program—which, inspired by the war in Ukraine, promises to spend $1 billion on small drones—to the Artificial Intelligence Rapid Capabilities Cell, a unit bringing AI into everything from battlefield decision-making to logistics. European militaries are under pressure to up their tech investment, triggered by concerns that Donald Trump’s administration will cut spending to Ukraine. Rising tensions between Taiwan and China weigh heavily on the minds of military planners, too.

In 2025, these trends will continue to be a boon for defense-tech companies like Palantir, Anduril, and others, which are now capitalizing on classified military data to train AI models.

 

The defense industry’s deep pockets will tempt mainstream AI companies into the fold too. OpenAI in December announced it is partnering with Anduril on a program to take down drones, completing a year-long pivot away from its policy of not working with the military. It joins the ranks of Microsoft, Amazon, and Google, which have worked with the Pentagon for years.

 

 

Other AI competitors, which are spending billions to train and develop new models, will face more pressure in 2025 to think seriously about revenue. It’s possible that they’ll find enough non-defense customers who will pay handsomely for AI agents that can handle complex tasks, or creative industries willing to spend on image and video generators.

 

But they’ll also be increasingly tempted to throw their hats in the ring for lucrative Pentagon contracts. Expect to see companies wrestle with whether working on defense projects will be seen as a contradiction to their values. OpenAI’s rationale for changing its stance was that “democracies should continue to take the lead in AI development,” the company wrote, reasoning that lending its models to the military would advance that goal. In 2025, we’ll be watching others follow its lead.

 

—James O’Donnell

 

5. Nvidia sees legitimate competition

""

For much of the current AI boom, if you were a tech startup looking to try your hand at making an AI model, Jensen Huang was your man. As CEO of Nvidia, the world’s most valuable corporation, Huang helped the company become the undisputed leader of chips used both to train AI models and to ping a model when anyone uses it, called “inferencing.”

 

A number of forces could change that in 2025. For one, behemoth competitors like Amazon, Broadcom, AMD, and others have been investing heavily in new chips, and there are early indications that these could compete closely with Nvidia’s—particularly for inference, where Nvidia’s lead is less solid.

 

A growing number of startups are also attacking Nvidia from a different angle. Rather than trying to marginally improve on Nvidia’s designs, startups like Groq are making riskier bets on entirely new chip architectures that, with enough time, promise to provide more efficient or effective training. In 2025 these experiments will still be in their early stages, but it’s possible that a standout competitor will change the assumption that top AI models rely exclusively on Nvidia chips.

 

Underpinning this competition, the geopolitical chip war will continue. That war thus far has relied on two strategies. On one hand, the West seeks to limit exports to China of top chips and the technologies to make them. On the other, efforts like the US CHIPS Act aim to boost domestic production of semiconductors.

 

Donald Trump may escalate those export controls and has promised massive tariffs on any goods imported from China. In 2025, such tariffs would put Taiwan—on which the US relies heavily because of the chip manufacturer TSMC—at the center of the trade wars. That’s because Taiwan has said it will help Chinese firms relocate to the island to help them avoid the proposed tariffs. That could draw further criticism from Trump, who has expressed frustration with US spending to defend Taiwan from China.

 

It’s unclear how these forces will play out, but it will only further incentivize chipmakers to reduce reliance on Taiwan, which is the entire purpose of the CHIPS Act. As spending from the bill begins to circulate, next year could bring the first evidence of whether it’s materially boosting domestic chip production.

 

—James O’Donnell

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo