Deep Research của OpenAI: Cách agent AI đang "nhắm" vào việc công sở của bạn

  • Deep Research của OpenAI là agent AI có khả năng tự động khám phá web, quyết định những liên kết cần nhấp, nội dung cần đọc và tổng hợp thành báo cáo chuyên sâu, hiện có trong gói ChatGPT Pro giá 200 USD/tháng.

  • Isla Fulford, nhà nghiên cứu tại OpenAI, nhận thấy tiềm năng của Deep Research ngay từ khi nó được sử dụng nội bộ - mỗi khi hệ thống ngừng hoạt động, cô nhận được rất nhiều tin nhắn từ đồng nghiệp mong muốn được tiếp tục sử dụng.

  • Sau khi ra mắt công chúng vào ngày 2/2, Deep Research đã nhận được phản hồi tích cực từ nhiều người dùng, bao gồm cả CEO Stripe Patrick Collison và chuyên gia chính sách AI Dean Ball.

  • Khác với các "agent AI" đơn giản hiện nay, Deep Research sử dụng quá trình suy luận nhân tạo để lập kế hoạch và tiến hành từng bước nghiên cứu, hiển thị chi tiết quá trình suy luận trong cửa sổ bên.

  • Josh Tobin, nhà nghiên cứu OpenAI, cho biết công ty coi Deep Research là công cụ có thể mở rộng để đảm nhận nhiều công việc văn phòng, với mục tiêu dài hạn là xây dựng agent không chỉ giỏi tạo báo cáo mà còn thực hiện được nhiều loại tác vụ khác.

  • Ethan Mollick, giáo sư trường Wharton, đánh giá Deep Research có thể tự động hóa công việc cổ cồn trắng, thực hiện "40 giờ công việc cấp trung bình chỉ trong 1 giờ kiểm tra", mặc dù vẫn cần chuyên gia kiểm tra kết quả.

  • OpenAI đang cân nhắc cung cấp các agent nâng cao với mức giá cao hơn nhiều, có thể lên đến 20.000 USD/tháng cho các agent có khả năng thực hiện "công việc cấp độ tiến sĩ".

  • Deep Research minh họa xu hướng nghiên cứu AI hiện đại tập trung vào agent và các mô hình reasoning, với các đối thủ cạnh tranh như Google DeepMind và Grok của Elon Musk cũng phát triển công cụ tương tự.

  • OpenAI đã thuê sinh viên sau đại học và chuyên gia để huấn luyện Deep Research, cung cấp dữ liệu cho thuật toán học tăng cường giúp mô hình trở thành trợ lý nghiên cứu tốt hơn.

  • Alexander Zerkle, sinh viên sau đại học tại UC San Diego, kể rằng Deep Research đã tạo ra một bài chứng minh định lý Schroeder-Bernstein rất dài cho ông của anh, một nhà toán học, cho thấy khả năng ấn tượng của công cụ này.

📌 Deep Research của OpenAI là agent AI tiên tiến đang mở đường cho tự động hóa công việc cổ cồn trắng, sử dụng khả năng suy luận để tạo báo cáo chuyên sâu từ web. Với giá 200 USD/tháng trong gói ChatGPT Pro, công cụ này có thể thực hiện công việc cấp trung bình tương đương 40 giờ làm việc.

https://www.wired.com/story/openais-deep-research-agent-is-coming-for-white-collar-work/

 

Tác nhân nghiên cứu sâu của OpenAI đang nhắm đến công việc văn phòng

Tác nhân tập trung vào nghiên cứu cho thấy làm thế nào một thế hệ mới của các mô hình AI có khả năng mạnh mẽ hơn có thể tự động hóa một số nhiệm vụ văn phòng. Một hình ảnh minh họa về hình ảnh có kết cấu và mờ của CEO OpenAI Sam Altman đặt sau những vòng tròn hiển thị... Hình ảnh minh họa: Nhân viên WIRED/Getty Images

Isla Fulford, một nhà nghiên cứu tại OpenAI, đã có linh cảm rằng Deep Research sẽ là một hit ngay cả trước khi nó được phát hành. Fulford đã giúp xây dựng tác nhân trí tuệ nhân tạo này, tự động khám phá web, tự quyết định những liên kết nào để nhấp vào, những gì để đọc và những gì để tổng hợp thành một báo cáo chuyên sâu. OpenAI đầu tiên đã cung cấp Deep Research nội bộ; bất cứ khi nào nó ngừng hoạt động, Fulford nói, cô đã bị tràn ngập các câu hỏi từ đồng nghiệp háo hức muốn có nó trở lại. "Số lượng người nhắn tin cho tôi khiến chúng tôi khá phấn khích," Fulford nói. Kể từ khi ra mắt công chúng vào ngày 2 tháng 2, Deep Research đã chứng tỏ là một thành công với nhiều người dùng bên ngoài công ty. Video nổi bật

"Deep Research đã viết 6 báo cáo cho đến nay trong ngày hôm nay," Patrick Collison, CEO của Stripe đã đăng trên X vài ngày sau khi sản phẩm được phát hành. "Nó thực sự xuất sắc. Xin chúc mừng những người đứng sau nó." "Deep Research là sản phẩm AI thực sự khiến một phần đáng kể của cộng đồng hoạch định chính sách ở DC bắt đầu cảm nhận được AGI," Dean Ball, một học giả tại Đại học George Mason chuyên về chính sách AI, đã viết. Deep Research có sẵn như một phần của gói ChatGPT Pro, với giá 200 đô la mỗi tháng. Nó nhận một truy vấn, chẳng hạn như "Viết cho tôi một báo cáo về ngành bảo hiểm y tế Massachusetts," hoặc "Hãy cho tôi biết về bài viết của WIRED về Bộ phận Hiệu quả Chính phủ," và sau đó đưa ra một kế hoạch, tìm kiếm các trang web liên quan, lọc qua nội dung của chúng, và quyết định những liên kết nào để nhấp vào và thông tin nào đáng được điều tra thêm. Sau khi khám phá đôi khi hàng chục phút, nó tổng hợp các phát hiện của mình thành một báo cáo chi tiết, có thể bao gồm trích dẫn, dữ liệu và biểu đồ. Nhiều công cụ hiện được gắn nhãn là tác nhân AI về cơ bản là các chatbot được kết nối với các chương trình đơn giản không có nhiều sự tinh vi. Bản thân mô hình Deep Research trải qua một loại suy luận nhân tạo trước khi đưa ra kế hoạch và tiến hành từng bước. Mô hình cung cấp chi tiết về lý luận này đằng sau nghiên cứu của nó trong một cửa sổ bên. "Đôi khi nó giống như 'Tôi cần quay lại, điều này dường như không hứa hẹn lắm,'" Josh Tobin, một nhà nghiên cứu khác của OpenAI tham gia xây dựng Deep Research, nói. "Thật thú vị khi đọc một số quỹ đạo đó, chỉ để hiểu mô hình đang suy nghĩ như thế nào." OpenAI rõ ràng coi Deep Research như một công cụ có thể đảm nhận nhiều công việc văn phòng hơn. "Đây là thứ mà chúng ta có thể mở rộng," Tobin nói, thêm rằng tác nhân có thể được đào tạo để hoàn thành công việc văn phòng cụ thể. Một tác nhân với quyền truy cập vào dữ liệu nội bộ của công ty có thể nhanh chóng chuẩn bị một báo cáo hoặc bài thuyết trình, chẳng hạn. Tobin nói mục tiêu lâu dài hơn là "xây dựng một tác nhân không chỉ giỏi trong việc xây dựng báo cáo thông qua tìm kiếm web, mà còn giỏi trong nhiều loại nhiệm vụ khác nữa." Bởi vì Deep Research được đào tạo để phân tích và tóm tắt văn bản do con người viết, Tobin nói nhóm của anh ngạc nhiên khi thấy nhiều người sử dụng nó để tạo mã. "Đó là một chủ đề thú vị để kéo theo," anh nói. "Chúng tôi không hoàn toàn chắc chắn về ý nghĩa của nó." Phổ biến nhất Mọi thứ bạn nói với Echo của bạn sẽ sớm được gửi đến Amazon, và bạn không thể từ chối Tin tức và sự kiện về thiết bị Mọi thứ bạn nói với Echo của bạn sẽ sớm được gửi đến Amazon, và bạn không thể từ chối Của Scharon Harding, Ars Technica Sinh viên đại học bác bỏ giả thuyết 40 năm tuổi, phát minh ra loại bảng băm mới Khoa học Sinh viên đại học bác bỏ giả thuyết 40 năm tuổi, phát minh ra loại bảng băm mới Của Steve Nadis 'Lý thuyết sân bay' sẽ khiến bạn bỏ lỡ chuyến bay Xu hướng 'Lý thuyết sân bay' sẽ khiến bạn bỏ lỡ chuyến bay Của Boutayna Chokrane Donald Trump tổ chức bữa tối 'Ánh nến' trị giá một triệu đô la khác - Với Elon Musk đi cùng Chính trị Donald Trump tổ chức bữa tối 'Ánh nến' trị giá một triệu đô la khác - Với Elon Musk đi cùng Của Leah Feiger Tuy nhiên, Tobin thừa nhận rằng công cụ này vẫn còn những điểm mù quan trọng. "Nó có thể gặp khó khăn trong việc phân biệt thông tin có thẩm quyền với tin đồn," anh nói. "Hiện tại nó thể hiện một điểm yếu trong việc hiệu chỉnh độ tin cậy, thường không truyền đạt chính xác sự không chắc chắn." Thời đại của lý luận Deep Research cho thấy làm thế nào các mô hình AI có khả năng mạnh mẽ hơn có thể tự động hóa công việc văn phòng, theo Ethan Mollick, giáo sư tại Trường Wharton thuộc Đại học Pennsylvania, người nghiên cứu việc áp dụng AI trong kinh doanh. Mollick, người thường xuyên sử dụng Deep Research, nói rằng mặc dù công cụ không hoàn hảo và hiệu quả nhất khi được sử dụng bởi các chuyên gia có thể kiểm tra công việc của nó, nó đã gây ấn tượng với các chuyên gia mà ông đã nói chuyện. "Đối với những người cấp cao, không phải là nó hoàn hảo hay đánh bại những người giỏi nhất," Mollick nói. "Mà là nó có thể làm 40 giờ công việc cấp trung bình, và chỉ mất một giờ để kiểm tra," Mollick nói. Liệu các công ty sẽ xem những công cụ như vậy là cách để bổ sung cho nhân viên của họ hay đơn giản là thay thế họ hoàn toàn vẫn còn phải xem xét. "Đó là điều khiến tôi lo lắng nhất," Mollick nói. Triển vọng về việc bán các công cụ có thể tự động hóa lượng lớn công việc văn phòng đòi hỏi kỹ năng cao có lẽ giải thích tại sao OpenAI đang cân nhắc cung cấp các tác nhân nâng cao với mức giá cao. Công ty đã nói với các nhà đầu tư rằng các tác nhân có khả năng làm "công việc cấp độ tiến sĩ" cuối cùng có thể có giá 20.000 đô la mỗi tháng, theo một báo cáo gần đây từ The Information, mặc dù chi tiết của kế hoạch như vậy vẫn chưa rõ ràng. Người phát ngôn của OpenAI, Kayla Wood, mô tả báo cáo là "chỉ là suy đoán." Bên cạnh việc gợi ý về những thay đổi trong công việc văn phòng, Deep Research minh họa cách nghiên cứu AI tiên tiến ngày càng tập trung vào cả các tác nhân và cái gọi là các mô hình lý luận phân tích vấn đề thành các phần cấu thành để phân tích và giải quyết chúng tốt hơn. Các đối thủ chính của OpenAI đều đang phát triển các mô hình lý luận của riêng họ, cũng như các công cụ tương tự như Deep Research. Google DeepMind đã phát hành một tác nhân nghiên cứu web với cùng tên như công cụ của OpenAI vào ngày 10 tháng 12 năm 2024. Grok của Elon Musk cung cấp một tính năng tương tự. Deep Research dường như là sản phẩm tinh vi nhất hiện tại, một phần vì nó dựa trên mô hình lý luận tiên tiến nhất của OpenAI, được gọi là OpenAI o3. Trong khi một mô hình ngôn ngữ lớn thông thường chỉ tạo ra văn bản để trả lời truy vấn, Deep Research sử dụng một hình thức lý luận mô phỏng để quyết định hành động tiếp theo. Những khả năng "agency" như vậy được coi rộng rãi là bước tiến hóa tiếp theo cho AI, mặc dù việc khiến các mô hình thực hiện hành động mà không mắc lỗi vẫn còn khó khăn. "Deep Research là một phần mở rộng tự nhiên của các mô hình lý luận này," Ruslan Salakhutdinov, một nhà khoa học máy tính tại Đại học Carnegie Mellon cũng đang làm việc trên các tác nhân web, nói. Tuy nhiên, Salakhutdinov cho biết, các tác nhân AI vẫn ở giai đoạn đầu, vẫn dễ mắc lỗi, và có khả năng sẽ có nhiều thử nghiệm và đổi mới phía trước. OpenAI đã thuê sinh viên sau đại học và các chuyên gia có kỹ năng cao khác để giúp đào tạo Deep Research. Những người dùng này đưa ra các truy vấn và sau đó sửa lỗi, cung cấp dữ liệu đào tạo cho thuật toán học tăng cường cho phép mô hình học cách trở thành một trợ lý nghiên cứu tốt hơn. Phổ biến nhất Mọi thứ bạn nói với Echo của bạn sẽ sớm được gửi đến Amazon, và bạn không thể từ chối Tin tức và sự kiện về thiết bị Mọi thứ bạn nói với Echo của bạn sẽ sớm được gửi đến Amazon, và bạn không thể từ chối Của Scharon Harding, Ars Technica Sinh viên đại học bác bỏ giả thuyết 40 năm tuổi, phát minh ra loại bảng băm mới Khoa học Sinh viên đại học bác bỏ giả thuyết 40 năm tuổi, phát minh ra loại bảng băm mới Của Steve Nadis 'Lý thuyết sân bay' sẽ khiến bạn bỏ lỡ chuyến bay Xu hướng 'Lý thuyết sân bay' sẽ khiến bạn bỏ lỡ chuyến bay Của Boutayna Chokrane Donald Trump tổ chức bữa tối 'Ánh nến' trị giá một triệu đô la khác - Với Elon Musk đi cùng Chính trị Donald Trump tổ chức bữa tối 'Ánh nến' trị giá một triệu đô la khác - Với Elon Musk đi cùng Của Leah Feiger WIRED đã nói chuyện với một số người đào tạo Deep Research cũng dường như ấn tượng với công cụ này. "Điều đầu tiên nó làm bây giờ, nó yêu cầu làm rõ và điều đó rất lớn," Olga Schrivner, một nhà ngôn ngữ học tại Viện Công nghệ Rose-Hulman đang giúp đào tạo Deep Research, nói. "Nó gần như là giao tiếp, và đột nhiên nó trở thành như trợ lý của bạn." "Ông của tôi là nhà toán học," Alexander Zerkle, một sinh viên sau đại học về vi sinh vật học tại UC San Diego, người đã cung cấp dữ liệu đào tạo cho Deep Research, nói. "Ông ấy muốn nó chứng minh cái gọi là định lý Schroeder-Bernstein. Tôi đã đưa điều đó cho Deep Research, và nó đã đưa ra một chứng minh rất dài. Tôi không hiểu bất kỳ phần nào trong đó, nhưng nó rất thú vị đối với ông ấy với tư cách là một nhà toán học." Khi các công cụ như Deep Research trở nên phổ biến hơn, chúng có thể bắt đầu thay đổi cách nhiều người sử dụng web, ngay cả khi sự cuồng nhiệt đi kèm với sự bùng nổ chatbot bắt đầu phai nhạt. Amelia Glaese, người dẫn đầu công việc về sự phù hợp tại OpenAI, nói rằng dù một chatbot thông minh đến đâu, một mô hình vượt ra ngoài việc tạo văn bản bằng cách thực hiện hành động và làm công việc có giá trị là một đề xuất khác. "Bạn có một mô hình có công dụng rất lớn — đã học cách thực hiện một số công việc thủ công liên quan đến nghiên cứu," cô nói. "Sau đó tôi nghĩ có một nhóm người mới nghĩ, 'Ồ, điều này thực sự hữu ích.'"

OpenAI’s Deep Research Agent Is Coming for White-Collar Work The research-focused agent shows how a new generation of more capable AI models could automate some office tasks. A photo illustration of a textured and blurred image of OpenAI CEO Sam Altman juxtaposed behind circles displaying... Photo-Illustration: WIRED Staff/Getty Images Isla Fulford, a researcher at OpenAI, had a hunch that Deep Research would be a hit even before it was released. Fulford had helped build the artificial intelligence agent, which autonomously explores the web, deciding for itself what links to click, what to read, and what to collate into an in-depth report. OpenAI first made Deep Research available internally; whenever it went down, Fulford says, she was inundated with queries from colleagues eager to have it back. “The number of people who were DMing me made us pretty excited,” says Fulford. Since going live to the public on February 2, Deep Research has proven to be a hit with many users outside the company too. Featured Video “Deep Research has written 6 reports so far today,” Patrick Collison, the CEO of Stripe posted on X a few days after the product was released. “It is indeed excellent. Congrats to the folks behind it.” “Deep Research is the AI product that really got a meaningful chunk of the policymaking community in DC to start feeling the AGI,” wrote Dean Ball, a fellow at George Mason University who specializes in AI policy. Deep Research is available as part of the ChatGPT Pro plan, which costs $200 per month. It takes a query, such as “Write me a report on the Massachusetts health insurance industry,” or “Tell me about WIRED’s coverage of the Department of Government Efficiency,” and then comes up with a plan, searching for relevant websites, combing through their content, and deciding what links to click and what information deserves further investigation. After exploring for sometimes tens of minutes, it synthesizes its findings into a detailed report, which may include citations, data, and charts. Many tools currently branded as AI agents are essentially chatbots connected to simple programs without much sophistication. The Deep Research model itself goes through an artificial kind of reasoning before devising a plan and moving forward with each step. The model provides details of this reasoning behind its research in a side window. “Sometimes it’s like ‘I need to backtrack, this doesn't seem that promising,’” says Josh Tobin, another OpenAI researcher involved in building Deep Research. “It’s pretty cool to read some of those trajectories, just to understand how the model is thinking.” OpenAI evidently sees Deep Research as a tool that could take on more office work. “This is a thing that we can scale,” Tobin says, adding that the agent could be trained to complete specific white-collar work. An agent with access to a company’s internal data could quickly prepare a report or presentation, for instance. Tobin says the longer goal is to “build an agent that is not just good at building reports through searching the web, but is good at many other types of tasks too.” Because Deep Research was trained to analyze and summarize human-written text, Tobin says his team was surprised to see many people using it to generate code. “It’s an interesting thread to pull,” he says. “We’re not totally sure what to make of it.” Most Popular Everything You Say to Your Echo Will Soon Be Sent to Amazon, and You Can’t Opt Out Gear News and Events Everything You Say to Your Echo Will Soon Be Sent to Amazon, and You Can’t Opt Out By Scharon Harding, Ars Technica Undergraduate Disproves 40-Year-Old Conjecture, Invents New Kind of Hash Table Science Undergraduate Disproves 40-Year-Old Conjecture, Invents New Kind of Hash Table By Steve Nadis ‘Airport Theory’ Will Make You Miss Your Flight Trends ‘Airport Theory’ Will Make You Miss Your Flight By Boutayna Chokrane Donald Trump Held Another Million-Dollar ‘Candlelight’ Dinner&-With Elon Musk in Tow Politics Donald Trump Held Another Million-Dollar ‘Candlelight’ Dinner—With Elon Musk in Tow By Leah Feiger Tobin admits, however, that the tool still has important blind spots. “It may struggle with distinguishing authoritative information from rumors,” he says. “It currently shows a weakness in confidence calibration, often failing to convey uncertainty accurately." Age of Reasoning Deep Research shows how more-capable AI models could automate white-collar work, says Ethan Mollick, a professor at the Wharton School of the University of Pennsylvania who studies business adoption of AI. Mollick, who uses Deep Research regularly, says that although the tool is imperfect and most effective when used by experts who can check its work, it has impressed professionals he has spoken to. “For senior-level people it’s not that it's flawless or that it beats the best people,” Mollick says. “It’s that it can do 40 hours of medium-level work, and it only takes an hour to check,” Mollick says. Whether companies will view such tools as a way to augment their workers or simply replace them wholesale remains to be seen. “That's what worries me the most,” Mollick says. The prospect of selling tools that can automate large amounts of highly skilled office work perhaps explains why OpenAI is considering offering advanced agents at a steep premium. The company has told investors that agents capable of doing “PhD-level work” could eventually cost $20,000 per month, according to a recent report from The Information, although details of such a plan remain unclear. OpenAI spokesperson Kayla Wood describes the report as “purely speculation.” Besides hinting at changes in white-collar work, Deep Research illustrates how frontier AI research is increasingly focused on both agents and so-called reasoning models that break problems down into constituent parts in order to better parse and solve them. OpenAI’s main rivals are all developing reasoning models of their own, as well as tools similar to Deep Research. Google DeepMind released a web research agent with the same name as OpenAI’s tool on December 10, 2024. Elon Musk’s Grok offers a similar feature. Deep Research appears to be the most sophisticated offering currently, partly because it is based on OpenAI’s most advanced reasoning model, called OpenAI o3. While a conventional large language model just generates text in response to a query, Deep Research uses a form of simulated reasoning to decide what actions to take next. Such “agentic” abilities are widely seen as the next evolutionary step for AI, although getting models to take actions without making mistakes remains challenging. “Deep Research is a natural extension of these reasoning models,” says Ruslan Salakhutdinov, a computer scientist at Carnegie Mellon University who is also working on web agents. Salakhutdinov says, however, that AI agents are still at an early stage, are still error prone, and there is likely to be a lot of experimentation and innovation ahead. OpenAI hired graduate students and other highly skilled professionals to help train Deep Research. These users give queries and then correct mistakes, providing training data for a reinforcement learning algorithm that lets the model learn to become a better research assistant. Most Popular Everything You Say to Your Echo Will Soon Be Sent to Amazon, and You Can’t Opt Out Gear News and Events Everything You Say to Your Echo Will Soon Be Sent to Amazon, and You Can’t Opt Out By Scharon Harding, Ars Technica Undergraduate Disproves 40-Year-Old Conjecture, Invents New Kind of Hash Table Science Undergraduate Disproves 40-Year-Old Conjecture, Invents New Kind of Hash Table By Steve Nadis ‘Airport Theory’ Will Make You Miss Your Flight Trends ‘Airport Theory’ Will Make You Miss Your Flight By Boutayna Chokrane Donald Trump Held Another Million-Dollar ‘Candlelight’ Dinner&-With Elon Musk in Tow Politics Donald Trump Held Another Million-Dollar ‘Candlelight’ Dinner—With Elon Musk in Tow By Leah Feiger WIRED spoke to several Deep Research trainers who also seemed impressed by the tool. “The first thing it does now, it asks for clarification and that's huge,” says Olga Schrivner, a linguist at the Rose-Hulman Institute of Technology who is helping train Deep Research. “It’s almost like communication, and all of a sudden it becomes like your assistant.” “My grandpa is a mathematician,” says Alexander Zerkle, a graduate student in microbiology at UC San Diego who has been providing training data for Deep Research. “He wanted it to prove what's called the Schroeder-Bernstein theorem. I gave that to Deep Research, and it spat out a very long proof. I don't understand any of it, but it's very exciting to him as a mathematician.” As tools like Deep Research become more widespread, they may start to change how many people use the web, even as the mania that accompanied the chatbot boom starts to fade. Amelia Glaese, who leads work on alignment at OpenAI, says that no matter how clever a chatbot is, a model that goes beyond generating text by taking actions and does valuable work is a different proposition. “You have a model that has this very big utility—that has learned how to do some of the manual work involved with research,” she says. “Then I think there’s a new set of people that are like, ‘Wow, this is really useful.’”

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo