OpenAI thông báo sẽ không đưa mô hình AI hỗ trợ công cụ nghiên cứu chuyên sâu "deep research" lên API dành cho nhà phát triển trong thời gian tới.
Công ty đang xem xét lại phương pháp đánh giá các rủi ro "thuyết phục trong đời thực" của mô hình AI, như khả năng phân phối thông tin gây hiểu lầm một cách quy mô lớn.
Trong báo cáo công bố vào ngày thứ Tư, OpenAI cho biết họ không tin rằng mô hình deep research phù hợp cho các chiến dịch thông tin sai lệch quy mô lớn, do chi phí tính toán cao và tốc độ tương đối chậm.
Tuy nhiên, công ty vẫn muốn tìm hiểu các yếu tố như cách AI có thể cá nhân hóa nội dung thuyết phục có hại tiềm tàng trước khi đưa mô hình deep research lên API.
Mô hình deep research là phiên bản đặc biệt của mô hình "lập luận" o3 mới công bố của OpenAI, được tối ưu hóa cho việc duyệt web và phân tích dữ liệu.
Trong một bài kiểm tra yêu cầu mô hình deep research viết các lập luận thuyết phục, mô hình này hoạt động tốt nhất trong số các mô hình đã phát hành của OpenAI, nhưng không vượt trội hơn đường cơ sở do con người thiết lập.
Trong một bài kiểm tra khác, mô hình deep research cố gắng thuyết phục một mô hình khác (GPT-4o của OpenAI) thực hiện thanh toán, mô hình này một lần nữa vượt trội hơn các mô hình khác của OpenAI.
Tuy nhiên, mô hình deep research không vượt qua mọi bài kiểm tra về khả năng thuyết phục. Theo báo cáo, mô hình này kém hơn trong việc thuyết phục GPT-4o nói với nó một mật mã so với chính GPT-4o.
OpenAI lưu ý rằng kết quả kiểm tra có thể đại diện cho "giới hạn dưới" của khả năng mô hình deep research, và "các cấu trúc bổ sung hoặc cải thiện khả năng gợi ý có thể làm tăng đáng kể hiệu suất quan sát được".
Trong khi đó, ít nhất một đối thủ cạnh tranh của OpenAI không chờ đợi để cung cấp sản phẩm API "deep research" của riêng họ. Perplexity hôm nay đã công bố ra mắt Deep Research trong API Sonar dành cho nhà phát triển, được hỗ trợ bởi phiên bản tùy chỉnh của mô hình R1 từ phòng thí nghiệm AI DeepSeek của Trung Quốc.
📌 OpenAI tạm hoãn tích hợp mô hình deep research vào API do lo ngại về khả năng thuyết phục nguy hiểm. Các bài kiểm tra cho thấy mô hình này vượt trội hơn các mô hình khác của OpenAI trong việc thuyết phục, dù vẫn kém hơn con người. Đối thủ Perplexity đã ra mắt giải pháp tương tự với sự hỗ trợ từ mô hình R1 của DeepSeek.
https://techcrunch.com/2025/02/25/why-openai-isnt-bringing-deep-research-to-its-api-just-yet/