Robin Li, nhà sáng lập Baidu, công khai nhận định nhu cầu đối với các mô hình AI tạo sinh chỉ xử lý văn bản như DeepSeek đang thu hẹp, trong khi thị trường chuyển dịch mạnh sang các mô hình đa phương tiện tích hợp xử lý văn bản, hình ảnh, âm thanh và video.
Tại hội nghị phát triển AI ở Vũ Hán, Baidu công bố hai mô hình mới: Ernie 4.5 Turbo và X1 Turbo, nổi bật với khả năng suy luận logic vượt trội, đa phương thức và chi phí thấp hơn đáng kể so với DeepSeek.
Robin Li chỉ ra các điểm yếu của DeepSeek: chỉ hỗ trợ văn bản, tỷ lệ ảo giác cao, tốc độ phản hồi chậm, chi phí sử dụng cao, khó ứng dụng trong các lĩnh vực rủi ro như tài chính, y tế và thương mại điện tử.
DeepSeek từng gây tiếng vang lớn tại Trung Quốc với mô hình R1 ra mắt tháng 1/2025, thu hút 125 triệu người dùng chỉ sau 1 tuần, nhưng hiện đối mặt cạnh tranh gay gắt từ Baidu, Alibaba (Qwen), ByteDance (Doubao), Tencent (Yuanbao) và nhiều startup AI khác.
Baidu đã tích hợp DeepSeek vào các sản phẩm như Qianfan, bản đồ, tìm kiếm, nhưng song song đó chủ động phát triển và mở nguồn mô hình riêng, giảm chi phí cho doanh nghiệp và nhà phát triển.
Baidu triển khai cụm máy chủ 30.000 chip Kunlun P800 để hỗ trợ huấn luyện và vận hành mô hình AI, khẳng định không thiếu tài nguyên tính toán cho phát triển AI quy mô lớn.
Giá sử dụng Ernie X1 Turbo chỉ 0,14 USD/1 triệu tokens đầu vào và 0,55 USD/1 triệu tokens đầu ra; Ernie 4.5 Turbo còn rẻ hơn, lần lượt 0,11 USD và 0,44 USD/1 triệu tokens, chỉ bằng 25% giá DeepSeek R1.
DeepSeek vẫn tiếp tục phát triển các phiên bản mới như R2, V4, nhưng bị đánh giá là chưa bắt kịp xu hướng đa phương thức và ứng dụng thực tiễn.
Baidu ra mắt ứng dụng AI agent Xinxiang, cạnh tranh trực tiếp với Quark của Alibaba và Manus AI, đẩy mạnh ứng dụng AI vào các lĩnh vực pháp lý, du lịch, phân tích tri thức.
Cổ phiếu Baidu tăng hơn 4% sau các công bố mới, cho thấy thị trường đánh giá cao chiến lược chuyển hướng sang AI đa phương tiện và mở rộng ứng dụng.
📌 Baidu công khai “dìm” DeepSeek khi nhu cầu AI văn bản thu hẹp, thị trường chuyển dịch sang AI đa phương tiện tích hợp văn bản, hình ảnh, âm thanh, video. Baidu ra mắt Ernie 4.5 Turbo và X1 Turbo với chi phí chỉ bằng 25% DeepSeek R1, tốc độ nhanh hơn, tỷ lệ ảo giác thấp, khẳng định vị thế dẫn đầu AI tại Trung Quốc.
https://www.ft.com/content/c462fbd1-1672-4d8f-bd91-c3aa185d2418
#FT
Lãnh đạo tập đoàn tìm kiếm đưa ra lời chỉ trích hiếm hoi đối với "con cưng" AI tạo sinh của Trung Quốc
Robin Li giới thiệu các mô hình AI đa phương thức mới vào thứ Sáu tại hội nghị nhà phát triển của Baidu ở Vũ Hán © Bloomberg
Eleanor Olcott tại Vũ Hán Đăng tải cách đây 16 giờ
Nhận cập nhật miễn phí về AI Đăng ký đơn giản để nhận bản tin AI myFT -- gửi trực tiếp đến hộp thư của bạn.
Nhà sáng lập Baidu phát biểu rằng nhu cầu cho loại mô hình dựa trên văn bản do DeepSeek phát triển đang "co hẹp", khi tập đoàn tìm kiếm của ông tìm cách khẳng định lại vị thế là công ty dẫn đầu về AI tại Trung Quốc.
Trong một lời chỉ trích đáng chú ý về những hạn chế của DeepSeek – "con cưng" AI của Trung Quốc, Robin Li phát biểu tại hội nghị nhà phát triển của Baidu vào thứ Sáu rằng mô hình hàng đầu của DeepSeek có những giới hạn. Sản phẩm R1 phổ biến của hãng, được cộng đồng nhà phát triển toàn cầu đánh giá cao, tập trung vào các tác vụ dựa trên văn bản.
"Thị trường cho các mô hình văn bản đang co hẹp," Li phát biểu khi phát hành hai mô hình đa phương thức mới — Ernie 4.5 Turbo và X1 Turbo — với khả năng xử lý không chỉ văn bản mà còn âm thanh, hình ảnh và video. Ông bổ sung rằng mô hình của DeepSeek có xu hướng cao hơn về các "ảo giác" gây hiểu lầm và chậm hơn, đắt hơn so với các sản phẩm trong nước khác.
DeepSeek chưa phản hồi ngay yêu cầu bình luận.
Li phát biểu rằng bối cảnh cạnh tranh cho các mô hình mới luôn thay đổi, với một loạt "các mô hình mới mạnh mẽ cung cấp nhiều lựa chọn hơn".
Nhận xét của ông đưa ra trong bối cảnh Baidu đang cố gắng tái định vị mình là công ty dẫn đầu về AI sau khi buộc phải xoay trục bằng cách ngừng dịch vụ đăng ký cho chatbot của mình và công bố các mô hình dưới dạng "mã nguồn mở" miễn phí. Baidu đối mặt với cạnh tranh gay gắt trong nước từ đối thủ Alibaba, công ty đã phát hành các mô hình đa phương thức mã nguồn mở cạnh tranh.
Baidu trình bày một số trường hợp sử dụng cho các mô hình đa phương thức của mình, bao gồm bản cập nhật cho nền tảng avatar AI cho phép các nhà bán hàng tạo ra nhân vật giống người để dẫn dắt livestream và quảng cáo sản phẩm.
Mặc dù Li chỉ ra những hạn chế của DeepSeek, công ty internet này vẫn sử dụng các mô hình của đối thủ kể từ khi startup này vươn lên vị trí dẫn đầu như công ty mô hình ngôn ngữ lớn hàng đầu của Trung Quốc sau khi phát hành mô hình suy luận R1 vào tháng 1.
Trong những tháng gần đây, Baidu đã thêm DeepSeek vào nền tảng doanh nghiệp Qianfan, cũng như tích hợp vào các ứng dụng bản đồ và tìm kiếm của mình.
Charlie Dai, phó chủ tịch tại Forrester Research, cho biết các thông báo của Baidu vào thứ Sáu sẽ "đẩy nhanh việc áp dụng AI trong các ngành công nghiệp tại Trung Quốc, hạ thấp rào cản cho các nhà phát triển và tiếp tục gia tăng cạnh tranh với các nhà cung cấp hàng đầu khác" như Alibaba Cloud, Huawei Cloud và Tencent Cloud.
Cổ phiếu Baidu tại Hồng Kông tăng hơn 4% sau tin này.
DeepSeek vẫn tập trung vào việc phát triển thêm các mô hình, với các kỹ sư làm việc hết công suất để phát hành các phiên bản tiếp theo — mô hình R2 và V4, theo báo cáo của Financial Times tháng trước.
Sau khi ChatGPT ra mắt vào tháng 11 năm 2022, Baidu là công ty Trung Quốc đầu tiên phản ứng với chatbot phổ biến của OpenAI. Vào tháng 3 năm 2023, công ty công bố Erniebot, với phiên bản di động sau đó đổi tên thành Wenxinyan.
Chatbot của Baidu đạt được thành công ban đầu tại Trung Quốc, nhưng Doubao của ByteDance và chatbot của DeepSeek sau đó vượt qua về mức độ phổ biến. Năm nay, Baidu dừng dịch vụ đăng ký sau khi sự tiếp nhận chậm chạp do sự dồi dào của các sản phẩm miễn phí từ đối thủ.
Sau khi ban đầu mạnh mẽ bảo vệ phương pháp mô hình đóng, Baidu cũng bắt đầu mở mã nguồn các mô hình của mình, cho phép các nhà phát triển linh hoạt hơn trong việc tạo ứng dụng.
Vào thứ Sáu, Baidu công bố phát hành ứng dụng tác nhân AI mới tên là Xinxiang, gia nhập thị trường ngày càng đông đúc bao gồm ứng dụng Quark của Alibaba và các sản phẩm từ các startup như Manus AI.
Baidu cũng công bố đã xây dựng một cụm tính toán gồm 30.000 chip AI Kunlun P800 từ công ty con thiết kế chất bán dẫn của mình, được cho là có thể hỗ trợ đào tạo nhiều mô hình giống DeepSeek. Li thêm rằng các nhà phát triển không cần lo lắng về tình trạng thiếu năng lực tính toán.
Financial Times tháng trước đưa tin Samsung đã bán cho Kunlun nguồn cung chip logic đủ dùng trong 3 năm, một thành phần quan trọng trong sản xuất sản phẩm AI. Khả năng Samsung tiếp tục làm việc với các sản phẩm Kunlun có thể bị hạn chế bởi các biện pháp kiểm soát xuất khẩu mới của Mỹ.