Thử nghiệm so sánh tính năng nghiên cứu sâu của ChatGPT, Gemini, Perplexity và Grok

 

 

  • Tác giả thử nghiệm tính năng Deep Research của bốn nền tảng AI: ChatGPT (OpenAI), Google Gemini, Perplexity AI và Grok (xAI) với cùng một đề bài: "Lịch sử phát triển của GPS từ ứng dụng quân sự đến hệ thống thương mại toàn cầu".

  • ChatGPT cung cấp hai phiên bản: Full Deep ResearchLightweight.

    • Phiên bản đầy đủ (full) mất gần 10 phút để hoàn thành báo cáo, cho ra kết quả chi tiết, mạch lạc, có dòng thời gian, ứng dụng thực tế, các giai đoạn phát triển, và kết luận rõ ràng.

    • Phiên bản rút gọn (lightweight) mất khoảng 4 phút, nội dung đơn giản, chủ yếu nêu mốc thời gian và sự kiện chính, thiếu chiều sâu phân tích.

    • Giao diện ChatGPT cũng hiển thị quá trình làm việc, nguồn tham khảo, và cho phép người dùng cung cấp thêm yêu cầu về mức độ chi tiết và phạm vi đề tài.

  • Google Gemini cũng có chế độ Deep Research dành cho cả người dùng miễn phí và trả phí.

    • Với mô hình Gemini 2.5 Pro, AI cho thấy sự chuyên nghiệp: tạo đề cương nghiên cứu trước khi viết, xin xác nhận người dùng, và sau đó thực hiện tìm kiếm.

    • Thời gian xử lý khoảng 8 phút, cho ra một báo cáo học thuật, chia mục rõ ràng, mở đầu bằng timeline, kết thúc bằng bảng tổng hợp các hệ thống GPS toàn cầu.

    • Phong cách văn bản hơi khô và mang tính học thuật, nhưng nội dung rất đáng tin cậy.

  • Perplexity AI thực hiện báo cáo nhanh chóng chỉ trong 3 phút, hiển thị các nguồn tham khảo và từng bước phân tích đang thực hiện.

    • Tuy nhiên, báo cáo ngắn, nội dung ở mức khái quát, không có chiều sâu, thiếu phân tích và dẫn chứng cụ thể.

    • Phù hợp để tham khảo nhanh, không lý tưởng cho nghiên cứu chuyên sâu hoặc học thuật.

  • Grok (xAI) có hai chế độ là DeepSearchDeeperSearch:

    • DeepSearch hoàn thành trong khoảng 1,5 phút, DeeperSearch mất hơn 2 phút. Cả hai đều nhanh, nhưng nội dung chỉ ở mức khái lược.

    • Dù DeeperSearch dài hơn nhưng vẫn không cung cấp chiều sâu mong đợi, không có phân tích rõ ràng hay tổ chức nội dung bài bản.

    • Grok thường xuyên dùng các nguồn không đáng tin cậy, dẫn đến tính chính xác thấp.

  • Về quyền truy cập, các AI có giới hạn sử dụng khác nhau:

    • ChatGPT Plus: 10 truy vấn Deep Research đầy đủ/tháng

    • Perplexity Pro: 500 truy vấn/ngày

    • Gemini: 20 truy vấn/ngày với người dùng trả phí

    • Grok (X Premium+): không giới hạn, nhưng chất lượng còn kém

  • Kết luận của tác giả:

    • ChatGPT là AI chiến thắng nhờ báo cáo sâu sắc, dễ hiểu và phù hợp người đọc phổ thông lẫn chuyên môn.

    • Google Gemini đứng thứ hai với bố cục logic, phong cách học thuật.

    • Perplexity và Grok tuy nhanh nhưng nội dung nghèo nàn, thiếu chiều sâu và không đạt tiêu chuẩn nghiên cứu thực thụ.

📌 Trong bài thử nghiệm cùng một đề tài GPS, ChatGPT vượt trội nhờ báo cáo chi tiết, rõ ràng và dễ đọc, trong khi Gemini phù hợp người ưa nghiên cứu học thuật. PerplexityGrok gây thất vọng vì nội dung sơ sài. Với những ai cần AI hỗ trợ nghiên cứu thật sự, ChatGPT là lựa chọn tốt nhất hiện nay.

https://www.pcmag.com/how-to/testing-deep-research-chatgpt-google-gemini-perplexity-grok-which-is-best

Không có file đính kèm.

14

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo