- Cognition đã giới thiệu Devin như "kỹ sư phần mềm AI đầu tiên", có khả năng giải quyết các vấn đề kỹ thuật và hoàn thành nhiệm vụ trên các trang web dành cho freelancer như Upwork.
- Tuy nhiên, kênh YouTube "Internet of Bugs" đã chỉ ra rằng Cognition đã nói dối về hiệu suất của Devin trong các video quảng cáo, bao gồm một nhiệm vụ cụ thể trên Upwork.
- Cognition chỉ cung cấp cho Devin câu đầu tiên của yêu cầu và bảo AI "tự tìm ra", trong khi phần quan trọng nằm ở câu thứ hai, dẫn đến việc Devin không thể đưa ra kết quả như mong đợi.
- Devin cũng được cho là có khả năng tìm ra lỗi mà con người bỏ qua, nhưng thực tế AI chỉ sửa lỗi trong tệp do chính nó tạo ra, không phải trong kho lưu trữ.
- Devin mất nhiều giờ để giải quyết nhiệm vụ, trong khi "Internet of Bugs" chỉ mất khoảng 30 phút để trả lời câu hỏi thực tế.
- Điều này cho thấy các kỹ sư phần mềm con người sẽ không bị mất việc trong thời gian tới, ngay cả khi AI như Devin đang được phát triển.
📌 Cognition, công ty đứng sau "kỹ sư phần mềm AI đầu tiên" Devin, đã bị kênh YouTube "Internet of Bugs" tố cáo nói dối về khả năng của AI này trong các video quảng cáo. Những sai sót trong cách trình bày của Cognition, cùng với hiệu suất thực tế của Devin, cho thấy AI này không mạnh mẽ như tuyên bố và các kỹ sư phần mềm con người vẫn đang có lợi thế trong tương lai gần.
Citations:
[1] "First AI Software Engineer" Creators Are Accused of Lying https://80.lv/articles/first-ai-software-engineer-creators-are-accused-of-lying/