• CodeStory đã phát triển framework đa tác tử mới có tên Aide, đạt 40,3% giải pháp được chấp nhận trên benchmark SWE-Bench-Lite, thiết lập tiêu chuẩn mới trong lĩnh vực phát triển phần mềm.
• Kiến trúc cốt lõi của Aide dựa trên nhiều tác tử, mỗi tác tử phụ trách một ký hiệu code cụ thể như lớp, hàm, enum hoặc kiểu dữ liệu. Điều này cho phép giao tiếp bằng ngôn ngữ tự nhiên giữa các bot, giúp mỗi bot tập trung vào một đơn vị nhiệm vụ cụ thể.
• Language Server Protocol (LSP) được sử dụng để tạo điều kiện giao tiếp giữa các tác tử, đảm bảo truyền thông tin chính xác và hiệu quả.
• Trong một lần chạy, có thể có tới 30 tác tử hoạt động đồng thời, cộng tác để đưa ra quyết định và chia sẻ thông tin.
• Framework sử dụng ClaudeSonnet3.5 và GPT-4o để tạo môi trường biên tập cho các tác tử thông qua Pyright và Jedi. GPT-4o xuất sắc trong chỉnh sửa code, trong khi Sonnet3.5 hỗ trợ tổ chức và điều hướng codebase.
• Sonnet 3.5 thể hiện hiểu biết sâu sắc về khả năng bảo trì và cấu trúc code bằng cách đề xuất tách các hàm thay vì làm phức tạp hóa các hàm đã phức tạp.
• SWE-Bench-Lite được chọn làm benchmark vì khả năng mô phỏng các thách thức lập trình thực tế. Cấu hình benchmark bao gồm một harness editor giả lập với Pyright cho chẩn đoán và Jinja cho các tính năng LSP.
• Quá trình benchmark cho thấy tầm quan trọng của sự hợp tác giữa các tác tử. Các tác tử phụ trách các ký hiệu code khác nhau có thể hoàn thành nhiệm vụ nhanh chóng và thường sửa các vấn đề không liên quan như lỗi lint hoặc TODO.
• Nhóm nghiên cứu đang tập trung vào việc đảm bảo giao tiếp suôn sẻ giữa các nhà phát triển và tác tử, xử lý các thay đổi code đồng thời và duy trì tính ổn định của code.
• Mục tiêu cuối cùng là tăng cường khả năng của các nhà phát triển con người chứ không phải thay thế họ, cung cấp một đàn tác tử chuyên biệt để cải thiện độ chính xác và hiệu quả của quá trình phát triển phần mềm.
📌 Aide, framework đa tác tử mới từ CodeStory, đạt 40,3% giải pháp được chấp nhận trên SWE-Bench-Lite. Sử dụng ClaudeSonnet3.5 và GPT-4o, framework cho phép 30 tác tử hoạt động đồng thời, hứa hẹn cách mạng hóa phát triển phần mềm thông qua hợp tác đa tác tử và tăng cường khả năng của nhà phát triển.
https://www.marktechpost.com/2024/07/01/transforming-software-development-with-multi-agent-collaboration-codestorys-aide-framework-sets-state-of-the-art-on-swe-bench-lite-with-40-3-accepted-solutions/