Codex là công cụ lập trình dựa trên đám mây do OpenAI phát triển, được tối ưu hóa cho kỹ thuật phần mềm, sử dụng mô hình codex-1 – một phiên bản đặc biệt của mô hình o3.
Codex có thể đọc, chỉnh sửa mã, chạy lệnh kiểm thử và phản hồi yêu cầu từ người dùng trong môi trường được cách ly, không có kết nối internet sau giai đoạn thiết lập ban đầu.
Các container hoạt động riêng biệt cho từng phiên làm việc, đảm bảo cách ly dữ liệu và môi trường phát triển, đồng thời Codex chỉ truy cập được các thư mục được cấu hình sẵn.
Mỗi tác vụ đều kèm theo nhật ký hành động và trích dẫn rõ ràng (diff, log terminal), giúp người dùng dễ dàng theo dõi, xác minh và kiểm tra kết quả trước khi hợp nhất mã vào kho chính.
Về độ an toàn, Codex đạt tỷ lệ từ chối cao đối với nội dung bị cấm trong bài đánh giá StrongReject, với chỉ số 0,98 về khả năng từ chối prompt nguy hiểm.
Đối với tác vụ nguy hại như viết mã độc, mô hình đạt tỷ lệ từ chối 0,97 (bài kiểm tra tổng hợp) và 0,98 (tập thử nghiệm vàng – golden set).
Hệ thống được trang bị sandbox mạng và hệ thống file để tránh rò rỉ dữ liệu, phá hoại hệ thống, hoặc thực hiện lệnh nguy hiểm trong môi trường thực tế.
Để hạn chế lỗi sai, Codex được đào tạo để nhận diện tình huống phức tạp như thiếu tệp cần thiết hoặc repository không tương thích và thành thật khi không thể hoàn thành nhiệm vụ.
Trước khi huấn luyện lại, mô hình chỉ nhận đúng lỗi ở mức 0,15; sau huấn luyện, tỷ lệ này tăng lên 0,85, cho thấy tiến bộ rõ rệt trong tính trung thực và minh bạch.
Đối với các cuộc tấn công prompt injection, Codex có khả năng bỏ qua các lệnh độc hại trong môi trường coding với tỷ lệ 0,98.
📌 Codex là trợ lý lập trình AI được cách ly hoàn toàn với mạng, hoạt động trong môi trường sandbox bảo mật cao, cung cấp khả năng viết mã chính xác và kiểm tra đầy đủ qua nhật ký. Với tỷ lệ từ chối tác vụ nguy hại lên đến 0,98 và khả năng chống prompt injection đạt 0,98, Codex là công cụ AI tạo sinh an toàn và đáng tin cậy trong phát triển phần mềm doanh nghiệp.
https://cdn.openai.com/pdf/8df7697b-c1b2-4222-be00-1fd3298f351d/codex_system_card.pdf