- Quan hệ đối tác giữa Scale AI và Lầu Năm Góc nhằm thử nghiệm và đánh giá các mô hình ngôn ngữ lớn (LLMs) cho việc sử dụng trong quân sự.
- Mục tiêu của dự án là đảm bảo các mô hình AI an toàn và đáng tin cậy cho việc hỗ trợ và cải thiện kế hoạch và quyết định quân sự.
- Văn phòng Kỹ thuật số và Trí tuệ nhân tạo (CDAO) của Lầu Năm Góc cần phương pháp thử nghiệm và đánh giá AI để sử dụng trong môi trường quân sự.
- Quá trình T&E (kiểm thử và đánh giá) sẽ bao gồm việc tạo ra "bộ dữ liệu giữ lại" để đánh giá và xem xét các cặp phản hồi, đảm bảo chất lượng tương đương với con người.
- Mục tiêu là tăng cường độ bền vững và khả năng phục hồi của hệ thống AI trong môi trường phân loại, cho phép áp dụng công nghệ LLM trong môi trường an toàn.
- Scale AI dự định tự động hóa quá trình phát triển càng nhiều càng tốt để có cái nhìn cơ bản về hiệu suất của các mô hình mới.
📌 Quan hệ đối tác giữa Scale AI và Lầu Năm Góc đánh dấu một bước tiến quan trọng trong việc thử nghiệm và đánh giá các mô hình AI ngôn ngữ lớn (LLMs) để sử dụng an toàn và hiệu quả trong quân sự. Việc tạo ra khung kiểm thử và đánh giá cho phép đánh giá chính xác các mô hình AI, đảm bảo chúng đáng tin cậy và an toàn khi triển khai. Sự hợp tác này không chỉ mang lại lợi ích cho Lầu Năm Góc mà còn cho Scale AI, qua việc mở rộng kinh nghiệm và chuyên môn trong lĩnh vực AI sinh tạo và đánh giá công nghệ.
Citations:
[1] https://www.cryptopolitan.com/the-pentagon-is-testing-new-ai-models/