Haize Labs - Startup chuyên thương mại hóa việc jailbreak các mô hình AI hàng đầu

• Haize Labs là một startup do Leonard Tang (22 tuổi) thành lập vào tháng 12/2023, chuyên thương mại hóa nghiên cứu về tấn công đối kháng và độ mạnh mẽ của AI.
• Công ty sử dụng bộ công cụ "haizing suite" gồm các thuật toán tìm kiếm và tối ưu hóa để quét không gian đầu vào của các mô hình ngôn ngữ lớn (LLM), tìm ra các lỗ hổng an toàn.
• Haize Labs đã jailbreak thành công hàng chục mô hình AI khác nhau trên nhiều phương thức như văn bản, âm thanh, hình ảnh, video, mã nguồn.
• Một số khách hàng của Haize Labs là chính các nhà cung cấp mô hình AI như Anthropic. Công ty cung cấp dịch vụ haizing và giải pháp phòng thủ thời gian thực.
Mô hình khó jailbreak nhất là Claude của Anthropic. Các mô hình dễ bị phá vỡ là những mô hình không thực hiện tinh chỉnh an toàn như Vicuna và Mistral.
• Haize Labs khẳng định mục đích là chủ động tìm ra lỗ hổng để cung cấp giải pháp phòng thủ, ngăn chặn các hành vi có hại xảy ra với AI.
• Đội ngũ đồng sáng lập gồm Leonard Tang, Richard Liu và Steve Li - bạn cùng lớp tại Đại học Harvard. Công ty cũng nhận được sự hỗ trợ từ các cố vấn và nhà đầu tư thiên thần.

📌 Haize Labs đang thương mại hóa việc jailbreak các mô hình AI hàng đầu, phát hiện hàng chục lỗ hổng trên nhiều phương thức như văn bản, âm thanh, hình ảnh, video. Với bộ công cụ "haizing suite", công ty đã jailbreak thành công cả những mô hình khó như Claude, giúp các nhà cung cấp AI như Anthropic xác định điểm yếu và cung cấp giải pháp phòng thủ. Haize Labs khẳng định mục đích là ngăn chặn các hành vi có hại với AI.

https://venturebeat.com/ai/haize-labs-is-using-algorithms-to-jailbreak-leading-ai-models/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo