• AI tạo sinh đã làm thay đổi ngành công nghệ, tạo ra những rủi ro mới về rò rỉ dữ liệu nhạy cảm thông qua các mô hình ngôn ngữ lớn (LLM) và thúc đẩy tăng cường yêu cầu từ các cơ quan quản lý.
• Các tổ chức cần xem xét lại các nguyên tắc cốt lõi trong quản lý dữ liệu và đảm bảo cách tiếp cận hợp lý để tăng cường LLM bằng dữ liệu doanh nghiệp/phi công khai.
• Cần làm mới cách quản trị dữ liệu, đặc biệt là việc sử dụng dữ liệu trong các giải pháp AI tạo sinh:
• Xác thực và tạo khả năng bảo vệ dữ liệu: Nền tảng dữ liệu cần được chuẩn bị cho mức độ bảo vệ và giám sát cao hơn, bao gồm mã hóa, ẩn danh, tokenization và phân loại dữ liệu tự động bằng machine learning.
• Cải thiện kiểm soát, khả năng kiểm toán và giám sát: Cần thiết kế mới cho việc truy cập, sử dụng dữ liệu và tương tác với bên thứ ba. Cần có hệ thống theo dõi đầy đủ cách sử dụng, sửa đổi và chia sẻ dữ liệu.
• Chuẩn bị dữ liệu cho AI tạo sinh: Cần kỷ luật mới để đảm bảo chất lượng, độ chính xác và tính phù hợp của dữ liệu để đào tạo và tăng cường mô hình ngôn ngữ cho AI. Cần tăng cường quản trị dữ liệu để phù hợp với các nền tảng quản lý dữ liệu phi truyền thống như cơ sở dữ liệu vector.
• Dữ liệu doanh nghiệp thường phức tạp, đa dạng và phân tán, gây khó khăn cho việc tích hợp vào giải pháp AI tạo sinh. Vấn đề này càng trở nên phức tạp hơn do yêu cầu tuân thủ quy định, giảm thiểu rủi ro và thiếu hụt kỹ năng trong tích hợp dữ liệu.
• IBM đã phát triển IBM gen AI data ingestion factory - một dịch vụ được quản lý để giải quyết "vấn đề dữ liệu" của AI và khai thác tiềm năng của dữ liệu doanh nghiệp cho AI tạo sinh.
• Các khả năng cốt lõi bao gồm: thu thập dữ liệu có thể mở rộng, tuân thủ quy định, quản lý quyền riêng tư dữ liệu.
• Dịch vụ này độc lập với nền tảng AI và dữ liệu, cho phép triển khai ở mọi nơi và cung cấp tùy chỉnh cho môi trường và trường hợp sử dụng của khách hàng.
• Các kết quả chính có thể đạt được bao gồm: giảm thời gian tích hợp dữ liệu, sử dụng dữ liệu tuân thủ, giảm thiểu rủi ro, kết quả nhất quán và có thể tái tạo.
📌 AI tạo sinh đặt ra thách thức mới cho quản lý dữ liệu doanh nghiệp. IBM gen AI data ingestion factory cung cấp giải pháp toàn diện, giúp tối ưu hóa việc tích hợp dữ liệu vào AI, đảm bảo tuân thủ quy định và giảm thiểu rủi ro. Doanh nghiệp cần đánh giá lại cách tiếp cận quản lý dữ liệu để thích ứng với kỷ nguyên AI mới.
https://www.ibm.com/blog/re-evaluating-data-management-in-the-generative-ai-age/