Dù doanh nghiệp đầu tư 30-40 tỷ USD vào AI tạo sinh, 95% chưa thấy lợi nhuận

  • Báo cáo MIT State of AI in Business 2025 cho thấy doanh nghiệp đã chi 30-40 tỷ USD cho AI tạo sinh nhưng 95% không thấy lợi nhuận; chỉ 5% vượt qua “GenAI Divide”.

  • Qlik & ESG: 94% doanh nghiệp tăng đầu tư AI nhưng chỉ 21% vận hành hiệu quả. Informatica: nguyên nhân chính là dữ liệu kém chất lượng, thiếu sẵn sàng và hạ tầng non trẻ.

  • Vấn đề không nằm ở mô hình AI mà ở việc thiếu tích hợp, không đo lường được sự phù hợp với dữ liệu, kỳ vọng của nhân viên và quản trị động.

  • Các khung truyền thống (RICE, ICE, MoSCoW) thất bại với AI vì:

    • Reach dựa vào số người dùng tuyệt đối, dễ phóng đại.

    • Confidence chủ quan, bỏ qua rủi ro dữ liệu và khả năng mô hình.

    • Effort chỉ tính code, không tính chi phí làm sạch dữ liệu.

    • Impact khó đo lường vì AI có thể hỗ trợ hoặc thay thế con người, hành vi không nhất quán.

  • Apple với nghiên cứu “The Illusion of Thinking” chỉ ra giới hạn của mô hình lý luận lớn (LRM): khó khái quát ngoài dữ liệu huấn luyện, hành vi thiếu ổn định.

  • Stanford 2025 nghiên cứu 800 nhiệm vụ/100 nghề: nhân viên muốn AI hỗ trợ gần 50% công việc, nhưng nhiều dự án AI tập trung vào tác vụ sai. Đề xuất “Human Agency Scale” cho thấy giá trị cao nhất nằm ở AI hỗ trợ, không thay thế.

  • ARISE (AI Readiness and Impact-Scoring Evaluation) ra đời thay thế RICE:

    • Giữ Reach, Impact, Confidence, Effort nhưng chuẩn hóa thang đo.

    • Bổ sung 3 yếu tố: AI Desire (nhu cầu thực sự), AI Capability (dữ liệu, độ chín mô hình), Intent (AI hỗ trợ hay tự động).

    • Công thức: ARISE Score = (Reach * Impact * Confidence / Effort) × AI Desire × AI Capability × Intent Multiplier.

  • Ví dụ: AI coding assistant (điểm ARISE = 20) được ưu tiên cao hơn AI tự động khắc phục lỗi (điểm = 1) vì khả năng dữ liệu còn yếu.

  • ARISE giúp doanh nghiệp tránh chạy theo demo ảo, tập trung vào dự án có giá trị thực, cân bằng giữa con người và AI.


📌 

Dù 30-40 tỷ USD đã được đổ vào AI tạo sinh, 95% tổ chức chưa gặt hái lợi ích, chủ yếu vì khung quản lý dự án lỗi thời và dữ liệu thiếu sẵn sàng. ARISE ra đời như công cụ AI-native thay thế RICE, bổ sung thước đo AI Desire, Capability và Intent, đảm bảo tính khả thi và giá trị thực tế. Nhờ vậy, doanh nghiệp có thể tránh sai lầm phổ biến, ưu tiên đúng dự án AI và cân bằng giữa hỗ trợ con người và tự động hóa.

https://venturebeat.com/ai/how-ai-product-teams-are-rethinking-impact-risk-feasibility

 

Ví dụ cụ thể và tính toán chi tiết điểm ARISE:


Công thức tổng quát:

ARISE Score = (Reach × Impact × Confidence / Effort) × AI Desire × AI Capability × Intent Multiplier

Trong đó:

  • Reach: phần trăm người dùng hưởng lợi (0-1).

  • Impact: mức độ tác động (0.25 → 3.0).

  • Confidence: độ tin cậy (0-1).

  • Effort: nỗ lực, tính bằng người-tháng (càng ít càng tốt).

  • AI Desire: nhu cầu AI (1-5).

  • AI Capability: mức độ sẵn sàng dữ liệu, mô hình (1-5).

  • Intent Multiplier: hệ số theo mục đích (Reactive = 1.0; Proactive = 1.2).


Ví dụ 1: AI trợ lý viết code cho lập trình viên

  • Reach = 1.0 (100% dev trong công ty đều dùng).

  • Impact = 2.0 (năng suất +50%).

  • Confidence = 1.0 (khá chắc chắn vì dùng mô hình có sẵn).

  • Effort = 2 (2 người-tháng).

  • AI Desire = 5 (nhu cầu cực cao).

  • AI Capability = 4 (dữ liệu + công nghệ khá sẵn sàng).

  • Intent Multiplier = 1.0 (chỉ hỗ trợ, không tự động hành động).

Tính:
ARISE = (1.0 × 2.0 × 1.0 / 2) × 5 × 4 × 1.0
= (1.0) × 20
= 20 điểm

→ Rất đáng ưu tiên.


Ví dụ 2: Hệ thống AI tự động giám sát log và sửa lỗi server

  • Reach = 1.0 (toàn bộ hệ thống backend hưởng lợi).

  • Impact = 2.5 (giảm downtime lớn).

  • Confidence = 0.5 (khá rủi ro, chưa kiểm chứng).

  • Effort = 12 (12 nhân-tháng).

  • AI Desire = 5 (rất mong muốn).

  • AI Capability = 2 (thiếu dữ liệu + mô hình chưa đủ chín).

  • Intent Multiplier = 1.2 (tự động hành động, rủi ro cao hơn).

Tính:
ARISE = (1.0 × 2.5 × 0.5 / 12) × 5 × 2 × 1.2
= (1.25 / 12) × 12
≈ 0.104 × 12
1.25 điểm

→ Rủi ro cao, nên chia nhỏ hoặc hoãn lại.

 

Trong ARISE, yếu tố Reach được tái định nghĩa để phù hợp với AI, khác với RICE cũ. Thay vì “ước tính số người dùng tuyệt đối” (dễ bị phóng đại), Reach trong ARISE đo bằng tỉ lệ phần trăm (%) người dùng thực tế trong tập khách hàng hoặc nhân viên sẽ được hưởng lợi.

👉 Công thức chuẩn hóa:
Reach = % người dùng hưởng lợi / 100
→ Kết quả nằm trong khoảng 0 – 1.


Ví dụ cách tính Reach

  • 0.1 (10%)

    • Tính năng AI chỉ phục vụ nhóm nhỏ.

    • Ví dụ: AI hỗ trợ đội ngũ pháp lý nội bộ (~10% nhân viên).

  • 0.3 (30%)

    • Lợi ích cho một bộ phận rộng nhưng không toàn diện.

    • Ví dụ: AI gợi ý câu trả lời email cho bộ phận sales (~30% công ty).

  • 0.5 (50%)

    • Một nửa người dùng hưởng lợi trực tiếp.

    • Ví dụ: AI chatbot hỗ trợ khách hàng ở thị trường Mỹ (50% khách hàng toàn cầu).

  • 0.8 (80%)

    • Đa số người dùng được hưởng lợi.

    • Ví dụ: AI phân tích dữ liệu truy vấn trong app mà hầu hết khách hàng đều sử dụng.

  • 1.0 (100%)

    • Toàn bộ người dùng trong phạm vi dự án.

    • Ví dụ: AI coding assistant triển khai cho tất cả lập trình viên trong công ty.


📌 Ý nghĩa: Reach giúp đội ngũ tránh “thổi phồng” số người dùng. Thay vì nói “1 triệu người sẽ hưởng lợi”, ARISE buộc chuẩn hóa theo tỉ lệ phần trăm người dùng thực tế, giúp so sánh công bằng giữa dự án nhỏ và lớn.

 

Impact trong khung ARISE được định nghĩa là mức độ tác động mà một sáng kiến AI mang lại cho người dùng, doanh nghiệp hoặc quy trình. Điểm số được chuẩn hóa trên thang 0.25x → 3.0x, thay vì “ước lượng cảm tính” như trong RICE. Điều này giúp so sánh khách quan hơn giữa các dự án.

Cụ thể:

  • 0.25 (Minimal impact)

    • Tác động rất nhỏ, hầu như chỉ mang tính cải thiện bề mặt.

    • Ví dụ: AI gợi ý icon mới trong giao diện, không ảnh hưởng đến năng suất.

  • 0.5 (Low impact)

    • Cải thiện nhỏ, hữu ích nhưng không thay đổi trải nghiệm cốt lõi.

    • Ví dụ: chatbot hỗ trợ FAQ cho một nhóm nhỏ người dùng nội bộ.

  • 1.0 (Medium impact)

    • Tác động vừa phải, giúp cải thiện đáng kể nhưng không đột phá.

    • Ví dụ: AI gợi ý văn bản trong email, tiết kiệm vài phút mỗi ngày.

  • 2.0 (High impact)

    • Lợi ích rõ rệt, giảm nhiều chi phí hoặc loại bỏ “điểm đau” lớn.

    • Ví dụ: AI tự động phân loại tài liệu pháp lý, giảm 50% thời gian xử lý của luật sư.

  • 3.0 (Massive impact)

    • Tác động mang tính cách mạng, có thể thay đổi toàn bộ quy trình hoặc chi phí.

    • Ví dụ: AI tự động xử lý giao dịch tài chính từ đầu đến cuối mà không cần kiểm duyệt thủ công.

👉 Điểm đặc biệt: trong ARISE, Impact không chỉ là “AI tạo ra tính năng gì” mà phải gắn trực tiếp với kết quả đo lường được (thời gian tiết kiệm, chi phí giảm, năng suất tăng, rủi ro giảm).

 

Intent Multiplier trong ARISE chính là hệ số phản ánh “mức độ chủ động” của AI trong một tính năng hay dự án. Nó giúp phân biệt giữa AI chỉ hỗ trợ con người (reactive) và AI tự động đưa ra hành động (proactive).

1. Reactive (1.0)

  • AI chỉ phản hồi khi có lệnh hoặc yêu cầu từ người dùng.

  • Nó đóng vai trò “trợ lý” chứ không hành động thay con người.

  • Rủi ro thấp hơn vì con người vẫn kiểm soát.

  • Ví dụ:

    • Chatbot gợi ý câu trả lời nhưng nhân viên CSKH bấm “send” mới gửi đi.

    • AI code assistant gợi ý đoạn mã, lập trình viên quyết định có dùng hay không.

2. Proactive (1.2)

  • AI tự động hành động, không chờ người yêu cầu.

  • Có tiềm năng tác động lớn hơn (giảm nhiều nhân lực, thời gian) → do đó nhân hệ số cao hơn (1.2).

  • Nhưng cũng kèm theo rủi ro cao hơn (sai sót, thiên kiến, mất kiểm soát).

  • Ví dụ:

    • AI giám sát hệ thống server và tự khởi động lại dịch vụ khi phát hiện lỗi.

    • AI tài chính tự động thực hiện giao dịch khi thấy cơ hội arbitrage.

Vì sao Intent cần nhân hệ số?

  • Reactive an toàn nhưng hiệu quả thường hạn chế → giữ nguyên (1.0).

  • Proactive tiềm năng tạo giá trị vượt trội nhưng nguy cơ cũng cao → nhân hệ số (1.2) để khuyến khích cân nhắc, không bỏ qua các cơ hội đột phá.


📌 Nói đơn giản:

  • Reactive = 1.0 → AI chỉ “giúp việc” → giá trị vừa phải, ít rủi ro.

  • Proactive = 1.2 → AI “tự làm” → tiềm năng cao, rủi ro cao, cần quản trị tốt.

 

AI Desire trong ARISE là thước đo về mức độ cần thiết hoặc giá trị thực sự của việc dùng AI cho một vấn đề cụ thể. Nó nhằm trả lời câu hỏi:

👉 “Có thực sự cần AI để giải quyết vấn đề này, hay chúng ta đang cố nhồi AI vào cho… thời thượng?”

Nếu nhu cầu AI cao, dự án có giá trị rõ ràng và dễ thuyết phục. Nếu thấp, nghĩa là có thể giải quyết bằng công cụ truyền thống rẻ hơn, nhanh hơn.


Thang điểm (1 → 5)

  • 1 = Rất thấp

    • Vấn đề có thể giải quyết tốt bằng công cụ thường.

    • AI chỉ làm phức tạp thêm, ROI thấp.

    • Ví dụ: làm báo cáo Excel định kỳ → macro hoặc BI tool đủ rồi.

  • 2 = Thấp

    • AI chỉ mang tính “nice to have”, không tạo khác biệt lớn.

    • Ví dụ: AI gợi ý icon hoặc màu sắc trong PowerPoint.

  • 3 = Trung bình

    • AI mang lại giá trị nhất định, nhưng không bắt buộc.

    • Ví dụ: chatbot trả lời FAQ cho khách hàng → tiết kiệm nhân sự, nhưng vẫn có giải pháp khác thay thế.

  • 4 = Cao

    • AI thực sự giải quyết được “điểm đau” lớn, giúp tăng tốc hoặc giảm chi phí đáng kể.

    • Ví dụ: AI hỗ trợ luật sư phân loại tài liệu pháp lý, tiết kiệm 50% thời gian.

  • 5 = Rất cao (bắt buộc)

    • Nếu không có AI thì gần như không thể giải quyết hiệu quả.

    • Ví dụ: AI phân tích triệu chứng y khoa từ ảnh X-quang, AI phát hiện gian lận giao dịch theo thời gian thực.


📌 Điểm đặc biệt: AI Desire buộc đội ngũ phải chứng minh lý do tồn tại của dự án AI, tránh tình trạng “AI vì AI” – nghĩa là đưa AI vào chỉ để… trông hiện đại.

 

AI Capability trong ARISE là thước đo về điều kiện kỹ thuật, dữ liệu và độ chín công nghệ để triển khai thành công một sáng kiến AI. Nó trả lời câu hỏi:

👉 “Chúng ta có đủ dữ liệu, hạ tầng và mô hình để hiện thực hóa ý tưởng này chưa?”

Nếu AI Capability thấp, dù ý tưởng hay đến đâu thì cũng khó thành công.


Thang điểm (1 → 5)

  • 1 = Rất thấp

    • Dữ liệu thiếu, rời rạc hoặc chất lượng kém.

    • Không có hạ tầng AI hoặc đội ngũ chưa đủ kỹ năng.

    • Ví dụ: muốn làm chatbot chăm sóc khách hàng nhưng chưa có kho dữ liệu hội thoại nào.

  • 2 = Thấp

    • Có dữ liệu nhưng chưa đủ khối lượng/độ sạch.

    • Mô hình AI còn ở mức thử nghiệm, nhiều rủi ro.

    • Ví dụ: AI phân tích văn bản pháp lý nhưng dữ liệu chỉ thu thập được 20% tài liệu, nhiều lỗi OCR.

  • 3 = Trung bình

    • Dữ liệu có, nhưng cần nhiều xử lý để dùng được.

    • Có mô hình hoặc API, nhưng cần fine-tuning hoặc tích hợp phức tạp.

    • Ví dụ: AI phân tích ảnh y tế dựa trên bộ dataset công khai, cần tinh chỉnh mới dùng tốt cho bệnh viện.

  • 4 = Cao

    • Dữ liệu đầy đủ, tương đối sạch.

    • Có mô hình đáng tin cậy và hạ tầng sẵn sàng.

    • Ví dụ: AI coding assistant dùng API của vendor lớn (như OpenAI, Anthropic) + dữ liệu code nội bộ.

  • 5 = Rất cao

    • Dữ liệu chuẩn hóa, phong phú, cập nhật liên tục.

    • Hệ thống ML/LLM nội bộ đã trưởng thành, đội ngũ kỹ thuật dày kinh nghiệm.

    • Ví dụ: Google hay Amazon triển khai AI gợi ý tìm kiếm dựa trên kho dữ liệu khổng lồ, pipeline đã vận hành nhiều năm.


📌 Ý nghĩa: AI Capability là “điểm nghẽn thực tế” – nó ngăn không cho những ý tưởng hấp dẫn nhưng thiếu dữ liệu/hạ tầng thành dự án khả thi.


📌 Như vậy, với cùng tầm ảnh hưởng rộng, dự án AI coding assistant (20 điểm) vượt trội hơn nhiều so với hệ thống AI sửa lỗi tự động (1.25 điểm). ARISE giúp tránh bị cuốn theo ý tưởng “nghe hay” nhưng thiếu khả năng triển khai thực tế.

 

Không có file đính kèm.

19

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo