AI agent đang trở thành xu hướng công nghệ mới, khác với chatbot thông thường, chúng có thể hoạt động bên ngoài cửa sổ chat, điều hướng nhiều ứng dụng để thực hiện các tác vụ phức tạp theo lệnh đơn giản từ người dùng.
Các công ty đang liên tục công bố framework và chức năng mới cho AI agent, quảng bá công nghệ này như cách giúp cuộc sống dễ dàng hơn. Ví dụ tiêu biểu bao gồm "computer use" của Claude (Anthropic) và "general AI agent" Manus.
Lợi ích tiềm năng của AI agent rất hấp dẫn: hỗ trợ công việc nặng nhọc, tạo bài thuyết trình, giúp người khuyết tật thực hiện tác vụ trực tuyến, điều phối hỗ trợ đồng thời cho nhiều người trong tình huống khẩn cấp.
Nhóm nghiên cứu tại Hugging Face cảnh báo rằng việc phát triển agent có thể đang đứng trước một sai lầm nghiêm trọng: càng tự chủ, AI càng làm giảm quyền kiểm soát của con người.
AI agent được xây dựng trên nền tảng large language models (LLMs) vốn không thể dự đoán và dễ mắc lỗi. Khi LLM tạo văn bản trong giao diện chat, lỗi chỉ giới hạn trong cuộc trò chuyện, nhưng khi hệ thống có thể hoạt động độc lập với quyền truy cập vào nhiều ứng dụng, nó có thể thực hiện các hành động ngoài ý muốn.
Các hệ thống AI agent có thể được phân loại theo mức độ tự chủ từ thấp đến cao: từ bộ xử lý đơn giản, bộ định tuyến, công cụ gọi, agent đa bước, đến agent hoàn toàn tự chủ có thể viết và thực thi mã mới mà không cần giám sát.
Tiền lệ lịch sử cho thấy tầm quan trọng của việc duy trì giám sát con người. Năm 1980, hệ thống máy tính báo động sai về hơn 2.000 tên lửa Xô Viết đang hướng đến Bắc Mỹ, nhưng thảm họa đã được ngăn chặn nhờ con người kiểm tra chéo giữa các hệ thống cảnh báo khác nhau.
Hugging Face đang phát triển smolagents, một framework cung cấp môi trường an toàn và cho phép nhà phát triển xây dựng agent với tính minh bạch, đảm bảo kiểm soát con người phù hợp.
Phát triển AI agent cần đi kèm với việc đảm bảo giám sát của con người, giới hạn phạm vi hoạt động của AI agent, và tập trung vào phúc lợi con người thay vì chỉ tăng hiệu quả.
📌 Việc phát triển AI agent đang tạo ra cuộc cách mạng công nghệ nhưng cũng mang lại rủi ro lớn. Các chuyên gia từ Hugging Face khuyến nghị duy trì sự giám sát của con người, phát triển hệ thống nguồn mở minh bạch như smolagents, và đảm bảo AI vẫn là công cụ hỗ trợ thay vì người ra quyết định.
https://www.technologyreview.com/2025/03/24/1113647/why-handing-over-total-control-to-ai-agents-would-be-a-huge-mistake/
#MIT
Khi các hệ thống AI có thể kiểm soát nhiều nguồn cùng lúc, tiềm năng gây hại bùng nổ. Chúng ta cần duy trì con người trong vòng kiểm soát.
Tác giả: Margaret Mitchell, Avijit Ghosh, Sasha Luccioni, Giada Pistilli
Ngày 24 tháng 3 năm 2025
Một minh họa ảnh cho thấy một người đàn ông với khuôn mặt kỹ thuật số bị lỗi, đưa tay về phía người xem. Sarah Rogers/MITTR | Photos Getty
AI tác nhân đã tạo ra sự chú ý trong ngành công nghệ. Không giống như chatbot, những hệ thống đột phá mới này hoạt động bên ngoài cửa sổ trò chuyện, điều hướng nhiều ứng dụng để thực hiện các nhiệm vụ phức tạp, như lên lịch họp hoặc mua sắm trực tuyến, để đáp ứng các lệnh đơn giản của người dùng. Khi các tác nhân được phát triển để trở nên có khả năng hơn, một câu hỏi quan trọng xuất hiện: Chúng ta sẵn sàng từ bỏ bao nhiêu quyền kiểm soát, và với giá nào?
Các khuôn khổ và chức năng mới cho AI tác nhân được công bố gần như hàng tuần, và các công ty quảng bá công nghệ này như một cách để làm cho cuộc sống của chúng ta dễ dàng hơn bằng cách hoàn thành các nhiệm vụ mà chúng ta không thể làm hoặc không muốn làm. Các ví dụ nổi bật bao gồm "sử dụng máy tính", một chức năng cho phép hệ thống Claude của Anthropic hành động trực tiếp trên màn hình máy tính của bạn, và "tác nhân AI tổng quát" Manus, có thể sử dụng các công cụ trực tuyến cho nhiều nhiệm vụ khác nhau, như tìm kiếm khách hàng hoặc lập kế hoạch chuyến đi.
Những phát triển này đánh dấu một bước tiến lớn trong trí tuệ nhân tạo: các hệ thống được thiết kế để hoạt động trong thế giới kỹ thuật số mà không cần sự giám sát trực tiếp của con người.
Lời hứa rất hấp dẫn. Ai không muốn được hỗ trợ với công việc nặng nhọc hoặc các nhiệm vụ không có thời gian thực hiện? Sự hỗ trợ của các tác nhân có thể sớm có nhiều hình thức khác nhau, chẳng hạn như nhắc bạn hỏi đồng nghiệp về giải bóng rổ của con họ hoặc tìm hình ảnh cho bài thuyết trình tiếp theo của bạn. Trong vài tuần, chúng có thể sẽ tạo được các bài thuyết trình cho bạn.
Cũng có tiềm năng rõ ràng cho những khác biệt sâu sắc và có ý nghĩa trong cuộc sống của mọi người. Đối với những người có vấn đề về khả năng di chuyển tay hoặc thị lực kém, các tác nhân có thể hoàn thành các nhiệm vụ trực tuyến để đáp ứng các lệnh ngôn ngữ đơn giản. Tác nhân cũng có thể điều phối sự hỗ trợ đồng thời cho các nhóm lớn người trong các tình huống quan trọng, chẳng hạn như điều hướng giao thông để giúp người lái xe thoát khỏi một khu vực hàng loạt càng nhanh càng tốt khi thảm họa xảy ra.
Nhưng tầm nhìn này về AI tác nhân mang lại những rủi ro đáng kể có thể bị bỏ qua trong cuộc chạy đua hướng tới sự tự chủ lớn hơn. Nhóm nghiên cứu của chúng tôi tại Hugging Face đã dành nhiều năm để triển khai và điều tra các hệ thống này, và những phát hiện gần đây của chúng tôi cho thấy việc phát triển tác nhân có thể đang ở bên bờ của một sai lầm rất nghiêm trọng.
Vấn đề cốt lõi này nằm ở trung tâm của điều thú vị nhất về AI tác nhân: Hệ thống AI càng tự chủ, chúng ta càng từ bỏ sự kiểm soát của con người. AI tác nhân được phát triển để linh hoạt, có khả năng hoàn thành một loạt nhiệm vụ đa dạng không cần phải được lập trình trực tiếp.
Đối với nhiều hệ thống, sự linh hoạt này được thực hiện bởi vì chúng được xây dựng trên các mô hình ngôn ngữ lớn, những mô hình không thể dự đoán và dễ mắc phải các lỗi đáng kể (và đôi khi hài hước). Khi một LLM tạo văn bản trong giao diện trò chuyện, bất kỳ lỗi nào cũng chỉ giới hạn trong cuộc trò chuyện đó. Nhưng khi một hệ thống có thể hành động độc lập và với quyền truy cập vào nhiều ứng dụng, nó có thể thực hiện các hành động mà chúng ta không dự định, chẳng hạn như thao tác tệp, mạo danh người dùng, hoặc thực hiện các giao dịch trái phép. Chính tính năng đang được bán—giảm sự giám sát của con người—là lỗ hổng chính.
Để hiểu bức tranh rủi ro-lợi ích tổng thể, hữu ích để đặc trưng các hệ thống AI tác nhân trên một phổ tự chủ. Cấp độ thấp nhất bao gồm các bộ xử lý đơn giản không có tác động đến luồng chương trình, như chatbot chào đón bạn trên trang web của công ty. Cấp độ cao nhất, các tác nhân hoàn toàn tự chủ, có thể viết và thực thi mã mới mà không có ràng buộc hoặc giám sát của con người—chúng có thể thực hiện hành động (di chuyển tệp, thay đổi bản ghi, giao tiếp qua email, v.v.) mà không cần bạn yêu cầu bất cứ điều gì. Các cấp độ trung gian bao gồm bộ định tuyến, quyết định các bước do con người cung cấp để thực hiện; người gọi công cụ, chạy các chức năng do con người viết bằng cách sử dụng các công cụ do tác nhân đề xuất; và các tác nhân đa bước xác định chức năng nào để làm khi nào và như thế nào. Mỗi cấp độ đại diện cho việc loại bỏ dần sự kiểm soát của con người.
Rõ ràng rằng AI tác nhân có thể cực kỳ hữu ích cho những gì chúng ta làm hàng ngày. Nhưng điều này mang lại những lo ngại rõ ràng về quyền riêng tư, an toàn và bảo mật. Các tác nhân giúp cập nhật thông tin về ai đó sẽ đòi hỏi thông tin cá nhân của người đó và theo dõi rộng rãi các tương tác trước đây của bạn, điều này có thể dẫn đến vi phạm quyền riêng tư nghiêm trọng. Các tác nhân tạo hướng dẫn từ bản vẽ tòa nhà có thể được sử dụng bởi những kẻ xấu để tiếp cận các khu vực trái phép.
Và khi các hệ thống có thể kiểm soát nhiều nguồn thông tin cùng lúc, tiềm năng gây hại bùng nổ. Ví dụ, một tác nhân có quyền truy cập vào cả giao tiếp cá nhân và nền tảng công khai có thể chia sẻ thông tin cá nhân trên mạng xã hội. Thông tin đó có thể không đúng sự thật, nhưng nó sẽ thoát khỏi radar của các cơ chế kiểm tra thực tế truyền thống và có thể được khuếch đại với việc chia sẻ thêm để tạo ra thiệt hại danh tiếng nghiêm trọng. Chúng tôi tưởng tượng rằng "Đó không phải là tôi—đó là tác nhân của tôi!!" sẽ sớm trở thành một cụm từ phổ biến để biện minh cho các kết quả xấu.
Tiền lệ lịch sử chứng minh tại sao việc duy trì sự giám sát của con người là quan trọng. Năm 1980, các hệ thống máy tính đã sai lầm chỉ ra rằng hơn 2.000 tên lửa Xô Viết đang hướng về Bắc Mỹ. Lỗi này đã kích hoạt các thủ tục khẩn cấp đưa chúng ta đến gần thảm họa một cách nguy hiểm. Điều đã ngăn chặn thảm họa là sự xác minh chéo của con người giữa các hệ thống cảnh báo khác nhau. Nếu việc ra quyết định được ủy thác hoàn toàn cho các hệ thống tự chủ ưu tiên tốc độ hơn sự chắc chắn, kết quả có thể đã thảm khốc.
Một số người sẽ phản đối rằng lợi ích đáng với rủi ro, nhưng chúng tôi cho rằng việc nhận ra những lợi ích đó không đòi hỏi phải từ bỏ hoàn toàn sự kiểm soát của con người. Thay vào đó, sự phát triển của AI tác nhân phải diễn ra song song với sự phát triển của sự giám sát của con người được đảm bảo theo cách giới hạn phạm vi những gì AI tác nhân có thể làm.
Các hệ thống tác nhân mã nguồn mở là một cách để giải quyết rủi ro, vì những hệ thống này cho phép sự giám sát lớn hơn của con người về những gì hệ thống có thể và không thể làm. Tại Hugging Face, chúng tôi đang phát triển smolagents, một khuôn khổ cung cấp môi trường bảo mật sandbox và cho phép các nhà phát triển xây dựng các tác nhân với tính minh bạch làm cốt lõi để bất kỳ nhóm độc lập nào cũng có thể xác minh liệu có sự kiểm soát thích hợp của con người hay không.
Cách tiếp cận này trái ngược hoàn toàn với xu hướng phổ biến hướng tới các hệ thống AI ngày càng phức tạp, không minh bạch, che giấu quy trình ra quyết định của chúng sau nhiều lớp công nghệ độc quyền, làm cho việc đảm bảo an toàn trở nên không thể.
Khi chúng ta điều hướng sự phát triển của AI tác nhân ngày càng tinh vi, chúng ta phải nhận ra rằng tính năng quan trọng nhất của bất kỳ công nghệ nào không phải là tăng hiệu quả mà là thúc đẩy sự hạnh phúc của con người.
Điều này có nghĩa là tạo ra các hệ thống vẫn là công cụ chứ không phải là người ra quyết định, là trợ lý chứ không phải là sự thay thế. Phán đoán của con người, với tất cả những khiếm khuyết của nó, vẫn là thành phần thiết yếu trong việc đảm bảo rằng các hệ thống này phục vụ chứ không phải làm suy yếu lợi ích của chúng ta.
4 công ty dịch vụ chuyên nghiệp lớn nhất thế giới (Big Four) đang trong cuộc đua phát triển AI, với giai đoạn mới nhất tập trung vào AI tác nhân (agentic AI).
Deloitte và EY cùng ngày công bố nền tảng AI tác nhân mới, cả hai đều được xây dựng với sự hợp tác của Nvidia.
Nền tảng Zora AI của Deloitte cung cấp "nhân viên kỹ thuật số thông minh" có khả năng nhận thức, lý luận và hành động để hoàn thành nhiệm vụ một cách tự động.
Đội tài chính của Deloitte đã sử dụng nền tảng này và công ty dự định cung cấp quyền truy cập cho hàng nghìn nhân viên vào cuối năm nay.
Zora AI hỗ trợ nhân viên trong các nhiệm vụ tài chính như quản lý chi phí, phân tích xu hướng bán hàng và tối ưu hóa vốn lưu động.
EY giới thiệu EY.ai Agentic Platform, ban đầu sẽ được sử dụng bởi 80.000 nhân viên từ bộ phận thuế, với 150 agent thuế hỗ trợ các nhiệm vụ như thu thập dữ liệu và phân tích tài liệu.
Deloitte tuyên bố Zora AI sẽ giảm 25% chi phí của đội tài chính, tăng năng suất 40% và "giải phóng hàng nghìn giờ làm việc mỗi năm".
EY dự kiến lực lượng kết hợp giữa chuyên gia thuế và AI agents sẽ xử lý hơn 3 triệu trường hợp tuân thủ thuế và định nghĩa lại hơn 30 triệu quy trình thuế trong năm tới.
Raj Sharma của EY cho biết AI tác nhân đang "biến đổi căn bản hoạt động kinh doanh" và việc có được những hiểu biết hữu ích từ công nghệ này "sẽ ảnh hưởng đến việc doanh nghiệp thành công hay tụt hậu".
Các công ty Big Four đang phải xem xét lại mô hình kinh doanh của họ, với EY cân nhắc chuyển từ tính phí theo giờ sang mô hình "dịch vụ như phần mềm" dựa trên kết quả.
Jillian Wanner của Deloitte nói rằng ngành tư vấn đang bị "đảo lộn" và nhân viên Deloitte cần phải "đặt tư duy kỹ thuật lên hàng đầu", trở thành "nhà công nghệ và kỹ sư trước, tư vấn viên sau".
KPMG đang tích hợp AI agents vào dịch vụ khách hàng, chất lượng, báo cáo và hiệu quả, coi chúng như "đồng nghiệp kỹ thuật số sáng tạo".
PwC tập trung vào cách AI tác nhân có thể "nâng cao hiệu quả hoạt động, chuyển đổi trải nghiệm khách hàng và thúc đẩy tăng trưởng doanh thu và lợi nhuận".
📌 Big Four đang cách mạng hóa ngành tư vấn với AI tác nhân, Deloitte và EY dẫn đầu. Công nghệ này hứa hẹn giảm 25% chi phí, tăng 40% năng suất và xử lý hơn 3 triệu trường hợp thuế. Mô hình kinh doanh đang chuyển từ tính phí theo giờ sang dựa trên kết quả.
https://www.businessinsider.com/deloitte-ey-launch-agentic-ai-platforms-big-four-competition2025-3
Polly Thompson, 24 tháng 3 năm 2025, 1:43 PM UTC
Big Four đang cạnh tranh để phát triển các giải pháp AI tốt nhất. Deloitte và EY vừa bước vào giai đoạn cạnh tranh tiếp theo — sử dụng AI tác nhân làm việc cùng nhân viên. AI tác nhân có thể định hình lại mô hình kinh doanh của các công ty tư vấn.
Các công ty dịch vụ chuyên nghiệp Big Four đang chạy đua AI riêng của họ. Deloitte, EY, PwC và KPMG đã đầu tư mạnh vào tự động hóa và AI trong nhiều năm, cạnh tranh để xây dựng các giải pháp tốt nhất cho khách hàng và tối ưu hóa hoạt động nội bộ. Sự đổi mới của Big Four, với hàng trăm nghìn nhân viên, thiết lập một ví dụ cho các doanh nghiệp trên toàn thế giới.
Hiện tại, họ đang chuyển sang cái mà các công ty trong ngành công nghệ thường gọi là làn sóng AI thứ ba: AI tác nhân. Nó xoay quanh các hệ thống thông minh, hay "tác nhân", có thể hoàn thành nhiệm vụ hoặc đưa ra quyết định mà không cần sự can thiệp của con người. Trong khi chatbot AI chỉ phản hồi các câu hỏi, AI tác nhân có thể hành động.
Tuần trước, Deloitte và EY đã công bố các nền tảng AI tác nhân mới, cả hai đều được xây dựng với sự hợp tác của Nvidia.
Nền tảng của Deloitte, Zora AI, cung cấp cho khách hàng một lựa chọn các "nhân viên kỹ thuật số thông minh" hoặc tác nhân có thể nhận thức, lý luận và hành động để hoàn thành các nhiệm vụ một cách tự động, Deloitte cho biết trong một thông cáo báo chí.
Nền tảng này sẽ hoạt động như một "lực lượng lao động kỹ thuật số để thay đổi cách thức công việc được thực hiện," Deloitte nói.
Đội ngũ tài chính của Deloitte đã sử dụng nền tảng này, và công ty tư vấn dự định cung cấp quyền truy cập vào Zora AI cho hàng nghìn nhân viên trước cuối năm nay.
Các tác nhân Zora AI sẽ hỗ trợ nhân viên Deloitte với các nhiệm vụ tài chính, như quản lý chi phí và hóa đơn, phân tích xu hướng bán hàng và hiệu suất, và tối ưu hóa các yêu cầu vốn lưu động. Nền tảng sẽ được mở rộng để hỗ trợ các chức năng khác bao gồm mua sắm, bán hàng và tiếp thị, cũng như dịch vụ khách hàng.
Cùng ngày, EY giới thiệu Nền tảng AI Tác nhân EY.ai, một nền tảng AI tác nhân ban đầu sẽ được sử dụng bởi 80.000 nhân viên từ bộ phận thuế của công ty. Họ sẽ có quyền truy cập vào 150 tác nhân thuế để hỗ trợ với các nhiệm vụ như thu thập dữ liệu, phân tích và xem xét tài liệu, và tuân thủ thuế thu nhập và thuế gián thu.
Deloitte và EY đã khẳng định rằng AI tác nhân sẽ vừa hữu ích cho người lao động vừa mang tính biến đổi trong nơi làm việc.
Các câu chuyện liên quan:
Cách các công ty phần mềm đang phát triển AI tác nhân và chuẩn bị nhân viên cho làn sóng AI tạo sinh tiếp theo
Giám đốc điều hành Deloitte nói rằng các nhà tư vấn phải 'đặt tư duy kỹ thuật lên hàng đầu' trong bối cảnh AI gây gián đoạn trong ngành
Jason Girzadas, CEO của Deloitte Hoa Kỳ, cho biết AI Tác nhân đại diện cho sự khởi đầu của "kỷ nguyên doanh nghiệp tự chủ" và sẽ biến đổi mô hình công việc và kinh doanh.
Công ty cho biết Zora AI sẽ giảm chi phí của đội ngũ tài chính xuống 25%, tăng năng suất lên 40%, và "giải phóng hàng nghìn giờ nỗ lực mỗi năm."
Raj Sharma, đối tác quản lý toàn cầu về tăng trưởng và đổi mới của EY, cũng ca ngợi tiềm năng của AI tác nhân trong một thông cáo báo chí, nói rằng nó "đang biến đổi cơ bản hoạt động kinh doanh."
Việc có được những hiểu biết có thể hành động được cung cấp bởi loại công nghệ này "sẽ ảnh hưởng đến việc các doanh nghiệp thành công hay tụt hậu," Sharma nói.
Lực lượng lao động kết hợp này giữa các chuyên gia thuế và tác nhân AI sẽ nhắm tới việc vượt qua 3 triệu trường hợp tuân thủ thuế và định nghĩa lại hơn 30 triệu quy trình thuế trong năm tới.
EY nói với BI rằng các bài kiểm tra trước đó với mô hình thuế của EY đã chứng minh chất lượng câu trả lời được cải thiện, đạt độ chính xác 86% so với mô hình chung.
Trước khi đạt được tiềm năng biến đổi lớn mà các nhà ủng hộ hứa hẹn AI tác nhân sẽ mang lại, các công ty Big Four và các doanh nghiệp khác trước tiên phải tìm ra cách quản lý tầng lớp nhân viên kỹ thuật số mới và cách tốt nhất để tích hợp các giải pháp mới vào mô hình kinh doanh của họ.
Tại Diễn đàn Kinh tế Thế giới vào tháng 1, Sharma của EY nói với BI rằng sức mạnh của AI tác nhân đang buộc công ty phải xem xét lại mô hình thương mại của mình.
Thay vì tính phí khách hàng dựa trên giờ và tài nguyên mà EY có thể chi cho một dự án, Sharma nói rằng AI tác nhân có thể yêu cầu một cách tiếp cận "dịch vụ dưới dạng phần mềm" trong đó khách hàng trả tiền dựa trên kết quả.
Deloitte không trả lời các câu hỏi của BI về cách thức các tác nhân sẽ ảnh hưởng đến lực lượng lao động của họ. Trong một cuộc thảo luận vào thứ Tư tại hội nghị GTC của Nvidia về việc trao quyền cho lực lượng lao động liên bang với AI, Jillian Wanner, hiệu trưởng của Deloitte, cho biết ngành tư vấn nói chung đang bị "gián đoạn" trong bối cảnh các chuyển đổi AI.
"Tại Deloitte, không còn chấp nhận được việc không đặt tư duy kỹ thuật lên hàng đầu," Wanner, người giúp lãnh đạo phát triển nhân viên AI tại Deloitte, nói. Khi ngành công nghiệp thay đổi, nhân viên Deloitte cần hành động như "các nhà công nghệ và kỹ sư trước tiên," và "các nhà tư vấn sau."
David Rowlands, giám đốc toàn cầu về AI của KPMG, nói với BI rằng công ty đang đan xen AI tác nhân vào cách họ cung cấp dịch vụ cho khách hàng, sử dụng chúng như "những đồng nghiệp kỹ thuật số đổi mới làm việc chặt chẽ với những người tài năng của chúng tôi trong Kiểm toán, Thuế và Tư vấn."
Một người đàn ông mặc bộ đồ hải quân, mỉm cười, ngồi trong phòng có ghế sofa và bàn. David Rowlands là giám đốc toàn cầu về AI của KPMG. KPMG
Rowlands cho biết KPMG đang làm việc với các đối tác công nghệ của mình để tạo ra các giải pháp tác nhân xung quanh dịch vụ khách hàng, chất lượng, hiểu biết sâu sắc, báo cáo, đảm bảo và hiệu quả.
"Sớm thôi, chúng tôi sẽ làm việc song song với một lực lượng lao động tác nhân được đào tạo tốt, nhanh nhẹn, đầy trí tuệ — cả IQ và EQ — một lực lượng bỏ qua các rào cản, biên giới, chính trị và không bao giờ ngủ," người phát ngôn của KPMG nói thêm.
PwC cũng đang làm việc để xác định cách AI tác nhân phù hợp với hoạt động của công ty. Umang Paw, giám đốc công nghệ của PwC UK, nói với BI rằng trọng tâm là cách nó có thể "tăng cường hiệu quả hoạt động, chuyển đổi trải nghiệm khách hàng, và thúc đẩy tăng trưởng doanh thu và lợi nhuận."
Paw nói thêm rằng PwC tư vấn cho khách hàng về "tác động biến đổi" của AI tác nhân đối với lực lượng lao động của họ và nói rằng "sự tin cậy, AI có trách nhiệm và các biện pháp kiểm soát liên quan được tích hợp ngay từ đầu."
Nội bộ, công ty đã xây dựng và triển khai các tác nhân "để thu thập, điều tra và làm sạch dữ liệu" và có một "khuôn khổ tác nhân để giao tiếp với khách hàng theo những cách phức tạp," Bivek Sharma, giám đốc AI của PwC cho biết.
Deloitte vừa giới thiệu nền tảng Zora AI, cung cấp bộ AI agent sẵn sàng triển khai để thực hiện các chức năng kinh doanh.
Danh mục Zora AI by Deloitte hiện bao gồm các agent chức năng cho tài chính và sẽ được mở rộng để bao gồm các lĩnh vực khác như nhân sự, chuỗi cung ứng, mua sắm, bán hàng, tiếp thị và dịch vụ khách hàng.
CEO Deloitte Hoa Kỳ Jason Girzadas nhấn mạnh chúng ta đang bước vào kỷ nguyên doanh nghiệp tự động, nơi các agent có thể chuyển đổi công việc và mô hình kinh doanh.
Zora AI for Finance được xây dựng trên nền tảng Nvidia AI, tích hợp với các nền tảng phần mềm doanh nghiệp lớn, giải quyết quản lý chi phí và hóa đơn, xu hướng bán hàng và hiệu suất, tối ưu hóa vốn lưu động.
Deloitte đang sử dụng Zora AI for Finance nội bộ cho quy trình quản lý chi phí và đã phát hiện ra rằng nó giảm chi phí 25% và tăng năng suất 40%.
CEO Nvidia Jensen Huang cho biết làn sóng tiến bộ AI hiện tại bắt đầu với AI tạo sinh đang chuyển sang AI agent, sẽ thúc đẩy việc sử dụng AI trong kinh doanh.
Waymo One, dịch vụ xe tự lái thuộc Alphabet, đã hợp tác với Uber để đưa xe tự lái đến công chúng tại Phoenix và gần đây đã bắt đầu triển khai tại Austin, với Atlanta sẽ là điểm đến tiếp theo.
Để gọi xe tự lái, người dùng phải kích hoạt xe tự lái trong ứng dụng Uber. Waymo có sẵn trên UberX, Uber Green, Uber Comfort hoặc Uber Comfort Electric với chi phí tương tự như chuyến đi Uber thông thường, ngoại trừ không cần tiền boa.
Waymo có thể di chuyển trong bán kính 37 dặm quanh trung tâm Austin như một phương tiện hoàn toàn tự động - không có tài xế hoặc người quản lý đội xe hỗ trợ từ xa.
Waymo "nhìn" thông qua cảm biến LiDAR trên nóc xe, liên tục quay và sử dụng ánh sáng laser để tạo bản đồ 3D của môi trường xung quanh, đồng thời sử dụng camera và cảm biến radar để hỗ trợ điều hướng và phát hiện vật thể.
Waymo là công ty xe tự lái tiên tiến nhất cung cấp dịch vụ cho công chúng, hoạt động ở Cấp độ 4, nơi xe có thể tự lái nhưng bị giới hạn trong một khu vực.
Tesla, mặc dù cung cấp tính năng tự lái hoàn toàn (FSD) cho khách hàng, chỉ hoạt động ở mức tự động Cấp độ 2 - nghĩa là xe sẽ hỗ trợ người lái với việc tăng tốc, phanh và lái nhưng người lái vẫn phải tham gia.
📌 Deloitte ra mắt Zora AI giúp giảm 25% chi phí và tăng 40% năng suất trong quản lý tài chính, trong khi Waymo triển khai dịch vụ xe tự lái cấp độ 4 tại Austin thông qua Uber, mở ra kỷ nguyên mới cho giao thông đô thị và tự động hóa doanh nghiệp.
https://www.pymnts.com/artificial-intelligence-2/2025/deloitte-begins-rollout-of-ai-agents-for-finance-and-other-business-functions/
Oracle vừa công bố tính năng mới cho phép doanh nghiệp tạo AI agent riêng mà không cần viết mã.
Tính năng này có sẵn trên Fusion Cloud Applications Suite của Oracle, giúp doanh nghiệp quản lý tài chính, nhân sự, chuỗi cung ứng và nhiều lĩnh vực khác.
AI agent là các AI chuyên biệt và hoàn toàn tự chủ, có thể hỗ trợ doanh nghiệp trong các quy trình làm việc cụ thể.
Oracle đã giới thiệu hơn 50 AI agent năm ngoái, có khả năng từ trả lời câu hỏi của nhân viên về phúc lợi đến lên lịch ca làm việc.
Với công bố mới, khách hàng có thể truy cập AI Agent Studio để tạo, thử nghiệm, tùy chỉnh và triển khai AI agent riêng.
Để tạo AI agent, người dùng chỉ cần mô tả rõ mục tiêu và các công cụ có sẵn, không cần kiến thức lập trình.
AI agent có thể sử dụng các ứng dụng trong Fusion và bên ngoài như Microsoft Teams hoặc Slack để hoàn thành nhiệm vụ.
Các công ty công nghệ lớn như Meta, Microsoft đều đang phát triển công nghệ AI agent.
CEO Salesforce Marc Benioff cho rằng chúng ta đang bước vào "Kỷ nguyên AI tự chủ" với các AI worker tự động.
Miranda Nash của Oracle cho rằng AI agent là tương lai của AI tiên tiến, nhưng cần giữ phạm vi hẹp để tránh nhầm lẫn.
Trong tương lai, Oracle sẽ kết hợp các AI agent chuyên biệt để thực hiện các tác vụ phức tạp hơn.
📌 Oracle ra mắt công cụ tạo AI agent không cần lập trình trên nền tảng Fusion Cloud, mở ra khả năng tự động hóa quy trình cho doanh nghiệp. Với hơn 50 AI agent có sẵn và khả năng tạo mới dễ dàng, Oracle đang dẫn đầu xu hướng AI tự chủ trong doanh nghiệp.
https://qz.com/oracles-is-now-letting-businesses-create-their-own-ai-a-1851771226
Zapier AI là công cụ đa nền tảng mạnh mẽ giúp tự động hóa các tác vụ lặp lại hàng ngày, được thành lập từ năm 2011 và đã trở thành một trong những ứng dụng làm việc từ xa được yêu thích nhất.
Với việc tích hợp AI vào năm 2023, người dùng có thể tạo ra các quy trình tự động hóa phức tạp bằng ngôn ngữ tự nhiên thông qua Copilot - trợ lý quy trình làm việc được hỗ trợ bởi AI, không cần kiến thức lập trình chuyên sâu.
Zapier AI tích hợp với hơn 7.000 ứng dụng web, cho phép tạo các tự động hóa đơn giản hoặc đa bước phức tạp. Ví dụ: tạo Zap tự động soạn thảo phản hồi email Gmail bằng ChatGPT hoặc xây dựng quy trình lấy dữ liệu từ Google Forms, tạo liên hệ trong Hubspot và gửi thông báo qua Slack.
Công cụ này còn cho phép điền thông tin vào bảng bằng lệnh ngôn ngữ tự nhiên thay vì công thức phức tạp, phân tích và tóm tắt dữ liệu từ bảng tính, tài liệu hoặc tin nhắn.
Zapier AI có khả năng tạo chatbot tùy chỉnh cho nhóm hoặc khách hàng, được xây dựng trên mô hình GPT-4o mini của OpenAI và có thể được đào tạo trên các nguồn kiến thức liên quan đến doanh nghiệp như trang web, tệp và bảng.
Zapier Agents hoạt động như đồng nghiệp tùy chỉnh thực hiện các tác vụ cụ thể và học hỏi về doanh nghiệp trong quá trình làm việc.
Mặc dù hiệu quả trong việc tạo tự động hóa, Zapier AI không thể đưa ra quyết định phức tạp thay bạn và không phải là sự thay thế cho phán đoán của con người.
Zapier cung cấp nhiều gói dịch vụ: gói Miễn phí với Zap không giới hạn và quyền truy cập vào trình tạo Zap hỗ trợ AI; gói Professional dành cho cá nhân với giá 29,99 USD/tháng; gói Team cho doanh nghiệp với giá 103,50 USD/tháng.
Các tính năng bổ sung như chatbot có sẵn dưới dạng tiện ích bổ sung với gói Miễn phí để thử nghiệm, gói Pro cho cá nhân (20 USD/tháng) và gói Advanced cho nhóm (100 USD/tháng).
Zapier AI là dịch vụ dựa trên đám mây có sẵn qua giao diện web, không có ứng dụng dành riêng cho máy tính để bàn hoặc di động, đây là điểm hạn chế duy nhất đáng chú ý.
📌 Zapier AI là công cụ tự động hóa mạnh mẽ kết nối 7.000+ ứng dụng, cho phép tạo quy trình không cần code và chatbot thông minh dựa trên GPT-4o mini. Với gói miễn phí hào phóng và giao diện đơn giản, đây là giải pháp lý tưởng để tăng hiệu quả công việc.
https://www.techradar.com/computing/artificial-intelligence/what-is-zapier-ai-everything-you-need-to-know-about-the-ai-automation-tool
Agent AI là thế hệ tiếp theo của AI, có khả năng hành động độc lập, cộng tác để đạt được mục tiêu lớn hơn và tiếp quản toàn bộ quy trình kinh doanh.
Microsoft thông báo có 100.000 tổ chức đang sử dụng Copilot Studio, gấp đôi chỉ sau vài tháng, bao gồm Standard Bank, Thomson Reuters, Virgin Money và Zurich Insurance.
Theo báo cáo của Accenture đầu tháng 1, agent AI sẽ thay thế con người trở thành người dùng chính của hầu hết hệ thống doanh nghiệp vào năm 2030.
Khảo sát của KPMG với 100 giám đốc điều hành cho thấy 12% công ty đang triển khai agent AI, 37% đang trong giai đoạn thử nghiệm, và 51% đang khám phá việc sử dụng.
Trường hợp sử dụng #1 - Phát triển phần mềm và CNTT: Agent AI có thể quản lý mã, sửa lỗi và hiện đại hóa mã cũ. Cognition đã phát hành Devin, kỹ sư phần mềm AI đầu tiên trên thế giới, với khả năng vượt qua mốc 14% trên bài kiểm tra SWE-bench.
Trường hợp sử dụng #2 - Tự động hóa và năng suất: 60% người được hỏi trong khảo sát KPMG cho biết nhiệm vụ hành chính là trường hợp sử dụng chính. Công ty luật Avantia đã sử dụng agent AI để xử lý hợp đồng nhanh hơn, dự kiến cải thiện biên lợi nhuận lên tới 45% vào giữa năm 2025.
Trường hợp sử dụng #3 - Dịch vụ khách hàng: Tại Dun & Bradstreet, agent AI giúp khách hàng tương tác với dữ liệu của 500 triệu doanh nghiệp trên toàn thế giới, đảm bảo thông tin chính xác và liên quan.
Trường hợp sử dụng #4 - Tạo nội dung: Theo khảo sát Langbase, tạo văn bản và tóm tắt là trường hợp sử dụng phổ biến thứ hai với 59% người trả lời. EY sử dụng agent AI trong dịch vụ quản lý rủi ro bên thứ ba, giảm thời gian từ 50 giờ xuống còn vài phút để tạo báo cáo chi tiết.
Trường hợp sử dụng #5 - Nhân sự và hỗ trợ nhân viên: Khảo sát của IBM cho thấy 43% công ty sử dụng agent AI cho HR. Indicium, công ty dịch vụ dữ liệu toàn cầu, triển khai agent AI từ giữa năm 2024 để hỗ trợ HR trong việc truy xuất kiến thức nội bộ, gắn thẻ và lập tài liệu.
Các nhà phát triển đang tập trung vào an toàn với 55% người trả lời trong khảo sát LangChain cho biết công cụ theo dõi và quan sát là biện pháp kiểm soát bắt buộc, 44% đã thiết lập rào cản bảo vệ, và 40% sử dụng đánh giá ngoại tuyến.
Quản lý thay đổi là quá trình quan trọng khi triển khai agent AI để giảm thiểu rủi ro gây ra bởi tự động hóa quy mô lớn.
📌 Agent AI đang nhanh chóng thâm nhập doanh nghiệp với 12% công ty đã triển khai và 37% đang thí điểm. Accenture dự đoán đến năm 2030, agent AI sẽ thay thế con người là người dùng chính của hệ thống doanh nghiệp, tạo tiềm năng cải thiện hiệu quả lên đến 45%.
https://www.cio.com/article/3843379/5-top-business-use-cases-for-ai-agents.html?amp=1
AI agent đang thay đổi thế giới kinh doanh, nhiều doanh nhân nghe đến thuật ngữ này nhưng không hiểu ý nghĩa hoặc cách áp dụng. Những người áp dụng sớm sẽ vượt lên trước.
AI agent không phải là xu hướng thoáng qua mà đang thay đổi cách doanh nghiệp vận hành. Hầu hết lãnh đạo doanh nghiệp lãng phí thời gian vào các nhiệm vụ nên tự động hóa, nhưng AI agent có thể xử lý những nhiệm vụ đó.
Trí tuệ nhân tạo tự nó chỉ là trí thông minh thô. Nó là động cơ nhưng không phải là chiếc xe. Nhiều người nghĩ AI đồng nghĩa với ChatGPT, nhưng điều đó hạn chế. Sự thay đổi thật sự xảy ra khi AI được ghép nối với các nhiệm vụ cụ thể - đó chính là AI agent.
AI agent làm việc 24/7, không nghỉ ngơi, không mắc lỗi ngớ ngẩn. Trong khi người khác vẫn đang mày mò với các lệnh prompt cơ bản, doanh nhân thông minh đã xây dựng AI agent để xử lý toàn bộ quy trình trong doanh nghiệp.
AI agent hoạt động như một trợ lý cá nhân cực kỳ hiệu quả. Trong khi AI cơ bản trả lời câu hỏi, AI agent thực hiện hành động. Nó không chỉ nói cách đặt lịch hẹn - nó đặt lịch cho bạn. Nó không chỉ soạn email - nó gửi chúng đi.
Mọi AI agent đều tuân theo mô hình ba bước: hiểu, suy nghĩ và hành động. Đầu tiên, chúng tiếp nhận yêu cầu. Thứ hai, xử lý và tìm cách tiếp cận tốt nhất. Thứ ba, thực hiện hành động để hoàn thành công việc.
AI agent học hỏi trong quá trình làm việc. Càng làm việc với AI agent, nó càng trở nên tốt hơn. Nó học hỏi sở thích, dự đoán nhu cầu và thích ứng với phong cách của bạn.
AI agent không tồn tại độc lập. Chúng kết nối với các công cụ bạn đang sử dụng như lịch, email, CRM, mạng xã hội. Điều này cho phép chúng phối hợp trong toàn bộ hệ sinh thái kinh doanh của bạn.
Bạn có thể bắt đầu nhỏ với AI agent. Hãy để một agent quản lý lịch và nhắc nhở khách hàng, một agent khác quản lý bài đăng mạng xã hội, một agent thứ ba phân tích cuộc trò chuyện với khách hàng để tìm ra mẫu hình và thông tin chi tiết.
📌 AI agent đang tạo ra cuộc cách mạng trong kinh doanh với khả năng làm việc 24/7, không mắc lỗi và học hỏi liên tục. Doanh nghiệp áp dụng sớm công nghệ này sẽ có lợi thế cạnh tranh lớn, tự động hóa các quy trình và tập trung vào các quyết định chiến lược quan trọng hơn.
https://www.forbes.com/sites/jodiecook/2025/03/18/ai-agents-explained-in-simple-terms-anyone-can-understand/
AI Agents: Giải thích đơn giản để ai cũng hiểu
Jodie Cook – 18 tháng 3, 2025, 09:00 AM EDT
AI agents đang dần chiếm lĩnh thế giới kinh doanh của bạn. Ngày càng có nhiều doanh nhân nghe thấy thuật ngữ này nhưng không biết nó có nghĩa là gì hay nó áp dụng như thế nào trong thực tế. Nó vừa phức tạp, vừa mang tính kỹ thuật, và lại thay đổi nhanh chóng. Nếu tụt lại phía sau, những người mới tham gia sẽ giành được cơ hội kinh doanh mà bạn có thể đã nắm bắt được.
AI agents không phải là một xu hướng nhất thời. Chúng đang thay đổi cách các doanh nghiệp vận hành. Hầu hết các nhà lãnh đạo doanh nghiệp đang lãng phí thời gian vào những công việc nên được tự động hóa, nhưng AI agents có thể xử lý những công việc đó, cho phép bạn tập trung vào các quyết định thúc đẩy sứ mệnh kinh doanh. Những người áp dụng AI agents sớm sẽ vươn lên dẫn đầu.
Dưới đây là AI agents là gì, vì sao chúng quan trọng đối với bạn và chúng sẽ thay đổi doanh nghiệp của bạn mãi mãi như thế nào.
AI tự thân nó chỉ là trí tuệ thô. Nó là động cơ chứ không phải là chiếc xe. Hầu hết mọi người đều cho rằng AI chỉ là ChatGPT, nhưng đó là cách hiểu hạn chế. Yếu tố thay đổi cuộc chơi thực sự là khi AI được ghép nối với các nhiệm vụ cụ thể. Đó chính là AI agents.
AI agents đại diện cho một sự thay đổi cơ bản trong cách các doanh nghiệp vận hành. Các agent làm việc 24/7. Chúng không nghỉ phép. Chúng không phạm sai lầm ngớ ngẩn. Khi mọi người vẫn đang loay hoay với các câu lệnh cơ bản, những doanh nhân thông minh đã xây dựng AI agents để xử lý toàn bộ quy trình trong doanh nghiệp của họ.
Hãy nghĩ về một AI agent như là trợ lý cá nhân hiệu quả nhất thế giới. AI cơ bản chỉ trả lời câu hỏi, còn AI agent thì thực hiện hành động. Nó không chỉ nói cho bạn cách đặt lịch hẹn — nó sẽ đặt lịch cho bạn. Nó không chỉ soạn thảo email — nó sẽ gửi email. Nó không chỉ nhớ sở thích của khách hàng — nó sử dụng chúng để cá nhân hóa các tương tác mà bạn không cần phải làm gì cả.
Hiện nay, có các công cụ cho phép bạn giải thích quy trình, tích hợp với phần mềm bạn đang sử dụng, và nhấn "bắt đầu." Doanh nghiệp của bạn vận hành nhờ các tác vụ. AI agents sẽ thực hiện các tác vụ đó. Đây là sức mạnh bạn không thể bỏ qua.
Mỗi AI agent đều tuân theo cùng một mô hình 3 bước: hiểu, suy nghĩ và hành động.
Khi bạn tạo một quy trình tự động, agent sẽ hiểu yêu cầu. Nó luôn sẵn sàng suy nghĩ và hành động, cung cấp kết quả cho bạn 24/7.
Mô hình 3 bước này biến AI từ trạng thái bị động sang trạng thái chủ động. Đây là sự khác biệt giữa một nhân viên cần được giám sát liên tục và một nhân viên có thể tự xử lý công việc.
Càng làm việc với AI agent, nó càng trở nên tốt hơn. Cũng giống như một thành viên mới trong nhóm, nó cải thiện theo kinh nghiệm. Nó học được sở thích của bạn, dự đoán nhu cầu của bạn và điều chỉnh theo phong cách của bạn. Qua thời gian, AI agent của bạn sẽ trở thành một công cụ độc nhất, phù hợp với nhu cầu của bạn.
Điều này có nghĩa là các doanh nhân bắt đầu sử dụng AI agents ngay bây giờ sẽ có lợi thế lớn so với những người chờ đợi. AI của bạn sẽ phát triển cùng bạn, trở nên ngày càng giá trị theo từng tháng.
AI agents không tồn tại độc lập. Chúng tích hợp với các công cụ bạn đã sử dụng, như lịch, email, CRM, mạng xã hội và nhiều công cụ khác. Điều này có nghĩa là chúng có thể phối hợp trên toàn bộ hệ sinh thái kinh doanh của bạn.
Thay vì nhảy qua lại giữa các ứng dụng và tự chuyển dữ liệu theo cách thủ công, AI agent của bạn sẽ xử lý mọi kết nối. Kết quả? Doanh nghiệp của bạn vận hành như một hệ thống liền mạch thay vì các mảnh ghép rời rạc.
Bạn có thể bắt đầu nhỏ với AI agents.
Những doanh nghiệp sẽ phát triển mạnh mẽ trong thập kỷ tới sẽ không phải là những doanh nghiệp có lượng người theo dõi lớn nhất hay trang web bắt mắt nhất. Chúng sẽ là những doanh nghiệp xây dựng được một hệ thống AI agents để khuếch đại sức ảnh hưởng của mình trong khi vẫn duy trì cách tiếp cận độc đáo.
Hãy chọn một lĩnh vực trong doanh nghiệp của bạn đang tốn quá nhiều thời gian. Tìm một AI agent có thể xử lý công việc cụ thể đó. Để nó tự vận hành trong khi bạn tập trung vào phát triển doanh nghiệp và phục vụ khách hàng của mình.
AI Agents Explained In Simple Terms Anyone Can Understand
ByJodie Cook, Senior Contributor. Jodie Cook covers ChatGPT prompts & AI for coaches and entrepreneurs.
Follow Author
Mar 18, 2025, 09:00am EDT
AI agents are taking over your business world. More and more entrepreneurs hear the term but don't know what it means or how it applies to them. It's confusing, technical, and moves fast. Fall behind and new entrants win business you could have claimed.
AI agents are not a passing trend. They are changing how businesses operate. Most business leaders waste time on tasks that should be automated, but AI agents handle those tasks so you can focus on decisions that move your mission forward. The ones who adopt AI agents early will pull ahead.
Here's what AI agents are, why they matter to you, and how they'll change your business forever.
Why AI agents matter to you right now
AI by itself is just raw intelligence. It's the engine but not the car. Most people get stuck thinking AI equals ChatGPT, but that's limiting. The real game-changer is when AI gets paired with specific tasks. That's what AI agents are.
PROMOTED
AI agents represent a fundamental shift in how business works. Agents work 24/7. They don’t take time off. They don’t make silly mistakes. While everyone else is figuring out basic prompts, smart entrepreneurs are building AI agents to handle entire processes in their business.
Understanding AI agents (without the tech jargon)
They work like your dream assistant
Think of an AI agent as the world's most efficient personal assistant. While basic AI answers questions, an AI agent takes action. It doesn't just tell you how to book appointments - it books them for you. It doesn't just draft emails - it sends them. It doesn't just remember your client preferences - it uses them to personalize interactions without you lifting a finger.
There are tools out there that let you explain your process, plug in the software you already use, and press play. Your business runs on tasks. AI agents do those tasks. That's power you can't ignore.
Forbes Daily: Join over 1 million Forbes Daily subscribers and get our best stories, exclusive reporting and essential analysis of the day’s news in your inbox every weekday.
Email address
Sign Up
By signing up, you agree to our Terms of Service, and you acknowledge our Privacy Statement. Forbes is protected by reCAPTCHA, and the Google Privacy Policy and Terms of Service apply.
They follow a simple pattern
Every AI agent follows the same three-step pattern: understand, think, and act. First, they take in what you're asking. Second, they process the request and figure out the best approach. Third, they take action to get the job done. When you create an automation, the agent understands the ask. It’s constantly ready to think and act, giving you the output 24/7.
This three-step pattern turns AI from passive to active. It's the difference between an employee who needs constant supervision and one who can run with the ball.
They learn as they go
The more you work with an AI agent, the better it gets. Just like a new team member, it improves with experience. It learns your preferences, anticipates your needs, and adapts to your style. Over time, your agent becomes uniquely yours.
This means the entrepreneurs who start using AI agents now will have a massive edge over those who wait. Your AI grows with you, becoming more valuable month after month.
They connect to your existing tools
AI agents don't exist in isolation. They plug into the tools you already use. Your calendar, email, CRM, social media, and more. This means they can coordinate across your entire business ecosystem.
Instead of jumping between apps and manually transferring information, your agent handles the connections. The result? Your business runs as one seamless operation instead of disconnected pieces.
How to use AI agents in your business
You can start small with AI agents. Have one handle your calendar scheduling and client reminders. Let another one manage your social media posts. Use a third to analyze customer conversations for patterns and insights.
The businesses that thrive in the next decade won't be the ones with the biggest following or the fanciest website. They'll be the ones who built an army of AI agents to multiply their impact while maintaining their unique approach.
Pick one area of your business that takes too much time. Find an AI agent that handles that specific task. Let it run while you focus on growing your business and serving your customers.
Adobe vừa ra mắt công cụ Adobe Experience Agent Orchestrator cho phép điều phối các agent AI trong nền tảng Adobe Experience, đánh dấu bước tiến quan trọng để cạnh tranh với Salesforce trong lĩnh vực quản lý trải nghiệm khách hàng.
Mặc dù nổi tiếng với các công cụ sáng tạo như Photoshop, Adobe còn là đối thủ của Salesforce trong ngành quản lý quan hệ khách hàng (CRM) với nền tảng Adobe Experience - cổng tập trung lưu trữ dữ liệu khách hàng và cung cấp công cụ tạo trải nghiệm cá nhân hóa.
Công ty đã giới thiệu 10 "Experience Agent" có thể triển khai nhanh chóng trong vài phút, bao gồm: agent đánh giá tài khoản để phát triển khách hàng tiềm năng, agent phân tích đối tượng để tối ưu hóa phân khúc khách hàng giá trị cao, agent phân tích dữ liệu để phát hiện xu hướng, agent kỹ thuật dữ liệu để xử lý thông tin khách hàng.
Các agent khác bao gồm: agent thử nghiệm giúp mô phỏng sáng kiến marketing, agent hành trình hỗ trợ trải nghiệm đa kênh, agent sản xuất nội dung tạo tài liệu marketing, agent tối ưu hóa website, agent tối ưu hóa quy trình làm việc, và agent tư vấn sản phẩm đề xuất sản phẩm dựa trên sở thích khách hàng.
Adobe cũng ra mắt Brand Concierge - agent AI đầu tiên tương tác với người tiêu dùng thay mặt thương hiệu trên nhiều kênh, tạo trải nghiệm cá nhân hóa và hỗ trợ khách hàng từ khâu tìm hiểu đến mua hàng.
Liz Miller từ Constellation Research nhận xét Adobe đang tập trung hơn vào việc sử dụng công nghệ để thúc đẩy kết quả kinh doanh, đặc biệt ấn tượng với agent Site Optimizer có khả năng phân tích dữ liệu lưu lượng thời gian thực để dự đoán, chẩn đoán vấn đề và đề xuất các giải pháp khắc phục.
Adobe không chỉ phát triển agent riêng mà còn công bố Hệ sinh thái Đối tác Agent AI, cho phép khách hàng sử dụng agent của bên thứ ba thông qua Agent Orchestrator, với các đối tác khởi động bao gồm Acxiom, AWS, IBM, Microsoft, RainFocus, SAP và Workday.
Brand Concierge không chỉ giúp người tiêu dùng mà còn hỗ trợ đội ngũ bán hàng B2B bằng cách cung cấp nội dung tùy chỉnh dựa trên mối quan hệ tài khoản hiện có và xử lý các tác vụ như đặt lịch họp theo dõi.
Adobe Experience Platform Agent Orchestrator hoạt động như cổng quản lý nhiều agent AI khai thác thông tin từ nền tảng dữ liệu khách hàng, nâng cao khả năng suy luận nhờ cơ sở kiến thức định hướng dịch vụ khách hàng.
Với việc triển khai các agent AI, Adobe khẳng định các trải nghiệm khách hàng ngày càng năng động và cá nhân hóa, đòi hỏi công nghệ tự động hóa để đội ngũ marketing có thể theo kịp nhu cầu thị trường.
📌 Adobe triển khai Adobe Experience Agent Orchestrator cùng 10 agent AI chuyên biệt nhằm tự động hóa marketing và bán hàng, cạnh tranh trực tiếp với Salesforce. Brand Concierge - agent tương tác với khách hàng đa kênh và hệ sinh thái đối tác với AWS, Microsoft, IBM đánh dấu bước tiến quan trọng trong quản lý trải nghiệm khách hàng.
https://siliconangle.com/2025/03/18/689809/
Thế hệ robot tiếp theo sắp ra mắt với khả năng kết hợp công nghệ tiên tiến và trí tuệ nhân tạo, biến chúng thành sinh vật thông minh có thể chia sẻ thế giới với con người.
Robot hình người có khả năng đi, chạy, nhảy và thực hiện các nhiệm vụ như con người nhưng không bị mệt mỏi hay chán nản, được thiết kế để hòa nhập vào môi trường của con người.
Thị trường robot hình người được Elon Musk ước tính trị giá 10 nghìn tỷ USD, thậm chí có thể lên tới 25 nghìn tỷ USD theo một báo cáo khác.
Các gã khổng lồ công nghệ đều tham gia vào cuộc đua: Tesla với "Optimus", Amazon và Microsoft hậu thuẫn Figure AI với "Figure02", Google với "Apollo", và Meta đang đầu tư hàng tỷ đô vào lĩnh vực này.
Công ty Israel Mentee Robotics do Giáo sư Amnon Shashua sáng lập đang phát triển MenteeBot 3.0, cao 1m75, nặng 70kg, có khả năng nhìn 360 độ với 5 camera và sức nâng lên tới 25kg.
Điểm mạnh của MenteeBot là "bộ não" - bộ xử lý AI kép Jetson Orin AGX của Nvidia giúp robot hiểu lệnh nói, học môi trường, di chuyển tự động và bắt chước hành động con người.
Giá dự kiến của MenteeBot từ 20.000-30.000 USD, rẻ hơn nhiều so với các đối thủ có giá trên 100.000 USD, tuy nhiên sẽ được bán dưới dạng thuê bao bao gồm bảo trì và cập nhật phần mềm.
Theo nghiên cứu của Goldman Sachs, hiện có 700.000 việc làm chưa được lấp đầy ở Mỹ, với dự báo thiếu hụt 2 triệu lao động toàn cầu vào năm 2030.
Robot mới sẽ được cho thuê với giá dưới 10 USD/giờ và có thể làm việc 24/7, tổng cộng hơn 700 giờ làm việc một tháng so với 180 giờ của người lao động.
Cạnh tranh chính giữa các công ty sẽ tập trung vào "trí thông minh" của robot, với khả năng AI ưu việt và bắt chước con người nhanh hơn, chính xác hơn sẽ quyết định người chiến thắng.
Figure AI gây ấn tượng với robot "Figure01" có thể pha cà phê bằng máy espresso và nhận diện, phục vụ trái cây cho người yêu cầu "thứ gì đó để ăn".
Công nghiệp robot hình người đang phát triển trên toàn cầu với hơn 160 nhà sản xuất, trong đó có hơn 60 ở Trung Quốc, 30 ở Mỹ và khoảng 40 ở châu Âu.
Nvidia đóng vai trò quan trọng trong cuộc cách mạng robot, cung cấp cả phần cứng lẫn công nghệ mô phỏng để huấn luyện robot trước khi triển khai trong thế giới thực.
Theo Giáo sư Gal Chechik của Nvidia, "Ranh giới tiếp theo cho AI là thế giới vật lý - AI thế giới thực", với mô phỏng cho phép robot huấn luyện nhanh hơn, giảm lượng đào tạo thực tế cần thiết.
📌 Cuộc cách mạng robot hình người đang đến gần với hơn 160 nhà sản xuất toàn cầu. Các robot như MenteeBot 3.0 giá 20.000-30.000 USD sẽ làm việc 700 giờ/tháng với chi phí dưới 10 USD/giờ, giải quyết tình trạng thiếu 2 triệu lao động toàn cầu vào năm 2030.
https://www.ynetnews.com/business/article/skradev3yl
OpenManus là nền tảng nguồn mở miễn phí, được phát triển như giải pháp thay thế cho Manus AI - công cụ độc quyền chuyên tự động hóa các tác vụ phức tạp.
Nền tảng này ra đời để giải quyết các rào cản tiếp cận của Manus AI như danh sách chờ và tính chất mã nguồn đóng, mang công nghệ AI tiên tiến đến với nhiều người dùng hơn.
OpenManus hỗ trợ nhiều tác vụ đa dạng như kiểm toán SEO, phát triển ứng dụng và phân tích dữ liệu, được vận hành bởi học tăng cường và các mô hình ngôn ngữ lớn.
Khả năng của nền tảng bao gồm tạo bảng điều khiển hiệu suất bán hàng và tự động hóa phát triển ứng dụng quản lý tác vụ đơn giản.
Việc cài đặt OpenManus đòi hỏi kiến thức về Python và quản lý các phụ thuộc, bao gồm các bước như tạo môi trường Conda, cài đặt thư viện cần thiết và cấu hình API keys.
Mặc dù phức tạp trong cài đặt, nền tảng này mang lại sự linh hoạt cao, cho phép người dùng tùy chỉnh hệ thống theo nhu cầu cụ thể.
OpenManus đối mặt với một số thách thức: hiệu suất chậm hơn so với Manus, thiếu giao diện người dùng đồ họa (GUI) và giới hạn tốc độ trên một số mô hình.
Những hạn chế này giảm sự hấp dẫn đối với người dùng không có chuyên môn kỹ thuật và gây khó khăn cho các dự án quy mô lớn.
Là dự án nguồn mở, OpenManus phát triển nhờ đóng góp của cộng đồng, với kế hoạch cải thiện hiệu suất, giới thiệu tính năng mới và đơn giản hóa trải nghiệm người dùng.
Điểm mạnh lớn nhất của OpenManus là miễn phí, loại bỏ rào cản tài chính liên quan đến các agent AI độc quyền, đặc biệt hữu ích cho doanh nghiệp nhỏ, startup và các nhà phát triển độc lập.
📌 OpenManus là giải pháp nguồn mở miễn phí thay thế cho Manus AI, hỗ trợ tự động hóa nhiều tác vụ như phân tích SEO, phát triển ứng dụng và phân tích dữ liệu. Với ưu điểm về chi phí và tính linh hoạt, nền tảng đang phát triển để khắc phục các hạn chế về hiệu suất và giao diện người dùng.
https://www.geeky-gadgets.com/manus-ai-alternative-open-source/
Trí tuệ nhân tạo đã trở thành phần thiết yếu trong hoạt động kinh doanh, đặc biệt với các startup và doanh nghiệp nhỏ đang tìm cách cạnh tranh và phát triển trong môi trường thương mại biến đổi nhanh chóng.
Theo phân tích của Cục Thống kê, các công ty siêu nhỏ (4 nhân viên trở xuống) có mức tăng trưởng ứng dụng AI đứng thứ hai kể từ tháng 9/2023, chỉ sau các tập đoàn có 250+ nhân viên. Tỷ lệ áp dụng AI của doanh nghiệp nhỏ tăng từ 4,6% lên 5,8%, trong khi tập đoàn lớn tăng từ 5,2% lên 7,8%.
AI agent là hệ thống có khả năng tự động thực hiện các nhiệm vụ đa bước, từ kế toán và phát triển kinh doanh đến chăm sóc khách hàng. Alan Paton, CEO của Qodea, khẳng định rằng tác động của chúng sẽ mang tính chuyển đổi.
Với AI agent, startup có thể cung cấp hỗ trợ khách hàng toàn cầu bằng mọi ngôn ngữ, vượt trội hơn đối thủ lớn. Câu hỏi và khiếu nại của khách hàng được phản hồi mọi lúc với độ tinh vi khiến họ không nhận ra đang nói chuyện với AI.
AI agent giải phóng thời gian cho nhà sáng lập để tập trung vào các lĩnh vực then chốt cho tăng trưởng thay vì bị sa lầy vào công việc lặp đi lặp lại.
Công ty marketing Jam7 đã phát triển nền tảng marketing agentic (AMP) giúp thương hiệu công nghệ B2B đạt được vị trí dẫn đầu thị trường, tăng số lượng khách hàng tiềm năng, giảm chi phí thu hút và tăng cường tương tác.
AI agent có giá phải chăng ngay cả với doanh nghiệp nhỏ nhất, với nhiều giải pháp có sẵn thông qua gói đăng ký, chi phí hàng tháng từ 30 USD đến 500 USD tùy theo tính năng và mức sử dụng.
Công ty tư vấn cấp phép Onyx đã phát triển AI agent riêng để giúp doanh nghiệp tiết kiệm chi phí khi mua phần mềm từ Microsoft, SAP và Oracle, đảm bảo họ nhận được thỏa thuận tốt nhất.
Dự án phát triển AI agent của Onyx mất hơn 6 tháng với đội ngũ ban đầu 4 người nhanh chóng mở rộng lên 14 nhà phát triển toàn thời gian để xử lý khối lượng truy vấn khách hàng ngày càng tăng trên toàn cầu.
Khi công nghệ AI tiếp tục phát triển và trở nên dễ tiếp cận hơn, có thể dự đoán tương lai AI agent sẽ trở thành phần không thể thiếu trong chiến lược kinh doanh của mọi tổ chức, kể cả nhỏ nhất.
📌 AI agent đang giúp startup vượt trội với chi phí hợp lý (30-500 USD/tháng). Các công ty siêu nhỏ đã tăng tỷ lệ áp dụng AI từ 4,6% lên 5,8%, giúp họ hỗ trợ khách hàng toàn cầu đa ngôn ngữ và tự động hóa nhiều tác vụ, giải phóng thời gian cho nhà sáng lập tập trung vào tăng trưởng.
https://www.forbes.com/sites/alisoncoleman/2025/03/16/how-ai-agents-are-helping-startups-to-scale/
Người dùng email đã được cảnh báo rằng các cuộc tấn công AI và hack sẽ gia tăng trong năm nay, ngày càng khó phát hiện hơn, bao gồm cả deepfake tinh vi và nhiều cuộc tấn công tự động bởi AI.
Một video và blog mới từ Symantec đã chứng minh cách một agent AI (hay "operator") có thể được triển khai để thực hiện cuộc tấn công phishing. Khác với các mô hình ngôn ngữ lớn (LLM) thông thường chỉ hỗ trợ thụ động, các agent có khả năng thực hiện các nhiệm vụ như tương tác với trang web.
Trong thử nghiệm của Symantec, agent AI đã tự tìm kiếm trên internet và LinkedIn để xác định địa chỉ email của mục tiêu, sau đó tìm kiếm lời khuyên về cách tạo các script độc hại và tự viết nội dung lừa đảo.
Dick O'Brien của Symantec giải thích: "Chúng tôi đã theo dõi việc sử dụng AI bởi kẻ tấn công trong một thời gian. Mục tiêu của chúng tôi là xem liệu một agent có thể thực hiện cuộc tấn công từ đầu đến cuối mà không cần sự can thiệp nào khác ngoài lệnh ban đầu."
Các biện pháp bảo mật tích hợp trong agent AI hiện rất sơ sài. Symantec cho biết lần đầu tiên thử nghiệm thất bại vì Operator từ chối tiếp tục do liên quan đến việc gửi email không được yêu cầu, nhưng chỉ cần điều chỉnh nhỏ trong lệnh (nói rằng mục tiêu đã ủy quyền gửi email) đã dễ dàng vượt qua hạn chế này.
Đáng chú ý, khi Operator không tìm thấy địa chỉ email của mục tiêu trực tuyến, nó đã thành công suy luận địa chỉ dựa trên các địa chỉ khác trong cùng tổ chức.
Trong một báo cáo khác, nhóm nghiên cứu tại Tenable cảnh báo về nguy cơ lạm dụng các mô hình AI nguồn mở như DeepSeek V3 và DeepSeek R1 để tạo ra mã độc keylogger và ransomware.
Guy Feinberg từ Oasis Security nhấn mạnh: "Không thể ngăn kẻ tấn công thao túng AI, giống như không thể ngăn họ lừa đảo nhân viên. Giải pháp là quản trị tốt hơn và bảo mật cho tất cả danh tính - cả con người và phi nhân."
Các chuyên gia khuyến nghị tổ chức nên triển khai các biện pháp kiểm soát bảo mật mạnh mẽ, giả định AI sẽ được sử dụng chống lại họ, kết hợp công nghệ phát hiện mối đe dọa nâng cao có thể nhận diện bất thường hành vi với các biện pháp bảo mật chủ động.
Symantec cảnh báo: "Công nghệ vẫn còn trong giai đoạn sơ khai, và các nhiệm vụ độc hại mà nó có thể thực hiện vẫn tương đối đơn giản so với những gì kẻ tấn công có kỹ năng có thể làm. Tuy nhiên, tốc độ tiến bộ trong lĩnh vực này có nghĩa là sẽ không lâu trước khi các agent trở nên mạnh mẽ hơn nhiều."
📌 Các agent AI đang tạo ra mối đe dọa bảo mật nghiêm trọng khi chúng có khả năng thực hiện tấn công phishing độc lập từ đầu đến cuối. Chỉ cần điều chỉnh nhỏ trong lệnh là có thể vượt qua các biện pháp bảo vệ, đặc biệt khi các mô hình nguồn mở như DeepSeek dễ dàng bị lạm dụng để tạo mã độc.
https://www.forbes.com/sites/zakdoffman/2025/03/16/new-gmail-outlook-apple-mail-warning-this-is-how-ai-attacks/
📌 AI đang trở thành yếu tố cốt lõi trong ngành viễn thông, giúp tăng doanh thu lên đến 15% và giảm chi phí vận hành 35%. Việc mở rộng AI đòi hỏi sự đầu tư vào nền tảng dữ liệu, quản lý thay đổi và hợp tác với đối tác công nghệ. Các AI agent có thể tự động hóa các quy trình phức tạp và cải thiện hiệu quả dịch vụ khách hàng, đưa các nhà mạng vào kỷ nguyên mới của sáng tạo và tăng trưởng.
https://www.mckinsey.com/industries/technology-media-and-telecommunications/our-insights/scaling-the-ai-native-telco
#McKinsey
✅ Tối ưu hóa bán hàng B2B:
✅ Tối ưu hóa vận hành mạng:
✅ Hỗ trợ khách hàng:
✅ Phân tích dữ liệu và quản lý quy trình:
📌 AI agents đang trở thành công cụ chiến lược trong ngành viễn thông, giúp tự động hóa quy trình, nâng cao trải nghiệm khách hàng và tăng doanh thu. Việc tích hợp AI agents vào các lĩnh vực như bán hàng, dịch vụ khách hàng và quản lý mạng đã cho thấy những kết quả rõ rệt: tăng ARPU từ 5% đến 15%, giảm 35% chi phí vận hành, và tăng 60% tỷ lệ giải quyết thành công. Trong bối cảnh AI tiếp tục phát triển, AI agents sẽ là yếu tố cốt lõi thúc đẩy sự đổi mới và tăng trưởng bền vững trong ngành viễn thông.
Trong vài tuần qua, hầu hết các công ty AI lớn như OpenAI, Anthropic, Google, xAI, Amazon, Microsoft và Perplexity đã công bố các sản phẩm mới không chỉ trả lời câu hỏi mà còn tự hoàn thành nhiệm vụ phức tạp.
Anthropic đã ra mắt Claude Code vào tháng trước, một chương trình lập trình có khả năng thực hiện phần lớn công việc của một nhà phát triển phần mềm với tốc độ nhanh hơn nhiều, "giảm thời gian phát triển và chi phí chung".
Google đã có một "mô hình làm việc" được sử dụng rộng rãi, và 3 công ty AI riêng biệt đều có các sản phẩm mang tên Deep Research, tất cả đều nhanh chóng thu thập và tổng hợp lượng thông tin khổng lồ thay mặt người dùng.
Sam Altman, đồng sáng lập OpenAI, đã cảnh báo từ năm 2016 rằng công nghệ sẽ xóa bỏ các công việc truyền thống, và nhấn mạnh với The Atlantic vào năm 2023 rằng "công việc chắc chắn sẽ biến mất".
Hai sự chuyển đổi quan trọng đã diễn ra trong những năm gần đây: tìm kiếm AI đã trở thành tiêu chuẩn với 300 triệu người sử dụng ChatGPT mỗi tuần và hơn 1 tỷ người dùng Google AI Overview; và công nghệ AI đã cải thiện đáng kể.
Các mô hình lập luận (reasoning models) mới được phát hành gần đây như o3-mini của OpenAI và Grok 3 của xAI đã gây ấn tượng mạnh. Một phần tư các công ty khởi nghiệp công nghệ trong đợt Y Combinator năm nay cho biết 95% mã của họ được tạo bằng AI.
Mark Zuckerberg dự đoán năm 2025 sẽ là năm có thể xây dựng "một agent kỹ thuật AI" có kỹ năng như "một kỹ sư giỏi, cấp trung bình". Dario Amodei của Anthropic dự báo AI sẽ "viết 90% mã" chỉ sau vài tháng nữa.
Tuy nhiên, những dự đoán này đã mờ nhạt đáng kể khi áp dụng vào thực tế: nỗ lực của Elon Musk và Bộ phận Hiệu quả Chính phủ nhằm thay thế công chức bằng AI đã gây ra mất việc làm hàng loạt và hỗn loạn.
Salesforce đang gặp khó khăn trong việc bán Agentforce cho khách hàng do vấn đề về độ chính xác và chi phí cao, nhưng CEO Marc Benioff khẳng định công ty có "3.000 khách hàng trả tiền đang trải nghiệm mức năng suất chưa từng có".
Động lực của ngành công nghiệp rất rõ ràng: doanh nghiệp đám mây của Google và Microsoft tăng trưởng nhanh chóng vào năm 2024, chủ yếu nhờ các dịch vụ AI của họ. OpenAI đang cân nhắc tính phí 20.000 USD mỗi tháng cho quyền truy cập vào các agent nghiên cứu cấp tiến sĩ.
📌 Các công ty công nghệ đang phát triển mạnh mẽ các sản phẩm AI có khả năng tự động hóa công việc con người. Với 300 triệu người dùng ChatGPT hàng tuần và dự báo AI sẽ viết 90% mã trong vài tháng tới, lời cảnh báo của Sam Altman về biến động thị trường lao động đang dần trở thành hiện thực.
https://www.theatlantic.com/technology/archive/2025/03/generative-ai-agents/682050/
Sam Altman có đúng về thị trường lao động không?
Các công ty công nghệ đang tung ra các sản phẩm AI có khả năng làm nhiều hơn là chỉ trả lời câu hỏi.
Bởi Matteo Wong
14 tháng 3, 2025, 2:13 PM ET
Tương lai tự động hóa vừa tiến thêm vài bước gần hơn. Trong vài tuần qua, gần như tất cả các công ty AI lớn — OpenAI, Anthropic, Google, xAI, Amazon, Microsoft và Perplexity, cùng với nhiều công ty khác — đã công bố các sản phẩm mới tập trung không phải vào việc trả lời câu hỏi hay giúp người dùng làm việc hiệu quả hơn, mà là hoàn thành các nhiệm vụ một cách độc lập. Các sản phẩm này được quảng bá vì khả năng “lý luận” giống như con người và hoạt động như những "tác nhân" (agents) có thể thực hiện công việc phức tạp từ đầu đến cuối.
Con người vẫn sẽ cần điều chỉnh các mô hình này, tất nhiên là vậy, nhưng chúng được thiết kế để giúp ít người hơn làm được khối lượng công việc của nhiều người hơn. Tháng trước, Anthropic đã ra mắt Claude Code, một chương trình lập trình có thể đảm nhận phần lớn công việc của một nhà phát triển phần mềm nhưng với tốc độ nhanh hơn nhiều, “giảm thời gian phát triển và chi phí hoạt động.” Chương trình này chủ động tham gia như một đồng nghiệp, viết và triển khai mã, cùng nhiều nhiệm vụ khác. Google hiện đã có một “mô hình chủ lực” sẵn sàng cho sử dụng rộng rãi, và có đến ba công ty AI riêng biệt đã tung ra các sản phẩm mang tên Deep Research, tất cả đều tập trung vào việc nhanh chóng thu thập và tổng hợp lượng lớn thông tin thay mặt cho người dùng. OpenAI ca ngợi rằng phiên bản của họ có khả năng “hoàn thành các nhiệm vụ nghiên cứu nhiều bước cho bạn” và “hoàn thành trong vài chục phút những gì một con người phải mất nhiều giờ mới làm được.”
Các công ty AI từ lâu đã xây dựng và hưởng lợi từ câu chuyện rằng sản phẩm của họ cuối cùng sẽ có khả năng tự động hóa các dự án lớn cho người dùng, thay thế việc làm và có thể làm thay đổi hoàn toàn nhiều ngành nghề hoặc thậm chí toàn bộ lĩnh vực trong xã hội. Ngay từ năm 2016, Sam Altman — khi đó vừa đồng sáng lập OpenAI — đã viết trong một bài blog rằng “khi công nghệ tiếp tục loại bỏ các công việc truyền thống,” các mô hình kinh tế mới có thể sẽ trở nên cần thiết, chẳng hạn như thu nhập cơ bản phổ quát (universal basic income). Từ đó đến nay, ông đã nhiều lần cảnh báo rằng AI sẽ làm gián đoạn thị trường lao động, nói với đồng nghiệp Ross Andersen vào năm 2023 rằng “công việc chắc chắn sẽ biến mất, không có gì phải bàn cãi.”
Bất chấp bản chất đáng ngại của những tuyên bố đó, chúng cho đến nay vẫn chỉ là suy đoán. Hai năm trước, ChatGPT thậm chí còn không thể thực hiện các phép toán cơ bản, và các nhà phê bình từ lâu đã nhấn mạnh vào các vấn đề của công nghệ này, từ thành kiến đến ảo tưởng. Các chatbot và trình tạo hình ảnh AI đã nhanh chóng nổi tiếng vì giúp học sinh gian lận trong bài tập về nhà và làm ngập tràn internet bằng các nội dung kém chất lượng. Các ứng dụng thực tiễn đã nhanh chóng xuất hiện trong một số ngành — lập trình, chăm sóc khách hàng, viết nội dung cơ bản — nhưng ngay cả những mô hình AI tốt nhất cũng rõ ràng chưa đủ khả năng để gây ra sự mất việc làm trên diện rộng.
Tuy nhiên, từ đó đến nay, hai sự chuyển đổi đã xảy ra.
Đầu tiên, tìm kiếm AI đã trở thành tiêu chuẩn. Các chatbot trở nên phổ biến vì chúng có thể trả lời câu hỏi của con người một cách mạch lạc — mặc dù thường xuyên không chính xác. Hàng tỷ người đã quen với việc tìm kiếm thông tin trực tuyến, khiến đây trở thành một ứng dụng hiển nhiên cho các mô hình AI — thứ mà nếu không có công cụ tìm kiếm thì có thể trông giống như các dự án nghiên cứu hơn là sản phẩm hoàn chỉnh. Hiện nay, 300 triệu người dùng ChatGPT mỗi tuần và hơn 1 tỷ người sử dụng công cụ tìm kiếm AI của Google, theo số liệu từ các công ty.
Tuy nhiên, mặc dù chatbot và tìm kiếm AI tạo ra sự thay đổi lớn về văn hóa, tiềm năng kinh doanh của chúng vẫn rất hạn chế đối với các gã khổng lồ công nghệ. So với các thuật toán tìm kiếm truyền thống, thuật toán AI đắt hơn để vận hành. Và tìm kiếm là một mô hình kinh doanh cũ mà AI tạo sinh chỉ có thể cải thiện phần nào — có thể dẫn đến vài cú nhấp chuột vào quảng cáo trả phí hoặc tạo ra một chút dữ liệu người dùng để nhắm mục tiêu quảng cáo trong tương lai.
Bước chuyển đổi thứ hai dẫn đến giai đoạn mới của kỷ nguyên AI đơn giản là công nghệ đã thực sự cải thiện, mặc dù vẫn còn đầy rẫy những vấn đề về thành kiến và độ chính xác. Các mô hình "lý luận" (reasoning models) được tung ra trong những tháng gần đây — chẳng hạn như o3-mini của OpenAI và Grok 3 của xAI — đã gây ấn tượng mạnh. Các sản phẩm AI này thực sự có thể hữu ích, và các ứng dụng của chúng trong việc thúc đẩy nghiên cứu khoa học có thể mang lại lợi ích to lớn.
Các nhà kinh tế, bác sĩ, lập trình viên và các chuyên gia khác đều đang nhận thấy rằng các mô hình mới này có thể đẩy nhanh công việc của họ; một phần tư các startup công nghệ trong đợt tuyển chọn năm nay của vườn ươm danh tiếng Y Combinator cho biết 95% mã của họ được tạo ra nhờ AI. Các công ty lớn — như McKinsey, Moderna và Salesforce — hiện đang sử dụng AI trong hầu hết các lĩnh vực kinh doanh của họ.
Sam Altman đã sử dụng ngôn ngữ tương tự trong thời gian gần đây, hình dung về vô số “nhân viên tri thức ảo” (virtual knowledge workers) xuất hiện trong mọi ngành công nghiệp. Nhưng tầm nhìn đầy hứa hẹn đó đã trở nên u ám hơn nhiều khi được triển khai trong thực tế.
Những vấn đề cố hữu của các mô hình AI tạo sinh — từ thành kiến, độ chính xác kém đến việc trích dẫn không chính xác — vẫn tồn tại, ngay cả khi công nghệ này đã có nhiều tiến bộ. Công nghệ tạo hình ảnh của OpenAI vẫn gặp khó khăn trong việc tạo ra những người có đúng số chi. Salesforce được cho là đang gặp khó khăn trong việc bán sản phẩm AI Agentforce của mình cho khách hàng vì vấn đề về độ chính xác và giá thành cao.
Tuy nhiên, các công ty vẫn tiếp tục thúc đẩy việc tự động hóa mọi thứ — tương lai tràn ngập AI có thể sẽ không hoàn hảo, nhưng nó vẫn đang đến gần.
Google và Perplexity đã không phản hồi yêu cầu bình luận, và người phát ngôn của Microsoft từ chối bình luận. Một người phát ngôn của OpenAI đã dẫn tôi đến một bài viết từ tháng 9, trong đó Altman viết: “Tôi không lo lắng rằng chúng ta sẽ hết việc để làm.” ■
Was Sam Altman Right About the Job Market?
Tech companies are unleashing AI products that do much more than answer questions.
By Matteo Wong
March 14, 2025, 2:13 PM ET
The automated future just lurched a few steps closer. Over the past few weeks, nearly all of the major AI firms—OpenAI, Anthropic, Google, xAI, Amazon, Microsoft, and Perplexity, among others—have announced new products that are focused not on answering questions or making their human users somewhat more efficient, but on completing tasks themselves. They are being pitched for their ability to “reason” as people do and serve as “agents” that will eventually carry out complex work from start to finish.
Humans will still nudge these models along, of course, but they are engineered to help fewer people do the work of many. Last month, Anthropic launched Claude Code, a coding program that can do much of a human software developer’s job but far faster, “reducing development time and overhead.” The program actively participates in the way that a colleague would, writing and deploying code, among other things. Google now has a widely available “workhorse model,” and three separate AI companies have products named Deep Research, all of which quickly gather and synthesize huge amounts of information on a user’s behalf. OpenAI touts its version’s ability to “complete multi-step research tasks for you” and accomplish “in tens of minutes what would take a human many hours.”
AI companies have long been building and benefiting from the narrative that their products will eventually be able to automate major projects for their users, displacing jobs and perhaps even entire professions or sectors of society. As early as 2016, Sam Altman, who had recently co-founded OpenAI, wrote in a blog post that “as technology continues to eliminate traditional jobs,” new economic models might be necessary, such as a universal basic income; he has warned repeatedly since then that AI will disrupt the labor market, telling my colleague Ross Andersen in 2023 that “jobs are definitely going to go away, full stop.”
Despite the foreboding nature of these comments, they have remained firmly in the realm of speculation. Two years ago, ChatGPT couldn’t perform basic arithmetic, and critics have long harped on the technology’s biases and mythomania. Chatbots and AI-powered image generators became known for helping kids cheat on homework and flooding the web with low-grade content. Meaningful applications quickly emerged in some professions—coding, fielding customer-service queries, writing boilerplate copy—but even the best AI models were clearly not capable enough to precipitate widespread job displacement.
Read: A chatbot is secretly doing my job
Since then, however, two transformations have taken place. First, AI search became standard. Chatbots exploded in popularity because they could lucidly—though frequently inaccurately—answer human questions. Billions of people were already accustomed to asking questions and finding information online, making this an obvious use case for AI models that might otherwise have seemed like research projects: Now 300 million people use ChatGPT every week, and more than 1 billion use Google’s AI Overview, according to the companies. Further underscoring the products’ relevance, media companies—including The Atlantic—signed lucrative deals with OpenAI and others to add their content to AI search, bringing both legitimacy and some additional scrutiny to the technology. Hundreds of millions were habituated to AI, and at least some portion have found the technology helpful.
But although plain chatbots and AI search introduced a major cultural shift, their business prospects were always small potatoes for the tech giants. Compared with traditional search algorithms, AI algorithms are more expensive to run. And search is an old business model that generative AI could only enhance—perhaps resulting in a few more clicks on paid advertisements or producing a bit more user data for targeting future advertisements.
Refining and expanding generative AI to do more for the professional class—not just students scrambling on term papers—is where tech companies see the real financial opportunity. And they’ve been building toward seizing it. The second transformation that has led to this new phase of the AI era is simply that the technology, while still riddled with biases and inaccuracies, has legitimately improved. The slate of so-called reasoning models released in recent months, such as OpenAI’s o3-mini and xAI’s Grok 3, has impressed in particular. These AI products can be genuinely helpful, and their applications to advancing scientific research could prove lifesaving. Economists, doctors, coders, and other professionals are widely commenting on how these new models can expedite their work; a quarter of tech start-ups in this year’s cohort at the prestigious incubator Y Combinator said that 95 percent of their code was generated with AI. Major firms—McKinsey, Moderna, and Salesforce, to name just a handful—are now using it in basically every aspect of their businesses. And the models continue getting cheaper, and faster, to deploy.
Read: The GPT era is already ending
Tech executives, in turn, have grown blunt about their hopes that AI will become good enough to do a human’s work. In a Meta earnings call in late January, CEO Mark Zuckerberg said, “2025 will be the year when it becomes possible to build an AI engineering agent” that’s as skilled as “a good, mid-level engineer.” Dario Amodei, the CEO of Anthropic, recently said in a talk with the Council on Foreign Relations that AI will be “writing 90 percent of the code” just a few months from now—although still with human specifications, he noted. But he continued, “We will eventually reach the point where the AIs can do everything that humans can,” in every industry. (Amodei, it should be mentioned, is the ultimate techno-optimist; in October, he published a sprawling manifesto, titled “Machines of Loving Grace,” that posited AI development could lead to “the defeat of most diseases, the growth in biological and cognitive freedom, the lifting of billions of people out of poverty to share in the new technologies, a renaissance of liberal democracy and human rights.”) Altman has used similarly grand language recently, imagining countless virtual knowledge workers fanning out across industries.
These bright visions have dimmed considerably when put into practice: Elon Musk and the Department of Government Efficiency’s efforts to replace human civil servants with AI may be the clearest and most dramatic execution of this playbook yet, with massive job loss and little more than chaos to show for it so far. Meanwhile, all of generative-AI models’ issues with bias, inaccuracy, and poor citations remain, even as the technology has advanced. OpenAI’s image-generating technology still struggles at times to produce people with the right number of appendages. Salesforce is reportedly struggling to sell its AI agent, Agentforce, to customers because of issues with accuracy and concerns about the product’s high cost, among other things. Nevertheless, the corporation has pressed on with its pitch, much as other AI companies have continued to iterate on and promote products with known issues. (In a recent earnings call, Salesforce CEO Marc Benioff said the firm has “3,000 paying Agentforce customers who are experiencing unprecedented levels of productivity.”) In other words, flawed products won’t stop tech companies’ push to automate everything—the AI-saturated future will be imperfect at best, but it is coming anyway.
The industry’s motivations are clear: Google’s and Microsoft’s cloud businesses, for instance, grew rapidly in 2024, driven substantially by their AI offerings. Meta’s head of business AI, Clara Shih, recently told CNBC that the company expects “every business” to use AI agents, “the way that businesses today have websites and email addresses.” OpenAI is reportedly considering charging $20,000 a month for access to what it describes as Ph.D.-level research agents.
Google and Perplexity did not respond to a request for comment, and a Microsoft spokesperson declined to comment. An OpenAI spokesperson pointed me to an essay from September in which Altman wrote, “I have no fear that we’ll run out of things to do.” He could well be right; the Bureau of Labor Statistics projects AI to substantially increase the demand for computer and business occupations through 2033. A spokesperson for Anthropic referred me to the start-up’s initiative to study and prepare for AI’s effect on the labor market. The effort’s first research paper analyzed millions of conversations with Anthropic’s Claude model and found that it was used to “automate” human work in 43 percent of cases, such as identifying and fixing a software bug.
Tech companies are revealing, more clearly than ever, their vision for a post-work future. ChatGPT started the generative-AI boom not with an incredible business success, but with a psychological one. The chatbot was and is still possibly losing the company money, but it exposed internet users around the world to the first popular computer program that could hold an intelligent conversation on any subject. The advent of AI search may have performed a similar role, presenting limited opportunity for immediate profits but habituating—or perhaps inoculating—millions of people to bots that can think, write, and live for you.
Các công ty logistics đa quốc gia như DHL đang sử dụng robot "rất rộng rãi" trong các kho hàng của họ để cải thiện hiệu quả và năng suất. Theo Javier Bilbao Uzquiano, CEO khu vực APAC của DHL Supply Chain, robot không thay thế mà bổ sung cho con ngýời.
Robot đang đảm nhận các công việc nặng nhọc và lặp đi lặp lại trong kho hàng như di chuyển pallet hoặc dỡ container. Khả năng tự động hóa ngày càng phát triển cho phép robot di chuyển tự do trong kho mà không cần sự giám sát của con người.
Công nghệ robot giúp các công ty logistics linh hoạt đối phó với các đợt cao điểm như Black Friday hoặc Cyber Monday khi nhu cầu tăng đột biến mà không cần thuê thêm nhiều nhân công tạm thời.
Talabat, dịch vụ đặt thức ăn trực tuyến tại Dubai, đang tập trung phát triển khả năng AI để phân tích hành vi khách hàng. CEO Tomaso Rodriguez cho biết đa số khách hàng mở ứng dụng nhưng không đặt hàng, và AI giúp công ty hiểu chính xác nhu cầu của từng cá nhân.
Nhờ AI, Talabat có thể đưa ra các đề xuất tốt hơn và nhắm mục tiêu người dùng với "ưu đãi phù hợp" để chuyển đổi họ thành khách hàng trả tiền.
Talabat cũng đang thử nghiệm sử dụng drone và robot cho việc giao hàng, nhưng các hạn chế địa phương là rào cản. Cả hai phương pháp đều đòi hỏi khách hàng phải tự nhận hàng, khác với việc giao hàng tận cửa bởi con người.
Rodriguez tin rằng tương tác con người vẫn rất quan trọng và sẽ không bị thay thế trong một thời gian dài, đặc biệt trong lĩnh vực giao hàng thực phẩm.
📌 Công nghệ thế hệ mới đang biến đổi chuỗi cung ứng toàn cầu với robot đảm nhận công việc nặng nhọc trong kho hàng của DHL và AI giúp Talabat tăng tỷ lệ chuyển đổi khách hàng. Mặc dù tự động hóa đang phát triển mạnh, các chuyên gia vẫn nhấn mạnh rằng công nghệ đang bổ sung chứ không thay thế hoàn toàn con người trong logistics.
https://www.cnbc.com/2025/03/14/how-ai-and-emerging-tech-is-changing-the-global-supply-chain.html
Một công ty nghiên cứu Mỹ đã cảnh báo rằng sức mạnh sản xuất của Trung Quốc đang tạo ra "mối đe dọa sinh tử" đối với Mỹ trong lĩnh vực robot.
Các nhà sản xuất Trung Quốc hiện chiếm gần 50% thị phần tại thị trường robot lớn nhất thế giới, tăng đáng kể từ mức 30% vào năm 2020.
Theo báo cáo của công ty nghiên cứu độc lập SemiAnalysis có trụ sở tại Mỹ, Trung Quốc hiện là "quốc gia duy nhất có vị thế" để đạt được mức độ tự động hóa cao.
Tự động hóa bằng robot thông minh sẽ cho phép mở rộng đáng kể công suất sản xuất trên nhiều ngành công nghiệp.
Các nhà sản xuất Trung Quốc đang ngang hàng với các tập đoàn phương Tây ở phân khúc thị trường thấp, và đang bắt đầu chiếm lĩnh các phân khúc thị trường cao cấp hơn.
Unitree Robotics, một công ty khởi nghiệp có trụ sở tại Hàng Châu, là ví dụ điển hình cho sự chuyển dịch này, với robot G1 được mô tả là "robot hình người khả thi duy nhất trên thị trường".
Đáng chú ý là robot G1 của Unitree "hoàn toàn tách biệt khỏi các linh kiện của Mỹ".
Báo cáo cảnh báo rằng nếu Trung Quốc đạt được tự động hóa quy mô đầy đủ "mà không có Mỹ đi theo", điều này sẽ tạo ra "mối đe dọa sinh tử" đối với nền kinh tế lớn nhất thế giới.
Kịch bản này sẽ thấy Trung Quốc hưởng lợi từ "sự mở rộng mạnh mẽ năng lực sản xuất [trên nhiều ngành công nghiệp] được hỗ trợ bởi hệ thống robot thông minh".
📌 Trung Quốc đang nhanh chóng chiếm lĩnh ngành robot toàn cầu với thị phần tăng từ 30% lên gần 50% chỉ trong 5 năm. Sự phát triển của các công ty như Unitree Robotics với robot hình người G1 không phụ thuộc vào linh kiện Mỹ đã tạo ra mối lo ngại về "đe dọa sinh tử" đối với vị thế công nghệ và sản xuất của Mỹ.
https://amp.scmp.com/tech/tech-trends/article/3302272/china-manufacturing-ai-pose-existential-threat-us-robotics-sector
OpenAI giới thiệu công cụ xây dựng AI Agent cho phép tự động hóa các tác vụ phức tạp thông qua các API như Web Search và Computer Use, giúp tối ưu quy trình làm việc và tăng năng suất.
API tìm kiếm web đảm bảo truy cập thông tin web theo thời gian thực, có trích dẫn, đặc biệt hữu ích cho việc thu thập thông tin thị trường, tổng hợp tin tức hoặc nghiên cứu chi tiết.
API sử dụng máy tính đơn giản hóa các tác vụ trên trình duyệt như điền biểu mẫu, quản lý tài khoản trực tuyến hoặc điều hướng trang web, giúp tự động hóa các thao tác lặp đi lặp lại.
Việc triển khai các công cụ AI Agent có thể sử dụng container Docker và môi trường ảo để đảm bảo cấu hình nhất quán và tách biệt các phụ thuộc, giảm thiểu xung đột trong quá trình phát triển.
OpenAI tích hợp các biện pháp kiểm tra an toàn mạnh mẽ để giám sát đầu ra và thúc đẩy sử dụng đạo đức, giúp giảm thiểu rủi ro trong quá trình triển khai AI.
Tính năng thực thi mã tự động cho phép kiểm tra script trong môi trường kiểm soát, đặc biệt có lợi cho các nhà phát triển đang thử nghiệm quy trình làm việc hoặc thuật toán mới.
Google Gemini 2.0 đánh dấu bước tiến quan trọng trong công nghệ chỉnh sửa hình ảnh, cung cấp công cụ tiên tiến để thao tác hình ảnh chính xác và trực quan.
Gemini 2.0 đơn giản hóa các tác vụ sáng tạo như thiết kế hình ảnh tiếp thị, nâng cao chất lượng ảnh cá nhân, hoặc tạo nội dung hấp dẫn cho mạng xã hội.
Công cụ của OpenAI có ứng dụng thực tế trong tự động hóa quy trình làm việc, quản lý đường dẫn dữ liệu, hoặc truy xuất thông tin theo thời gian thực, giảm công sức thủ công.
Thách thức hiện tại bao gồm xử lý lỗi trong API của OpenAI và đảm bảo tính nhất quán trong thuật toán chỉnh sửa hình ảnh của Gemini 2.0.
📌 Công nghệ AI Agent của OpenAI và Gemini 2.0 của Google đang biến đổi cách làm việc bằng cách tự động hóa tác vụ và nâng cao khả năng sáng tạo. Dù còn những thách thức cần khắc phục, tiềm năng của chúng trong nâng cao năng suất và hiệu quả là không thể phủ nhận.
https://www.geeky-gadgets.com/ai-agent-automation-tools-openai/
AI sẽ không thay thế con người, nhưng những chuyên gia biết kết hợp với AI sẽ vượt trội hơn hẳn về hiệu suất làm việc.
Tác giả Tom Popomaronis đã sử dụng AI như một "chánh văn phòng kỹ thuật số" trong suốt 1,5 năm qua, giúp chuyển đổi từ một người làm nhiều việc bị quá tải thành người làm việc chiến lược hiệu quả.
Lợi thế lớn nhất khi sử dụng AI là tiết kiệm thời gian. Công việc nghiên cứu trước đây mất cả ngày giờ chỉ cần dưới một giờ, cho phép tập trung vào các quyết định chiến lược thay vì công việc hành chính.
Sai lầm phổ biến của nhiều người là chỉ sử dụng một nền tảng AI. Tác giả duy trì hơn 30 "agent" AI chuyên biệt cho các mục đích khác nhau như nghiên cứu đối thủ, viết kịch bản bán hàng, phân tích tài chính, và sáng tạo.
Cách bắt đầu sử dụng AI hiệu quả là liệt kê các công việc tốn nhiều thời gian nhất, rồi thử nghiệm với các công cụ AI chuyên biệt để tự động hóa những công việc đó.
Khi cả đội ngũ cùng sử dụng AI, hiệu quả còn tăng cao hơn. Mọi người không chỉ thay thế công việc cũ bằng AI mà còn hợp tác, chia sẻ kinh nghiệm và cải thiện agent của nhau.
AI không thay thế trực giác con người, mà cung cấp thêm góc nhìn để thách thức giả định và củng cố quyết định của chúng ta.
Trong 5 năm tới, việc so sánh "agent" AI sẽ phổ biến. Những người điều chỉnh AI tốt nhất sẽ có lợi thế cạnh tranh lớn, đồng thời cải thiện chất lượng cuộc sống nhờ tự động hóa các công việc nhàm chán.
📌 Trong tương lai, những người kết hợp hiệu quả với nhiều agent AI chuyên biệt sẽ có lợi thế vượt trội. Bằng cách tự động hóa công việc hành chính và nghiên cứu, họ tiết kiệm hơn 30 giờ mỗi tuần để tập trung vào sáng tạo và chiến lược, tạo nên sự khác biệt lớn về năng suất.
https://www.entrepreneur.com/science-technology/ai-wont-replace-you-but-an-ai-equipped-professional/487604
Từ Barcelona, phóng viên Cheng Ting-Fang chia sẻ về xu hướng AI nổi bật tại Mobile World Congress. China Unicom trình diễn công nghệ biến ảnh thành nhân vật lịch sử cổ đại trong tích tắc, sử dụng mô hình ngôn ngữ lớn Yuanjing của họ.
iFlytek, nhà cung cấp hàng đầu công nghệ nhận dạng giọng nói Trung Quốc, giới thiệu công cụ tạo phim ngắn chỉ từ vài từ nhập vào, tạo ra phim hoạt hình phong cách Disney-Pixar trong vòng 20 giây. China Mobile với AsiaInfo sử dụng AI tăng cường DeepSeek và chip Nvidia để kiểm tra sức khỏe trong 30 giây.
Drone và robot người hình đang là hai từ khóa hàng đầu trong ngành công nghệ. Thị trường drone dự kiến tăng 62,6% từ năm 2023 đến gần 55 tỷ USD vào năm 2030, với châu Á là thị trường drone lớn nhất thế giới. Các nhà sản xuất drone Ukraine và Israel đang nhắm đến thị trường Hàn Quốc.
Robot người hình được TSMC, Tesla và Bắc Kinh coi là lĩnh vực trọng điểm phát triển tương lai. Tuy nhiên, CEO Agility Robotics Peggy Johnson cho biết đảm bảo robot an toàn làm việc cùng con người và thiếu dữ liệu thời gian thực để đào tạo là thách thức lớn.
Các nhà đầu tư giàu có Trung Quốc đang đổ hàng chục triệu đô la vào các công ty tư nhân của Elon Musk như SpaceX và xAI thông qua các cấu trúc đặc biệt che giấu danh tính. Ít nhất 30 triệu USD đã được đầu tư vào SpaceX, xAI và Neuralink trong hai năm qua.
NTT, nhà mạng hàng đầu Nhật Bản, đang đặt cược vào truyền thông quang học hoàn toàn, hứa hẹn giảm mức tiêu thụ điện năng của trung tâm dữ liệu AI xuống còn 1/100 so với hiện tại. Tuy nhiên, việc tích hợp các thành phần quang học vào từng liên kết của trung tâm dữ liệu còn nhiều thách thức.
Manus AI của Trung Quốc gây chú ý khi tuyên bố phát triển "tác nhân AI tổng quát" đầu tiên trên thế giới, có khả năng sàng lọc hồ sơ, nghiên cứu bất động sản và phân tích cổ phiếu. Mặc dù có những hoài nghi, nhà đầu tư vẫn đổ xô vào lĩnh vực này với sự hỗ trợ mạnh mẽ từ chính phủ.
📌 Trung Quốc đang dẫn đầu cuộc đua phát triển AI, drone và robot người hình với nhiều ứng dụng ấn tượng. Đồng thời, các nhà đầu tư Trung Quốc đã đầu tư ít nhất 30 triệu USD vào công ty của Elon Musk qua các cấu trúc che giấu danh tính, trong khi NTT Nhật Bản theo đuổi công nghệ viễn thông quang học giảm 99% tiêu thụ điện năng.
https://www.ft.com/content/1a236286-9592-442e-abd8-b05f6482e5eb
#FT
Drone, robot và "con cưng" AI tiếp theo của Trung Quốc
Câu chuyện nội bộ về các xu hướng công nghệ châu Á quan trọng, từ Nikkei Asia và Financial Times
© Pedro Pardo/AFP/Getty Images
Cheng Ting-Fang, Lauly Li, Kim Jaewon, Sun Yu, Mitsuru Obe và Cissy Zhou
Xuất bản
13 tháng 3 năm 2025
Xin chào mọi người! Đây là Cheng Ting-Fang, người dẫn chương trình #techAsia của bạn trong tuần này, gửi lời chào ấm áp từ Đài Bắc!
Tôi vừa trở về châu Á từ Barcelona — một thành phố tràn ngập những công trình kiến trúc nghệ thuật của Gaudi và các món tapas tươi ngon, từ tôm tỏi đến mực nướng và patatas bravas. Mỗi mùa xuân, ngành công nghiệp không dây toàn cầu lại tụ họp tại thành phố Tây Ban Nha này để tìm hiểu những thông tin mới nhất về thị trường. Năm nay, từ khóa được nhắc đến nhiều nhất một lần nữa là “trí tuệ nhân tạo.”
Tại Hội nghị Di động Thế giới (Mobile World Congress), tôi đã có cơ hội trực tiếp trải nghiệm các ứng dụng AI của Trung Quốc. Có những hàng dài người chờ đợi tại gian hàng của nhà mạng viễn thông China Unicom, nơi giới thiệu một trạm chụp ảnh có thể ngay lập tức biến các bức ảnh thành hình ảnh của các nhân vật lịch sử từ hàng thế kỷ trước — chẳng hạn như ghép khuôn mặt của tôi vào trang phục triều đại nhà Đường của Nữ hoàng Võ Tắc Thiên chỉ trong nháy mắt. Công ty cho biết mô hình ngôn ngữ lớn Yuanjing của họ chính là động cơ đứng sau sự biến đổi này.
© Cheng Ting-Fang
Trong khi đó, iFlytek — nhà cung cấp công nghệ nhận dạng giọng nói hàng đầu của Trung Quốc — đã trình diễn một công cụ mạnh mẽ (hình trên) cho phép các nhà sáng tạo nội dung tạo ra các bộ phim ngắn chỉ từ vài từ đầu vào, đồng thời chọn thể loại và phong cách ngay lập tức. Chưa đầy 20 giây sau, tôi đã xem một đoạn hoạt hình theo phong cách Disney-Pixar về Barcelona, được sản xuất hoàn toàn bằng AI. Công ty con của China Mobile, AsiaInfo — nhà cung cấp phần mềm viễn thông hàng đầu của Trung Quốc — đã sử dụng một chiếc camera đơn giản được hỗ trợ bởi mô hình ngôn ngữ AI DeepSeek và chip Nvidia để cung cấp cho khách tham quan các bài kiểm tra sức khỏe trong 30 giây bằng cách đo nhịp tim và nhịp thở.
Tuy nhiên, không phải mọi thứ đều mang tính tương lai. Đồng nghiệp của tôi, Lauly Li, và tôi đã chia sẻ một căn hộ hai phòng ngủ với một bàn làm việc lớn trong chuyến đi, nhưng chúng tôi đã phải chịu đựng 3 đêm không có nước nóng, buộc phải tắm trong chưa đầy một phút, cũng như 2 đêm bị gián đoạn bởi hệ thống giao thông ngầm. Dù gặp nhiều khó khăn, chúng tôi vẫn có thể gặp gỡ nhiều giám đốc điều hành trong ngành và sau khi bắt chuyến bay sớm nhất trở về châu Á lúc 6 giờ sáng, chúng tôi đã sớm trở về nhà.
Những điều lớn tiếp theo
Bên cạnh AI, máy bay không người lái và robot hình người là hai từ khóa nóng nhất trong ngành công nghệ khi xe điện và điện thoại di động đang chững lại.
Kim Jaewon của Nikkei Asia đưa tin rằng các nhà sản xuất máy bay không người lái của Ukraine và Israel, với kinh nghiệm thực chiến, hiện đang nhắm tới các thị trường nước ngoài — đặc biệt là Hàn Quốc, khi nước này đặt mục tiêu tăng gấp đôi lực lượng máy bay không người lái để đối phó với các mối đe dọa từ Triều Tiên. Các công ty trong nước như Korean Air và Pablo Air cũng đang nhắm tới thị trường đang phát triển nhanh chóng này. Trên toàn cầu, thị trường máy bay không người lái dự kiến sẽ tăng nhanh, với Viện Công nghệ An toàn Hàng không Hàn Quốc dự báo mức tăng 62,6% từ năm 2023 lên gần 55 tỷ USD vào năm 2030. Châu Á là thị trường máy bay không người lái lớn nhất thế giới.
Trong khi đó, robot hình người đã nổi lên như một lĩnh vực nóng kể từ đầu năm nay, khi CEO của TSMC gọi đây là trọng tâm chính cho sự phát triển công nghệ trong tương lai. Vào tháng 3, Bắc Kinh đã gọi robot hình người là xu hướng lớn tiếp theo sau xe điện, trong khi Tesla — nhà sản xuất xe điện hàng đầu của Mỹ — là một trong những cái tên lớn trong lĩnh vực công nghệ đang phát triển dự án robot hình người của riêng mình, Optimus.
Tuy nhiên, công nghệ này vẫn chưa thực sự hoàn thiện. Trong một cuộc phỏng vấn độc quyền với Agility Robotics — công ty khởi nghiệp về robot hàng đầu của Mỹ, CEO Peggy Johnson cho biết việc đảm bảo robot hình người có thể làm việc an toàn cùng con người là một trong những thách thức lớn nhất mà ngành công nghiệp phải vượt qua. CEO, một cựu chuyên gia trong ngành chip và công nghệ, cũng lưu ý rằng hiện chưa có đủ dữ liệu thời gian thực để đào tạo các hệ thống này một cách hiệu quả.
Dòng tiền âm thầm
Các nhà đầu tư giàu có của Trung Quốc đang rót hàng chục triệu USD vào các công ty tư nhân do Elon Musk kiểm soát — bao gồm SpaceX và xAI — thông qua một cơ chế che giấu danh tính trước công chúng, theo các nhà quản lý tài sản và nhà đầu tư tham gia các giao dịch này.
Từ khi Musk được coi là nhân vật quan trọng trong nỗ lực của cựu Tổng thống Mỹ Donald Trump nhằm tái cấu trúc chính phủ Mỹ, các nhà quản lý tài sản tại Trung Quốc đã quảng bá mối quan hệ của hai người như một yếu tố thu hút vốn từ giới nhà giàu Trung Quốc.
Khoảnh khắc "bừng sáng"
Nhà mạng viễn thông hàng đầu Nhật Bản NTT đang đặt cược lớn vào hệ thống truyền thông quang học hoàn toàn, giúp giảm mức tiêu thụ điện năng của các trung tâm dữ liệu AI xuống còn 1/100 so với hiện tại.
"Con cưng" trẻ của Trung Quốc
Cơn sốt AI của Trung Quốc vừa tìm thấy một "con cưng" mới. Manus AI — một công ty ít tên tuổi — đã gây xôn xao tuần trước khi tuyên bố đã phát triển "tác nhân AI tổng quát" đầu tiên trên thế giới.
Theo video demo được Manus AI công bố, tác nhân AI của họ có khả năng thực hiện các nhiệm vụ phức tạp như sàng lọc hồ sơ, nghiên cứu bất động sản và phân tích cổ phiếu.
Nhà phát triển cho biết hiệu năng của tác nhân này vượt qua các mô hình của OpenAI trong tất cả các cấp độ khó của chuẩn GAIA, dù một số người hoài nghi cho rằng đây có thể chỉ là hiệu ứng truyền thông thay vì một đột phá công nghệ thực sự.
Manus AI là một hệ thống được xây dựng dựa trên các mô hình có sẵn, có khả năng tương tác với internet và thực hiện chuỗi nhiệm vụ mà không cần xin phép người dùng.
Khi giao nhiệm vụ trực tuyến như xây dựng mạng lưới tài khoản mạng xã hội quảng cáo, nghiên cứu và viết tài liệu chiến lược, hoặc đặt vé và khách sạn cho hội nghị, Manus sẽ lập kế hoạch chi tiết và tự thực hiện.
Nhà phát triển Manus đến từ Trung Quốc, tuyên bố đã xây dựng tác nhân AI tổng quát đầu tiên trên thế giới "biến suy nghĩ thành hành động".
Dù nhiều phòng thí nghiệm AI trên thế giới đã thử nghiệm cách tiếp cận "agentic" này trong môi trường kín, điều đáng chú ý là Manus đã được phát hành công khai.
Trải nghiệm sử dụng Manus cho thấy hệ thống vẫn còn nhiều hạn chế: câu trả lời gây nhầm lẫn, độ trễ gây thất vọng và vòng lặp vô tận.
Các phòng thí nghiệm lớn của Mỹ như OpenAI thường thận trọng hơn trong việc phát hành sản phẩm. OpenAI đã chờ chín tháng trước khi phát hành đầy đủ GPT-2 vào năm 2019.
Google cũng giữ chatbot Lamda trong nội bộ từ năm 2020 và mất hơn hai năm mới phát hành thành Bard.
Các phòng thí nghiệm lớn đặc biệt thận trọng với AI dạng tác nhân vì cấp quyền tự do cho AI tìm giải pháp có thể tăng nguy cơ gây hại.
Anthropic và Google đã giới thiệu tính năng "sử dụng máy tính" nhưng chưa phát hành rộng rãi, với nhiều giới hạn về chính sách và công nghệ.
Sự xuất hiện của Manus làm khó khăn hơn cho cách tiếp cận thận trọng này khi khoảng cách giữa các phòng thí nghiệm AI lớn và các công ty khởi nghiệp đang thu hẹp.
Một số nhà quan sát Mỹ lo ngại về nguồn gốc Trung Quốc của Manus, nhưng thành công của Manus không thể sánh với DeepSeek, công ty Trung Quốc từng gây chấn động thế giới với mô hình AI giá rẻ.
Bất kỳ công ty nào từ Mỹ, Trung Quốc hay nơi khác đều có thể tạo ra tác nhân tương tự nếu sử dụng các thành phần có sẵn và sẵn sàng chấp nhận rủi ro.
Dù chưa có dấu hiệu Manus gây nguy hiểm, nhưng an toàn không thể chỉ dựa vào việc thử nghiệm quy mô lớn trước khi phát hành.
Các cơ quan quản lý và công ty cần giám sát các hệ thống đang được sử dụng, phản ứng nhanh chóng với mọi tác hại và sẵn sàng loại bỏ hoàn toàn các hệ thống gây hại.
📌 Manus đánh dấu kỷ nguyên mới khi thử nghiệm AI không còn diễn ra trong phòng thí nghiệm mà ở thế giới thực. Các phương pháp an toàn truyền thống không còn phù hợp, đòi hỏi cách tiếp cận mới: giám sát liên tục, phản ứng nhanh và sẵn sàng can thiệp khi cần thiết.
https://www.economist.com/leaders/2025/03/13/with-manus-ai-experimentation-has-burst-into-the-open
Với Manus, thử nghiệm AI đã bùng nổ ra công khai
Những phương thức cũ để đảm bảo an toàn đang ngày càng trở nên không phù hợp
Minh họa: Rose Wong
Ngày 13 tháng 3 năm 2025
Việc quan sát cánh tay tự động của tác nhân AI Manus cuộn qua hàng chục cửa sổ trình duyệt mang lại cảm giác bất an. Giao cho Manus một nhiệm vụ có thể hoàn thành trực tuyến, chẳng hạn như xây dựng mạng lưới quảng bá qua các tài khoản mạng xã hội, nghiên cứu và viết tài liệu chiến lược, hoặc đặt vé và khách sạn cho một hội nghị, và Manus sẽ viết ra một kế hoạch chi tiết, khởi động một phiên bản của chính nó để duyệt web và cố gắng thực hiện nhiệm vụ đó tốt nhất có thể.
Manus AI là một hệ thống được xây dựng trên các mô hình hiện có, có khả năng tương tác với internet và thực hiện một chuỗi nhiệm vụ mà không cần xin phép người dùng. Các nhà phát triển của Manus, có trụ sở tại Trung Quốc, tuyên bố đã tạo ra tác nhân AI tổng quát đầu tiên trên thế giới có khả năng "biến suy nghĩ của bạn thành hành động". Tuy nhiên, các phòng thí nghiệm AI trên khắp thế giới từ lâu đã thử nghiệm cách tiếp cận "tác nhân" này trong nội bộ. Điều khiến Manus trở nên đáng chú ý không phải là việc nó tồn tại, mà là việc các nhà sáng tạo đã hoàn toàn giải phóng nó. Một kỷ nguyên mới của thử nghiệm đã đến, và nó đang diễn ra không phải trong các phòng thí nghiệm, mà ngay ngoài đời thực.
Sử dụng Manus lâu hơn, sẽ thấy rõ rằng hệ thống này vẫn còn rất nhiều điểm cần cải thiện để trở nên thực sự hữu ích. Các câu trả lời khó hiểu, sự chậm trễ gây khó chịu và các vòng lặp không hồi kết khiến trải nghiệm trở nên thất vọng. Khi tung ra sản phẩm, rõ ràng các nhà phát triển đã ưu tiên hoàn thành công việc sớm hơn là làm tốt công việc đó.
Đây là sự tương phản với cách tiếp cận của các phòng thí nghiệm lớn của Mỹ. Một phần vì lo ngại về sự an toàn của các phát minh của mình, các công ty này đã giữ sản phẩm ở trạng thái thử nghiệm, kiểm tra và điều chỉnh cho đến khi đạt được phiên bản 1.0 đủ tốt. OpenAI đã mất 9 tháng trước khi chính thức phát hành GPT-2 vào năm 2019. Chatbot Lamda của Google đã hoạt động nội bộ từ năm 2020, nhưng công ty này đã giữ nó lại hơn 2 năm trước khi ra mắt dưới tên Bard.
Các phòng thí nghiệm lớn cũng đã thận trọng với AI tác nhân, và điều đó có lý do. Trao cho một tác nhân quyền tự do đưa ra các phương pháp riêng để giải quyết vấn đề, thay vì dựa vào hướng dẫn từ con người ở từng bước, cũng có thể làm tăng khả năng gây hại. Anthropic và Google đã trình diễn các tính năng "sử dụng máy tính", nhưng chưa công ty nào triển khai rộng rãi. Trong các bài kiểm tra và bản xem trước dành cho nhà phát triển, các hệ thống này vẫn bị giới hạn bởi chính sách hơn là công nghệ, khi liên tục trao lại quyền kiểm soát cho người dùng hoặc khi cần hoàn thành một nhiệm vụ phức tạp.
Sự tồn tại của Manus khiến cho cách tiếp cận thận trọng này trở nên khó duy trì hơn. Khi khoảng cách trước đây giữa các phòng thí nghiệm AI lớn và các công ty khởi nghiệp thu hẹp lại, các ông lớn không còn có thể đủ thời gian để trì hoãn. Và điều đó cũng có nghĩa là cách tiếp cận đảm bảo an toàn của họ không còn khả thi nữa.
Với một số người Mỹ, những người đang lo lắng rằng Trung Quốc có thể đang dẫn trước phương Tây, việc Manus có nguồn gốc từ Trung Quốc càng làm gia tăng mối đe dọa. Nhưng thành công của Manus chưa thể sánh với DeepSeek, một công ty Trung Quốc đã làm cả thế giới kinh ngạc với mô hình AI giá rẻ của mình. Bất kỳ công ty nào, dù của Mỹ, Trung Quốc hay quốc gia khác, đều có thể tạo ra một tác nhân tương tự, miễn là sử dụng đúng các thành phần có sẵn và có đủ tinh thần chấp nhận rủi ro.
May mắn là hiện tại chưa có dấu hiệu nào cho thấy Manus đã gây ra thiệt hại nghiêm trọng. Nhưng đảm bảo an toàn giờ đây không thể chỉ là việc các phòng thí nghiệm lớn thực hiện thử nghiệm quy mô lớn trước khi ra mắt. Thay vào đó, các cơ quan quản lý và công ty sẽ cần theo dõi sát sao những hệ thống đang được sử dụng thực tế, phản ứng nhanh chóng với bất kỳ thiệt hại nào được phát hiện và, nếu cần, rút các hệ thống hoạt động sai lệch ra khỏi thị trường. Dù thích hay không, Manus cho thấy rằng tương lai của phát triển AI sẽ diễn ra công khai. ■
With Manus, AI experimentation has burst into the open
The old ways of ensuring safety are becoming increasingly irrelevant
Illustration: Rose Wong
Mar 13th 2025
Watching the automatic hand of the Manus AI agent scroll through a dozen browser windows is unsettling. Give it a task that can be accomplished online, such as building up a promotional network of social-media accounts, researching and writing a strategy document, or booking tickets and hotels for a conference, and Manus will write a detailed plan, spin up a version of itself to browse the web, and give it its best shot.
Manus ai is a system built on top of existing models that can interact with the internet and perform a sequence of tasks without deferring to a human user for permission. Its makers, who are based in China, claim to have built the world’s first general AI agent that “turns your thoughts into actions”. Yet ai labs around the world have already been experimenting with this “agentic” approach in private. What makes Manus notable is not that it exists, but that it has been fully unleashed by its creators. A new age of experimentation is here, and it is happening not within labs, but out in the real world.
Spend more time using Manus and it becomes clear that it still has a lot further to go to become consistently useful. Confusing answers, frustrating delays and never-ending loops make the experience disappointing. In releasing it, its makers have obviously prized a job done first over a job done well.
This is in contrast to the approach of the big American labs. Partly because of concerns about the safety of their innovations, they have kept them under wraps, poking and prodding them until they hit a decent version 1.0. OpenAI waited nine months before fully releasing gpt-2 in 2019. Google’s Lamda chatbot was functioning internally in 2020, but the company sat on it for more than two years before releasing it as Bard.
Big labs have been cautious about agentic ai, too, and for good reason. Granting an agent the freedom to come up with its own ways of solving a problem, rather than relying on prompts from a human at every step, may also increase its potential to do harm. Anthropic and Google have demonstrated “computer use” features, for instance, yet neither has released them widely. And in assorted tests and developer previews, these systems are as limited by policy as technology, handing control back to the user at regular intervals or whenever a complex task needs to be finalised.
The existence of Manus makes this cautious approach harder to sustain, however. As the previously wide gap between big AI labs and upstarts narrows, the giants no longer have the luxury of taking their time. And that also means their approach to safety is no longer workable.
To some American observers, fixated on the idea that China might be stealing a march on the West, the fact that Manus is Chinese is especially threatening. But Manus’s success is nowhere near the scale of that of DeepSeek, a Chinese firm that stunned the world with its cheap AI model. Any company, be it American, Chinese or otherwise, could produce a similar agent, provided it used the right off-the-shelf components and had a large enough appetite for risk.
Fortunately, there is little sign yet that Manus has done anything dangerous. But safety can no longer be just a matter of big labs conducting large-scale testing before release. Instead, regulators and companies will need to monitor what is already used in the wild, rapidly respond to any harms they spot and, if necessary, pull misbehaving systems out of action entirely. Whether you like it or not, Manus shows that the future of ai development will play out in the open. ■
Manus, một agent AI đa năng mới ra mắt từ công ty khởi nghiệp Butterfly Effect ở Vũ Hán (Trung Quốc) đang thu hút sự chú ý toàn cầu, với những nhân vật có ảnh hưởng như Jack Dorsey và Victor Mustar khen ngợi hiệu suất của nó.
Manus tuyên bố là agent AI đa năng đầu tiên trên thế giới, sử dụng nhiều mô hình AI (như Claude 3.5 Sonnet và phiên bản tinh chỉnh của Qwen) cùng các agent hoạt động độc lập để thực hiện tự động nhiều loại nhiệm vụ.
Hiện tại chưa đến 1% người dùng trong danh sách chờ nhận được mã mời sử dụng Manus, trong khi kênh Discord của nó có hơn 186.000 thành viên.
MIT Technology Review đã thử nghiệm Manus và nhận thấy việc sử dụng nó giống như làm việc với một thực tập sinh thông minh và hiệu quả: đôi khi thiếu hiểu biết về yêu cầu, đưa ra giả định không chính xác hoặc cắt giảm công việc.
Manus có giao diện tiếng Anh mặc định với thiết kế tối giản. Điểm khác biệt là cửa sổ "Manus's Computer" cho phép người dùng không chỉ quan sát mà còn can thiệp vào quá trình làm việc của agent.
Trong bài kiểm tra lập danh sách nhà báo công nghệ Trung Quốc, Manus ban đầu chỉ đưa ra 5 tên, nhưng sau khi được yêu cầu kỹ lưỡng hơn, nó cung cấp danh sách toàn diện 30 nhà báo với thông tin chi tiết.
Khi tìm kiếm căn hộ tại New York, Manus có thể xử lý các yêu cầu phức tạp và đưa ra kết quả được tổ chức tốt với các danh mục như "tốt nhất tổng thể", "giá trị tốt nhất", và "lựa chọn cao cấp".
Nhiệm vụ đề cử 50 người cho danh sách Innovators Under 35 gặp khó khăn do quy mô lớn, với Manus chỉ có thể cung cấp 3 hồ sơ đầy đủ sau 3 giờ tìm kiếm.
Manus thường gặp sự cố và mất ổn định hệ thống, với thông báo quá tải dịch vụ xuất hiện nhiều lần, đôi khi Manus's Computer bị đóng băng trong thời gian dài.
Chi phí mỗi nhiệm vụ của Manus khoảng 2 USD, chỉ bằng 1/10 chi phí của ChatGPT DeepResearch, khiến nó có tiềm năng trở thành lựa chọn hàng đầu cho người dùng cá nhân nếu cải thiện được cơ sở hạ tầng máy chủ.
📌 Manus từ Trung Quốc cho thấy doanh nghiệp AI nước này không chỉ đi theo mô hình phương Tây mà đang định hình cách áp dụng agent AI tự chủ theo cách riêng. Với chi phí chỉ 2 USD/nhiệm vụ (1/10 so với DeepResearch), đây là công cụ đầy hứa hẹn dù vẫn cần khắc phục vấn đề ổn định hệ thống.
https://www.technologyreview.com/2025/03/11/1113133/manus-ai-review/
#MIT
AI agent đang nhanh chóng trở thành động lực mới đằng sau các microservice tạo nên hạ tầng của hệ thống doanh nghiệp.
Khi các agent này phát triển mạnh, bộ phận công nghệ thông tin (IT) sẽ trở thành "phòng nhân sự" ảo, có nhiệm vụ mua sắm, đào tạo và hướng dẫn các trợ lý AI tương tự như vai trò của HR trong quản lý nhân lực.
Tại hội thảo Mobile World Congress gần đây, một panel do Deloitte tổ chức đã thảo luận về vai trò mới nổi của AI agent trong doanh nghiệp.
Bryan Thompson, phó chủ tịch quản lý sản phẩm GreenLake tại HPE, cho biết AI agent là bước tiếp theo trong việc chia nhỏ và giải quyết vấn đề, tương tự cách tiếp cận microservice.
Fred Devoir từ Nvidia đồng ý rằng AI agent cho phép kết nối các quy trình làm việc của doanh nghiệp thông qua kiến trúc RESTful.
Abdi Goodarzi của Deloitte nhấn mạnh sự khác biệt của AI agent so với các công nghệ trước đây: "Cho đến nay, chúng ta chưa từng có công nghệ nào có thể tự động tạo ý tưởng hoặc thực thi độc lập".
Theo Devoir, quản lý vốn AI agent và quản lý vốn nhân lực là tương tự nhau, nhưng thay vì HR quản lý con người, bây giờ IT đóng vai trò như HR cho tất cả các agent.
Goodarzi chỉ ra rằng con người có cảm xúc, trong khi agent thì không, đòi hỏi phải có sự thay đổi trong văn hóa tổ chức, chiến lược nhân tài và cách con người làm việc với máy móc.
Các thách thức để xây dựng doanh nghiệp dựa trên AI agent bao gồm vấn đề dữ liệu phân tán trong các hệ thống khác nhau, tính đáng tin cậy của agent, và việc xây dựng lòng tin.
AI agent có thể giúp giải quyết vấn đề dữ liệu phân tán bằng cách triển khai agent tại nơi dữ liệu được lưu trữ thay vì phải mang dữ liệu đến AI.
Goodarzi dự đoán rằng 2025 sẽ là năm mà công nghệ AI agent bùng nổ trong các hệ thống sản xuất doanh nghiệp.
📌 Bộ phận IT đang chuyển mình thành "HR của thời đại AI" khi quản lý hàng nghìn AI agent trong doanh nghiệp. Thách thức lớn nhất không chỉ là kỹ thuật mà còn về xây dựng lòng tin với công nghệ xác suất này, nhưng 2025 được dự đoán là năm AI agent sẽ thực sự cất cánh.
https://www.zdnet.com/article/as-ai-agents-multiply-it-becomes-the-new-hr-department/
OpenAI vừa ra mắt bộ công cụ đầu tiên giúp các nhà phát triển và doanh nghiệp xây dựng agent AI - hệ thống có thể độc lập hoàn thành nhiệm vụ thay người dùng.
Responses API mới kết hợp tính đơn giản của Chat Completions API với khả năng sử dụng công cụ của Assistants API, tạo nền tảng linh hoạt hơn cho các ứng dụng agent.
3 công cụ tích hợp chính: tìm kiếm web (web search) cung cấp thông tin cập nhật với trích dẫn rõ ràng; tìm kiếm tệp (file search) truy xuất thông tin từ nhiều tài liệu; và sử dụng máy tính (computer use) tự động hóa các tác vụ trên máy tính.
SDK Agents nguồn mở mới đơn giản hóa việc điều phối quy trình làm việc đa tác nhân với các cải tiến như cấu hình LLM dễ dàng, chuyển giao thông minh giữa các agent và công cụ bảo vệ có thể cấu hình.
Công cụ tìm kiếm web trong API đạt điểm 90% và 88% trên SimpleQA (đánh giá độ chính xác của LLM trong việc trả lời câu hỏi thực tế) với GPT-4o search preview và GPT-4o mini search preview.
Computer use tool sử dụng mô hình Computer-Using Agent (CUA) đạt kỷ lục với tỷ lệ thành công 38,1% trên OSWorld cho các tác vụ sử dụng máy tính đầy đủ, 58,1% trên WebArena và 87% trên WebVoyager cho tương tác web.
Tìm kiếm tệp có giá 2,50 USD/nghìn truy vấn và lưu trữ tệp 0,10 USD/GB/ngày (miễn phí 1 GB đầu tiên). Computer use có giá 3 USD/1 triệu token đầu vào và 12 USD/1 triệu token đầu ra.
Nhiều công ty đã áp dụng các công cụ này: Hebbia sử dụng tìm kiếm web để giúp các nhà quản lý tài sản trích xuất thông tin; Navan tích hợp tìm kiếm tệp vào đại lý du lịch AI; Unify và Luminai sử dụng công cụ máy tính để tự động hóa quy trình.
OpenAI đã thực hiện đánh giá an toàn và red teaming để giải quyết rủi ro liên quan đến lạm dụng, lỗi mô hình và rủi ro tiên phong khi mở rộng khả năng CUA.
OpenAI cam kết tiếp tục phát triển SDK Agents như một framework nguồn mở để cộng đồng có thể mở rộng phương pháp tiếp cận của họ.
📌 OpenAI đang cách mạng hóa phát triển agent AI với Responses API và SDK Agents. Các công cụ tích hợp như tìm kiếm web (90% chính xác), tìm kiếm tệp và sử dụng máy tính (87% thành công trên WebVoyager) giúp xây dựng agent AI chỉ trong vài dòng code.
https://openai.com/index/new-tools-for-building-agents/
85% doanh nghiệp toàn cầu đã sử dụng AI tạo sinh, nhưng gặp khó khăn trong việc mở rộng quy mô do thiếu độ chính xác, quản trị và kiểm soát rủi ro.
Databricks giới thiệu nhiều công cụ mới để giúp doanh nghiệp triển khai AI agent một cách tự tin:
Mosaic AI Gateway: Quản lý tập trung các mô hình AI nguồn mở và thương mại
Bộ API Genie Conversation: Tích hợp chatbot vào các ứng dụng và công cụ năng suất
Ứng dụng Agent Evaluation Review nâng cấp: Đơn giản hóa quy trình đánh giá và phản hồi của chuyên gia
Suy luận hàng loạt không cần cấp phép: Chạy suy luận hàng loạt chỉ bằng truy vấn SQL
Mở rộng AI Gateway để hỗ trợ bất kỳ endpoint LLM nào, cho phép quản lý thống nhất các mô hình
API Genie Conversation cho phép truy vấn thông tin bằng ngôn ngữ tự nhiên từ nhiều nền tảng khác nhau
Cập nhật ứng dụng Agent Evaluation Review giúp thu thập phản hồi có cấu trúc dễ dàng hơn
Hỗ trợ suy luận hàng loạt không cần cấu hình cơ sở hạ tầng, chỉ cần viết truy vấn SQL đơn giản
Altana đã ứng dụng thành công suy luận hàng loạt với AI Functions, cải thiện đáng kể tốc độ phát triển
Databricks sẽ tiếp tục giới thiệu thêm nhiều tính năng mới trong "Tuần lễ Agent" để giúp doanh nghiệp triển khai AI agent ở quy mô lớn một cách tự tin
📌 Databricks giới thiệu 4 công cụ mới giúp doanh nghiệp triển khai AI agent ở quy mô lớn: quản lý tập trung mô hình, tích hợp chatbot, đánh giá agent và suy luận hàng loạt. Các giải pháp này giải quyết thách thức về độ chính xác, quản trị và rủi ro, tăng cường niềm tin khi triển khai AI trong các ứng dụng quan trọng.
https://www.databricks.com/blog/unlocking-potential-ai-agents-pilots-production-success
Salesforce cũng vừa giới thiệu AgentExchange - thị trường mới cho các agent AI trong phần mềm doanh nghiệp. Dịch vụ này ra mắt với hơn 200 đối tác bao gồm Google Cloud, DocuSign, Box và Workday, cung cấp các giải pháp agent đóng gói sẵn cho doanh nghiệp mà không cần chuyên môn kỹ thuật cao.
Lừa đảo PayPal mới đang sử dụng API của Docusign để tăng độ tin cậy cho email lừa đảo. Kẻ gian thiết lập tài khoản Docusign và sử dụng mẫu có sẵn để gửi hóa đơn PayPal trông hợp pháp. Người nhận được thông báo về giao dịch trái phép và được yêu cầu liên hệ theo số điện thoại cung cấp để bảo mật tài khoản và xử lý hoàn tiền.
Theo nghiên cứu của Viện công nghệ Massachusetts, 80% công ty đang giám sát nhân viên làm việc từ xa hoặc kết hợp, với 74% sử dụng phần mềm ghi lại hoạt động duyệt web và 62% theo dõi hoạt động màn hình. Sự gia tăng giám sát này liên quan đến căng thẳng cao hơn của nhân viên, giảm sự hài lòng trong công việc và có thể làm giảm năng suất.
Reddit đang trở thành nền tảng tối ưu cho doanh nghiệp vừa và nhỏ để cải thiện nỗ lực tối ưu hóa công cụ tìm kiếm (SEO), tương tác với cộng đồng địa phương và xây dựng niềm tin thương hiệu. Nội dung Reddit thường xuất hiện nổi bật trong kết quả tìm kiếm Google.
Các biện pháp bảo mật máy tính cần thiết bao gồm kích hoạt bảo vệ chống vi-rút tích hợp, sử dụng bộ bảo mật của bên thứ ba như Avast One, thực hiện các biện pháp bảo mật toàn diện và cập nhật phần mềm thường xuyên.
📌 Năm 2025 đánh dấu sự phát triển mạnh mẽ của agent AI trong dịch vụ khách hàng với Meta và Salesforce dẫn đầu. Trong khi đó, lừa đảo qua Docusign, giám sát nhân viên (80% công ty áp dụng) và cơ hội SEO từ Reddit đang là những xu hướng công nghệ quan trọng mà doanh nghiệp cần chú ý.
https://www.forbes.com/sites/quickerbettertech/2025/03/09/business-tech-news-meta-and-salesforce-introduce-ai-agents-for-small-businesses/
Manus là agent AI tự chủ đầu tiên của Trung Quốc, được thiết kế để xử lý các tác vụ phức tạp một cách độc lập, vượt xa khả năng chỉ đưa ra ý tưởng mà còn thực hiện hành động cụ thể.
Agent này đã tạo được sự quan tâm đáng kể trong cộng đồng AI, hiện chỉ có thể truy cập thông qua lời mời độc quyền, cho thấy tiềm năng của Trung Quốc trong việc định hình tương lai của trí tuệ nhân tạo.
Manus được thiết kế để kết nối liền mạch giữa tư duy và hành động, chuyển ý tưởng thành kết quả cụ thể trong nhiều lĩnh vực như lập kế hoạch du lịch, phân tích cổ phiếu và tạo tài liệu giáo dục.
Trong lĩnh vực lập kế hoạch du lịch, Manus tích hợp nhiều thông tin để tạo ra lịch trình cá nhân hóa, thậm chí còn thiết kế sổ tay du lịch tùy chỉnh theo nhu cầu cụ thể.
Khi phân tích cổ phiếu, Manus đi sâu vào dữ liệu tài chính, như của Tesla, cung cấp hình ảnh trực quan và đề xuất hành động thiết thực.
Agent này cũng xuất sắc trong việc tạo công cụ giáo dục, như trình bày video và tài liệu giáo dục giải thích các khái niệm phức tạp cho giáo viên trung học.
Manus còn hiệu quả trong việc tìm nguồn cung ứng B2B, thực hiện nghiên cứu kỹ lưỡng để xác định và đề xuất các nhà cung cấp tốt nhất, giúp doanh nghiệp tối ưu hóa hoạt động.
Điểm nổi bật của Manus là hiệu suất vượt trội trong tiêu chuẩn GAIA, một bài kiểm tra dành cho các trợ lý AI tổng quát, vượt qua cả Deep Research của OpenAI.
Manus đã đạt được hiệu suất tiên tiến nhất (SOTA) trên cả 3 cấp độ khó khăn của bài kiểm tra GAIA, chứng minh tiềm năng đáng kinh ngạc của nó.
Ji Yichao, doanh nhân Trung Quốc và là người đứng sau Manus, mô tả sản phẩm này là "agent thực sự tự chủ kết nối khoảng cách giữa ý tưởng và thực thi".
Video demo về Manus đã thu hút hơn 200.000 lượt xem trên nền tảng X chỉ trong một ngày, thể hiện sự quan tâm ngày càng tăng của cộng đồng.
Hiện tại, Manus hoạt động theo hệ thống chỉ mời, nhưng dự kiến sẽ sớm được cung cấp cho công chúng và có tiềm năng trở thành yếu tố thay đổi cuộc chơi cho doanh nghiệp, nhà giáo dục và cá nhân.
📌 Manus - agent AI tự chủ toàn diện đầu tiên của Trung Quốc do Ji Yichao phát triển, đạt hiệu suất SOTA trên tiêu chuẩn GAIA, vượt trội hơn Deep Research của OpenAI. Video demo đã thu hút 200.000 lượt xem trong một ngày, hứa hẹn sẽ mở rộng từ hệ thống mời sang sử dụng miễn phí trong tương lai.
https://indiandefencereview.com/manus-china-autonomous-ai-agent/
Manus là AI agent mới từ Trung Quốc được thiết kế để cách mạng hóa năng suất làm việc trong kỷ nguyên số hiện nay, nơi các trợ lý AI thông thường và quy trình làm việc thủ công không theo kịp khối lượng và độ phức tạp của công việc.
Điểm khác biệt của Manus là khả năng kết hợp nghiên cứu sâu với khả năng tự chủ điều khiển các công cụ kỹ thuật số, vượt xa các trợ lý thông thường.
Manus được phát triển để tư duy sâu, thực hiện các tác vụ phức tạp trên máy tính và duy trì bộ nhớ cá nhân hóa về tương tác với người dùng.
Công nghệ cốt lõi của Manus là sự kết hợp giữa mô hình ngôn ngữ lớn với xử lý đa phương thức và tích hợp công cụ mạnh mẽ, cho phép nó tự thực hiện nhiều nhiệm vụ từ trực quan hóa dữ liệu đến tạo nội dung.
Hệ thống học tập thích ứng của Manus cho phép tinh chỉnh phản hồi dựa trên tương tác người dùng, đảm bảo AI trở nên hiệu quả hơn theo thời gian.
Manus có thể tương tác trực tiếp với trình duyệt web, trình soạn thảo mã và hệ thống cơ sở dữ liệu, khác với các trợ lý AI khác chỉ đưa ra lời khuyên.
Các tính năng chính của Manus bao gồm: kiểm soát trình duyệt nâng cao có thể xử lý CAPTCHA, khả năng tạo và chỉnh sửa tệp, triển khai website hoàn chỉnh từ các lệnh, và nghiên cứu sâu với báo cáo được tổ chức tốt.
Manus có thể biến ý tưởng thành hành động cụ thể như phát triển lịch trình du lịch toàn diện, phân tích dữ liệu tài chính phức tạp, hoặc tạo báo cáo chi tiết.
Các ví dụ thực tế về khả năng của Manus bao gồm tạo website tương tác dựa trên thông tin dữ liệu và phân tích cổ phiếu.
Sự kết hợp giữa chiều sâu nhận thức và khả năng vận hành của Manus dẫn đến năng suất cao hơn, giảm khối lượng công việc thủ công và quy trình ra quyết định chính xác hơn.
📌 Manus là AI agent đột phá từ Trung Quốc kết hợp khả năng nghiên cứu sâu, điều khiển máy tính và trí nhớ cá nhân hóa. Với công nghệ tiên tiến, nó có thể tự động hóa các nhiệm vụ phức tạp từ phân tích cổ phiếu đến tạo website hoàn chỉnh, mang lại hiệu quả công việc vượt trội so với các trợ lý AI thông thường.
https://www.marktechpost.com/2025/03/08/meet-manus-a-new-ai-agent-from-china-with-deep-research-operator-computer-use-lovable-memory/
Answer from Perplexity: pplx.ai/share
Chris Cox, Giám đốc sản phẩm của Meta, tiết lộ rằng phần mềm AI nguồn mở Llama 4 sắp ra mắt sẽ có khả năng lập luận và tạo ra các tác nhân AI có thể sử dụng trình duyệt web và các công cụ khác.
Các tác nhân AI được định nghĩa bởi khả năng thực hiện các tác vụ nhiều bước thay vì chỉ tạo ra phản hồi cho các lệnh nhắc bằng văn bản.
Cox mô tả cách các mô hình AI tiên tiến hơn có thể được sử dụng để hỗ trợ các tác nhân AI hoàn thành các tác vụ kinh doanh cụ thể, như tự động lưu trữ hóa đơn.
Clara Shih, người đứng đầu bộ phận AI kinh doanh của Meta, cho biết công ty tin rằng ngày càng nhiều doanh nghiệp sẽ sử dụng các tác nhân AI để tự động hóa các tác vụ phức tạp.
Meta đã có mối quan hệ tin cậy với 200 triệu doanh nghiệp nhỏ trên toàn cầu. Trong tương lai gần, mỗi doanh nghiệp sẽ có AI đại diện để tự động hóa các tác vụ lặp đi lặp lại, nói bằng giọng nói của họ, tìm kiếm khách hàng và cung cấp dịch vụ vận chuyển 24/7.
Meta sẽ tổ chức hội nghị AI LlamaCon đầu tiên vào ngày 29 tháng 4.
CNBC đưa tin Meta sẽ ra mắt ứng dụng Meta AI độc lập trong quý 2.
📌 Meta đang đặt cược lớn vào AI với Llama 4, nhắm đến thị trường 200 triệu doanh nghiệp nhỏ. Phần mềm này hứa hẹn mang lại khả năng lập luận và tạo ra các tác nhân AI thông minh, có thể tự động hóa nhiều tác vụ phức tạp cho doanh nghiệp.
https://www.cnbc.com/2025/03/05/meta-product-chief-says-llama-4-will-power-ai-agents.html
AI đang định hình lại quá trình thiết kế và sản xuất sản phẩm, mang lại lợi ích về tính bền vững mà không loại bỏ lực lượng lao động.
Tại hội nghị 3DEXPERIENCE WORLD của Dassault Systèmes, các công ty trưng bày robot tự hành như Spot của Boston Dynamics, máy nướng burger AI của Aniai và máy làm kem nhanh của ColdSnap.
Gian Paolo Bassi, SVP của 3DEXPERIENCE Works, và Shrikant Savant, Giám đốc Phân tích Dữ liệu và Khoa học của SOLIDWORKS, nhấn mạnh AI sẽ là người bạn đồng hành số hóa của kỹ sư, giúp cải thiện hiệu quả và độ chính xác.
AI có khả năng tạo ra một lớp nhân viên tri thức mới trong các ngành, nhưng cần nỗ lực nâng cao kỹ năng và thích ứng.
Mặc dù việc đào tạo AI tiêu tốn nhiều năng lượng, nhưng nó giúp thúc đẩy các sáng kiến bền vững bằng cách cải thiện quản lý vòng đời sản phẩm, tối ưu hóa tài nguyên và giảm lãng phí.
Savant thách thức nhu cầu về các mô hình đa năng lớn như GPT, ủng hộ các giải pháp AI nhỏ hơn và tập trung vào quy trình làm việc cụ thể.
Các chuyên gia tin rằng tác động lâu dài của AI đối với môi trường sẽ là tích cực.
AI không hoàn hảo và cần con người xác thực các kết quả để đảm bảo độ chính xác.
Sự phát triển nhanh chóng của AI đặt ra nhu cầu về quy định và luật pháp phù hợp.
Tương lai đòi hỏi cả nhân viên và người sử dụng lao động chuẩn bị cho sự thay đổi, đầu tư vào việc nâng cao kỹ năng để duy trì khả năng cạnh tranh.
📌 AI đang định hình lại các ngành công nghiệp, không chỉ tự động hóa mà còn tạo ra cơ hội việc làm mới. Mặc dù tiêu tốn nhiều năng lượng, AI hỗ trợ tính bền vững và hiệu quả. Tương lai đòi hỏi sự chuẩn bị và nâng cao kỹ năng từ cả doanh nghiệp và người lao động để thích ứng với kỷ nguyên AI.
https://www.techradar.com/pro/ai-is-more-than-just-automation-its-reshaping-industries
Một nhóm nghiên cứu Trung Quốc đã giới thiệu AI agent mới có tên Manus vào ngày 06/03/2025.
Manus tuyên bố vượt trội các mô hình của OpenAI trong bài kiểm tra GAIA ở cả 3 cấp độ khó.
Khác với các mô hình AI thông thường, Manus hoạt động độc lập và có thể thực hiện nhiều tác vụ khác nhau.
Manus có khả năng hoạt động bất đồng bộ trên nền tảng đám mây, cho phép người dùng tắt thiết bị trong khi AI tiếp tục làm việc.
AI này có thể tự thích nghi và học hỏi theo thời gian dựa trên sở thích của người dùng.
Trong các bài demo, Manus đã thành công trong việc sàng lọc hồ sơ, nghiên cứu bất động sản và phân tích dữ liệu tài chính.
Manus có thể tự viết mã Python và triển khai website tương tác.
Công ty Manus AI dự định công bố mã nguồn mở cho các mô hình chính trong năm nay.
Sự ra mắt của Manus diễn ra sau khi DeepSeek R1 được giới thiệu đầu năm nay, tuyên bố có thể sánh ngang với GPT của OpenAI.
Cổ phiếu công nghệ Trung Quốc tăng mạnh sau tin tức này:
Chỉ số Hang Seng TECH tăng 4,7%
Alibaba tăng 7,2%
Tencent tăng 5,8%
Baidu tăng 3,8%
JD.com tăng hơn 4%
Xiaomi tăng 1,5%
Alibaba cũng vừa ra mắt một mô hình AI nguồn mở mới, cạnh tranh với DeepSeek.
📌 Trung Quốc đã chính thức gia nhập cuộc đua AI toàn cầu với sự ra mắt của Manus, một AI agent tuyên bố vượt trội OpenAI. Điều này đã tác động mạnh đến thị trường chứng khoán, với chỉ số Hang Seng TECH tăng 4,7% và các cổ phiếu công nghệ lớn như Alibaba, Tencent đều tăng trên 5%.
https://www.investing.com/news/stock-market-news/china-releases-new-ai-agent-manus-claims-to-outperform-openai-models-3910899
Hệ thống mới nhằm nhúng các tác nhân AI có thể dự đoán nhu cầu, giám sát thay đổi dữ liệu và hành động tự chủ trong mọi quy trình kinh doanh.
Salesforce tập trung vào khung đa tác nhân, nơi trợ lý AI cá nhân sẽ tương tác với tác nhân doanh nghiệp để hoàn thành nhiệm vụ.
Công ty giới thiệu bộ công cụ mới nhằm đẩy nhanh việc áp dụng công nghệ tác nhân, bao gồm Agentforce Developer Edition miễn phí, AI hỗ trợ trong Agent Builder và Testing Center.
Salesforce ra mắt AgentExchange, một thị trường với hơn 200 đối tác ban đầu và hàng trăm thành phần tác nhân được xây dựng sẵn.
Agentforce for Health nhằm giảm gánh nặng hành chính cho các nhà cung cấp dịch vụ chăm sóc sức khỏe, tự động hóa việc xác minh quyền lợi, tóm tắt hồ sơ bệnh nhân và đơn giản hóa việc đặt lịch hẹn.
Người áp dụng sớm báo cáo tiết kiệm hàng triệu đô la từ việc triển khai AI. Engine ước tính lợi ích hàng năm gần 1,9 triệu USD, trong khi Precina báo cáo tiết kiệm 80.000 USD mỗi năm cho mỗi 5.000 bệnh nhân.
Việc triển khai đòi hỏi phải dự đoán các điểm lỗi của AI. Salesforce nhấn mạnh tầm quan trọng của việc cung cấp hướng dẫn về những gì cần làm nếu AI không biết phải làm gì.
Vấn đề bảo mật và quyền riêng tư vẫn là ưu tiên hàng đầu, đặc biệt trong các ngành được quản lý như chăm sóc sức khỏe.
Nền tảng Agentforce 2dx sẽ được cung cấp rộng rãi vào tháng 4 năm 2025, với một số tính năng ra mắt sớm hơn, bắt đầu từ hôm nay.
📌 Salesforce ra mắt Agentforce 2dx, cho phép AI hoạt động tự chủ trên các hệ thống doanh nghiệp. Nền tảng này hứa hẹn tự động hóa nhiều quy trình, tiết kiệm hàng triệu đô la cho doanh nghiệp. Tuy nhiên, vấn đề bảo mật và quyền riêng tư vẫn là thách thức lớn cần giải quyết.
https://venturebeat.com/ai/salesforce-launches-agentforce-2dx-pushing-autonomous-ai-deep-into-enterprise-workflows/
AI agent là chìa khóa để mở ra tốc độ tạo giá trị nhanh hơn cho doanh nghiệp.
AI agent không chỉ tăng hiệu quả mà còn giúp mang lại giá trị nhanh hơn khi được triển khai đúng cách.
Khung Discover, Decide, Deliver cung cấp hướng dẫn về cách tích hợp AI agent vào doanh nghiệp.
Lãnh đạo doanh nghiệp cần suy nghĩ theo hướng thay đổi quy trình và tư duy khi áp dụng AI agent.
AI agent sẽ giúp công việc dễ dàng, nhanh chóng và hiệu quả hơn bằng cách xử lý các tác vụ thủ công tẻ nhạt, đẩy nhanh bàn giao giữa các nhóm và tăng tốc đưa sản phẩm ra thị trường.
Khung Discover, Decide, Deliver giúp lãnh đạo cắt giảm sự phức tạp và khai thác giá trị cho doanh nghiệp.
Trong giai đoạn Discover, AI agent có thể phân tích dữ liệu từ nhiều nguồn đa phương thức để tìm ra cơ hội mới nhanh hơn.
Ở giai đoạn Decide, AI agent giúp đưa ra quyết định nhanh hơn, giảm chi phí thử nghiệm và hành động nhanh chóng.
Trong giai đoạn Deliver, AI agent cho phép hợp tác liền mạch giữa các tổ chức, đẩy nhanh quá trình chuyển giao.
AI
Điều chỉnh quy trình AI agent phù hợp với năng lực vận hành
Xác định đầu ra và kết quả lý tưởng
Xác định các điểm cần can thiệp của con người
Thiết lập vòng phản hồi cho AI agent
📌 AI agent là chìa khóa giúp doanh nghiệp tăng tốc tạo giá trị. Khung Discover, Decide, Deliver giúp tích hợp AI agent vào toàn bộ chuỗi giá trị. Lãnh đạo cần thay đổi quy trình và tư duy để khai thác tối đa tiềm năng của AI agent, từ đó đẩy nhanh việc ra quyết định và đổi mới sáng tạo.
https://www.weforum.org/stories/2025/03/ai-agent-business-value/
#WEF
Gartner đã xác định 9 xu hướng hàng đầu về dữ liệu và phân tích (D&A) cho năm 2025:
AI tác nhân: Gartner khuyên các nhà lãnh đạo D&A sử dụng tác nhân để truy cập và chia sẻ dữ liệu của tổ chức và tự động hóa kết quả kinh doanh khép kín.
Mô hình ngôn ngữ nhỏ (SLM): đang được chú trọng hơn vì chúng nhẹ, phù hợp, rẻ hơn và nhanh hơn để đào tạo cho các trường hợp sử dụng cụ thể.
AI tổng hợp (composite AI) Gartner khuyến nghị kết hợp nhiều kỹ thuật AI để tăng hiệu quả công nghệ.
Dữ liệu tổng hợp: được đề xuất để bổ sung thông tin còn thiếu hoặc không đầy đủ, đặc biệt hữu ích cho các dự án AI.
Giải pháp quản lý metadata: được xác định là xu hướng quan trọng, với việc tự động hóa tìm kiếm và phân tích metadata.
Nền tảng trí tuệ quyết định: giúp tổ chức chuyển từ việc chỉ sử dụng dữ liệu sang chiến lược tập trung vào quyết định thông minh hơn.
Sản phẩm dữ liệu có khả năng tiêu thụ cao: có thể tái sử dụng và truy cập bởi các nhóm khác nhau.
Fabric dữ liệu đa phương thức (multimodal data fabric): Gartner khuyên thu thập và phân tích thông tin ở giai đoạn metadata của đường ống dữ liệu.
Chuyển đổi từ sử dụng dữ liệu đơn thuần sang chiến lược tập trung vào quyết định: Gartner cho rằng sự chuyển đổi này là rất quan trọng để thành công.
Gareth Herschel, phó chủ tịch phân tích của Gartner, nhấn mạnh rằng D&A đang trở nên phổ biến và các nhà lãnh đạo D&A phải đối mặt với áp lực làm nhiều hơn với nhiều nguồn lực hơn.
AI chiếm hơn một nửa danh sách xu hướng, với AI tác nhân là xu hướng AI lớn nhất.
📌 Gartner dự đoán 9 xu hướng D&A hàng đầu năm 2025, với AI chiếm ưu thế. AI tác nhân, mô hình ngôn ngữ nhỏ và AI tổng hợp là trọng tâm. Dữ liệu tổng hợp, quản lý metadata và nền tảng trí tuệ quyết định cũng được nhấn mạnh để tối ưu hóa chiến lược dữ liệu và ra quyết định.
https://www.zdnet.com/article/gartners-top-trends-in-data-and-analytics-for-2025-include-ai-agents/
Trợ lý AI tùy chỉnh có thể tiết kiệm thời gian bằng cách lưu trữ các tệp nền và lời nhắc cho các tác vụ lặp đi lặp lại.
Các nền tảng AI tạo sinh như ChatGPT, Claude và Google Gemini cho phép tạo trợ lý tùy chỉnh mà không cần kỹ năng lập trình.
4 lĩnh vực chính để sử dụng trợ lý AI: viết lách/tiếp thị, hướng dẫn/xử lý sự cố, quản lý dự án và tư vấn chiến lược.
Để tạo trợ lý, chọn nền tảng phù hợp, thử nghiệm với lời nhắc, viết hướng dẫn tùy chỉnh và cung cấp tệp kiến thức.
Hướng dẫn tùy chỉnh nên bao gồm mục đích, nhiệm vụ, giọng điệu và KPI cho trợ lý AI.
Cung cấp tệp tham khảo như ví dụ và thông tin bối cảnh để tăng cường hiệu quả của trợ lý.
Cải thiện liên tục trợ lý bằng cách cập nhật hướng dẫn và bổ sung tệp dựa trên phản hồi.
Trợ lý tùy chỉnh cho phép bắt đầu phiên mới mỗi lần sử dụng, tránh giới hạn của các cuộc trò chuyện dài.
Ví dụ về trợ lý AI bao gồm: trợ lý tiếp thị, bảng thông tin chiến lược, hỗ trợ kỹ thuật, tóm tắt nghiên cứu và theo dõi dự án.
Sarah Dopp tạo trợ lý Claude để hướng dẫn lập kế hoạch hàng ngày, xác định và ưu tiên nhiệm vụ.
Ken Romano tạo GPT tùy chỉnh mô phỏng phản hồi từ quản lý để tinh chỉnh lộ trình sản phẩm.
ChatGPT là nền tảng duy nhất cho phép tương tác bằng giọng nói với trợ lý tùy chỉnh.
Claude được đánh giá là nắm bắt phong cách viết tốt nhất nhưng không có kết nối trực tiếp với web.
Gemini có ưu thế trong tích hợp với Google Docs và Gmail để phân tích.
📌 Trợ lý AI tùy chỉnh có thể tiết kiệm hàng giờ làm việc, chỉ mất 20 phút để tạo và không yêu cầu kỹ năng lập trình. Chúng hỗ trợ nhiều lĩnh vực từ viết lách đến tư vấn chiến lược, với khả năng cải thiện liên tục thông qua phản hồi và cập nhật.
https://hbr.org/2025/03/how-to-build-your-own-ai-assistant
#HBR
Tác giả: Alexandra Samuel
Ngày 5 tháng 3, 2025
HBR Staff
Đối với những người thường xuyên sử dụng AI tạo sinh, việc tải lên cùng một tệp dữ liệu nền và nhập lại các câu lệnh lặp đi lặp lại có thể trở nên mệt mỏi. Tuy nhiên, nhiều nền tảng AI tạo sinh cho phép tạo trợ lý AI tùy chỉnh, giúp lưu trữ các yếu tố của câu lệnh mà người dùng thường xuyên sử dụng. Điều này giúp tiết kiệm thời gian bằng cách loại bỏ nhu cầu nhập lại thông tin mỗi lần thực hiện nhiệm vụ tương tự.
AI tạo sinh có thể giúp tiết kiệm thời gian, nhưng khi sử dụng thường xuyên, việc liên tục tải lên cùng một tập tin dữ liệu nền và nhập lại các câu lệnh cho những tác vụ quen thuộc có thể làm giảm hiệu quả. Đó là lý do nhiều nền tảng AI tạo sinh cho phép tạo các trợ lý AI tùy chỉnh: ChatGPT gọi đó là “custom GPT,” Claude gọi là “Project,” còn Google Gemini gọi là “Gem.” Những trợ lý này lưu trữ các yếu tố của câu lệnh mà bạn muốn sử dụng nhiều lần, giúp bạn không cần nhập lại mỗi khi cần AI hỗ trợ các nhiệm vụ lặp lại.
Việc tạo trợ lý có thể giúp xử lý nhiều loại công việc khác nhau mà không cần kiến thức kỹ thuật hay kỹ năng lập trình. Ví dụ, tôi đã tạo một trợ lý AI marketing cho mình, trong đó có các mẫu bản tin, bài viết và bài đăng mạng xã hội trước đây. Tôi sử dụng nó vài lần mỗi tuần để động não ý tưởng nội dung hoặc tách một bản tin thành các đoạn nội dung nhỏ có thể chia sẻ trên LinkedIn. Tôi cũng đã tạo một cố vấn chiến lược, một AI hỗ trợ kỹ thuật, một AI tóm tắt nghiên cứu dựa trên các lĩnh vực học thuật và ứng dụng cụ thể, cũng như một công cụ theo dõi dự án lớn nhất của tôi. Hầu hết các trợ lý này chỉ mất chưa đầy 20 phút để tạo và đã giúp tôi tiết kiệm hàng giờ làm việc.
Là một người viết và diễn giả về môi trường làm việc số, đồng thời đã xây dựng nhiều trang web, tôi có thể khẳng định rằng kỹ năng lập trình hạn chế của mình hoàn toàn không ảnh hưởng gì đến việc tạo các trợ lý AI tùy chỉnh. Sau 2 năm tạo nhiều mô hình và trợ lý AI tùy chỉnh khác nhau, cũng như giúp nhiều người tạo và tối ưu hóa trợ lý của họ, tôi nhận ra rằng nếu bạn có thể mô tả một dự án bằng ngôn ngữ đơn giản hoặc viết một mô tả công việc, bạn đủ khả năng để tạo một trợ lý AI tùy chỉnh hữu ích.
Hãy cùng xem xét những công việc mà trợ lý AI có thể giúp thực hiện, cũng như cách xây dựng và sử dụng chúng.
Có rất nhiều cách sử dụng trợ lý AI tùy chỉnh (bạn có thể tìm thấy hàng loạt custom GPT được chia sẻ trực tuyến), nhưng dưới đây là 4 lĩnh vực chính mà chúng có thể hỗ trợ hiệu quả nhất:
Trợ lý AI có thể hỗ trợ viết và tạo nội dung, từ soạn bài đăng mạng xã hội, viết báo cáo, xây dựng bài thuyết trình cho đến xử lý khiếu nại của khách hàng. Sử dụng trợ lý AI thay vì các câu lệnh đơn lẻ giúp bạn cung cấp trước hướng dẫn và ví dụ để AI tham khảo, tránh việc phải tìm lại tài liệu mỗi lần cần viết hoặc chỉnh sửa nội dung.
Cung cấp thông tin về hệ thống công nghệ của bạn cho trợ lý AI, và bạn sẽ có ngay câu trả lời cá nhân hóa mỗi khi gặp sự cố. Tương tự, bạn có thể tạo trợ lý hỗ trợ tài chính hoặc thuế, phân tích dữ liệu, hướng dẫn sử dụng ô tô, cố vấn sửa chữa thiết bị, v.v. (Tuy nhiên, hãy luôn kiểm chứng thông tin vì AI tạo sinh vẫn có thể đưa ra câu trả lời sai lệch.) Cách này cũng giúp cải thiện dịch vụ khách hàng: Roberta, một chuyên viên phân tích khách hàng, chia sẻ trên Instagram của HBR rằng cô sử dụng trợ lý AI để tự động hóa các câu hỏi thường gặp, từ đó có thể tập trung vào các vấn đề phức tạp hơn và phản hồi khách hàng nhanh hơn.
Trợ lý AI tùy chỉnh có thể sắp xếp và ưu tiên công việc, trích xuất hành động cần thực hiện từ biên bản họp và xây dựng cũng như cập nhật tiến độ dự án. Ví dụ, doanh nhân Sarah Dopp đã tạo một Claude Project mà cô sử dụng mỗi sáng để hướng dẫn bản thân qua loạt câu hỏi lập kế hoạch trong ngày, giúp cô xác định ưu tiên và mục tiêu học tập. Với sự phát triển của các "agent" – hệ thống AI có thể tương tác với phần mềm và trang web, trợ lý AI chat cũng sẽ sớm có thể kết nối trực tiếp với ứng dụng ghi chú, lịch điện tử, danh sách việc cần làm và các công cụ năng suất khác.
Bạn có thể tạo một cố vấn chuyên môn theo yêu cầu, với phong cách giao tiếp tùy chỉnh – từ nghiêm khắc đến khích lệ. (Nhưng cũng cần lưu ý khả năng AI đưa ra thông tin sai.) Ken Romano, một phó chủ tịch công nghệ, đã tạo một custom GPT mô phỏng phản hồi mà anh thường nhận từ quản lý của mình, giúp anh tinh chỉnh lộ trình sản phẩm trước khi trình bày với ban giám đốc.
Để bắt đầu, bạn có thể tạo một trợ lý AI đa năng cho mỗi lĩnh vực trên. Khi sử dụng, có thể bạn sẽ nhận thấy rằng hiệu quả hơn khi tạo nhiều trợ lý với phạm vi hẹp hơn, ví dụ: một trợ lý chuyên viết email tiếp cận khách hàng và một trợ lý khác chuyên xây dựng bài thuyết trình.
Lựa chọn nền tảng có thể phụ thuộc vào các công cụ AI mà tổ chức bạn cung cấp hoặc cho phép sử dụng. Nếu bạn có quyền tự chọn, hãy cân nhắc nhu cầu của mình:
Hãy bắt đầu với một cuộc trò chuyện bình thường và đưa ra câu lệnh kèm theo thông tin nền hoặc hướng dẫn cá nhân hóa. Cung cấp phản hồi chi tiết để cải thiện kết quả. Khi đạt kết quả mong muốn, hãy tổng hợp câu lệnh và phản hồi thành bộ hướng dẫn tùy chỉnh cho trợ lý.
Bộ hướng dẫn này sẽ xác định trợ lý AI là ai, nhiệm vụ của nó, cách nó hoạt động và giọng điệu câu trả lời. Hãy viết ở ngôi thứ hai ("bạn sẽ làm điều này") và mô tả chi tiết vai trò của trợ lý.
Tăng cường khả năng của trợ lý AI bằng cách tải lên các tệp tham chiếu, ví dụ: tài liệu kỹ thuật, sơ đồ, hướng dẫn sử dụng.
Trợ lý AI sẽ không hoàn hảo ngay từ đầu, vì vậy hãy liên tục điều chỉnh câu lệnh, cập nhật hướng dẫn và cung cấp thêm tài liệu để cải thiện kết quả. Khi có một trợ lý AI hiệu quả, bạn sẽ dành ít thời gian hơn để điều chỉnh câu lệnh và nhiều thời gian hơn để tập trung vào công việc chính của mình.
AI agent là hệ thống tự động có khả năng xử lý thông tin, đưa ra quyết định và thực hiện hành động dựa trên dữ liệu đầu vào, khác với workflow đơn giản, AI agent có thể thích ứng với thông tin thay đổi và sử dụng công cụ bên ngoài để đạt mục tiêu.
Anthropic, công ty tạo ra Claude, đã phát hành playbook xây dựng AI agent hiệu quả dựa trên kinh nghiệm từ hàng chục đội ngũ thành công. https://www.anthropic.com/research/building-effective-agents
Chọn cách tiếp cận phù hợp: workflow phù hợp cho nhiệm vụ được xác định rõ ràng, trong khi agent phù hợp khi cần tính linh hoạt và ra quyết định dựa trên mô hình.
"Prompt chaining" (liên kết nhắc) giúp chia nhỏ công việc thành các bước rõ ràng, mỗi bước xây dựng trên bước trước đó, tạo hiệu quả cao hơn.
Phân chia công việc giữa nhiều agent khác nhau tốt hơn là để một agent làm mọi thứ, giúp mỗi agent chuyên biệt trong lĩnh vực riêng.
Sử dụng "orchestrator" (người điều phối) để quản lý nhiệm vụ lớn, phân chia công việc và tổng hợp kết quả, hoạt động như một quản lý dự án.
Kiểm thử kỹ lưỡng trong môi trường sandbox là thiết yếu trước khi triển khai agent vào công việc thực tế, các đội hiệu quả dành nhiều thời gian tối ưu hóa công cụ hơn là tối ưu prompt tổng thể.
Cung cấp đúng công cụ cho agent là yếu tố quyết định hiệu quả, tạo hướng dẫn rõ ràng như đang viết cho thành viên mới trong nhóm.
Sử dụng "evaluator-optimizer workflow" (quy trình đánh giá-tối ưu) với một agent sáng tạo và một agent đánh giá, tạo vòng phản hồi để cải thiện chất lượng.
Kiểm soát chi phí bằng cách thiết lập điểm dừng rõ ràng và giới hạn ngân sách cho agent, tránh tình trạng tiêu tốn tài nguyên quá mức.
Cách tiếp cận hiệu quả là bắt đầu với một nhiệm vụ, chia nhỏ thành các bước rõ ràng, xây dựng agent cho từng microtask, kiểm thử kỹ lưỡng và phát triển từ đó.
📌 Các đội thành công với AI agent tuân theo playbook của Anthropic: chọn cấu trúc phù hợp, liên kết nhiệm vụ, phân chia công việc thông minh, sử dụng orchestrator cho công việc phức tạp, và kiểm thử kỹ lưỡng để đạt kết quả thực tế.
https://www.forbes.com/sites/jodiecook/2025/02/27/how-to-build-ai-agents-that-actually-work-anthropics-rules-revealed/
Unitree Robotics, công ty công nghệ có trụ sở tại Hàng Châu (Trung Quốc), vừa công bố quyết định mở nguồn mã cho thuật toán tiên tiến và thiết kế phần cứng của robot G1, hành động tương tự như cách DeepSeek đã mở nguồn mã các mô hình AI của mình.
Robot G1 đã có sự tiến bộ đáng kinh ngạc, từ những động tác khiêu vũ cứng nhắc đến các đòn võ xoay người nhanh như chớp chỉ trong vòng một tháng. Sau màn ra mắt vụng về tại Gala Lễ hội Mùa xuân Trung Quốc, robot này đã thể hiện các kỹ thuật võ thuật trong demo mới nhất được phát hành vào thứ Tư.
G1 được trang bị 43 khớp nối và có khả năng học bắt chước, cho phép nó thực hiện đòn đá xoay người một cách mềm mại đến mức được so sánh với phim "Mãnh Long Quá Giang" của Lý Tiểu Long.
Robot này có giá 99.000 nhân dân tệ (khoảng 13.622 USD), thể hiện sự cạnh tranh trực tiếp với Boston Dynamics, công ty robot nổi tiếng của Mỹ.
Unitree đã đăng tải bộ dữ liệu, mã đào tạo học tăng cường và thông số kỹ thuật phần cứng cho cả mô hình H1 và G1 lên GitHub, nền tảng thường được sử dụng cho các dự án phát triển nguồn mở.
Công ty đã thách thức cộng đồng trên mạng xã hội bằng câu hỏi: "Bạn muốn xem động tác nào tiếp theo?", cho thấy tham vọng vượt xa các động tác biểu diễn có kịch bản của đối thủ Boston Dynamics.
Quyết định mở nguồn mã này phản ánh chiến lược phát triển AI của Trung Quốc, tạo cơ hội cho cộng đồng toàn cầu đóng góp vào sự phát triển của công nghệ robot nhân hình.
Sự tiến bộ nhanh chóng của G1 từ các động tác vụng về đến những kỹ thuật võ thuật phức tạp chỉ trong vài tuần cho thấy tốc độ phát triển đáng kinh ngạc trong lĩnh vực robot nhân hình tại Trung Quốc.
Việc mở nguồn mã này có thể thúc đẩy sự đổi mới và hợp tác trong ngành công nghệ robot, tương tự như cách các mô hình AI mở đã thúc đẩy sự phát triển trong lĩnh vực trí tuệ nhân tạo.
📌 Unitree Robotics đã mở nguồn mã robot G1 giá 13.622 USD với 43 khớp nối, cho phép thực hiện động tác võ thuật tinh vi chỉ sau một tháng từ màn ra mắt vụng về. Động thái này phản ánh chiến lược nguồn mở của Trung Quốc trong cuộc đua công nghệ robot nhân hình toàn cầu.
https://www.scmp.com/news/china/science/article/3300380/another-deepseek-moment-chinas-kung-fu-bot-goes-open-source
Hybrid AI agents đang biến đổi cách chúng ta tương tác với dữ liệu bằng cách kết hợp nhiều công nghệ tiên tiến: tự động hóa trình duyệt, AI tạo sinh và công cụ quy trình làm việc.
Khác với hệ thống AI truyền thống phụ thuộc vào API có cấu trúc, các agent này tương tác trực tiếp với trang web, bắt chước hành vi con người để trích xuất dữ liệu hoặc hoàn thành quy trình làm việc.
Công nghệ nền tảng bao gồm: LangChain (kết nối mô hình ngôn ngữ với nguồn dữ liệu bên ngoài), GPT-4 của OpenAI (phân tích dữ liệu), Playwright (tự động hóa trình duyệt), Gemini API và GPU Nvidia (đảm bảo tốc độ xử lý thời gian thực).
Các ứng dụng chính của hybrid AI agents gồm: trích xuất dữ liệu tự động từ trang web, theo dõi giá sản phẩm thương mại điện tử (Amazon, eBay), phân tích mạng xã hội (Reddit), và tự động hóa không cần API.
Agent này đặc biệt hiệu quả trong các tình huống không có sẵn API, bị hạn chế hoặc không đủ, giúp tạo ra các giải pháp linh hoạt và mạnh mẽ cho nhiều lĩnh vực.
Khả năng thích ứng với nhiều tác vụ khác nhau làm cho hybrid AI agents trở thành công cụ có giá trị trong nhiều ngành công nghiệp, từ thương mại điện tử, nghiên cứu thị trường đến phân tích mạng xã hội.
Tiềm năng phát triển trong tương lai bao gồm việc tích hợp với robot để thực hiện các nhiệm vụ đòi hỏi cả tương tác kỹ thuật số và vật lý, mở rộng khả năng ứng dụng.
Các sự kiện công nghiệp như hội nghị Nvidia GTC 2025 sẽ là nơi trưng bày những tiến bộ mới nhất trong AI tạo sinh, robot học và hệ thống lai, cung cấp cơ hội khám phá đổi mới.
Hybrid AI agents dự kiến sẽ đóng vai trò trung tâm trong việc định hình tương lai của tự động hóa và ra quyết định dựa trên dữ liệu, với khả năng thích ứng đảm bảo tính phù hợp trong nhiều lĩnh vực.
📌 Hybrid AI agents kết hợp tự động hóa trình duyệt với AI tạo sinh đang cách mạng hóa trích xuất dữ liệu không cần API. Công nghệ này ứng dụng trong nhiều lĩnh vực từ thương mại điện tử đến phân tích mạng xã hội, với tiềm năng tích hợp robot học trong tương lai.
https://www.geeky-gadgets.com/hybrid-ai-agents-automation-tools/
"AI tác nhân" (AI agents) và "tác nhân AI" (agentic AI) là hai thuật ngữ đang xuất hiện ngày càng nhiều trong công nghệ kinh doanh, nhưng thường bị sử dụng lẫn lộn mặc dù chúng đề cập đến các khái niệm khác nhau.
Cả hai đều liên quan đến AI có khả năng giải quyết vấn đề nhiều bước một cách độc lập, với ít sự hướng dẫn từ con người.
Tác nhân AI là những ứng dụng cụ thể được tạo ra để thực hiện nhiệm vụ độc lập và đã được sử dụng rộng rãi hiện nay trong ngân hàng và thương mại điện tử để xác minh danh tính, tự động hóa giao dịch, lưu giữ hồ sơ và học hỏi về người dùng.
AI tác nhân đề cập đến lĩnh vực AI nghiên cứu và phát triển các mô hình có khả năng hoạt động như các tác nhân tự chủ.
Có thể hiểu tác nhân AI giống như những loại thuốc cụ thể được kê cho các tình trạng bệnh nhất định, trong khi AI tác nhân giống như toàn bộ lĩnh vực khoa học dược phẩm phát triển tất cả các loại thuốc.
Trong bối cảnh trí tuệ nhân tạo tổng quát (AGI), tác nhân AI hiện tại không phải là AGI - chúng có thể thực hiện các nhiệm vụ phức tạp nhưng vẫn chỉ là những nhiệm vụ cụ thể mà chúng được tạo ra.
AI tác nhân là một lĩnh vực nghiên cứu và phát triển AI mà một số người tin rằng cuối cùng sẽ dẫn đến AGI, bao gồm việc xây dựng AI có khả năng tương tác với hệ thống bên ngoài, cả về mặt kỹ thuật số và vật lý.
Hiểu biết về các khái niệm này rất quan trọng vì khi nghiên cứu và phát triển AI tác nhân tiếp tục, chúng ta sẽ thấy các tác nhân ngày càng tinh vi có khả năng tự động hóa nhiều nhiệm vụ khác nhau.
Trợ lý kỹ thuật số thực sự hữu ích và được cá nhân hóa, có khả năng học hỏi chi tiết về nhu cầu của chúng ta và thực hiện các bước để giúp chúng ta đạt được mục tiêu, chỉ là khởi đầu.
Khi tích hợp với robotics, các tác nhân cũng sẽ mở ra cánh cửa tự động hóa các nhiệm vụ vật lý, chẳng hạn như công việc xây dựng hoặc kỹ thuật phức tạp.
📌 AI tác nhân và tác nhân AI đang định hình lại công nghệ kinh doanh, với sự khác biệt quan trọng: tác nhân AI là ứng dụng cụ thể đang được sử dụng ngày nay trong khi AI tác nhân là lĩnh vực nghiên cứu hướng tới AGI. Hiểu biết này rất quan trọng khi tiến bộ công nghệ đang diễn ra với tốc độ có thể khiến nhiều người bất ngờ.
https://www.forbes.com/sites/bernardmarr/2025/02/25/the-important-difference-between-agentic-ai-and-ai-agents/
Theo Vijoy Pandey, Phó chủ tịch cấp cao của Outshift by Cisco, các tổ chức sẽ sớm triển khai hơn 20.000 agent AI, trong khi doanh nghiệp lớn có thể vận hành hàng trăm nghìn agent
Internet of Agents (IoA) là một internet mở và có khả năng tương tác, sẽ cách mạng hóa cách các agent hợp tác trong môi trường an toàn lượng tử
Agent AI sẽ hiện diện trong mọi phần mềm: phần mềm kinh doanh, cá nhân, avatar trên mạng xã hội và AI trong robot thực hiện công việc vật lý
Mỗi agent được xem như chuyên gia trong lĩnh vực riêng, thách thức là kết hợp các agent chuyên biệt để tăng cường sức mạnh của AI tạo sinh
Framework hợp tác mới khác biệt so với cơ sở hạ tầng internet hiện tại:
Agent AI cần chia sẻ trạng thái phức tạp
Ra quyết định phối hợp theo thời gian thực
Giao tiếp mang tính xác suất
Trao đổi dữ liệu đa phương thức (video, hình ảnh, văn bản)
Hệ sinh thái mở đóng vai trò quan trọng:
Không có "khu vườn khép kín"
Tối đa hóa giá trị cho mọi thực thể trong chuỗi
Tương tự như sự phát triển của internet với Linux, Apache, MySQL
Cloud computing bùng nổ nhờ hệ sinh thái nguồn mở như Kubernetes
Cần xây dựng các tiêu chuẩn mở cho:
Khả năng khám phá
Danh tiếng
Nhận dạng
Quản lý rủi ro
Giao tiếp
📌 Internet of Agents sẽ kết nối 20.000 agent AI/doanh nghiệp thông qua hệ sinh thái mở, không "khu vườn khép kín". Agent AI sẽ hiện diện trong mọi phần mềm, hợp tác theo thời gian thực với giao tiếp đa phương thức, đòi hỏi tiêu chuẩn mở cho nhận dạng và bảo mật.
https://venturebeat.com/ai/20000-ai-agents-per-company-how-will-they-all-work-together/
Wang Xingxing (Vương Hưng Hưng), 35 tuổi, sáng lập và điều hành Unitree Robotics - một trong những công ty hàng đầu Trung Quốc về phát triển robot tứ túc và robot nhân hình
Vương sinh năm 1990, là doanh nhân trẻ nhất tham dự hội nghị doanh nghiệp do chủ tịch Tập Cận Bình chủ trì, ngồi cùng hàng với các tên tuổi lớn như Nhậm Chính Phi (Huawei), Mã Vân(Alibaba) và Mã Hóa Đằng (Tencent)
Unitree gây ấn tượng mạnh khi cho ra mắt màn trình diễn múa dân gian bằng robot nhân hình trong chương trình Gala Tết Nguyên đán của đài truyền hình trung ương CCTV
Theo chia sẻ với CCTV sau hội nghị, Vương cho rằng robot ứng dụng AI đang phát triển với tốc độ chóng mặt, vượt xa kỳ vọng và dự đoán robot nhân hình sẽ đạt được bước tiến mới vào cuối năm nay
Unitree vẫn duy trì mô hình công ty tư nhân, tuy nhiên các nhà đầu tư đã đổ xô vào cổ phiếu của các nhà cung cấp linh kiện:
Cổ phiếu Zhejiang Changsheng Sliding Bearings tăng 62% trong 5 phiên gần nhất và tăng hơn 600% trong 12 tháng qua
Cổ phiếu Ningbo Shuanglin Auto Parts tăng 575% so với cùng kỳ năm ngoái
📌 Ở tuổi 35, Vương Hưng Hưng đã đưa Unitree trở thành công ty robot hàng đầu Trung Quốc với màn trình diễn ấn tượng trên CCTV và sự công nhận từ lãnh đạo cao cấp. Cổ phiếu các nhà cung cấp tăng mạnh phản ánh tiềm năng phát triển của ngành công nghiệp robot Trung Quốc.
https://www.scmp.com/tech/big-tech/article/3299435/meet-wang-xingxing-young-chinese-robotics-star-unitree-xi-jinpings-symposium
Google vừa công bố hệ thống AI mới có tên "Co-Scientist", sử dụng công nghệ tương tự các mô hình ngôn ngữ lớn như Gemini và ChatGPT
Co-Scientist có khả năng:
Phân tích tài liệu nghiên cứu đã công bố
Tổng hợp thông tin và đánh giá kết quả
Đề xuất giả thuyết mới
Đề xuất các thí nghiệm kiểm chứng
Trích dẫn tài liệu và giải thích đề xuất
Các nhà nghiên cứu tại Imperial College London đã sử dụng thành công hệ thống này để tái tạo công trình nghiên cứu của mình trong thời gian ngắn hơn nhiều
Hệ thống được thiết kế để hợp tác với các nhà khoa học thay vì tự động hóa hoàn toàn quá trình nghiên cứu
Google đã thực hiện nhiều đánh giá, bao gồm yêu cầu chuyên gia đưa ra 15 mục tiêu nghiên cứu thách thức trong lĩnh vực của họ
Co-Scientist đã được ứng dụng trong nghiên cứu về kháng kháng sinh - một trong những mối đe dọa lớn nhất đối với sức khỏe toàn cầu theo WHO
José Penadés từ Khoa Bệnh truyền nhiễm Imperial cho biết hệ thống có thể đề xuất giả thuyết tương tự như kết quả nghiên cứu nhiều năm của họ chỉ trong thời gian ngắn
Hiện tại, Google chỉ cung cấp Co-Scientist thông qua "chương trình thử nghiệm tin cậy" để đảm bảo người dùng có trách nhiệm
Các thách thức cần giải quyết:
Cách đánh giá nhanh các giả thuyết do AI đề xuất
Vấn đề ghi nhận công trạng và tài trợ nghiên cứu
Bảo tồn tính sáng tạo trong nghiên cứu khoa học
📌 Co-Scientist của Google đang mở ra kỷ nguyên mới cho nghiên cứu khoa học khi có thể rút ngắn quá trình từ nhiều năm xuống còn vài giờ. Hệ thống này đã được kiểm chứng hiệu quả qua 15 mục tiêu nghiên cứu thách thức và ứng dụng thực tế trong nghiên cứu kháng kháng sinh tại Imperial College London.
https://www.independent.co.uk/tech/google-ai-artificial-intelligence-science-b2700881.html
- Sam Altman và OpenAI đang phát triển AGI (trí tuệ nhân tạo tổng quát) với mục tiêu vượt trội con người trong mọi tác vụ nhận thức vào năm 2030 hoặc sớm hơn
- Trụ sở OpenAI tại San Francisco được đặt trong một nhà kho màu xám không biển hiệu, thiết kế hiện đại với sàn bê tông, gỗ sáng màu và nhiều cây xanh
- Công ty vừa tung ra 2 AI agent:
+ Operator: thực hiện các tác vụ cơ bản như mua sắm trực tuyến
+ Deep Research: nghiên cứu và tạo báo cáo chất lượng tương đương nghiên cứu sinh tiến sĩ
- OpenAI hiện có hơn 300 triệu người dùng mỗi tuần và đang huy động vốn mới do SoftBank dẫn đầu, định giá 300 tỷ USD (tăng 15 lần so với 2022)
- 7 công ty công nghệ hàng đầu Mỹ (Meta, Alphabet, Amazon, Microsoft, Nvidia, Tesla và Apple) đang đầu tư tổng cộng 560 tỷ USD vào cơ sở hạ tầng AI từ 2024 đến cuối năm nay
- Elon Musk vừa đưa ra đề nghị thâu tóm thù địch trị giá 97 tỷ USD nhưng đã bị OpenAI từ chối
- DeepSeek của Trung Quốc vừa phát hành mô hình AI miễn phí ngang tầm ChatGPT, cho thấy khoảng cách công nghệ AI giữa Mỹ và Trung Quốc đang thu hẹp
- Các nhà phát triển AI hàng đầu như OpenAI, Anthropic và Google đều tập trung vào phát triển agent có khả năng tự động thực hiện nhiều tác vụ phức tạp
📌 OpenAI đang dẫn đầu cuộc đua phát triển AI agent với 300 triệu người dùng/tuần. Công ty được định giá 300 tỷ USD, tăng 15 lần từ 2022, hướng tới AGI vào 2030 bất chấp những thách thức về an toàn và quản lý.
https://www.thetimes.com/business-money/companies/article/open-ai-headquarters-sam-altman-chat-gpt-interview-pg759t3x8
Danny Fortson, phóng viên khu vực Bờ Tây
Chủ nhật, ngày 16 tháng 2 năm 2025, 12:01 sáng GMT, The Sunday Times
Sam Altman không có câu trả lời cho câu hỏi mà ngày càng nhiều người đang đặt ra: khi trí tuệ nhân tạo (AI) tiến bộ với tốc độ đáng sợ, chúng ta sẽ nói gì với con cái mình? Chúng ta cần chuẩn bị thế hệ tiếp theo như thế nào khi không ai trong số họ sẽ giỏi hơn máy móc trong bất kỳ nhiệm vụ trí tuệ nào?
“Xuyên suốt lịch sử, người ta luôn dự đoán rằng rồi chúng ta sẽ chỉ phải làm việc 4 giờ một tuần hay đại loại vậy. Nhưng con người dường như được lập trình để muốn sáng tạo, muốn có ích cho người khác, muốn làm điều gì đó có ý nghĩa,” CEO của OpenAI nói trong một cuộc phỏng vấn độc quyền với The Times Tech Podcast vào tuần trước. “Tôi không tin rằng chúng ta sẽ cạn kiệt việc để làm và rồi sẽ có một cuộc sống khốn khổ, chỉ ngồi quanh quẩn, chơi game và dùng chất kích thích.”
Phiên bản nào đó của câu trả lời này—một kiểu nhún vai, vừa thẳng thắn vừa đầy lo âu—có thể nghe thấy từ nhiều người trong ngành và ngay cả tại công ty của Altman, khi họ đang chạy đua để xây dựng máy móc siêu trí tuệ. The Sunday Times mới đây đã có cơ hội hiếm hoi tiếp cận nhóm lãnh đạo cốt lõi và các kỹ sư của OpenAI tại trụ sở chính ở San Francisco, ngay trước khi Altman ghé qua London trên đường tới Hội nghị AI Action Summit tại Paris tuần trước.
Hội nghị tại thủ đô nước Pháp—nơi tập trung lãnh đạo, doanh nhân và nhà khoa học từ hơn 100 quốc gia—được kỳ vọng sẽ là cơ hội để thế giới thống nhất về các vấn đề quản trị một công nghệ có khả năng làm đảo lộn nền kinh tế và xã hội. Nhưng cuối cùng, hội nghị này chỉ mang lại một bức ảnh tập thể, chứ không có bước tiến thực chất nào. Mỹ và Anh thậm chí còn không ký vào tuyên bố chung, một tài liệu gây chú ý chỉ vì nó quá chung chung và không có tính ràng buộc.
Trong khi các chính trị gia còn loay hoay, Altman và nhóm của ông đang tăng tốc để đạt được AI cấp độ siêu trí tuệ (AGI)—một hệ thống vượt trội hơn cả con người giỏi nhất trong mọi nhiệm vụ—vào năm 2030, hoặc có thể sớm hơn.
Họ dường như được thúc đẩy bởi một kiểu lạc quan đậm chất Silicon Valley: một niềm tin rằng AI sẽ chữa khỏi bệnh tật, giải quyết biến đổi khí hậu và mở ra những chân trời mới.
Nhưng đi cùng với sự lạc quan đó là sự thừa nhận thẳng thắn rằng, để đạt được viễn cảnh này, chúng ta sẽ phải trải qua một giai đoạn chuyển đổi đầy hỗn loạn và đau đớn.
“Sẽ có rất nhiều điều tốt và rất nhiều điều xấu. Tôi thực sự tin rằng những điều tốt đẹp sẽ vượt trội hơn gấp nhiều lần, nhưng cũng sẽ có những hệ lụy thực sự tồi tệ. Và tôi nghĩ một số trong đó đã bắt đầu xuất hiện,” Altman thừa nhận.
Bạn có thể đi ngang qua mà không nhận ra.
Trụ sở của OpenAI tại San Francisco nằm trong một nhà kho khiêm tốn, giữa một khu vực toàn nhà kho—tàn dư của quá khứ công nghiệp của thành phố. Không có biển hiệu bên ngoài, không có tòa nhà chọc trời sừng sững giữa đường chân trời—chỉ là một khối xám lớn.
Bên trong trụ sở OpenAI, mọi thứ đều toát lên vẻ tối giản nhưng hiện đại: sàn bê tông mài bóng, nội thất gỗ sáng màu, bếp đầy nước có ga và cà phê, cùng vô số cây xanh ngập trong ánh sáng tự nhiên từ những ô cửa kính mờ. Nó trông không khác gì các startup công nghệ khác, ngoại trừ một vài điểm nhấn như chiếc đàn piano Yamaha màu đen bóng ở khu lễ tân và một chiếc ghế hình quả bơ, một món đồ nội thất lấy cảm hứng từ một bức ảnh do DALL·E—trình tạo hình ảnh của OpenAI—tạo ra cách đây ba năm. Khi đó, công nghệ này khiến cả thế giới kinh ngạc, nhưng giờ đây, nó gần như đã trở nên lỗi thời.
Ngày The Sunday Times ghé thăm, không khí trong văn phòng căng thẳng hơn bình thường. Cổ phiếu công nghệ Mỹ lao dốc sau khi DeepSeek, một công ty AI ít tên tuổi của Trung Quốc, bất ngờ tung ra một mô hình miễn phí có khả năng ngang ngửa ChatGPT. Điều này phá vỡ niềm tin rằng Mỹ—dưới sự dẫn dắt của OpenAI—đã tạo ra khoảng cách đáng kể với Trung Quốc trong cuộc đua AI.
Nick Turley, trưởng nhóm phát triển ChatGPT, không quá ngạc nhiên.
“Là người tiên phong, chúng tôi luôn biết rằng sẽ có lúc người khác bắt kịp,” Turley nói.
Nhưng ông không quá bận tâm về điều đó, vì theo ông, thế giới sắp thay đổi một lần nữa, giống như khi nhóm của ông ra mắt ChatGPT vào tháng 11/2022.
“Theo tôi, 2025 là năm của các tác tử AI (agents),” Turley nhận định.
Các tác tử AI (AI agents) là công cụ không còn bị giới hạn trong ô tìm kiếm của website hay ứng dụng, mà có thể tự động thực hiện nhiệm vụ trên internet—từ đặt vé, soạn email đến thực hiện nghiên cứu chuyên sâu ngang tầm tiến sĩ hoặc chuyên gia tài chính tại Phố Wall.
“Thị trường tiềm năng của một tác tử AI xuất sắc gần như bằng toàn bộ những gì con người làm trên trình duyệt web ngày nay,” Turley nói.
“Ngay từ đầu, mục tiêu của chúng tôi không phải là tạo ra một chatbot. Nội bộ chúng tôi luôn gọi nó là 'siêu trợ lý' (super assistant).”
Trong vài tuần qua, OpenAI đã ra mắt hai tác tử AI:
Mặc dù Operator vẫn còn khá vụng về, nhưng đó là một phần trong chiến lược triển khai theo từng bước (iterative deployment) của OpenAI—tung ra sản phẩm chưa hoàn thiện để người dùng sử dụng, phản hồi và giúp hệ thống cải thiện nhanh hơn.
Dù vậy, tác động của Deep Research đã khiến nhiều người kinh ngạc.
Tyler Cowen, nhà kinh tế học nổi tiếng, nhận xét:
“Tôi đã thử để nó viết một số bài nghiên cứu dài 10 trang, và bài nào cũng xuất sắc.
Chất lượng tương đương với một trợ lý nghiên cứu tiến sĩ giỏi, người mất hai tuần để làm một nhiệm vụ như vậy. Nhưng Deep Research chỉ mất 5-6 phút.”
Altman nói thêm:
“Nhiều người sau khi dùng đã nói: 'Đây là khoảnh khắc AGI của tôi'—khi họ nhận ra AI đang thực hiện công việc có giá trị kinh tế thực sự và họ không nghĩ hệ thống có thể làm được điều đó.”
Các tác tử AI đã trở thành trọng tâm phát triển của nhiều công ty AI hàng đầu.
Tuy nhiên, khi hàng ngàn—và cuối cùng là hàng tỷ—tác tử AI ngày càng mạnh mẽ xuất hiện trên internet, điều này đặt ra một thách thức lớn về an toàn.
Johannes Heidecke, trưởng bộ phận an toàn hệ thống của OpenAI, cho biết:
“Chúng tôi đã phát triển một khung đánh giá rủi ro để đo lường mức độ nguy hiểm của các mô hình AI.”
Khung này bao gồm:
Heidecke cũng cho biết, nghịch lý thay, mô hình càng thông minh thì lại càng an toàn hơn.
“Các mô hình lập luận tiên tiến mới của chúng tôi mất thời gian suy nghĩ trước khi phản hồi, nên ít bị ‘bẻ khóa’ hơn.
Vẫn còn nhiều việc phải làm, nhưng dấu hiệu rất tích cực.”
Mặc dù OpenAI đã tự đặt ra quy tắc kiểm soát, nhưng thực tế là phần lớn các biện pháp này vẫn mang tính tự nguyện.
Không có quy định nghiêm ngặt nào được ban hành tại Anh hoặc Mỹ.
Tuần trước, JD Vance, phó tổng thống Mỹ, cảnh báo về việc áp dụng quá nhiều quy định sẽ “giết chết một ngành công nghiệp mang tính đột phá”.
Tại châu Âu, Đạo luật AI của EU có đưa ra một số quy định an toàn sản phẩm, nhưng hầu hết những điều khoản này được viết trước khi ChatGPT ra mắt vào năm 2022, nên chưa thực sự bắt kịp thực tế.
Trong khi đó, khả năng của AI đang phát triển với tốc độ chóng mặt.
Mark Chen, trưởng bộ phận nghiên cứu OpenAI, nói:
“Trước đây, chúng tôi có thể kiểm tra AI bằng các bài thi dành cho con người, như kỳ thi toán quốc tế.
Nhưng giờ đây, hầu như không còn bài thi nào đủ khó để thách thức AI.”
Tuy nhiên, dù có khả năng đáng kinh ngạc, AI đôi khi vẫn mắc sai lầm ngớ ngẩn.
Tháng này, Google bị bẽ mặt khi quảng cáo Super Bowl cho mô hình Gemini AI hiển thị thông tin sai về lượng phô mai Gouda tiêu thụ trên thế giới.
Tháng 12, Apple AI viết lại tiêu đề một bài báo của BBC về Luigi Mangione, khẳng định sai sự thật rằng nghi phạm giết người đã tự sát.
Bất chấp những sai sót, AI vẫn đang tiến về phía trước với tốc độ không thể ngăn cản.
Dù chúng ta có chuẩn bị hay không, các tác tử AI sắp trở thành một phần không thể thiếu của cuộc sống, làm thay đổi cách con người làm việc, học tập và tương tác với thế giới.
Câu hỏi không còn là “AI có thể làm gì?” mà là “Chúng ta sẽ sống thế nào trong một thế giới có AI?”.
Bất chấp những sai lầm và thách thức, các động lực tài chính và địa chính trị đang đẩy AI tiến xa hơn bao giờ hết.
Hiện tại, hơn 300 triệu người sử dụng OpenAI mỗi tuần, và công ty đang trong quá trình huy động một vòng vốn mới do SoftBank dẫn đầu, với mức định giá lên tới 300 tỷ USD (240 tỷ bảng)—gấp 15 lần giá trị của OpenAI vào năm 2022.
7 ông lớn công nghệ Mỹ—Meta, Alphabet, Amazon, Microsoft, Nvidia, Tesla và Apple—đang chi tổng cộng 560 tỷ USD để đầu tư vào hạ tầng AI từ năm 2024 đến cuối năm nay.
Elon Musk, người đang điều hành công ty AI của riêng mình là Grok, đã tìm cách làm chậm bước tiến của OpenAI bằng con đường pháp lý, khi liên tục đệ đơn kiện công ty. Tuần trước, ông bất ngờ đưa ra đề nghị thâu tóm OpenAI với giá 97 tỷ USD theo hình thức mua lại thù địch (hostile takeover), nhưng đã bị từ chối ngay lập tức.
Những động thái quyết liệt này là một phần trong cuộc chiến giành quyền kiểm soát công nghệ có thể tạo ra hàng nghìn tỷ USD, khi AI đang tự động hóa hàng loạt ngành công nghiệp.
Về mặt địa chính trị, AI đã trở thành chiến trường quan trọng, khi Trung Quốc, Mỹ và châu Âu tranh giành vị thế thống trị.
Tất cả các công ty AI hàng đầu của Mỹ, bao gồm OpenAI, gần đây đều bắt đầu hợp tác với Lầu Năm Góc và ngành công nghiệp quốc phòng.
Altman thừa nhận:
“Sẽ rất tệ nếu chính phủ Mỹ không hiểu về AI và tác động mà nó sẽ gây ra. Vì vậy, chúng tôi muốn giúp đỡ.”
Tuy nhiên, ông cũng đặt ra một câu hỏi lớn:
“Chúng ta đang hướng tới một kỷ nguyên AI có tính dân chủ hay AI mang tính độc tài?
Tôi nghiêng về phía AI dân chủ, nhưng điều đó sẽ đi kèm với những thách thức.
Chúng ta chưa bao giờ trao quyền cho cá nhân nhiều đến mức như những gì AI sắp làm.”
Dù AI đang trở thành vấn đề địa chính trị, bên trong trụ sở OpenAI, các kỹ sư vẫn tập trung vào việc phát triển sản phẩm—một mô hình AI hiệu quả, mà cả người dùng cá nhân lẫn doanh nghiệp đều sẵn sàng trả tiền để sử dụng.
Joanne Jang, trưởng nhóm hành vi mô hình (model behavior) của OpenAI, đang lãnh đạo một nhóm chuyên trách về "tính cách" của ChatGPT.
Nhóm của Jang đảm nhận nhiệm vụ tinh chỉnh để đảm bảo ChatGPT:
Theo Jang, đội của cô đang xây dựng tính cách của “người sếp tương lai” của chúng ta.
“Trong tương lai, chúng tôi chắc chắn muốn có nhiều ‘tính cách’ và cài đặt mặc định khác nhau để người dùng lựa chọn.”
- OpenAI vừa ra mắt Operator - AI agent đầu tiên có khả năng hoạt động tự chủ trên web
- World (trước đây là Worldcoin) - dự án của Sam Altman và Alex Blania thuộc Tools for Humanity đang phát triển công cụ liên kết AI agent với danh tính online của người dùng
- Dự án World dựa trên ý tưởng trong tương lai sẽ không thể phân biệt được người thật và AI agent trên internet. World tạo "proof of human" bằng cách quét mống mắt qua thiết bị hình cầu kim loại
- World ID có thể được sử dụng để cấp phép cho AI agent hoạt động thay mặt người dùng, giúp các website xác minh agent đang đại diện cho người thật
- OpenAI vừa công bố hợp tác với Uber, Instacart và DoorDash cho phép Operator sử dụng nền tảng của họ
- Theo Tiago Sada - Giám đốc sản phẩm của World, việc cho phép AI agent được xác thực hoạt động thay người dùng rất quan trọng với doanh nghiệp vì giúp tăng doanh số
- Các doanh nghiệp có thể cho phép AI agent được xác thực truy cập thay vì chặn hoàn toàn để tránh tấn công DDOS hay lừa đảo
- Sam Altman đang xây dựng hệ sinh thái với OpenAI là trung tâm: Helion Energy (năng lượng fusion), Retro Biosciences (khoa học tuổi thọ) và World ID (xác thực danh tính)
📌 Sam Altman kết nối 3 dự án lớn: OpenAI (AI agent Operator), World ID (xác thực danh tính số) và các nền tảng thương mại điện tử hàng đầu như Uber, DoorDash để AI agent có thể thay người dùng thực hiện giao dịch trực tuyến với "thẻ xanh" World ID.
https://techcrunch.com/2025/01/24/sam-altmans-world-now-wants-to-link-ai-agents-to-your-digital-identity/
- ByteDance vừa ra mắt UI-TARS - AI agent mới có khả năng điều khiển máy tính và thực hiện các quy trình công việc phức tạp một cách tự động
- UI-TARS được huấn luyện với khoảng 50 tỷ token và có hai phiên bản: 7B và 72B tham số, hoạt động trên cả PC và MacOS
- Mô hình đạt hiệu suất vượt trội trong hơn 10 tiêu chuẩn đánh giá GUI, vượt qua GPT-4o của OpenAI, Claude của Anthropic và Gemini của Google
- Trong bài kiểm tra VisualWebBench, UI-TARS 72B đạt 82,8%, cao hơn GPT-4o (78,5%) và Claude 3.5 (78,2%)
- UI-TARS-7B đạt điểm cao nhất 93,6% trong WebSRC, trong khi UI-TARS-72B đạt 88,6% trong ScreenQA-short
- Giao diện của UI-TARS gồm 2 tab: một tab hiển thị quá trình "suy nghĩ" từng bước và tab còn lại thực hiện các hành động tự động
- Mô hình được huấn luyện trên tập dữ liệu lớn gồm các ảnh chụp màn hình với metadata chi tiết về mô tả phần tử, kiểu, vị trí và chức năng
- UI-TARS có cả bộ nhớ ngắn hạn và dài hạn, có khả năng suy luận nhanh (System 1) và chậm (System 2)
- Mô hình được trang bị khả năng sửa lỗi và phản ánh sau hành động để học hỏi và cải thiện hiệu suất
- Khác với Claude chỉ mạnh trong tác vụ web, UI-TARS thể hiện hiệu suất xuất sắc trên cả web và thiết bị di động
📌 UI-TARS của ByteDance đã thiết lập một cột mốc mới trong lĩnh vực AI agent với khả năng vượt trội GPT-4 và Claude trong các bài kiểm tra GUI. Với điểm số 82,8% trong VisualWebBench và 93,6% trong WebSRC, mô hình chứng minh tiềm năng to lớn trong việc tự động hóa các tác vụ máy tính phức tạp.
https://venturebeat.com/ai/bytedances-ui-tars-can-take-over-your-computer-outperforms-gpt-4o-and-claude/
- Số lượng khởi nghiệp về AI agent tăng vọt từ vài công ty lên hàng chục mỗi tháng trong năm qua
- Israel đang chứng kiến làn sóng khởi nghiệp xây dựng AI agent, tận dụng thế mạnh về an ninh mạng và khoa học dữ liệu
- Sam Altman dự đoán 2025 là năm AI agent thực sự tham gia lực lượng lao động
- Đến 2027, ít nhất 50% công ty sẽ triển khai một số hình thức AI agent
5 giai đoạn tiến hóa của AI agent:
- Giai đoạn 1 - Chat tổng quát: Các mô hình nền tảng như ChatGPT, Claude làm nền tảng để hiểu khả năng của AI
- Giai đoạn 2 - Chuyên gia theo lĩnh vực: AI chuyên biệt cho từng ngành như pháp lý (EvenUp, Darrow)
- Giai đoạn 3 - Agent (hiện tại): Chuyển từ chat sang thực thi nhiệm vụ, ví dụ như Devin trong lĩnh vực lập trình
- Giai đoạn 4 - Đổi mới AI: AI có khả năng sáng tạo và khám phá hướng đi mới, không chỉ thực hiện nhiệm vụ đơn thuần
- Giai đoạn 5 - Tổ chức AI từ cốt lõi: Tập hợp các AI agent có thể tự ra quyết định và lựa chọn mục tiêu tối ưu
Yếu tố then chốt:
- Cần xây dựng lòng tin thông qua khả năng giải thích và hạ tầng AI
- Doanh nghiệp vừa và nhỏ sẽ là người áp dụng sớm do không đủ nguồn lực thuê nhân lực
- Công ty Maisa đang phát triển "bằng chứng công việc" cho AI agent
- Emcie xây dựng hạ tầng tạo AI agent siêu chuyên biệt
📌 AI agent đang chuyển từ giai đoạn hỗ trợ (co-pilot) sang tự động hoàn toàn (autopilot). Đến 2027, 50% công ty sẽ ứng dụng AI agent, mở ra kỷ nguyên tổ chức AI từ cốt lõi với 3 người có thể tạo ra công ty kỳ lân nhờ tự động hóa.
https://www.nfx.com/post/ai-agent-revolution
- Yoshua Bengio, nhà khoa học nghiên cứu AI người Canada, đưa ra cảnh báo về AI agents tại Diễn đàn kinh tế thế giới ở Davos 2025
- AI agents - trí tuệ nhân tạo có khả năng hoạt động độc lập không cần sự can thiệp của con người - là chủ đề nóng tại sự kiện này
- Bengio khẳng định mọi kịch bản thảm họa với AGI hoặc siêu trí tuệ đều xảy ra nếu AI có tính tác nhân (agentic)
- Các ứng dụng AI trong khoa học và y tế không cần tính tác nhân, vẫn có thể phát triển mạnh mẽ mà không gây nguy hiểm
- OpenAI vừa ra mắt AI agent có thể lướt web và thực hiện các tác vụ như đặt nhà hàng hoặc thêm hàng vào giỏ
- Doanh nghiệp đang nhận thấy lợi nhuận từ AI agents và dự kiến đưa vào lực lượng lao động từ năm 2025
- Bengio đề xuất xây dựng hệ thống "giám sát" không tác nhân để kiểm soát các hệ thống có tác nhân
- Ông kêu gọi quy định quốc gia yêu cầu các công ty AI phải chứng minh độ an toàn trước khi phát triển mô hình có tính tác nhân
- Demis Hassabis, CEO Google DeepMind đồng tình cần có biện pháp giảm thiểu rủi ro như bảo mật và thử nghiệm agents trong môi trường mô phỏng
- Hassabis chỉ ra xu hướng kinh tế đang thúc đẩy phát triển hệ thống có tính tác nhân để đáp ứng nhu cầu người dùng
📌 Yoshua Bengio, một trong ba "cha đẻ AI", cảnh báo AI agents là con đường nguy hiểm nhất, đề xuất phát triển hệ thống không tác nhân và quy định kiểm soát chặt chẽ. Dự báo AI agents sẽ tham gia lực lượng lao động từ 2025 dù tiềm ẩn rủi ro về AGI và siêu trí tuệ.
https://www.businessinsider.com/yoshua-bengio-ai-godfather-agents-2025-1
- Yann LeCun, giám đốc khoa học AI của Meta, dự báo một mô hình kiến trúc AI hoàn toàn mới sẽ xuất hiện trong 3-5 năm tới
- Tại phiên thảo luận "Debating Technology" ở Davos, LeCun nhận định AI tạo sinh và các mô hình ngôn ngữ lớn (LLM) hiện tại còn nhiều hạn chế
- LeCun cho rằng tuổi thọ của mô hình LLM hiện tại chỉ còn khoảng 3-5 năm nữa
- 4 hạn chế chính của các hệ thống AI hiện tại:
- Thiếu hiểu biết về thế giới vật lý
- Thiếu bộ nhớ bền vững
- Thiếu khả năng suy luận
- Thiếu khả năng lập kế hoạch phức tạp
- "Mô hình thế giới" (world models) được kỳ vọng sẽ giúp máy móc hiểu được động lực của thế giới thực, bao gồm:
- Có trí nhớ
- Có óc phán đoán
- Có trực giác
- Có khả năng suy luận
- Meta và OpenAI đang nghiên cứu phát triển robot:
- OpenAI đang tuyển dụng cho đội ngũ robot mới
- Tập trung vào robot đa năng, thích ứng và linh hoạt
- Hướng tới trí thông minh giống con người trong môi trường thực
- LeCun dự đoán thập niên tới có thể là "thập kỷ của robot", khi các tiến bộ trong AI và robot kết hợp để mở ra một lớp ứng dụng thông minh mới
📌 Trong 3-5 năm tới, một mô hình kiến trúc AI mới sẽ thay thế các LLM hiện tại với khả năng hiểu biết thế giới thực, có trí nhớ và khả năng suy luận. Thập niên 2025-2035 được dự đoán là kỷ nguyên của robot thông minh.
https://techcrunch.com/2025/01/23/metas-yann-lecun-predicts-a-new-ai-architectures-paradigm-within-5-years-and-decade-of-robotics/
- Perplexity vừa phát triển trợ lý AI cho thiết bị di động Android, có khả năng trả lời câu hỏi và thực hiện các tác vụ thay người dùng
- Trợ lý mới có tính năng multimodal, cho phép:
+ Phân tích nội dung trên màn hình
+ Mở camera để "nhìn" và nhận diện vật thể
+ Viết email
+ Đặt lời nhắc
+ Đặt bàn ăn tối
- Các ứng dụng được hỗ trợ hiện tại:
+ Spotify
+ YouTube
+ Uber
+ Ứng dụng email
+ Tin nhắn
+ Đồng hồ
- Cách kích hoạt trợ lý:
+ Cài đặt ứng dụng Perplexity
+ Thay thế trợ lý mặc định của điện thoại
+ Vuốt lên từ góc trái màn hình hoặc giữ nút Home
- Hạn chế hiện tại:
+ Chưa hoạt động trên iPhone do giới hạn quyền từ Apple
+ Không tương thích với một số ứng dụng như Slack, Reddit
+ Chưa thể tương tác với tính năng bình luận trên YouTube
- Phát triển song song với các đối thủ:
+ Google vừa công bố Gemini trên Galaxy S25
+ OpenAI phát triển Operator AI cho các tác vụ web
📌 Perplexity đã tạo bước đột phá với trợ lý AI đa năng trên Android, hỗ trợ 6 ứng dụng chính và khả năng multimodal. Tuy nhiên, vẫn có giới hạn về tương thích ứng dụng và chưa có mặt trên iOS.
https://www.theverge.com/2025/1/23/24350488/perplexity-ai-mobile-assistant-android
Operator là gì: Operator là bản xem trước nghiên cứu của mô hình "Computer-Using Agent" (CUA), tích hợp khả năng nhìn của GPT-4o với lập luận tiên tiến qua học tăng cường. Mô hình này có thể tương tác với giao diện đồ họa (GUI), như nút bấm, menu, và trường văn bản trên màn hình máy tính, mở rộng khả năng trợ giúp đa dạng cho người dùng.
Ứng dụng chính: Người dùng có thể sử dụng Operator để thực hiện các công việc hàng ngày qua trình duyệt, như đặt hàng tạp hóa, đặt chỗ, mua vé sự kiện. Đây là bước tiến quan trọng hướng tới việc AI không chỉ trả lời câu hỏi mà còn thực hiện hành động thay mặt người dùng.
Rủi ro chính: Các nguy cơ được xác định bao gồm:
Điểm chuẩn chuẩn bị: Hệ thống đánh giá rủi ro dựa trên các yếu tố như:
Biện pháp giảm thiểu rủi ro:
Mục tiêu an toàn: Áp dụng các khung an toàn của OpenAI và thử nghiệm toàn diện dựa trên GPT-4o để đảm bảo Operator an toàn trước khi ra mắt công chúng.
📌 Operator là một bước tiến AI với khả năng tương tác GUI tiên tiến, hỗ trợ đa dạng tác vụ hàng ngày. Tuy nhiên, các nguy cơ như tấn công prompt injection và sai sót mô hình đòi hỏi khung giảm thiểu rủi ro toàn diện. Chỉ các mô hình đạt điểm an toàn từ "trung bình" trở xuống mới được triển khai, đảm bảo độ tin cậy và an toàn cho người dùng.
https://openai.com/index/operator-system-card/
- OpenAI vừa giới thiệu Operator, một AI agent đa năng, được thiết kế để tự động hóa các nhiệm vụ trên trình duyệt web như đặt vé du lịch, đặt bàn nhà hàng, mua sắm trực tuyến.
- Operator hiện chỉ có mặt tại Mỹ, dành cho người dùng gói Pro của ChatGPT với giá 200 USD/tháng (tương đương khoảng 4.600.000 VND). Dự kiến, tính năng sẽ mở rộng cho các gói Plus, Team, và Enterprise trong tương lai.
- Người dùng có thể truy cập Operator qua nền tảng operator.chatgpt.com, với kế hoạch tích hợp vào các nền tảng ChatGPT khác sau này.
- Operator sử dụng mô hình Computer-Using Agent (CUA), kết hợp khả năng thị giác từ mô hình GPT-4o với năng lực suy luận của các mô hình tiên tiến hơn. CUA có thể tương tác với giao diện trang web như nhấn nút, điền biểu mẫu mà không cần API từ nhà phát triển.
- OpenAI đã hợp tác với các công ty như DoorDash, eBay, Instacart để đảm bảo Operator tuân thủ các điều khoản dịch vụ. Đồng thời, Operator yêu cầu xác nhận từ người dùng trước khi thực hiện các hành vi quan trọng như gửi email hoặc đặt hàng.
- Giới hạn: Operator không thể xử lý các tác vụ phức tạp như tạo slide chi tiết hay quản lý các hệ thống lịch phức tạp. Một số thao tác vẫn yêu cầu giám sát trực tiếp, ví dụ như nhập thông tin thẻ tín dụng hoặc vượt CAPTCHA.
- OpenAI đã triển khai hệ thống giám sát, tạm ngưng hoạt động nếu phát hiện hành vi đáng ngờ, nhằm ngăn chặn lạm dụng như phishing hay tấn công DDoS.
- Điểm yếu hiện tại: Operator gặp khó khăn với các giao diện chuyên biệt, giới hạn số lượng tác vụ hàng ngày, và chưa hỗ trợ các tính năng như gửi email hay xóa sự kiện lịch.
- Đây là bước tiến quan trọng của OpenAI trong việc cạnh tranh với các đối thủ như Rabbit, Google, và Anthropic. AI agent như Operator là tương lai của internet, không chỉ xử lý thông tin mà còn thực hiện hành động thay con người.
---
📌 OpenAI ra mắt Operator như một bước tiến lớn trong tự động hóa nhiệm vụ bởi AI. Dù sở hữu khả năng độc đáo như mô phỏng thao tác người dùng trên trình duyệt, Operator hiện vẫn có một số hạn chế và yêu cầu giám sát ở các tác vụ nhạy cảm. Giá dịch vụ khởi điểm tại Mỹ là 200 USD/tháng.
https://techcrunch.com/2025/01/23/openai-launches-operator-an-ai-agent-that-performs-tasks-autonomously/
- Oracle đã công bố một bộ AI agent mới nhằm hỗ trợ nhân viên bán hàng trong việc xử lý các tác vụ liên quan đến khách hàng.
- Bộ AI agent này giúp nhân viên bán hàng thực hiện các nhiệm vụ lặp đi lặp lại và phức tạp hơn với tính tự động cao.
- Các agent của Oracle không giống như những trợ lý ảo thông thường mà người tiêu dùng hay sử dụng; chúng được thiết kế để xử lý các tác vụ cụ thể trong lĩnh vực bán hàng.
- Mỗi khi nhân viên bán hàng gặp gỡ khách hàng, họ cần cập nhật thông tin về tiến độ giao dịch. Các agent có khả năng viết những bản cập nhật này.
- Một agent mang tên “customer intelligence” có khả năng truy xuất dữ liệu từ nhiều lĩnh vực phần mềm của Oracle và viết báo cáo cho các nhóm bán hàng.
- Agent này có thể xử lý thông tin đa ngôn ngữ, điều này rất hữu ích khi tiếp xúc với khách hàng quốc tế.
- Ví dụ, nếu một khách hàng lặp lại không nhận được hàng đúng hạn ở một quốc gia khác, hệ thống sẽ thông báo cho nhóm bán hàng tại Mỹ.
- Oracle cho biết các tính năng này đã có sẵn từ ngày 21 tháng 1 năm 2025 và không tính phí thêm cho khách hàng.
📌 Oracle đã ra mắt AI agents hỗ trợ nhân viên bán hàng, không chỉ giúp cập nhật thông tin giao dịch mà còn hỗ trợ xử lý dữ liệu đa ngôn ngữ, tạo điều kiện thuận lợi trong các cuộc đàm phán với khách hàng.
https://www.reuters.com/technology/artificial-intelligence/oracle-rolls-out-ai-agents-sales-professionals-2025-01-21/
- AI agents là trí tuệ nhân tạo tự động hóa quy trình và nâng cao năng suất cho doanh nghiệp.
- Chúng có khả năng quan sát, lập kế hoạch và hành động một cách tự động, giảm thiểu sự giám sát của con người.
- Một ví dụ điển hình: Một công ty hàng tiêu dùng sử dụng AI agent để tối ưu hóa các chiến dịch marketing toàn cầu, trước đây cần 6 nhà phân tích mỗi tuần, giờ chỉ cần 1 người và hoàn thành trong vòng một giờ.
- Quy trình làm việc của AI agent bao gồm 4 bước chính: thu thập dữ liệu, phân tích hiệu suất, đưa ra khuyến nghị và cập nhật nền tảng.
- AI agents hoạt động theo chu trình "Quan sát - Lập kế hoạch - Hành động", cho phép chúng học hỏi và cải thiện theo thời gian dựa trên tương tác trước đó.
- Cấu trúc của AI agents thường bao gồm: giao diện tập trung vào người dùng, mô-đun bộ nhớ, mô-đun hồ sơ, mô-đun lập kế hoạch và mô-đun hành động.
- AI agents không chỉ là công cụ, mà là những thực thể có khả năng quyết định tự động, giúp tối ưu hóa quy trình làm việc.
- AI agents có thể phát triển từ những trợ lý mã hóa đơn giản đến các mạng lưới tự động hóa phức tạp.
- Hiệu suất của AI agents tăng cường từ việc học hỏi quá trình làm việc của con người và thực hiện các nhiệm vụ nhỏ, xác định rõ.
- AI agents đem lại giá trị cho doanh nghiệp qua 3 lĩnh vực chính: tự động hóa quy trình, hợp tác với con người và phân tích dữ liệu.
- Ngành marketing đã áp dụng AI agents để tạo nội dung blog, tiết kiệm 95% chi phí và cải thiện tốc độ gấp 50 lần.
- AI agents trong dịch vụ khách hàng đã giúp một ngân hàng toàn cầu giảm chi phí tới 10 lần.
- Một công ty sinh phẩm đã sử dụng AI agents để rút ngắn thời gian phát triển sản phẩm, tăng hiệu suất lên 35%.
- Dự báo thị trường cho AI agents sẽ tăng trưởng 45% CAGR trong 5 năm tới, cho thấy tiềm năng lớn trong tương lai.
📌 Sự phát triển của AI agents hứa hẹn sẽ thay đổi cách thức làm việc trong các ngành công nghiệp. Chúng không chỉ cải thiện hiệu suất mà còn tạo ra những mô hình kinh doanh mới, giảm thiểu sự phụ thuộc vào nhân lực, giúp tổ chức phát triển nhanh hơn.
https://www.bcg.com/capabilities/artificial-intelligence/ai-agents
Trí tuệ nhân tạo
Từ tự động hóa các công việc lặp lại đến cách mạng hóa các quy trình phức tạp, các tác nhân AI đang định hình lại năng suất và đổi mới cho các doanh nghiệp trong tương lai.
Hãy tưởng tượng một đồng đội làm việc không ngừng nghỉ, học hỏi liên tục và thích nghi với nhu cầu của bạn. Đó chính là lời hứa từ các tác nhân AI. Với khả năng quan sát, lập kế hoạch và hành động tự động, các tác nhân AI mở ra một chương mới về chuyển đổi toàn diện trong các ngành công nghiệp — tối ưu hóa quy trình, thúc đẩy phân tích dữ liệu và nâng cao tiềm năng con người như chưa từng có.
Nói một cách đơn giản, các tác nhân AI là trí tuệ nhân tạo sử dụng các công cụ để đạt được mục tiêu. Các tác nhân AI có khả năng ghi nhớ xuyên suốt các nhiệm vụ và trạng thái thay đổi; chúng có thể sử dụng một hoặc nhiều mô hình AI để hoàn thành nhiệm vụ; và chúng có thể quyết định khi nào cần truy cập các hệ thống nội bộ hoặc bên ngoài thay mặt người dùng. Điều này cho phép các tác nhân AI đưa ra quyết định và hành động một cách tự động với sự giám sát tối thiểu từ con người.
Ví dụ, một công ty hàng tiêu dùng đã muốn tối ưu hóa các chiến dịch tiếp thị toàn cầu bằng cách sử dụng một tác nhân AI để chuyển đổi quy trình. Một dự án từng cần 6 nhà phân tích làm việc hàng tuần giờ đây chỉ cần 1 nhân viên làm việc với tác nhân AI, mang lại kết quả trong chưa đầy một giờ. Cách thức hoạt động như sau:
Các tác nhân AI quan sát môi trường của chúng, tận dụng các mô hình ngôn ngữ lớn (LLM) để lập kế hoạch và truy cập các hệ thống được kết nối để hành động và đạt được mục tiêu.
Chu trình "Quan sát - Lập kế hoạch - Hành động" này được củng cố liên tục vì các công cụ của tác nhân AI luôn phân tích thế giới thay đổi như thế nào dựa trên các tương tác trước đây và học cách làm việc hiệu quả và chính xác hơn theo thời gian.
Các tác nhân AI có cách triển khai khác nhau nhưng thường bao gồm 5 thành phần chính:
Các tác nhân AI đại diện cho một kỷ nguyên mới trong trí tuệ nhân tạo, vượt xa các công cụ phần mềm truyền thống. Không giống như các công cụ tĩnh, các tác nhân phần mềm thông minh này hoạt động như các thực thể tự động đưa ra quyết định. Chúng phân tích dữ liệu, lập kế hoạch nhiệm vụ, thực hiện hành động và liên tục thích nghi — thường là theo thời gian thực.
Điểm mạnh đặc biệt của các tác nhân AI bao gồm:
Các tác nhân AI có mức độ phức tạp khác nhau, từ các trợ lý lập trình đơn giản đến các mạng phức tạp tự động hóa các quy trình mà ngày nay cần cả đội ngũ con người.
Hiệu suất mạnh mẽ của tác nhân AI đến từ việc mô phỏng chặt chẽ các quy trình mà con người thực hiện. Điều này là do các mô hình ngôn ngữ lớn (LLM) — thành phần lập kế hoạch cốt lõi của các tác nhân hiện đại — có khả năng "kế thừa" nhận thức của con người.
Các tác nhân AI mang lại giá trị kinh doanh trong 3 lĩnh vực chính:
Các tác nhân AI đang nhanh chóng trở thành xu hướng phổ biến trong nhiều ngành công nghiệp:
Các tác nhân AI đang nhanh chóng được áp dụng rộng rãi và dự kiến thị trường này sẽ tăng trưởng 45% hàng năm trong 5 năm tới.
Khi các tác nhân AI trở thành tiêu chuẩn, con người sẽ làm việc chặt chẽ với chúng như đồng đội, mở ra tiềm năng mới cho sáng tạo và tăng năng suất.
- Sự tự chủ của đại lý (agent) AI mang lại nhiều thách thức cho các doanh nghiệp trong việc cân bằng giữa giám sát và tự do.
- Giám sát quá mức có thể làm giảm năng suất, trong khi tự do không kiểm soát có thể gây ra rủi ro cho thương hiệu và mối quan hệ với khách hàng.
- Cần hiểu rõ các rủi ro liên quan để quyết định mức độ tự chủ cần thiết cho các đại lý AI.
- Các đại lý AI đang tiến hóa từ chatbot cơ bản thành các hệ thống nhận thức có khả năng suy nghĩ chiến lược, lập kế hoạch và học hỏi từ kinh nghiệm.
- Kinh nghiệm từ các tình huống rủi ro trong quá khứ cho thấy sự cần thiết phải kết hợp dữ liệu và bối cảnh để các đại lý AI hoạt động hiệu quả hơn.
- 3 loại vấn đề cần xem xét khi xác định mức độ tự chủ cho đại lý AI bao gồm:
- Vấn đề phức tạp: Có thể kiểm soát được và thường thích hợp cho tự chủ cao, như trong trường hợp ngân hàng tự động điều chỉnh dữ liệu khi có thay đổi lãi suất.
- Vấn đề mơ hồ: Có nhiều biến số không xác định, cần thêm dữ liệu để đưa ra quyết định chính xác hơn, ví dụ như ô tô tự lái gặp trở ngại.
- Vấn đề không chắc chắn: Khó khăn nhất để xác định, cần sự can thiệp của con người, ví dụ như trong các tình huống khẩn cấp hoặc khủng hoảng.
- Việc tự động hóa các nhiệm vụ có thể giúp các doanh nghiệp tiết kiệm thời gian và giảm rủi ro, nhưng cần có sự giám sát hợp lý để tránh các quyết định sai lầm.
- Thị trường AI đang chứng kiến sự chuyển mình mạnh mẽ, với hàng tỷ đại lý AI sẽ tham gia vào lực lượng lao động trong tương lai gần.
📌 Các doanh nghiệp cần cân nhắc kỹ lưỡng trong việc phân chia quyền tự chủ cho đại lý AI. 3 loại vấn đề (phức tạp, mơ hồ, không chắc chắn) sẽ hướng dẫn quyết định giám sát và tự do, đảm bảo sự an toàn và hiệu suất cao trong hoạt động.
https://hbr.org/2025/01/how-much-supervision-should-companies-give-ai-agents?ab=HP-topics-text-2
#HBR
Công ty nên giám sát các tác nhân AI đến mức nào?
Tác giả: Mike Walsh
Ngày 15 tháng 1 năm 2025
Tóm tắt:
Tính tự chủ của các tác nhân AI là một vấn đề nan giải. Trong nhiều trường hợp, cần có sự giám sát, chẳng hạn như một con người trong chu trình ra quyết định, để tránh thảm họa. Tuy nhiên, nếu giám sát quá mức, năng suất sẽ bị giảm sút. Nếu trao quá ít quyền, khả năng của tác nhân AI bị giới hạn ở mức trả lời các câu hỏi cơ bản. Nhưng nếu để chúng có quá nhiều tự do, thương hiệu, uy tín, mối quan hệ khách hàng và thậm chí cả sự ổn định tài chính đều có nguy cơ bị tổn hại.
Chúng ta đang chứng kiến sự chuyển đổi mang tính cách mạng từ các chatbot cơ bản sang các tác nhân nhận thức thực sự — những hệ thống có thể tư duy chiến lược, lập kế hoạch và học hỏi từ thành công lẫn thất bại. Tuy nhiên, nếu luôn đưa con người vào chu trình, chúng ta khó có thể đạt được những lợi ích thực sự từ sự chuyển đổi AI. Vì vậy, mức độ tự do nào nên được trao cho các tác nhân AI? Câu trả lời không chỉ dựa trên mức độ rủi ro mà còn dựa trên khả năng hiểu rõ rủi ro đó.
Tác nhân AI là các hệ thống hành động. Khác với chatbot, chúng sử dụng các mô hình ngôn ngữ lớn để tổ chức các hoạt động giải quyết vấn đề phức tạp, bao gồm lập kế hoạch, lý luận và thậm chí tương tác với các tác nhân AI khác. Hãy nghĩ về chúng như những đồng nghiệp ảo hiệu quả cao hoặc một dạng lao động kỹ thuật số.
Hàng tỷ tác nhân AI sẽ sớm gia nhập lực lượng lao động và thay đổi đáng kể hiệu quả đầu ra của các công ty. Mục đích của một tác nhân AI là hoàn thành công việc — từ việc nhân viên xin nghỉ phép, trợ lý bán hàng đưa ra khuyến nghị cá nhân hóa cho khách hàng, đến giám đốc dược phẩm xác định các ứng viên phù hợp nhất cho một thử nghiệm lâm sàng.
Chúng có thể trở thành lớp kiểm soát bao quanh mọi giao dịch, thay thế các giao diện phức tạp và quy trình rườm rà của các nền tảng phần mềm doanh nghiệp. Tính đơn giản và hữu ích của chúng là một thách thức trực tiếp đối với các nhà cung cấp phần mềm như dịch vụ truyền thống (SaaS) cũng như các nhà lãnh đạo công nghệ không chuẩn bị cho sự lan rộng nhanh chóng của chúng.
Tính tự chủ của tác nhân AI là một bài toán khó. Giám sát quá nhiều sẽ làm mất đi lợi ích về năng suất. Tuy nhiên, trong nhiều trường hợp, giám sát lại cần thiết để tránh hậu quả nghiêm trọng.
Từ khi AI tạo sinh xuất hiện, đã có nhiều ví dụ cho thấy sự “hỗn loạn thuật toán” khiến các nhà lãnh đạo phải cảnh giác — từ một chatbot của đại lý ô tô đề nghị bán xe mới với giá 1 USD, đến một hãng hàng không bị kiện vì chatbot AI "bịa ra" chính sách không tồn tại.
Để giảm thiểu vấn đề này, các tổ chức đang phát triển các tác nhân AI kết nối trực tiếp với hệ thống và dữ liệu nội bộ. Điều này tạo ra một con dao hai lưỡi: tác nhân AI ít có khả năng "bịa đặt" nếu dựa vào dữ liệu nội bộ, nhưng mức độ tin cậy tăng lên cũng đồng nghĩa với việc chúng có thể đưa ra các quyết định quan trọng, như phê duyệt khoản vay mua nhà, phân bổ an sinh xã hội, bảo vệ cơ sở hạ tầng quan trọng khỏi tấn công mạng, tuyển dụng hoặc sa thải nhân viên, hay thậm chí kiểm soát các hệ thống vũ khí.
Một giải pháp rõ ràng cho vấn đề an toàn AI là đưa con người vào chu trình cho mọi quyết định có hậu quả nghiêm trọng. Tuy nhiên, cách tiếp cận này có thể dẫn đến kết quả ngược lại.
Hãy xem xét Waymo, dịch vụ taxi tự lái trước đây là dự án xe tự hành của Google. Rủi ro trong việc để một cỗ máy chở người ở tốc độ cao, đưa ra quyết định đột ngột, rõ ràng là cực kỳ lớn. Waymo có trung tâm vận hành công nghệ tên Fleet Response, giám sát các chuyến xe trong thời gian thực. Nhưng thay vì trực tiếp điều khiển xe từ xa khi gặp sự cố (do độ trễ nguy hiểm), các nhân viên của Waymo chỉ trả lời câu hỏi từ xe tự hành khi cần thiết.
Cách làm này giúp hệ thống AI của họ học hỏi, trở nên đáng tin cậy hơn và tăng cường khả năng vận hành dài hạn. Điều này cho thấy một cách tiếp cận khác biệt: không dựa vào mức độ rủi ro, mà dựa trên việc rủi ro đó có thể giảm thiểu bằng dữ liệu và ngữ cảnh hay không.
Vấn đề phức tạp
Các vấn đề này khó quản lý nhưng có thể xác định rõ và lập tài liệu, làm cho chúng phù hợp với tính tự chủ cao và giám sát tối thiểu. Ví dụ: khi Cục Dự trữ Liên bang thay đổi lãi suất, các hệ thống tự động có thể điều chỉnh dữ liệu trên nhiều nền tảng để cập nhật thông tin.
Vấn đề mơ hồ
Những vấn đề này có nhiều biến số không xác định rõ ràng, nhưng có thể cải thiện dự đoán bằng cách thu thập thêm dữ liệu. Ví dụ: một xe tự lái đối mặt với vật cản bất ngờ.
Vấn đề bất định
Đây là loại vấn đề khó khăn nhất vì chúng không thể định nghĩa rõ ràng, và thêm dữ liệu cũng không giúp ích nhiều. Ví dụ: đại dịch không có phác đồ điều trị rõ ràng, hoặc các vấn đề như đói nghèo và biến đổi khí hậu.
Tương lai thuộc về các tác nhân AI có khả năng suy luận dựa trên ngữ cảnh thực tế, chứ không chỉ dựa trên dữ liệu đào tạo. Nhưng để đạt được điều đó, chúng cần tự do học hỏi và phát triển trong các tình huống thực tế.
Như Jensen Huang, CEO của Nvidia, đã nói: "Bộ phận CNTT của mỗi công ty sẽ trở thành bộ phận nhân sự của các tác nhân AI trong tương lai."
Thiết kế các tác nhân AI hiệu quả không khác gì trở thành một nhà lãnh đạo tốt hơn. Điều quan trọng không phải là đưa ra các quyết định cá nhân chính xác, mà là cải thiện quy trình tổng thể để đánh giá và thực thi quyết định ở quy mô tổ chức.
- Tác nhân/đặc vụ AI tự động đang phát triển nhanh chóng, hứa hẹn giúp con người quản lý tài chính, bảo hiểm và du lịch mà không cần can thiệp trực tiếp.
- Những tác nhân này có khả năng ra quyết định và thực hiện hành động dựa trên dữ liệu người dùng mà không cần sự giám sát của con người.
- Giám đốc điều hành Salesforce dự đoán triển khai một tỷ tác nhân AI trong vòng một năm, trong khi CEO Meta cho rằng số lượng tác nhân AI sẽ vượt qua dân số thế giới.
- Sự cạnh tranh giữa các công ty công nghệ đang thúc đẩy việc phát triển các tác nhân AI, kéo theo những câu hỏi về tác động xã hội, ranh giới đạo đức và hậu quả lâu dài.
- Nếu không có sự giám sát, các tác nhân AI có thể gây ra rủi ro lớn, như việc bị thao túng bởi hệ thống AI khác, dẫn đến kết quả không minh bạch và khó khăn trong việc xác định trách nhiệm.
- Một ví dụ điển hình là tác nhân AI tài chính cá nhân, có thể phân tích hồ sơ tài chính và sức khỏe để thương lượng với các công ty bảo hiểm, tiềm ẩn nguy cơ về quyền riêng tư và phơi nhiễm dữ liệu nhạy cảm.
- Việc tích hợp các tác nhân AI vào sản phẩm công ty đã bắt đầu, với Salesforce và Microsoft đã đưa vào một số công cụ của họ.
- Các công ty cần xây dựng các tiêu chuẩn an toàn và đạo đức từ giai đoạn đầu phát triển, nhằm ngăn ngừa lạm dụng và phân biệt đối xử.
- Cần có cơ chế giám sát toàn diện cho các tác nhân AI, đảm bảo rằng quyết định quan trọng vẫn do con người thực hiện.
- Người tiêu dùng cũng nên đòi hỏi thông tin rõ ràng về cách hoạt động của tác nhân AI và quyền can thiệp vào quyết định của chúng.
📌 Tác nhân AI có tiềm năng mang lại lợi ích lớn nhưng cũng đặt ra nhiều rủi ro cho sự kiểm soát của con người. Cần thiết phải thiết lập quy định và giữ vững giá trị nhân văn trong thế giới ngày càng tự động hóa.
https://theconversation.com/ai-agents-promise-to-arrange-your-finances-do-your-taxes-book-your-holidays-and-put-us-all-at-risk-247021
📌 Tương lai mà Jensen Huang hình dung là một thế giới nơi mọi người quản lý tác nhân AI cá nhân, mang lại "siêu trí tuệ" để giải quyết các nhiệm vụ phức tạp. Với các công nghệ như RTX Blackwell, Cosmos, và DLSS 4, Nvidia đang dẫn đầu xu hướng này, tạo ra nền tảng cho AI tích hợp sâu rộng vào đời sống và công việc.
https://venturebeat.com/ai/in-the-future-we-will-all-manage-our-own-ai-agents-jensen-huang-qa/
- OpenAI đã chính thức giới thiệu tính năng "tasks" cho ChatGPT, cho phép thực hiện nhiệm vụ tự động.
- Tính năng này đang ở giai đoạn beta dành cho người dùng ChatGPT Plus, Teams, và Pro trong vài ngày tới.
- Người dùng có thể yêu cầu ChatGPT thực hiện các tác vụ trong tương lai, như thông báo tin tức hàng tuần và bản cập nhật thời tiết hàng ngày.
- Tính năng "tasks" kết hợp giữa thông báo từ Google Alerts, lịch cá nhân và khả năng hiện có của ChatGPT, đánh dấu bước tiến lớn trong việc phát triển AI tác nhân (agentic AI).
- Theo Sam Altman, CEO của OpenAI, năm 2025 sẽ chứng kiến sự phát triển lớn của AI giúp người dùng.
- Mục tiêu AGI (Trí tuệ nhân tạo tổng quát) đang trở nên gần hơn với các tính năng mới này, mặc dù vẫn còn thách thức trong việc phát triển thêm.
- OpenAI phân loại các giai đoạn AI thành 5 cấp độ, với cấp độ 3 là "agents", và cấp độ 5 là "superintelligence".
- Người dùng có thể chọn "4o với nhiệm vụ đã lên lịch" từ menu trong ChatGPT để bắt đầu sử dụng tính năng này.
- Việc quản lý nhiệm vụ diễn ra trong menu thả xuống từ tài khoản cá nhân.
- ChatGPT cũng có thể đề xuất nhiệm vụ, cho phép người dùng chấp nhận hoặc từ chối.
- Thông báo nhiệm vụ sẽ được gửi qua thông báo đẩy trên trình duyệt và ứng dụng di động.
📌 Tính năng mới "tasks" của ChatGPT cho phép người dùng giao nhiệm vụ cho AI, từ nhắc nhở đến báo cáo thời tiết. Tính năng này đang ở giai đoạn beta và sẽ được triển khai cho người dùng Plus, Team, và Pro trên tất cả các nền tảng.
https://sea.mashable.com/tech/35976/openai-adds-agentic-ai-tasks-to-chatgpt-heres-what-it-can-do-for-you
- AI hiện thân đề cập đến việc tích hợp hệ thống AI vào máy móc, với trọng tâm là tương tác giữa thực thể vật lý và môi trường.
- Khái niệm này nhấn mạnh rằng trí thông minh không chỉ đến từ tính toán trừu tượng, mà còn từ sự tương tác thực tế.
- Khái niệm "intelligence gắn với cơ thể" được phổ biến bởi các nhà nghiên cứu như Rodney Brooks, người ủng hộ rằng trí thông minh không thể đạt được mà không có tương tác vật lý với thế giới thực.
- Trong robotics, AI hiện thân chứng tỏ vai trò quan trọng trong việc thiết kế các hệ thống AI có khả năng tương tác và thích ứng với môi trường.
- Một số ví dụ điển hình về AI hiện thân bao gồm:
- Robot Boston Dynamics như Spot và Atlas, với khả năng di chuyển trên địa hình phức tạp.
- Xe tự lái, hoạt động dựa trên nguyên tắc AI hiện thân để nhận diện môi trường xung quanh.
- Robot hình người như Optimus của Tesla, thực hiện các nhiệm vụ yêu cầu tương tác tương tự con người.
- Trí thông minh trong AI có nhiều khía cạnh, thường được định nghĩa là khả năng học hỏi, hiểu biết và áp dụng kiến thức để giải quyết vấn đề.
- AI hiện thân mở rộng định nghĩa này, bao gồm cả sự nhận thức tình huống và khả năng vật lý cần thiết để máy móc hoạt động hiệu quả trong thế giới thực.
- Việc đo lường AI truyền thống tập trung vào các phép đo hiệu suất cụ thể, trong khi AI hiện thân cần thêm các phương pháp đánh giá như khả năng thích ứng và tích hợp cảm biến.
- Phương pháp TOPS (trillions of operations per second) hiện đang được công nhận rộng rãi để đo hiệu suất hệ thống AI.
- Tranh cãi về khả năng của AI hiện thân trong việc đạt được "trí thông minh thật sự" vẫn diễn ra, với sự nhấn mạnh vào tương tác thực tế là một yếu tố quan trọng.
- Nghiên cứu và phát triển AI hiện thân thể hiện một biên giới quan trọng trong lĩnh vực robot và AI, góp phần thu hẹp khoảng cách giữa máy móc và thế giới thực.
📌 AI hiện thân đang trở thành một yếu tố quan trọng trong nghiên cứu robotics, nhấn mạnh sự tương tác vật lý và nhận thức môi trường. Điều này thiết lập nền tảng cho sự phát triển các hệ thống AI mạnh mẽ hơn, có khả năng thích ứng và hoạt động hiệu quả trong môi trường thực tế.
https://roboticsandautomationnews.com/2025/01/10/what-is-embodied-ai-and-what-are-its-implications/88436/
- agents là công nghệ mới đang được các công ty hàng đầu như Google DeepMind, OpenAI và Anthropic phát triển mạnh mẽ trong ngành AI.
- Sam Altman dự đoán rằng vào năm 2025, AI agents sẽ "gia nhập lực lượng lao động" và tạo ra sự thay đổi đáng kể cho các công ty.
- agents được định nghĩa là các hệ thống phần mềm có khả năng thực hiện nhiệm vụ với ít hoặc không cần giám sát.
- các mô hình ngôn ngữ lớn (large language models) đã đủ thông minh để hỗ trợ agents thực hiện nhiều nhiệm vụ hữu ích, như tổng hợp thông tin từ tài liệu, tìm kiếm công thức nấu ăn và điền vào giỏ hàng trực tuyến.
- Anthropic đã giới thiệu một trong những agents tiên tiến nhất mang tên Computer Use, cho phép người dùng chỉ đạo Claude thực hiện các tác vụ trên máy tính giống như con người.
- tính năng này hiện vẫn còn một số hạn chế và gặp lỗi, nhưng đã được cung cấp cho một số nhà phát triển thử nghiệm.
- Jared Kaplan, đồng sáng lập và nhà khoa học chính của Anthropic, đã chỉ ra 5 cách mà agents sẽ cải thiện vào năm 2025:
1. agents sẽ cải thiện khả năng sử dụng công cụ, trở nên thông minh hơn trong việc thực hiện các nhiệm vụ phức tạp và nhận biết khi nào cần sửa lỗi.
2. agents sẽ hiểu rõ ngữ cảnh và học hỏi từ các tài liệu, ứng dụng mà người dùng sử dụng, từ đó đưa ra giải pháp hữu ích và an toàn hơn.
3. vai trò của các trợ lý lập trình sẽ được cải thiện, cho phép việc lập trình trở nên dễ dàng hơn với khả năng phát hiện và sửa lỗi hiệu quả.
4. vấn đề an toàn trở thành ưu tiên hàng đầu, với sự quan tâm đặc biệt đối với việc phòng chống xâm nhập từ các yêu cầu độc hại nhằm điều khiển hoạt động của AI.
5. AI sẽ trở thành một công cụ hữu ích trong nhiều lĩnh vực, từ công nghệ đến lập trình, nhưng cũng sẽ phải đối mặt với nhiều thử thách mới.
📌 Các agents AI sẽ cải thiện đáng kể vào năm 2025, đặc biệt trong việc sử dụng công cụ và tương tác an toàn hơn, hứa hẹn mang lại những lợi ích to lớn cho các doanh nghiệp và nhà phát triển.
https://www.technologyreview.com/2025/01/11/1109909/anthropics-chief-scientist-on-5-ways-agents-will-be-even-better-in-2025/
#MIT
- AI agents đang được các doanh nghiệp ứng dụng rộng rãi trong nhiều lĩnh vực như phát triển thuốc, dịch vụ khách hàng, tiếp thị và nghiên cứu.
- Johnson & Johnson đang sử dụng AI agents trong quy trình tổng hợp hóa học để phát hiện thuốc hiệu quả hơn và giảm thiểu sai sót thời gian bằng cách tự động tính toán các yếu tố cần thiết cho quá trình.
- Moody’s đã phát triển 35 AI agents, cho phép thực hiện nghiên cứu tài chính và phân tích công ty một cách tự động, với khả năng đưa ra những đánh giá khác nhau cho các yếu tố tài chính phức tạp.
- EBay đã tạo ra một “agent framework” giúp viết mã và tạo các chiến dịch tiếp thị, đồng thời hỗ trợ người mua tìm kiếm hàng hóa và người bán đăng bán sản phẩm.
- Deutsche Telekom triển khai một AI agent cho phép nhân viên hỏi bất kỳ điều gì liên quan đến chính sách nội bộ và sản phẩm, đồng thời tự động thực hiện các tác vụ như đặt nghỉ phép.
- Cosentino đã triển khai một “lực lượng lao động số” để cải thiện dịch vụ khách hàng, giúp giảm thiểu số lượng nhân viên cần thiết nhưng vẫn đảm bảo chất lượng phục vụ.
📌 AI agents đang trở thành công cụ quan trọng trong việc tự động hóa và tối ưu hóa quy trình tại các doanh nghiệp lớn, từ phát hiện thuốc cho đến cải thiện dịch vụ khách hàng. Hàng triệu USD đầu tư vào công nghệ này dự kiến sẽ mang lại lợi ích lớn trong tương lai.
https://www.wsj.com/articles/how-are-companies-using-ai-agents-heres-a-look-at-five-early-users-of-the-bots-26f87845
#WSJ
Các công ty đang sử dụng các tác nhân AI như thế nào? Đây là cái nhìn về 5 người dùng đầu tiên của các bot này
Các doanh nghiệp này đang sử dụng các tác nhân AI để khám phá thuốc, dịch vụ khách hàng, tiếp thị, viết mã và nghiên cứu. Nhưng họ vẫn chưa sẵn sàng để các bot hoạt động mất kiểm soát.
Belle Lin
Ngày 6 tháng 1 năm 2025, 7:00 sáng theo giờ ET
Nếu các tác nhân AI hoạt động như mong đợi, chúng có thể mang lại cho doanh nghiệp lợi tức đầu tư mà họ đang tìm kiếm từ AI tạo sinh.
Các tác nhân trí tuệ nhân tạo đã nổi lên như một trong những khía cạnh thú vị nhất của AI tạo sinh trong kinh doanh vì chúng đưa chatbot lên một tầm cao mới, thực hiện các nhiệm vụ phức tạp mà không cần sự hỗ trợ từ con người.
Những tác nhân AI tự động này có thể làm theo hướng dẫn và thực hiện các công việc như kiểm tra đặt chỗ thuê xe tại sân bay hoặc sàng lọc các khách hàng tiềm năng.
Các công ty phần mềm từ Salesforce đến ServiceNow, Microsoft và Workday vào năm ngoái đều đã công bố các tác nhân AI của riêng mình, mà theo họ có thể giúp các doanh nghiệp giảm sự can thiệp của con người trong các lĩnh vực như tuyển dụng, liên hệ khách hàng tiềm năng, tạo nội dung tiếp thị và quản lý công nghệ thông tin.
Nếu các tác nhân AI này hoạt động như mong đợi, chúng cũng có thể mang lại cho doanh nghiệp lợi tức đầu tư mà họ đang tìm kiếm từ AI tạo sinh. Theo một số lãnh đạo công nghệ doanh nghiệp, điều này có nghĩa là khả năng liên kết công nghệ với việc giảm số giờ làm việc của nhân viên hoặc thậm chí số người mới cần thuê.
Phu Nguyen, người đứng đầu mảng môi trường làm việc số tại Pure Storage, coi các tác nhân AI là một sự hỗ trợ rõ ràng cho mỗi nhân viên của công ty lưu trữ dữ liệu này: “Tại sao chỉ có các giám đốc điều hành mới có người viết email hay làm slide giúp họ? Hãy tưởng tượng, giờ đây tất cả nhân viên đều có quyền năng đó?” anh nói.
Tuy nhiên, nhiều tác nhân AI hơn cũng đồng nghĩa với nhiều vấn đề hơn, đặc biệt trong lĩnh vực an ninh mạng, theo công ty nghiên cứu thị trường và tư vấn CNTT Gartner. Đến năm 2028, ít nhất 15% các quyết định kinh doanh hàng ngày sẽ được thực hiện tự động thông qua AI tác nhân—tăng từ 0% vào năm 2024, Gartner cho biết. Nhưng cũng trong thời điểm đó, 25% các vi phạm doanh nghiệp sẽ liên quan đến việc lạm dụng tác nhân AI.
Dưới đây là năm công ty đã bắt đầu tích hợp các tác nhân AI vào sản phẩm và hoạt động của mình, cùng những gì họ đã học được trong quá trình này.
Johnson & Johnson: Các tác nhân khám phá thuốc
Tại Johnson & Johnson, công ty chăm sóc sức khỏe có trụ sở tại New Jersey, các tác nhân AI đang được sử dụng để hỗ trợ quá trình tổng hợp hóa học trong khám phá thuốc.
Khi một phân tử dược phẩm đầy triển vọng được xác định, theo CIO Jim Swanson, nó cần được đo lường về hiệu quả chi phí và độ tin cậy. Có rất nhiều biến số cần xem xét trong quá trình này—từ nhiệt độ đến các phản ứng được tối ưu hóa.
Giải pháp: một tác nhân AI tự động có thể xác định thời điểm tốt nhất để thực hiện chuyển đổi dung môi, quá trình mà một dung môi được thay thế bằng dung môi khác để kết tinh một phân tử và thực sự tạo ra thuốc, Swanson nói.
Không có sự trợ giúp của các công nghệ này, các nhà khoa học của J&J sẽ phải thực hiện nhiều lần lặp lại của cùng một quy trình theo cách thủ công, đảm bảo điều kiện phù hợp để tối ưu hóa việc chuyển đổi.
“Chúng tôi đang sử dụng các tác nhân để xử lý nội dung đó, với tất cả các biến số, và tìm ra: ‘Khi nào là thời điểm tiếp theo để thực hiện chuyển đổi đó và thực sự thực hiện nó?’” ông nói. Các tác nhân này được kết hợp với học máy truyền thống và bản sao số (digital twins)—thực chất là các bản sao kỹ thuật số của các thực thể trong thế giới thực—để tăng tốc quy trình.
Tuy nhiên, J&J đang tiến hành cẩn trọng. Họ đang “lưu ý đến rủi ro liên quan đến các tác nhân tự động có thể tạo ra hành vi sai lệch,” Swanson nói, chẳng hạn như tạo ra thông tin thiên vị và xuất hiện các lỗi nhận thức.
Nhân viên xem xét các kết quả đầu ra từ các tác nhân, nhưng công ty vẫn đang tìm cách để việc giám sát đó có thể được thực hiện một cách có hệ thống hơn.
Moody’s: Các tác nhân phân tích tài chính có khả năng bất đồng quan điểm
Các tác nhân AI đang trở thành nhân tố chủ chốt trong nghiên cứu tại Moody’s, công ty phân tích tài chính và phần mềm có trụ sở tại New York.
Nhiều khía cạnh của nghiên cứu, bao gồm so sánh ngành và xem xét các hồ sơ của công ty tại Ủy ban Chứng khoán và Giao dịch Hoa Kỳ (SEC), trước đây đã được thuê ngoài đến các khu vực có chi phí thấp hơn ngoài Hoa Kỳ, theo Nick Reed, Giám đốc sản phẩm của công ty. Giờ đây, một phần công việc đó đang được thực hiện bởi các tác nhân AI tự động—cụ thể là các tác nhân hoạt động phối hợp với các tác nhân khác.
Công ty đã phát triển tổng cộng 35 tác nhân, một số tác nhân đảm nhận các nhiệm vụ nhỏ như quản lý dự án, và liên kết chúng với các tác nhân giám sát, tạo nên cái mà Reed gọi là “hệ thống đa tác nhân”.
Các tác nhân của Moody’s được cung cấp hướng dẫn cụ thể, tính cách và quyền truy cập vào dữ liệu và nghiên cứu. Nhờ đó, chúng có thể đưa ra các kết luận khác nhau, đặc biệt trong các chủ đề phức tạp như phân tích sức khỏe tài chính của một công ty có vẻ ổn định nhưng đang đối mặt với rủi ro địa chính trị.
“Đó gần giống như khả năng của một người” Reed nói. “Điều chúng tôi đã nhận ra là một tác nhân sẽ làm tốt hơn khi không phải làm đa nhiệm.”
EBay: Các tác nhân viết mã và bán hàng hóa
EBay dự kiến triển khai các tác nhân có thể giúp người mua tìm kiếm hàng hóa và người bán đăng sản phẩm.
EBay đang sử dụng các tác nhân AI để hỗ trợ viết mã và tạo chiến dịch tiếp thị. Công ty cũng có kế hoạch triển khai các tác nhân có thể giúp người mua tìm kiếm sản phẩm và người bán liệt kê hàng hóa.
Để đạt được điều đó, thị trường trực tuyến có trụ sở tại San Jose, California, đã tạo ra một “khung tác nhân” của riêng mình, có thể sử dụng nhiều mô hình ngôn ngữ lớn trong nền tảng, theo Nitzan Mekel-Bobrov, Giám đốc AI của eBay.
Khung tác nhân này hoạt động như một người điều phối, quyết định mô hình AI nào sẽ được sử dụng cho các nhiệm vụ cụ thể như dịch mã và đề xuất các đoạn mã, Mekel-Bobrov cho biết. Khi các tác nhân của eBay trở nên phức tạp hơn, chúng sẽ có khả năng hoạt động tự động hơn—viết mã từng dòng như các nhà phát triển con người, ông bổ sung.
“Khi nhân viên tương tác ngày càng nhiều với các hệ thống, hệ thống cũng học được sở thích cụ thể của họ,” ông nói.
Deutsche Telekom: Tác nhân 'hỏi gì cũng đáp' dành cho nhân viên
Gã khổng lồ viễn thông Deutsche Telekom, với khoảng 80.000 nhân viên tại Đức, đã triển khai một tác nhân AI để nhân viên có thể hỏi bất kỳ câu hỏi nào về chính sách nội bộ và các quyền lợi, cũng như nhân viên dịch vụ có thể hỏi về sản phẩm và dịch vụ.
Khoảng 10.000 nhân viên sử dụng tác nhân AI này mỗi tuần, theo Jonathan Abrahamson, Giám đốc Sản phẩm và Kỹ thuật số của Deutsche Telekom.
Deutsche Telekom cũng đang thử nghiệm cho phép tác nhân, được gọi là askT, thực hiện các nhiệm vụ thay mặt nhân viên, Abrahamson cho biết thêm. Một nhân viên muốn đặt kỳ nghỉ tiếp theo, chẳng hạn, có thể yêu cầu askT điền đơn xin nghỉ phép vào hệ thống nhân sự thay họ.
Cosentino: 'Nhân viên số' giải quyết vấn đề khách hàng
Công ty Tây Ban Nha Cosentino, nhà sản xuất bề mặt bàn bếp và các vật liệu đá khác cho nhà ở và công trình, đã đưa vào hoạt động một “lực lượng lao động số” gồm các tác nhân AI để lấp đầy khoảng trống trong đội ngũ dịch vụ khách hàng, theo Rafael Domene, CIO của công ty.
Cosentino gọi các tác nhân này là nhân viên số vì chúng được đối xử như vậy—chúng cần phải có một bộ kỹ năng cơ bản, nhưng cũng được đào tạo khi “bắt đầu công việc”. Chúng được hướng dẫn tuân theo một quy trình nghiêm ngặt, và công ty sẽ phát hiện nếu chúng đi chệch hướng, Domene nói.
Hiện tại, “nhân viên số” của công ty đã thay thế hoàn toàn công việc của 3 đến 4 người trước đây đảm nhận việc xử lý đơn hàng của khách hàng, và những nhân viên này hiện đang tập trung vào các lĩnh vực khác trong dịch vụ, theo Domene.
How Are Companies Using AI Agents? Here’s a Look at Five Early Users of the Bots
These businesses are using AI agents for drug discovery, customer service, marketing, writing code and research. But they aren’t quite ready to let the bots run amok.
By
Belle Lin
Jan. 6, 2025 7:00 am ET
If AI agents work as promised, they could give businesses the return on investment they have been looking for out of generative AI
Artificial intelligence agents have emerged as one of the most exciting aspects of generative AI for business because they take chatbots to the next level, performing complex tasks without help from humans.
These autonomous AI agents can follow instructions and do things from checking a car rental reservation at the airport to screening potential sales leads.
Software companies from Salesforce to ServiceNow, Microsoft and Workday last year all announced their own AI agents, which they say can help businesses be even more hands-off in areas like recruiting employees, contacting potential sales leads, creating marketing content and managing their information-technology.
If these AI agents work as promised, they could also provide businesses with the return on investment they have been looking for out of generative AI. According to some corporate technology leaders, that means the ability to tie the technology to a reduction in the number of hours employees work, or even how many new people they need to hire.
Phu Nguyen, the head of digital workplace at Pure Storage, considers AI agents an obvious boost for each of the data storage firm’s employees: “Why should executives be the only people that have a ghost writer that writes their emails or does their slides? Imagine, now, all employees have that power?” he said.
Still, more AI agents can mean more problems, especially in cybersecurity, according to market research and IT consulting firm Gartner. By 2028, at least 15% of daily business decisions will be made autonomously through agentic AI—up from 0% in 2024, Gartner said. But, also by that time, 25% of enterprise breaches will be tied to AI agent abuse.
Here are five companies that have started integrating AI agents into their products and operations, and what they have learned in the process.
Johnson & Johnson: Drug discovery agents
At New Jersey-based Johnson & Johnson, AI agents are being used to help the healthcare giant with the chemical synthesis process in drug discovery.
Once a promising pharmaceutical molecule has been identified, according to Chief Information Officer Jim Swanson, it needs to be measured for its cost effectiveness and reliability. And there are a lot of variables to consider in doing so—from temperature to which reactions are being optimized.
The solution: an autonomous AI agent that can determine the best time to conduct a solvent switch, a process where one solvent is swapped for another to crystallize a molecule and actually create the drug, Swanson said.
Without the help of these technologies, J&J’s scientists would go through multiple iterations of the same process manually, ensuring the right conditions are in place to optimize the switch.
“We’re using agents now to take that content, with all those variables, and figure out, ‘When’s the next time to do that switch and actually execute it?’” he said. The agents are combined with traditional machine learning and digital twins—essentially digital replicas of real-world entities—to speed up the process, he said.
Still, J&J is proceeding with caution. It is being “mindful of this risk with autonomous agents that could be creating bad behaviors,” Swanson said, such as generating biased information and outputting hallucinations.
Employees review the outputs of its agents, he said, but the company is still figuring out how that oversight can be done more systematically.
Moody’s: Financial analysis agents that disagree
AI agents are becoming key players in research at Moody’s, the New York-based financial analysis and software company.
Many aspects of research, including industry comparisons and looking at companies’ Securities and Exchange Commission filings, were already outsourced to lower-cost areas outside the U.S., said Nick Reed, the company’s chief product officer. Now, some of that work is being done by autonomous AI agents—specifically those that work in conjunction with other agents.
The company has developed a total of 35 agents, some for smaller tasks like project management, and linked them up with agents for supervising them, creating what Reed calls a “multi-agent system.”
Moody’s agents are given specific instructions, personalities and access to data and research. As a result, they can come to different conclusions, especially for complex topics like analyzing the financial fitness of a company that appears healthy, but is facing geopolitical risk.
“It’s almost a bit like your ability as an individual person,” Reed said. “What we worked out is that an agent is better at not multitasking.”
EBay: Agents that write code and sell items
EBay plans to roll out agents that can help buyers find items and sellers list goods.
EBay is using AI agents to help write code and create marketing campaigns. The company also plans to roll out agents that can help buyers find items and sellers list goods.
To make it all happen, the San Jose, Calif.-based online marketplace created its own “agent framework” that can use several large language models in the background, said Nitzan Mekel-Bobrov, eBay’s chief AI officer.
The agent framework functions as an orchestrator, dictating which AI models will be used for certain tasks like translating code and suggesting code snippets, Mekel-Bobrov said. As its agents become more sophisticated, they’ll be able to act more autonomously—writing more code on their own, line by line, as human developers would, he added.
“As employees interact more and more with the systems, it also learns their specific preferences,” he said.
Deutsche Telekom: An ask me anything agent for employees
Telecommunications giant Deutsche Telekom, which has roughly 80,000 employees in Germany, has rolled out an AI agent for its employees to ask any question about internal policies and benefits, and for its service staff to ask questions about its products and services.
About 10,000 employees use the AI agent each week, said Jonathan Abrahamson, Deutsche Telekom’s Chief Product and Digital Officer.
Deutsche Telekom is also experimenting with letting the agent, which it calls askT, perform tasks on behalf of employees, Abrahamson added. An employee who wants to book their next vacation, for instance, can tell askT to put the leave request into the human resources software system on their behalf.
Cosentino: ‘Digital workforce’ solving customer issues
The Spanish company Cosentino, which makes countertop surfaces and other stone materials for homes and buildings, has brought on a “digital workforce” of AI agents to fill the gaps in its customer service staff, said Rafael Domene, the company’s CIO.
Cosentino calls its agents digital workers because they’re treated that way—they need to come with a set of basic skills, but they also get training when they first arrive on the job. They’re also instructed to follow a strict process, and the company knows if they go off the rails, Domene said.
Now, its “digital staff” have entirely replaced the work of three to four people previously involved in clearing customer orders, and those staff are focusing on other areas of service, according to Domene.
- AI đang phát triển từ khả năng tạo ra văn bản, âm thanh và video sang khả năng tương tác với thế giới vật lý.
- Các mô hình AI hiện tại gặp khó khăn khi áp dụng vào thực tế, như trong việc phát triển xe tự lái an toàn và tin cậy.
- Trí tuệ vật lý là hình thức mới của máy móc thông minh, có khả năng hiểu môi trường động, đối phó với tính không chắc chắn và ra quyết định theo thời gian thực.
- Mô hình trí tuệ vật lý dựa trên hiểu biết về các nguyên tắc cơ bản của thực tại, như nguyên nhân và kết quả.
- Nhóm nghiên cứu tại MIT phát triển các mô hình trí tuệ vật lý gọi là mạng lỏng. Một thí nghiệm cho thấy 2 drone, một sử dụng AI tiêu chuẩn và một sử dụng mạng lỏng, có thể thực hiện nhiệm vụ trong mùa hè, nhưng chỉ drone với mạng lỏng thành công trong các điều kiện mùa đông hoặc đô thị khác.
- Trí tuệ vật lý có khả năng giải thích và thực hiện các lệnh phức tạp từ văn bản hoặc hình ảnh, giúp cầu nối giữa hướng dẫn số và thực thi trong thế giới thực.
- Một ví dụ là hệ thống có thể thiết kế và in 3D các robot nhỏ chỉ trong chưa đầy một phút từ các gợi ý như "robot có thể đi về phía trước".
- Công ty khởi nghiệp Covariant đang phát triển chatbot có khả năng điều khiển cánh tay robot, đã huy động được hơn 222 triệu USD để triển khai robot phân loại trong các kho hàng trên toàn cầu.
- Một đội ngũ tại Carnegie Mellon đã chứng minh rằng robot sử dụng một camera và cơ chế không chính xác cũng có thể thực hiện các chuyển động parkour phức tạp nhờ học tăng cường.
- Năm 2023 đánh dấu thời kỳ chuyển từ văn bản sang hình ảnh, năm 2024 là từ văn bản sang video, và năm 2025 sẽ là kỷ nguyên của trí tuệ vật lý với nhiều thiết bị thông minh mới có khả năng thực hiện tác vụ trong thế giới thực.
📌 Trí tuệ vật lý là xu hướng mới, giúp AI tương tác hiệu quả với môi trường thực. Các mô hình như mạng lỏng cho phép robot học hỏi và thích ứng, từ đó mở rộng khả năng thực thi nhiệm vụ trong thực tế, tạo ra nhiều cơ hội mới cho công nghệ và tự động hóa.
https://www.wired.com/story/ai-physical-intelligence-machine-learning/
- NVIDIA công bố dòng mô hình ngôn ngữ lớn nguồn mở Llama Nemotron, xây dựng trên nền tảng Llama - bộ mô hình đã được tải xuống hơn 650 triệu lần
- Dòng sản phẩm bao gồm hai họ mô hình chính:
- Llama Nemotron: Tập trung vào xử lý ngôn ngữ
- Cosmos Nemotron: Chuyên về thị giác-ngôn ngữ
- Ba phiên bản mô hình được cung cấp:
- Nano: Tối ưu cho ứng dụng thời gian thực, độ trễ thấp
- Super: Độ chính xác cao, hiệu suất tốt trên một GPU
- Ultra: Độ chính xác cao nhất, thiết kế cho quy mô trung tâm dữ liệu
- Các tính năng chính của nền tảng:
- Tích hợp dịch vụ vi mô NVIDIA NIM
- Hỗ trợ tìm kiếm và tóm tắt video
- Khả năng tùy chỉnh cho từng doanh nghiệp
- Tích hợp NVIDIA NeMo Retriever để kết nối với dữ liệu doanh nghiệp
- Các đối tác hàng đầu đã áp dụng:
- SAP với nền tảng Joule
- ServiceNow cho dịch vụ AI tác tử
- Mô hình được tối ưu hóa thông qua:
- Kỹ thuật cắt tỉa (pruning)
- Huấn luyện với bộ dữ liệu chất lượng cao
- Tích hợp khả năng theo dõi hướng dẫn, trò chuyện, lập trình
- Tính khả dụng:
- Miễn phí cho thành viên NVIDIA Developer Program
- Triển khai thương mại thông qua nền tảng NVIDIA AI Enterprise
- Hỗ trợ đa dạng môi trường: đám mây, trung tâm dữ liệu, máy tính cá nhân
📌 NVIDIA định hình lại tương lai AI tác tử với dòng Nemotron, cung cấp giải pháp toàn diện từ biên đến trung tâm dữ liệu. Mô hình nguồn mở Llama đạt 650 triệu lượt tải xuống, kết hợp 3 phiên bản (Nano, Super, Ultra) đáp ứng mọi nhu cầu triển khai.
https://blogs.nvidia.com/blog/nemotron-model-families/
- Tim Brooks, cựu đồng trưởng nhóm phát triển công cụ tạo video Sora của OpenAI, sẽ dẫn dắt nhóm nghiên cứu mới tại Google DeepMind
- Nhóm mới sẽ phát triển các mô hình AI có khả năng mô phỏng thế giới vật lý, làm việc cùng các nhóm:
+ Gemini: mô hình phân tích hình ảnh và tạo văn bản
+ Veo: công cụ tạo video
+ Genie: mô hình mô phỏng trò chơi và môi trường 3D theo thời gian thực
- Mục tiêu của nhóm:
+ Phát triển công cụ tạo nội dung tương tác theo thời gian thực
+ Tích hợp với các mô hình multimodal hiện có như Gemini
+ Hướng tới phát triển AGI (trí tuệ nhân tạo tổng quát)
- Các công ty khác cũng đang phát triển mô hình thế giới:
+ World Labs của Fei-Fei Lee
+ Decart (Israel)
+ Odyssey
- Thách thức và lo ngại:
+ Theo nghiên cứu của Animation Guild, hơn 100.000 việc làm trong ngành phim, truyền hình và hoạt hình tại Mỹ sẽ bị ảnh hưởng bởi AI vào năm 2026
+ Vấn đề bản quyền chưa được giải quyết với việc sử dụng video từ YouTube để huấn luyện mô hình
+ Activision Blizzard đã sa thải nhiều nhân viên và sử dụng AI để tăng năng suất
📌 Google DeepMind tham vọng xây dựng mô hình AI mô phỏng thế giới thực dưới sự dẫn dắt của Tim Brooks từ OpenAI. Dự án hướng tới AGI và tích hợp với Gemini, tuy nhiên đối mặt thách thức về tác động việc làm khi 100.000 vị trí trong ngành giải trí có thể bị ảnh hưởng vào 2026.
https://techcrunch.com/2025/01/06/google-is-forming-a-new-team-to-build-ai-that-can-simulate-the-physical-world/
- Jensen Huang, CEO Nvidia phát biểu tại hội nghị Consumer Electronics Show ở Las Vegas ngày 8/1/2024, khẳng định cuộc cách mạng AI sắp mang lại bước đột phá trong ngành robot
- CEO Nvidia tin rằng "khoảnh khắc ChatGPT" trong lĩnh vực robot đa năng đang rất gần kề, tương tự như cách ChatGPT của OpenAI đã thúc đẩy sự quan tâm rộng rãi về AI tạo sinh từ cuối năm 2022
- Theo Huang, có 3 loại robot quan trọng không cần môi trường đặc biệt để hoạt động:
+ Robot thông tin với AI agent
+ Xe tự lái
+ Robot hình người
- Nvidia giới thiệu sáng kiến Isaac Groot nhằm thúc đẩy phát triển robot, bao gồm:
+ Các foundation model
+ Pipeline dữ liệu
+ Framework mô phỏng
+ Máy tính robot Thor
- Công nghệ mới cho phép:
+ Thu thập dữ liệu huấn luyện robot mà không cần robot thực
+ Ghi lại chuyển động của con người
+ Tạo chính sách robot
+ Kiểm thử phần mềm trong môi trường mô phỏng trước khi triển khai thực tế
- Thách thức lớn nhất là thu thập dữ liệu huấn luyện cho robot hình người, đòi hỏi phải:
+ Thu thập hàng trăm mẫu thị phạm từ con người
+ Dùng AI và omniverse để tạo ra hàng triệu chuyển động tổng hợp
+ Từ đó AI học cách thực hiện nhiệm vụ
📌 Nvidia đặt cược lớn vào tương lai robot thông minh với sáng kiến Isaac Groot, nhắm tới 3 mảng trọng tâm: robot thông tin, xe tự lái và robot hình người. Công ty cung cấp nền tảng toàn diện từ thu thập dữ liệu đến mô phỏng và triển khai thực tế.
https://www.foxbusiness.com/technology/nvidia-ceo-the-chatgpt-moment-general-robotics-just-around-corner
- Nvidia vừa công bố nền tảng AI Cosmos tại triển lãm CES 2025 ở Las Vegas, nhằm cách mạng hóa việc phát triển robot và xe tự hành
- Nền tảng này sử dụng world foundation models (WFMs) - các mạng neural có khả năng tạo mô phỏng video chính xác
- Cosmos được huấn luyện trên bộ dữ liệu khổng lồ gồm 20 triệu giờ thước phim thực tế về robot và lái xe
- Nền tảng cung cấp 3 loại mô hình: Nano, Super và Ultra cho các mức hiệu suất khác nhau
- Công nghệ cho phép xử lý 20 triệu giờ dữ liệu chỉ trong 14 ngày sử dụng GPU của Nvidia, thay vì mất nhiều năm với phương pháp thông thường
- Các công ty lớn đã áp dụng sớm bao gồm: Uber, Agility Robotics và các công ty xe tự hành Waabi, Wayve
- Cosmos được phát hành dưới dạng phần mềm nguồn mở thông qua nền tảng Hugging Face
- Nền tảng hỗ trợ tạo dữ liệu tổng hợp, cho phép nhà phát triển thử nghiệm trong môi trường ảo mà không cần dữ liệu thực tế lớn
- Theo giáo sư Farshid Amirabdollahian, các thách thức vẫn tồn tại bao gồm: chi phí, an toàn, quy định và nhận thức của công chúng
📌 Nvidia Cosmos đánh dấu bước tiến quan trọng trong ngành robot với khả năng xử lý 20 triệu giờ dữ liệu thực tế chỉ trong 14 ngày. Nền tảng nguồn mở này đang được các công ty hàng đầu như Uber và Agility Robotics áp dụng, hứa hẹn mang lại cuộc cách mạng trong phát triển robot và xe tự hành.
https://www.newsweek.com/nvidia-cosmos-ai-chatgpt-moment-robotics-2010961
- Nvidia và OpenAI đang chuẩn bị cho sự xuất hiện của robot hình người được hỗ trợ bởi AI và các công cụ "siêu thông minh" trong tương lai gần.
- CEO Nvidia Jensen Huang công bố kế hoạch triển khai "AI agent" tại nơi làm việc, với các trợ lý AI sẽ xuất hiện trong văn phòng.
- Tại triển lãm CES ở Las Vegas, Nvidia tập trung vào phát triển robot và công nghệ có khả năng hoạt động trong môi trường thực, bao gồm robot tác nhân, xe tự lái và robot hình người.
- Nvidia công bố hợp tác với Toyota để phát triển thế hệ xe tự lái tiếp theo, đồng thời Mercedes-Benz sẽ bắt đầu sản xuất xe được trang bị công nghệ Nvidia trong năm nay.
- Nvidia ra mắt nền tảng mới giúp các nhà phát triển huấn luyện robot hình người thông qua "học bắt chước" để mô phỏng hành vi con người chính xác hơn.
- CEO OpenAI Sam Altman dự đoán các tác nhân AI đầu tiên sẽ "tham gia lực lượng lao động" vào năm 2025, đồng thời công ty đang hướng tới phát triển trí tuệ nhân tạo tổng quát (AGI).
- OpenAI đặt mục tiêu phát triển "siêu thông minh", với tầm nhìn rằng các công cụ siêu thông minh có thể đẩy nhanh quá trình khám phá khoa học và đổi mới vượt xa khả năng hiện tại của con người.
📌 Hai gã khổng lồ công nghệ Nvidia và OpenAI đang dẫn đầu cuộc cách mạng AI với kế hoạch triển khai robot hình người và công cụ siêu thông minh vào năm 2025. Nvidia tập trung vào robot học bắt chước và xe tự lái, trong khi OpenAI hướng tới phát triển AGI và siêu thông minh nhằm thúc đẩy đột phá khoa học.
https://www.washingtontimes.com/news/2025/jan/7/tech-titans-readying-ai-humanoid-robots-superintel/
- Các công ty công nghệ lớn như Google, Microsoft, Anthropic và OpenAI đang phát triển thế hệ chatbot mới gọi là "AI agent", có khả năng điều khiển máy tính thay người dùng
- Sam Altman, CEO OpenAI khẳng định AI agent có thể hoàn thành công việc cả tháng chỉ trong 1 giờ
- ChatGPT hiện có 300 triệu người dùng hàng tuần, đây là động lực để các công ty tìm cách phát triển công nghệ AI thiết yếu hơn nữa
- Google đang thử nghiệm agent Mariner có khả năng đặt hàng tạp hóa trực tuyến bằng cách đọc công thức nấu ăn và tự động thêm nguyên liệu vào giỏ hàng
- Anthropic cảnh báo AI agent đôi khi hiểu sai và thực hiện lệnh từ văn bản trên trang web, bất chấp chỉ dẫn của người dùng
- Chuyên gia bảo mật Johann Rehberger đã chứng minh lỗ hổng này bằng cách khiến AI agent tự động tải và chạy malware
- AI agent cần "nhìn thấy" màn hình máy tính qua screenshot và tải lên cloud để phân tích, tiềm ẩn rủi ro về quyền riêng tư
- Microsoft đã trì hoãn ra mắt tính năng Recall - cho phép tìm kiếm mọi hoạt động trên máy tính qua screenshot, sau khi nhận phản hồi về quyền riêng tư
- Corynne McSherry từ Electronic Frontier Foundation cảnh báo người dùng nên thận trọng vì các công ty công nghệ có thể sử dụng dữ liệu thu thập được để quảng cáo hoặc bán cho bên thứ ba
- Chuyên gia Yacine Jernite lo ngại AI agent trong môi trường làm việc có thể khiến nhân viên mất thời gian sửa lỗi và vô tình cung cấp dữ liệu để thay thế chính họ
📌 Năm 2025, AI agent sẽ là xu hướng công nghệ mới có khả năng tự động hóa nhiều tác vụ thay con người, tuy nhiên đặt ra thách thức lớn về quyền riêng tư và bảo mật khi chúng cần quyền truy cập sâu vào đời sống số của người dùng.
https://www.washingtonpost.com/technology/2025/01/05/agents-ai-chatbots-google-mariner/
Bước nhảy vọt tiếp theo của AI yêu cầu truy cập sâu vào đời sống số của bạn
Các giám đốc điều hành công nghệ đang quảng bá "các tác nhân AI" (AI agents), những trợ lý kỹ thuật số có thể thực hiện các tác vụ trên máy tính, như là bước phát triển lớn tiếp theo của trí tuệ nhân tạo.
Ngày 5 tháng 1, 2025, 7:35 sáng EST
Các công ty công nghệ đã tiên phong phát triển chatbot AI nay cho biết rằng các phiên bản mạnh mẽ hơn, được gọi là “tác nhân” (agents), sẽ giúp mọi người hoàn thành công việc.
SAN FRANCISCO — Các công ty công nghệ đang chạy đua để nâng cấp các chatbot như ChatGPT không chỉ để cung cấp câu trả lời mà còn để kiểm soát máy tính nhằm thực hiện hành động thay cho người dùng.
Các chuyên gia về trí tuệ nhân tạo và an ninh mạng cảnh báo rằng công nghệ này sẽ yêu cầu người dùng tiết lộ nhiều hơn về đời sống số của mình cho các tập đoàn, có thể gây ra các vấn đề mới về quyền riêng tư và bảo mật.
Trong vài tuần gần đây, các giám đốc điều hành từ các công ty AI hàng đầu bao gồm Google, Microsoft, Anthropic và OpenAI đều dự đoán rằng một thế hệ trợ lý kỹ thuật số mới được gọi là “tác nhân AI” sẽ hoàn toàn thay đổi cách mọi người tương tác với máy tính.
Họ cho rằng công nghệ này, dự kiến sẽ là trọng tâm lớn của ngành vào năm 2025, ban đầu sẽ tự động hóa các công việc nhàm chán như mua sắm trực tuyến hoặc nhập liệu và cuối cùng sẽ xử lý những công việc phức tạp mà con người phải mất hàng giờ để hoàn thành.
“Điều này sẽ là một thay đổi rất lớn đối với cách thế giới hoạt động trong thời gian ngắn,” Sam Altman, Giám đốc điều hành OpenAI, cho biết tại một sự kiện của công ty vào tháng 10. “Mọi người sẽ yêu cầu một tác nhân làm một việc gì đó mà trước đây phải mất cả tháng, và nó sẽ hoàn thành trong một giờ.”
OpenAI đã nói rằng các tác nhân sẽ được hưởng lợi từ công việc gần đây của họ trong việc làm cho phần mềm AI có khả năng suy luận tốt hơn. Vào tháng 12, công ty đã ra mắt một hệ thống có tên là O1, hiện có sẵn thông qua ChatGPT, với mục tiêu giải quyết các vấn đề theo từng giai đoạn.
Mặc dù ChatGPT một mình có 300 triệu người dùng hàng tuần, OpenAI và các đối thủ như Google và Microsoft cần tìm ra các cách mới để khiến công nghệ AI của mình trở nên thiết yếu. Các công ty công nghệ đã đầu tư hàng trăm tỷ đô la vào công nghệ này trong hai năm qua, một cam kết lớn mà các nhà phân tích phố Wall cảnh báo sẽ khó thu hồi vốn.
Một mục tiêu tham vọng của các công ty phát triển tác nhân AI là làm cho chúng tương tác với các phần mềm khác như con người, bằng cách hiểu giao diện trực quan và sau đó nhấp chuột hoặc nhập dữ liệu để hoàn thành tác vụ.
Các công ty AI đang ra mắt và thử nghiệm các phiên bản tác nhân có thể xử lý các tác vụ như mua sắm trực tuyến, đặt lịch hẹn với bác sĩ hoặc lọc và trả lời email. Salesforce và các nhà cung cấp phần mềm doanh nghiệp khác đã mời khách hàng của họ tạo các phiên bản giới hạn của tác nhân để thực hiện các công việc như chăm sóc khách hàng.
Trong một buổi trình diễn gần đây tại trụ sở của Google ở Mountain View, California, một tác nhân AI do phòng thí nghiệm DeepMind của công ty phát triển, có tên là Mariner, được giao một tài liệu chứa công thức nấu ăn và được yêu cầu mua nguyên liệu trực tuyến.
Mariner, xuất hiện dưới dạng thanh bên trong trình duyệt Chrome, đã điều hướng đến trang web của chuỗi cửa hàng tạp hóa Safeway. Từng mục một, tác nhân này tìm kiếm từng sản phẩm trong danh sách và thêm vào giỏ hàng trực tuyến, tạm dừng khi hoàn thành để hỏi xem người đặt nhiệm vụ có muốn nó hoàn tất giao dịch hay không.
Mariner hiện chưa có sẵn công khai và Google vẫn đang làm việc để làm cho nó hữu ích đồng thời cho phép con người duy trì quyền kiểm soát đối với một số hành động nhất định, như thanh toán.
“Nó đang thực hiện một số tác vụ rất tốt, nhưng chắc chắn còn nhiều cải tiến mà chúng tôi muốn thực hiện,” Jaclyn Konzelmann, giám đốc quản lý sản phẩm tại Google, nói khi trình diễn tác nhân này.
Tác nhân AI mang lại nhiều hứa hẹn lớn. Một bot có thể trả lời các email thông thường trong khi một người chăm sóc con cái hoặc thực hiện công việc quan trọng hơn có thể rất hữu ích với nhiều người, và các doanh nghiệp có thể tìm thấy vô số ứng dụng cho các trợ lý AI có thể lập kế hoạch và thực hiện các hành động phức tạp.
Tuy nhiên, ngay cả những lãnh đạo trong ngành công nghệ đang chạy đua phát triển tác nhân AI cũng thừa nhận rằng chúng mang lại những rủi ro mới.
“Khi bạn cho phép một mô hình AI làm điều gì đó như vậy, có rất nhiều thứ mà nó có thể làm,” Dario Amodei, giám đốc điều hành của Anthropic AI, nói tại một hội nghị của Viện An toàn AI Hoa Kỳ vào tháng 11. “Nó có thể nói mọi thứ thay mặt tôi, thực hiện hành động, tiêu tiền hoặc thay đổi trạng thái nội bộ của máy tính.”
• Năm 2025 được dự báo là năm của điều phối AI, khi các chương trình thử nghiệm và ứng dụng AI mới hội tụ thành giá trị đầu tư thực tế
• Swami Sivasubramanian từ AWS nhấn mạnh 2025 sẽ là năm của năng suất, khi các lãnh đạo quan tâm nhiều hơn đến chi phí sử dụng AI và cách đạt được năng suất gấp 5 lần
• Theo Akshay Krishnaswamy của Palantir, các nhà quản lý đang mong đợi thấy tác động thực tế của đầu tư AI vào hoạt động kinh doanh
• Dự kiến sẽ có sự bùng nổ các framework điều phối AI mới cạnh tranh với LangChain, bao gồm Microsoft Magentic và LlamaIndex
• Nhu cầu tạo cơ sở hạ tầng để quản lý nhiều Agent và ứng dụng AI ngày càng tăng cao
• Các nền tảng như AWS Bedrock và Slack đang cung cấp kết nối với Agent từ Salesforce Agentforce hoặc ServiceNow
• Các mô hình suy luận mạnh mẽ như OpenAI 03 và Google Gemini 2.0 có thể giúp Agent điều phối trở nên hiệu quả hơn
• Don Vu từ New York Life cảnh báo về thách thức "last-mile" - nhân viên vẫn thường chọn phương pháp thủ công thay vì sử dụng công cụ AI
• Việc thay đổi hành vi con người được đánh giá là khó khăn hơn triển khai ứng dụng
• Các công ty cần tập trung vào quản lý thay đổi và tái thiết quy trình kinh doanh để thúc đẩy việc áp dụng AI
📌 Năm 2025 sẽ chứng kiến làn sóng điều phối AI với sự xuất hiện của nhiều framework mới cạnh tranh LangChain. Doanh nghiệp tập trung vào việc tăng năng suất lên gấp 5 lần thông qua điều phối đa Agent, tuy nhiên vẫn phải đối mặt với thách thức thay đổi thói quen sử dụng của nhân viên.
https://venturebeat.com/ai/three-ways-2025-will-be-the-year-of-agentic-productivity/
• Nvidia, công ty có giá trị vốn hóa hơn 3 nghìn tỷ USD, đang chuyển hướng tập trung vào thị trường robot
• Deepu Talla, phó chủ tịch mảng robot của Nvidia, nhận định thị trường robot đã đạt điểm bùng phát, AI vật lý và robot sắp có bước đột phá lớn
• Nvidia cung cấp nền tảng robot toàn diện bao gồm:
- Phần mềm huấn luyện mô hình AI nền tảng trên hệ thống DGX
- Nền tảng mô phỏng Omniverse
- Phần cứng Jetson
• Công ty sẽ ra mắt Jetson Thor vào năm 2025 - bộ não robot mới nhất trong dòng máy tính nhỏ gọn Jetson
• 2 yếu tố then chốt thúc đẩy sự phát triển:
- Sự trỗi dậy của các mô hình AI tạo sinh mạnh mẽ
- Khả năng huấn luyện robot trong môi trường mô phỏng
• Deepu Talla gia nhập Nvidia từ 2013, góp phần quan trọng đưa công ty tham gia vào lĩnh vực robot
• Figure AI, startup robot huy động được 675 triệu USD từ các nhà đầu tư bao gồm Nvidia, Jeff Bezos, Microsoft và OpenAI
• Hiện tại, mảng AI chiếm 88% doanh thu quý của Nvidia (35 tỷ USD)
• Dự báo từ BCC Research: Thị trường robot sẽ tăng từ 78 tỷ USD hiện tại lên 165 tỷ USD vào cuối năm 2029
📌 Nvidia đang đặt cược vào thị trường robot 165 tỷ USD với chip Jetson Thor, khi mảng AI đối mặt cạnh tranh từ AMD. Công ty kỳ vọng robot sẽ bùng nổ như ChatGPT nhờ sự kết hợp giữa AI tạo sinh và công nghệ mô phỏng tiên tiến.
https://www.techspot.com/news/106134-nvidia-believes-robotics-market-about-explode-like-chatgpt.html
- Giám đốc Microsoft Satya Nadella đưa ra dự đoán về tương lai ngành phần mềm: AI agent sẽ thay thế hoàn toàn các ứng dụng và nền tảng SaaS truyền thống
- Thay vì phải học cách sử dụng các phần mềm phức tạp, người dùng có thể đơn giản ra lệnh cho AI agent thực hiện công việc một cách hiệu quả
- AI agent sẽ tương tác trực tiếp với cơ sở dữ liệu để thực thi nhiệm vụ, bỏ qua các lớp ứng dụng trung gian và mang lại trải nghiệm người dùng liền mạch hơn
- Ví dụ thay vì phải điều hướng qua hệ thống CRM phức tạp, người dùng có thể yêu cầu AI agent truy xuất dữ liệu khách hàng, phân tích xu hướng hoặc tạo báo cáo theo thời gian thực
- Vai trò của nhà phát triển sẽ thay đổi: tập trung vào huấn luyện mô hình AI thay vì xây dựng ứng dụng tĩnh
- Microsoft đang dẫn đầu xu hướng này với các công cụ như Copilot được tích hợp vào Excel và Word, thể hiện tầm nhìn về giải pháp kinh doanh AI từ cốt lõi
- AI agent có thể tương tác liền mạch với nhiều cơ sở dữ liệu, cho phép doanh nghiệp tối ưu hóa cơ sở hạ tầng mà không bị ràng buộc vào một công nghệ cụ thể
- Logic kinh doanh sẽ được tích hợp trực tiếp vào AI agent, tự động hóa các tác vụ như tạo báo cáo, gửi email hoặc phân tích dữ liệu
📌 Theo dự đoán của CEO Microsoft, AI agent sẽ thay thế hoàn toàn phần mềm truyền thống, loại bỏ giao diện người dùng tĩnh. Sự thay đổi này sẽ tác động sâu rộng đến ngành công nghiệp phần mềm, vai trò của nhà phát triển và cách doanh nghiệp vận hành.
https://www.geeky-gadgets.com/ai-agents-replacing-traditional-software/
- OpenAI đề xuất các biện pháp toàn diện nhằm nâng cao độ an toàn và tin cậy cho hệ thống AI Agent - loại AI có khả năng tự thích nghi để đạt mục tiêu phức tạp trong thời gian dài
- Các hệ thống AI Agent đang định hình lại cách tự động hóa công việc trong nhiều lĩnh vực như phát triển phần mềm, hậu cần và dịch vụ khách hàng
- Thách thức chính của AI Agent:
+ Phải điều hướng trong môi trường động
+ Dễ bị tấn công bởi các tác nhân độc hại
+ Thiếu quy trình chuẩn để quản lý rủi ro
+ Phương pháp giám sát thủ công không phù hợp với môi trường đòi hỏi quyết định nhanh
- Các biện pháp an toàn được đề xuất:
+ Đánh giá kỹ lưỡng về khả năng thực hiện nhiệm vụ
+ Giới hạn quyền thực hiện các hành động quan trọng
+ Cung cấp nhật ký chi tiết để giám sát
+ Thiết kế khả năng ngắt hoạt động khi cần thiết
- Kết quả thử nghiệm:
+ Giảm 37% tỷ lệ lỗi nhờ đánh giá nhiệm vụ
+ Tăng 45% độ tin cậy của người dùng nhờ tính minh bạch
+ Cải thiện 52% khả năng phục hồi hệ thống khi gặp sự cố
+ Đạt 61% tỷ lệ thành công trong việc phát hiện và sửa các hành động có hại
- Khung quản trị đề xuất yêu cầu trách nhiệm chung giữa nhà phát triển, triển khai và người dùng
📌 Nghiên cứu của OpenAI đã chứng minh hiệu quả của các biện pháp an toàn mới cho AI Agent với việc giảm 37% tỷ lệ lỗi, tăng 45% độ tin cậy và khả năng phát hiện 61% hành động có hại trước khi gây hậu quả nghiêm trọng.
https://www.marktechpost.com/2024/12/21/openai-researchers-propose-comprehensive-set-of-practices-for-enhancing-safety-accountability-and-efficiency-in-agentic-ai-systems/
• Andrew Ng đã đề xuất lý thuyết về việc sử dụng mạng lưới thần kinh và dữ liệu lớn để phát triển trí tuệ nhân tạo tổng quát cách đây gần 15 năm.
• Năm 2011, ông đã giúp ra mắt Google Brain, một trong những chương trình AI tham vọng nhất thời bấy giờ.
• Hiện nay, Andrew Ng được coi là một trong những nhân vật được kính trọng nhất trong lĩnh vực khoa học máy tính.
• AI Fund của ông dự kiến huy động hơn 120 triệu USD cho quỹ thứ hai. Tính đến tháng 6, quỹ đã huy động được 69,75 triệu USD từ 13 đối tác.
• AI Fund được thành lập năm 2018 với số vốn 175 triệu USD, có sự hậu thuẫn của Sequoia và Softbank Group. Quỹ đã thực hiện 43 khoản đầu tư tính đến nay.
• Amazon đã bổ nhiệm Andrew Ng vào hội đồng quản trị vào tháng 4, thể hiện mong muốn nâng cao vị thế trong lĩnh vực AI của công ty.
• Andrew Ng đã nỗ lực phổ cập kiến thức về học sâu thông qua các khóa học trực tuyến trên Coursera và DeepLearning.AI, với hơn 8 triệu học viên tham gia.
• Ông được coi là một "ngôi sao AI" và là nhân vật trung tâm trong tương lai của trí tuệ nhân tạo.
• Gần đây, Andrew Ng dự đoán rằng AI tác nhân - các tác nhân AI có khả năng tự động giải quyết nhiệm vụ - sẽ là trọng tâm trong lĩnh vực công nghệ trong những năm tới.
• Ông cho rằng AI tác nhân sẽ đóng góp nhiều hơn cho sự phát triển của AI so với việc mở rộng quy mô các mô hình ngôn ngữ lớn.
• Nhiều công ty công nghệ lớn như Google, Microsoft và Anthropic đã bắt đầu phát triển các sản phẩm và tính năng dựa trên AI tác nhân.
• Andrew Ng nhận thấy rằng quy trình làm việc dựa trên tác nhân đang phát triển nhanh chóng và mang lại kết quả kinh doanh đáng kể.
• Ông tin rằng ngày càng có nhiều công ty công nghệ đang cố gắng xây dựng nền tảng hỗ trợ quy trình làm việc dựa trên tác nhân, và ngày càng có nhiều ứng dụng được phát triển sử dụng công nghệ này.
📌 Andrew Ng, chuyên gia hàng đầu về AI, đang đặt cược vào AI tác nhân như xu hướng tương lai. Với AI Fund huy động 69,75 triệu USD và 8 triệu học viên trên các khóa học trực tuyến, Ng đang định hình tương lai của AI thông qua đầu tư và giáo dục.
https://www.fastcompany.com/91246968/andrew-ng-is-betting-big-on-agentic-ai
Andrew Ng đang đặt cược lớn vào AI tác nhân
Andrew Ng, một trong những tên tuổi hàng đầu trong lĩnh vực trí tuệ nhân tạo (AI), đang đặt cược lớn vào AI tác nhân (agentic AI) — các tác nhân AI tự động có khả năng giải quyết nhiệm vụ mà không cần sự can thiệp liên tục từ con người.
Khoảng 15 năm trước, Ng đưa ra một ý tưởng: nếu Google huấn luyện mạng nơ-ron bằng dữ liệu khổng lồ và sức mạnh tính toán, liệu điều đó có dẫn đến trí tuệ nhân tạo tổng quát không? Google đã đồng ý và năm 2011, Ng giúp khởi động Google Brain, một trong những dự án AI tham vọng nhất thời đó.
Kể từ đó, Ng đã khẳng định vị trí của mình như một trong những nhân vật uy tín nhất trong lĩnh vực khoa học máy tính.
Ng đã làm việc trong nhiều năm để phổ biến kiến thức về học sâu (deep learning) và AI đến công chúng. Qua các dự án như Coursera và DeepLearning.AI, ông đã giảng dạy cho hơn 8 triệu học viên.
Ng chia sẻ: “Hơn 1 trên 1.000 người trên hành tinh này đã tham gia một khóa học AI của tôi.”
Gần đây, Ng dự đoán AI tác nhân sẽ đóng vai trò lớn trong việc thúc đẩy AI vượt xa những gì mà việc mở rộng mô hình ngôn ngữ lớn có thể đạt được.
AI tác nhân đã bắt đầu trở thành một xu hướng trong không gian công nghệ:
“Các quy trình tác nhân đang thực sự tăng trưởng và mang lại kết quả kinh doanh ý nghĩa,” Ng nhận xét. Ông tin rằng đây là giai đoạn đầu của sự phát triển, khi nhiều công ty công nghệ đang xây dựng nền tảng hỗ trợ và ứng dụng dựa trên AI tác nhân.
Andrew Ng không chỉ là một nhà lãnh đạo trong việc phát triển AI mà còn là một trong những nhân vật định hình tương lai của ngành. Với tầm nhìn về AI tác nhân, ông dự đoán một giai đoạn mới trong công nghệ, nơi các tác nhân tự động hóa sẽ trở thành trung tâm của tiến bộ AI.
- Genesis là nền tảng vật lý đa năng do Genesis Embodied AI phát triển, tập trung vào nghiên cứu robot và AI
- Nền tảng được xây dựng hoàn toàn bằng Python, nhanh hơn 10-80 lần so với các giải pháp GPU hiện có như Isaac Gym
- Tốc độ mô phỏng vật lý nhanh hơn 430.000 lần so với thời gian thực, đạt 43 triệu FPS trên một card đồ họa RTX 4090
- Tương thích với nhiều hệ điều hành: Linux, macOS, Windows và hỗ trợ nhiều nền tảng: CPU, NVIDIA, AMD, Apple Metal
- Tích hợp nhiều bộ giải toán vật lý trong một framework: Rigid Body, MPM, SPH, FEM, PBD và Stable Fluid
- Hỗ trợ đa dạng nền tảng robot: cánh tay robot, robot có chân, drone và robot mềm
- Tương thích với các định dạng file MJCF, URDF, obj và glb
- Tích hợp công nghệ ray-tracing để tạo hình ảnh chất lượng cao
- Có khả năng đào tạo chính sách điều khiển robot trong thế giới thực chỉ trong 26 giây
- Dễ dàng cài đặt qua PyPI với lệnh: pip install genesis-world (yêu cầu Python >=3.9)
- Cả công cụ vật lý và nền tảng mô phỏng đều là nguồn mở
- Sắp ra mắt phương thức ".generate" và framework tạo sinh mạnh mẽ
📌 Genesis là bước đột phá trong nghiên cứu robot với tốc độ mô phỏng 43 triệu FPS, nhanh hơn 430.000 lần so với thời gian thực. Nền tảng nguồn mở này tích hợp đa dạng công cụ vật lý, hỗ trợ nhiều loại robot và có thể đào tạo robot trong 26 giây.
https://www.marktechpost.com/2024/12/19/meet-genesis-an-open-source-physics-ai-engine-redefining-robotics-with-ultra-fast-simulations-and-generative-4d-worlds/
- Trung Quốc đặt mục tiêu triển khai 1 triệu robot được tích hợp AI vào năm 2025, bao gồm robot hình người và robot có bánh xe
- Các công ty chủ chốt:
+ AGI Bot (Thượng Hải): Tiên phong trong đổi mới robotics
+ Xang Robotics: Công ty con của nhà sản xuất xe điện lớn
- Ứng dụng đa dạng trong nhiều lĩnh vực:
+ Gia đình: Robot hình người hỗ trợ nấu ăn, dọn dẹp, chăm sóc
+ Nhà máy: Robot công nghiệp hướng đến tự động hóa hoàn toàn vào 2030
+ Y tế: Chăm sóc bệnh nhân
+ Bán lẻ: Quản lý kho hàng
+ Dịch vụ công: Bảo trì đô thị
- Công nghệ tiên tiến:
+ Tích hợp AI nâng cao độ chính xác và khả năng ra quyết định
+ Kiểm tra độ bền trong nhiều môi trường khác nhau
+ Tối ưu hóa dữ liệu thực tế và giả lập
- Sản xuất cộng sinh: Robot tham gia vào quy trình sản xuất robot:
+ Rút ngắn thời gian sản xuất
+ Giảm chi phí nhân công
+ Nâng cao kiểm soát chất lượng
- Đầu tư từ ngành công nghiệp:
+ BYD và Huawei đầu tư hơn 7 tỷ nhân dân tệ
+ Hợp tác công-tư thúc đẩy đổi mới
- Thách thức cần vượt qua:
+ Nâng cao tính tự chủ của robot
+ Cải thiện tương tác người-máy
+ Đảm bảo an toàn trong môi trường làm việc chung
📌 Trung Quốc đang dẫn đầu cuộc cách mạng robotics toàn cầu với kế hoạch triển khai 1 triệu robot vào 2025. Với đầu tư hơn 7 tỷ nhân dân tệ từ các tập đoàn lớn như BYD và Huawei, sáng kiến này sẽ thay đổi căn bản cách thức sản xuất và sinh hoạt trong tương lai gần.
https://www.geeky-gadgets.com/china-ai-robotics-initiative/
• AI agent, hay AI tác nhân, là hệ thống tự động có khả năng cảm nhận và hành động trong môi trường để đạt được mục tiêu.
• Đến năm 2027, Deloitte dự đoán một nửa số công ty sử dụng AI tạo sinh sẽ triển khai thí điểm AI agent.
• Microsoft, IBM và OpenAI đang phát triển AI agent. OpenAI dự kiến ra mắt "Operator" vào tháng 1/2025, có khả năng thực hiện các tác vụ như lập trình và đặt vé du lịch.
• Cognition Software đã ra mắt "Devin" vào tháng 3/2024, một kỹ sư phần mềm tự động có thể thực hiện các tác vụ lập trình phức tạp dựa trên lệnh bằng ngôn ngữ tự nhiên.
• Các nhà đầu tư đã rót hơn 2 tỷ USD vào các startup tập trung vào ứng dụng doanh nghiệp trong 2 năm qua.
• AI agent bao gồm các thành phần chính: đầu vào từ người dùng, môi trường hoạt động, cảm biến, trung tâm điều khiển, dữ liệu đầu vào, công cụ thực hiện hành động và hành động.
• Lợi ích của AI agent bao gồm: thực hiện các tác vụ phức tạp ngoài khả năng của người dùng, giải quyết vấn đề thiếu hụt nhân tài, tăng hiệu quả chuỗi cung ứng và cải thiện robot vật lý.
• AI agent có thể được ứng dụng trong phát triển phần mềm, giáo dục, tài chính, dịch vụ khách hàng và chăm sóc sức khỏe.
• Rủi ro của AI agent bao gồm: lỗi kỹ thuật, vấn đề bảo mật, các vấn đề đạo đức về ra quyết định và trách nhiệm giải trình, rủi ro kinh tế xã hội như mất việc làm.
• Các biện pháp giảm thiểu rủi ro: tăng tính minh bạch, giám sát con người trong quy trình, thiết lập hướng dẫn đạo đức rõ ràng, ưu tiên quản trị dữ liệu và an ninh mạng, triển khai chiến lược giáo dục và nâng cao nhận thức cộng đồng.
• AI agent đang định hình lại cách chúng ta làm việc và sự hợp tác giữa con người và máy móc. Doanh nghiệp cần cân bằng giữa đổi mới và triển khai có trách nhiệm để tận dụng tiềm năng của công nghệ đột phá này.
📌 AI agent đang định hình lại tương lai công việc với khả năng tự động hóa các tác vụ phức tạp. Dự kiến 50% công ty sẽ triển khai thí điểm đến 2027, với hơn 2 tỷ USD đầu tư trong 2 năm qua. Tuy nhiên, cần cân nhắc kỹ lưỡng các rủi ro về kỹ thuật, đạo đức và xã hội.
https://www.weforum.org/stories/2024/12/ai-agents-risks-artificial-intelligence/
#WEF
Ngày 16/12/2024
AI tạo sinh dưới dạng chatbot đã và đang thay đổi cách con người làm việc. Tác nhân AI (AI agents) sẽ tiếp tục nâng cao năng suất hơn nữa.
Tác nhân AI (Agentic AI) là các hệ thống tự động có khả năng cảm nhận và thực hiện hành động dựa trên môi trường để đạt được mục tiêu. Nhiều công ty công nghệ như Microsoft, IBM và OpenAI đang phát triển các tác nhân AI, với kỳ vọng sẽ tạo ra sự thay đổi lớn trong ngành công nghiệp và nâng cao năng suất.
Ví dụ: OpenAI dự kiến ra mắt tác nhân AI mang tên “Operator” vào tháng 1/2025 với khả năng thực hiện các nhiệm vụ như lập trình và đặt chuyến du lịch. Cognition Software đã phát triển “Devin” vào tháng 3/2024, một kỹ sư phần mềm tự động có thể thực hiện các tác vụ lập trình phức tạp dựa trên lệnh ngôn ngữ tự nhiên.
Cấu trúc của một tác nhân AI bao gồm:
Ví dụ thực tế: Trong thành phố thông minh, hệ thống tác nhân đa tác vụ (Multi-Agent Systems - MAS) có thể quản lý luồng giao thông theo thời gian thực bằng cách sử dụng công nghệ giao tiếp xe-tất cả (V2X), giúp xe tương tác với nhau và hạ tầng đường bộ.
Ứng dụng thực tế: Báo cáo Navigating the AI Frontier đã nêu 5 trường hợp sử dụng AI trong phát triển phần mềm, giáo dục, tài chính, dịch vụ khách hàng, và y tế.
Dù mang lại nhiều tiềm năng, tác nhân AI cũng tạo ra một số rủi ro liên quan đến kỹ thuật, đạo đức, và tác động xã hội:
Giải pháp quản lý rủi ro:
Sự trỗi dậy của tác nhân AI không chỉ là bước chuyển về công nghệ mà còn thay đổi cách chúng ta làm việc và tương tác với máy móc. Bằng cách hiểu rõ khả năng và giới hạn của công nghệ này, cùng các chiến lược triển khai có trách nhiệm, doanh nghiệp có thể khai thác tối đa tiềm năng của AI mà vẫn giảm thiểu rủi ro.
Việc cân bằng giữa đổi mới và triển khai an toàn sẽ là chìa khóa để các tổ chức thích ứng và phát triển trong kỷ nguyên AI.
• Slack sẽ tích hợp sâu các AI agent Agentforce của Salesforce vào nền tảng cộng tác nơi làm việc của mình, nhấn mạnh trí tuệ theo ngữ cảnh là yếu tố khác biệt chính trong thị trường AI agent ngày càng đông đúc.
• Rob Seaman, Giám đốc sản phẩm của Slack, cho biết các kênh Slack thường phản ánh cấu trúc tổ chức và ưu tiên tại thời điểm đó, cung cấp ngữ cảnh phong phú để các agent trả lời câu hỏi và suy luận.
• Việc tích hợp là một phần trong bản phát hành Agentforce 2.0 của Salesforce, dự kiến ra mắt vào ngày 17 tháng 12.
• Các AI agent thế hệ tiếp theo được định nghĩa bởi 3 khả năng quan trọng: kiến thức theo ngữ cảnh toàn diện, khả năng suy luận và khả năng hành động.
• Slack sẽ giới thiệu một thư viện các AI agent có thể tùy chỉnh để thực hiện nhiều tác vụ khác nhau, từ đào tạo nhân viên mới đến quản lý các dự án phức tạp đa chức năng.
• Tất cả các agent sẽ hoạt động với "ngữ cảnh người dùng", nghĩa là chúng chỉ có thể truy cập thông tin mà người dùng được phép xem.
• Nền tảng bao gồm các biện pháp bảo vệ mạnh mẽ thông qua "lớp tin cậy" của Salesforce, xử lý thông tin nhạy cảm một cách phù hợp và đảm bảo tuân thủ các quy tắc kinh doanh.
• Người dùng có thể kiểm tra các agent trong thời gian thực và quan sát quá trình ra quyết định của chúng thông qua giao diện xây dựng minh bạch.
• Đối với các doanh nghiệp đang gặp khó khăn với các phần mềm phân mảnh, tích hợp này có thể báo hiệu sự thay đổi trong cách tổ chức tiếp cận cơ sở hạ tầng công nghệ của họ.
• Seaman đã nêu ví dụ cụ thể về việc đào tạo nhân viên, cho rằng các agent có thể giúp đơn giản hóa quá trình này.
• Việc tích hợp đại diện cho một bước đi chiến lược của cả Slack và Salesforce nhằm đặt mình ở vị trí hàng đầu trong cuộc cách mạng AI doanh nghiệp.
• Trong khi các công ty như Anthropic và OpenAI đã ra mắt AI agent của riêng họ, việc tích hợp sâu của Slack với quy trình làm việc doanh nghiệp và khả năng truy cập ngữ cảnh tổ chức có thể mang lại lợi thế cạnh tranh đáng kể.
• Sự phát triển này diễn ra vào thời điểm quan trọng khi các tổ chức đang vật lộn với việc triển khai hiệu quả các công cụ AI đồng thời duy trì bảo mật và tin cậy.
📌 Slack và Salesforce tích hợp AI agent vào nền tảng cộng tác, nhấn mạnh trí tuệ theo ngữ cảnh. Các agent có thể thực hiện nhiều tác vụ, từ đào tạo nhân viên đến quản lý dự án phức tạp, với biện pháp bảo vệ mạnh mẽ. Đây là bước đi chiến lược trong cuộc đua AI doanh nghiệp.
https://venturebeat.com/ai/slacks-ai-agents-are-learning-from-your-office-chats-heres-whats-next/
- AI tác nhân là hệ thống AI có khả năng chủ động và tự chủ, không cần sự hướng dẫn liên tục từ con người để đạt được mục tiêu
- Khác biệt của AI tác nhân so với AI tạo sinh:
+ Tập trung vào ra quyết định thay vì tạo nội dung
+ Không phụ thuộc vào lệnh của người dùng
+ Có thể thực hiện chuỗi hoạt động phức tạp độc lập
- 3 lợi ích chính:
+ Chuyên môn hóa lực lượng lao động tốt hơn
+ Độ tin cậy thông tin cao hơn
+ Tăng cường khả năng đổi mới sáng tạo
- Ứng dụng tiềm năng:
+ Dịch vụ khách hàng: Chatbot thông minh có thể tự động xử lý khiếu nại và đề xuất giải pháp
+ Sản xuất: Tối ưu dây chuyền sản xuất, dự đoán sự cố thiết bị
+ Hỗ trợ bán hàng: Tự động hóa công việc hành chính, lên lịch họp, phản hồi khách hàng
+ Y tế và chăm sóc xã hội: AI agent có thể hỗ trợ chăm sóc người cao tuổi, nhắc uống thuốc
- Thách thức và yêu cầu thành công:
+ Cần xác định mục tiêu SMART rõ ràng
+ Chú trọng lựa chọn và phối hợp nhóm AI agents
+ Xây dựng khung quyết định an toàn và giám sát phù hợp
📌 AI tác nhân đánh dấu bước tiến mới trong tương tác người-máy, hứa hẹn tăng năng suất và đổi mới sáng tạo. Tuy nhiên cần có hành động sớm từ doanh nghiệp và chính phủ để đảm bảo phát triển an toàn, công bằng và mang lại lợi ích tối ưu.
https://hbr.org/2024/12/what-is-agentic-ai-and-how-will-it-change-work
#HBR
Agentic AI đang mang đến một bước nhảy vọt trong cách con người tương tác và hợp tác với AI. Từ việc lên kế hoạch du lịch đến tối ưu hóa chuỗi cung ứng hay hỗ trợ chăm sóc sức khỏe, công nghệ này mở ra nhiều khả năng mới nhờ sự tự chủ và khả năng thực hiện các nhiệm vụ phức tạp.
Agentic AI có thể được định nghĩa bằng một từ: chủ động. Theo Enver Cetin, chuyên gia AI tại Ciklum, đây là hệ thống AI có khả năng hành động độc lập để đạt được mục tiêu mà không cần sự hướng dẫn liên tục từ con người.
Khác biệt chính giữa Agentic AI và AI tạo sinh:
Agentic AI cho phép phân chia công việc ở mức độ chi tiết hơn, tạo ra sự hiệu quả và đổi mới. Ví dụ:
Agentic AI có khả năng thực hiện thí nghiệm và sáng tạo:
Agentic AI có khả năng lọc và đánh giá nguồn thông tin một cách chính xác hơn, giảm thiểu hiện tượng "ảo giác thông tin" thường gặp ở AI tạo sinh. Ví dụ, trong môi trường doanh nghiệp, AI có thể xác định dữ liệu chính xác nhất từ hệ thống CRM thay vì các nguồn không đáng tin cậy.
Agentic AI đưa tương lai tự động hóa tiến thêm một bước gần hơn, với hứa hẹn tăng năng suất, đổi mới và sự tin cậy. Tuy nhiên, để đạt được lợi ích này, doanh nghiệp và chính phủ cần hành động sớm để đảm bảo sự phát triển của Agentic AI được thực hiện một cách an toàn và công bằng.
• Deep Research chính thức ra mắt cho người đăng ký Gemini Advanced, là tính năng Agent đầu tiên của Gemini giúp tự động hóa quá trình nghiên cứu.
• Tính năng này hoạt động bằng cách:
Tạo kế hoạch nghiên cứu nhiều bước cho người dùng xem xét và phê duyệt
Phân tích thông tin liên quan từ web
Liên tục tinh chỉnh phân tích qua nhiều lần tìm kiếm
Tạo báo cáo tổng hợp với các phát hiện chính
Cho phép xuất sang Google Docs kèm link nguồn gốc.
• Deep Research sử dụng:
Hệ thống Agent mới kết hợp chuyên môn tìm kiếm của Google
Khả năng suy luận nâng cao của mô hình Gemini
Cửa sổ ngữ cảnh 1 triệu token.
• Tính năng này đặc biệt hữu ích cho:
Sinh viên chuẩn bị thuyết trình
Doanh nhân phân tích đối thủ cạnh tranh
Marketer nghiên cứu chiến dịch marketing AI.
• Gemini 2.0 Flash thử nghiệm:
Là phiên bản tối ưu hóa chat của mô hình Gemini 2.0 mới nhất
Cải thiện hiệu suất trên nhiều tiêu chí đánh giá quan trọng
Đã có sẵn trên web và sắp ra mắt trên ứng dụng di động.
• Deep Research hiện có sẵn bằng tiếng Anh trên desktop và web di động, dự kiến ra mắt trên ứng dụng di động đầu năm 2025.
📌 Gemini đã đạt bước tiến quan trọng với Deep Research - Agent đầu tiên tự động hóa nghiên cứu và mô hình 2.0 Flash thử nghiệm. Tính năng mới giúp tiết kiệm hàng giờ nghiên cứu, phân tích web tự động và tạo báo cáo tổng hợp với cửa sổ ngữ cảnh 1 triệu token.
https://blog.google/products/gemini/google-gemini-deep-research/
- Databricks vừa công bố khả năng tạo dữ liệu tổng hợp nhằm đơn giản hóa quá trình đánh giá hiệu suất của các AI agent trong môi trường doanh nghiệp.
- Mục tiêu chính là giúp các nhà phát triển có thể nhanh chóng tạo ra tập dữ liệu nhân tạo chất lượng cao để đánh giá các hệ thống agent đang phát triển.
- Giải pháp này giúp giảm thiểu thời gian tương tác với các chuyên gia và tăng tốc quy trình đưa các agent vào sản xuất.
- Mặc dù chi tiết hơn về cách hoạt động của dữ liệu tổng hợp vẫn chưa được công bố, công ty cho biết thử nghiệm nội bộ cho thấy cải thiện đáng kể về hiệu suất của các AI agent.
- Databricks đã tiếp nhận MosaicML và tích hợp công nghệ này vào nền tảng Đánh giá Dữ liệu, cho phép doanh nghiệp xây dựng và triển khai các giải pháp máy học và AI tạo sinh trên dữ liệu của họ.
- Tính năng Đánh giá Agent hiện có hai khả năng chính: cho phép chuyên gia tự định nghĩa tập dữ liệu và tạo ra một thước đo để đánh giá chất lượng phản hồi của AI agent.
- Dữ liệu tổng hợp giúp rút ngắn thời gian xây dựng tập dữ liệu đánh giá, do đó giảm khối lượng công việc của các chuyên gia.
- Hệ thống mới cho phép các nhà phát triển tạo ra tập dữ liệu đánh giá trong vài phút thay vì hàng giờ.
- Thử nghiệm nội bộ cho thấy hiệu suất của AI agent được cải thiện gần gấp đôi trong khả năng tìm kiếm tài liệu liên quan.
- Quy trình tạo dữ liệu chỉ cần 4 bước đơn giản, giúp tạo dữ liệu một cách nhanh chóng mà không cần chuyển đổi sang môi trường bên ngoài.
- Nhiều doanh nghiệp đã sử dụng API dữ liệu tổng hợp và ghi nhận sự cải thiện 60% trong chất lượng phản hồi của mô hình trước khi nhờ sự can thiệp của các chuyên gia.
- Databricks dự định mở rộng Đánh giá Agent với các tính năng cho phép chuyên gia chỉnh sửa dữ liệu tổng hợp và quản lý vòng đời của tập dữ liệu đánh giá.
- Các giải pháp mới dự kiến sẽ thúc đẩy việc áp dụng Mosaic AI của Databricks, củng cố vị thế của công ty trong lĩnh vực dữ liệu và AI tạo sinh.
- Snowflake cũng đang theo kịp với các sản phẩm AI của mình, bao gồm việc hợp tác với Anthropic để phát triển ứng dụng AI.
📌 Databricks ra mắt API tạo dữ liệu tổng hợp, giúp giảm 60% thời gian cải thiện đại lý AI và nâng cao hiệu suất gần gấp đôi trong việc tìm kiếm tài liệu. Công ty dự kiến mở rộng tính năng này trong tương lai.
https://venturebeat.com/data-infrastructure/databricks-makes-ai-agent-evaluation-a-breeze-with-new-synthetic-data-capabilities/
- Các lãnh đạo công nghệ dự đoán năm 2025 sẽ là năm AI trưởng thành và có khả năng làm việc thực sự thông qua các AI agent tự chủ
- Marc Benioff, CEO Salesforce, kỳ vọng về kỷ nguyên "Agentic" với các AI agent tự động sẽ mở ra tiềm năng khổng lồ và định nghĩa lại cách làm việc
- Goldman Sachs ngược lại cảnh báo khoản đầu tư 1.000 tỷ USD vào hạ tầng AI có thể mang lại lợi nhuận khiêm tốn
- Theo Goldman Sachs, trong thập kỷ tới AI chỉ có thể tăng năng suất Mỹ thêm 0,5% và GDP dưới 1%
- Gartner dự báo đến năm 2028:
+ 1/3 ứng dụng phần mềm doanh nghiệp sẽ tích hợp AI agent (so với dưới 1% hiện nay)
+ 15% quyết định công việc hàng ngày sẽ do AI agent tự động đưa ra
- Các thách thức chính khi triển khai AI agent:
+ Cần nhiều lớp bảo mật bao gồm "guardian agent" giám sát hoạt động
+ Quản lý phức tạp khi triển khai hàng nghìn agent
+ Vấn đề ảo giác và kết quả không nhất quán từ large language model
- Sampsa Samila từ IESE Business School nhận định:
+ AI sẽ thay đổi cách làm việc nhưng trong 10 năm chứ không phải 1 năm
+ So sánh với quá trình điện khí hóa nhà máy kéo dài 30 năm
+ ChatGPT sau 2 năm chỉ giúp tăng năng suất chứ chưa thay đổi bản chất công việc
📌 Năm 2025 đánh dấu bước ngoặt của AI agent nhưng vẫn còn nhiều thách thức. Gartner dự báo đến 2028 có 1/3 phần mềm doanh nghiệp tích hợp AI agent, tạo ra thay đổi từ từ thay vì đột phá như kỳ vọng của các lãnh đạo công nghệ.
https://qz.com/ai-agents-chatbots-artificial-intelligence-work-1851714587
- 25% doanh nghiệp sử dụng AI tạo sinh dự kiến sẽ triển khai AI agents vào năm 2025, con số này sẽ tăng lên 50% vào năm 2027, theo báo cáo từ Deloitte.
- AI agents, hay AI tác động, là các giải pháp phần mềm có khả năng hoàn thành nhiệm vụ phức tạp với ít hoặc không cần giám sát con người.
- Khoảng cách giữa nam và nữ trong việc áp dụng Gen AI đang thu hẹp nhanh chóng; dự kiến đến năm 2025, việc phụ nữ sử dụng Gen AI sẽ đạt hoặc vượt qua đàn ông.
- Tiêu thụ điện năng tại các trung tâm dữ liệu toàn cầu sẽ gấp đôi, đạt 4% tổng tiêu thụ năng lượng (khoảng 1.065 terawatt-giờ) vào năm 2030, do sự gia tăng tiêu thụ năng lượng từ Gen AI.
- Đến năm 2025, trên 30% điện thoại thông minh và khoảng 50% laptop sẽ được trang bị khả năng xử lý Gen AI tại chỗ.
- Sự phát triển của AI agents sẽ được thúc đẩy bởi đổi mới từ cả các start-up và các công ty hàng đầu trong ngành, tìm kiếm các cơ hội doanh thu mới.
- AI agents sẽ sử dụng các mô hình ngôn ngữ lớn (LLMs), có khả năng lý luận, phân tích và thích ứng với các quy trình làm việc không thể đoán trước.
- AI tác động có thể hoạt động tự động, có khả năng lập kế hoạch và thực hiện nhiệm vụ phức tạp mà không cần can thiệp nhiều từ con người.
- Các AI agents có khả năng cảm nhận môi trường và xử lý thông tin đa phương tiện như video, hình ảnh, âm thanh, văn bản và số liệu.
- AI agents có thể tương tác với các công cụ và hệ thống để hoàn thành nhiệm vụ, đồng thời huy động sự tham gia của các hệ thống và bot khác.
- Theo nghiên cứu từ Salesforce, một phần ba người tiêu dùng thích làm việc với AI agents để có dịch vụ nhanh hơn; họ cũng muốn biết khi nào đang tương tác với AI.
- Mặc dù các CIO thấy rằng AI là công nghệ chuyển đổi, chỉ 11% trong số họ triển khai hoàn toàn, do lo ngại về an ninh và hạ tầng dữ liệu.
📌 25% doanh nghiệp dự kiến triển khai AI agents vào năm 2025, tăng lên 50% vào năm 2027. Sự phát triển này được thúc đẩy bởi nhu cầu đổi mới và khả năng của AI agents trong việc hoàn thành nhiệm vụ phức tạp, trong khi tiêu thụ điện năng tại các trung tâm dữ liệu dự kiến sẽ gấp đôi.
https://www.zdnet.com/article/25-of-enterprises-using-ai-will-deploy-ai-agents-by-2025/
- Thị trường AI agent đạt giá trị 3,86 tỷ USD trong năm 2023 và dự kiến tăng trưởng với tốc độ 45,1% từ 2024-2030
- AI agent kết hợp khả năng tự động hóa, trải nghiệm hội thoại và điều phối quy trình để dẫn dắt giai đoạn tiếp theo của AI tạo sinh
- Các nền tảng lớn như Appian, Atlassian, Cisco Webex, Salesforce, SAP đã công bố tích hợp AI agent trong năm 2023
- So với chatbot truyền thống chỉ giải quyết vấn đề cơ bản, AI agent có thể:
+ Thực hiện quản lý sự cố dự đoán
+ Phân tích nguyên nhân gốc rễ vấn đề
+ Tự động hóa quy trình phức tạp
+ Đưa ra quyết định độc lập
- AI agent đòi hỏi dữ liệu chất lượng cao để hoạt động hiệu quả:
+ Cần dữ liệu chính xác và cập nhật
+ Yêu cầu kiểm tra tính toàn vẹn dữ liệu
+ Cần xem xét lại chính sách quản trị AI và dữ liệu
- Lợi ích chính của AI agent:
+ Cải thiện năng suất làm việc
+ Tự động hóa các công việc lặp đi lặp lại
+ Giúp nhân viên tập trung vào công việc giá trị cao
+ Tối ưu quy trình trong nhân sự và tài chính
- Ứng dụng trong các ngành:
+ Bán lẻ: Tư vấn mua sắm cá nhân hóa
+ Sản xuất: Chẩn đoán sức khỏe máy móc
+ Công nghệ: Hỗ trợ phát triển phần mềm
+ Y tế: Cập nhật hồ sơ bệnh nhân
📌 AI agent đang định hình lại tương lai làm việc với thị trường 3,86 tỷ USD (2023), tốc độ tăng trưởng 45,1%/năm. Công nghệ này vượt trội hơn chatbot truyền thống nhờ khả năng tự động hóa phức tạp, ra quyết định độc lập và tích hợp đa nền tảng, mang lại hiệu quả cao cho doanh nghiệp.
https://www.infoworld.com/article/3611465/how-ai-agents-will-transform-the-future-of-work.html
- Claude, một nhân viên AI, hoạt động độc lập trong môi trường phần mềm và ứng dụng.
- Anthropic giới thiệu tính năng mới gọi là "Computer Use", cho phép Claude tương tác trực tiếp với phần mềm, thực hiện các tác vụ phức tạp mà không cần sự can thiệp của con người.
- Tính năng này mô phỏng quy trình tự động hóa robot nhưng tiến xa hơn bằng cách tái hiện quá trình tư duy của con người.
- Claude có khả năng nhận biết thông tin từ hình ảnh, lý luận, và đưa ra quyết định phù hợp.
- Ví dụ, Claude có thể được giao nhiệm vụ tổ chức dữ liệu khách hàng, liên kết chúng với dữ liệu tài chính và gửi tin nhắn cá nhân qua WhatsApp mà không có sự can thiệp.
- Các lập trình viên có thể yêu cầu Claude thiết lập cụm Kubernetes với các cấu hình và dữ liệu chính xác.
- Tuy nhiên, có nhược điểm khi phụ thuộc hoàn toàn vào Claude vì nó thực hiện từng bước như con người, do đó có thể chậm hơn.
- Claude cần có quyền truy cập độc quyền vào máy tính khi hoạt động, giống như một nhân viên thực thụ.
- Các chuyên gia nhấn mạnh rằng AI không hoàn toàn độc lập nhưng mô phỏng sự tự chủ, mở ra cơ hội đổi mới trong kinh doanh.
- Các công ty như Relevance phát triển các AI agents có khả năng xử lý quy trình công việc tương tự như việc mà 5 nhân viên toàn thời gian thực hiện.
- Việc triển khai nhiều AI agents chuyên biệt có thể gia tăng năng suất, giúp tự động hóa các hoạt động như xác nhận khách hàng tiềm năng và hỗ trợ khách hàng.
- Dù có lợi ích lớn từ tự động hóa, nhưng cần thiết phải có sự giám sát và thiết lập các nguyên tắc an toàn cho AI agents.
- Các thách thức hiện tại bao gồm việc thiếu hụt quy trình tổ chức và sự khéo léo trong lập tài liệu.
- Sự kết hợp giữa Computer Use của Anthropic và AI agents có thể mở ra cơ hội tự động hóa mà trước đây không tưởng tượng được, đặc biệt trong các hoạt động sáng tạo và không lặp lại.
📌 Claude của Anthropic giúp tự động hóa quy trình kinh doanh. Tính năng "Computer Use" cho phép Claude hoạt động độc lập trong phần mềm, mở ra cơ hội đổi mới với hiệu suất cao hơn và ít tài nguyên hơn.
https://www.forbes.com/sites/charlestowersclark/2024/11/29/anthropics-claude-the-ai-junior-employee-transforming-business/
- Qwen Agent là framework để phát triển ứng dụng LLM, cung cấp khả năng theo dõi hướng dẫn, sử dụng công cụ, lập kế hoạch, và ghi nhớ.
- Alibaba Cloud vừa ra mắt Qwen Agent trên GitHub, thu hút sự quan tâm của các nhà phát triển.
- Người dùng có thể sử dụng dịch vụ mô hình qua DashScope của Alibaba Cloud hoặc triển khai mô hình riêng thông qua các mô hình mã nguồn mở Qwen.
- Qwen Agent cung cấp nhiều thành phần nguyên tử như các LLM (kế thừa từ lớp BaseChatModel) và công cụ kế thừa từ lớp BaseTool.
- Các thành phần cấp cao hơn như agents (kế thừa từ lớp Agent) cũng được tích hợp.
- Giao diện người dùng Gradio được đề cập bởi một người dùng trên X, góp phần nâng cao trải nghiệm sử dụng.
- Qwen2-Math, series LLM toán học đầu tiên trong gia đình Qwen, đã được ra mắt cách đây gần một tháng, sau đó được nâng cấp thành Qwen2.5-Math với nhiều mô hình tùy chỉnh.
- Qwen2-Math series chỉ hỗ trợ giải toán tiếng Anh bằng phương pháp Chain-of-Thought (CoT), trong khi Qwen2.5-Math mở rộng hỗ trợ cả CoT và Tool-integrated Reasoning (TIR).
- Trải nghiệm của các nhà phát triển với Qwen chủ yếu tích cực, nhiều người cho rằng Qwen 2.5 tốt hơn ChatGPT cho các tác vụ lập trình.
- Một nhà phát triển cho biết đã tạo ra một trò chơi Pac-Man hoàn chỉnh bằng Python nhờ vào mô hình 72B, vượt qua khả năng của Claude.
- Qwen cũng là lựa chọn hợp lý cho các nhà phát triển muốn giảm bớt phụ thuộc vào các giải pháp đám mây với chi phí thấp hơn so với GPT-4 và Claude.
- Amazon Web Services (AWS) đã giới thiệu Multi-Agent Orchestrator, cho phép quản lý nhiều AI agents và hội thoại phức tạp.
- Microsoft Research công bố Magentic-One, hệ thống đa tác nhân giúp giải quyết các nhiệm vụ mở trong nhiều lĩnh vực.
- OpenAI đã giới thiệu Swarm, framework cho việc xây dựng và triển khai các hệ thống đa tác nhân.
- IBM cũng ra mắt Bee Agent Framework, công cụ mã nguồn mở cho việc tạo dựng và triển khai các workflow dựa trên agent.
📌 Qwen Agent là framework mạnh mẽ cho phát triển ứng dụng LLM với nhiều tính năng nổi bật và chi phí thấp cho nhà phát triển. Nhiều nhà phát triển đã chuyển sang dùng Qwen 2.5 cho các tác vụ lập trình, cho thấy sự ấn tượng và khả năng vượt trội so với các AI khác như ChatGPT và Claude.
https://analyticsindiamag.com/ai-news-updates/qwen-agent-is-here/
- AI Agent là ứng dụng chuyên biệt của AI được thiết kế để thực hiện nhiệm vụ hoặc mô phỏng tương tác, bao gồm agent công cụ và agent mô phỏng
- Nghiên cứu từ Stanford và Google DeepMind cho thấy chỉ với 2 giờ phỏng vấn, agent mô phỏng có thể sao chép tính cách người dùng với độ chính xác 85% trong các bài kiểm tra tiêu chuẩn
- Agent mô phỏng có thể ứng dụng trong:
+ Nghiên cứu: Thay thế người tham gia, giảm chi phí và vấn đề đạo đức
+ Đào tạo: Mô phỏng tương tác xã hội phức tạp
+ Tự phản ánh: Giúp người dùng hiểu về thói quen và định kiến của bản thân
- Agent công cụ tập trung vào chức năng thực tế như quản lý lịch trình, email và tự động hóa quy trình
- Các rủi ro chính:
+ Suy giảm tính tự chủ do phụ thuộc vào AI để ra quyết định
+ Cô lập xã hội khi con người ưa thích tương tác với AI hơn người thật
+ Vấn đề về quyền riêng tư và đạo đức khi thu thập dữ liệu cá nhân
+ Khả năng bị lạm dụng để giả mạo và thao túng
- 4 nguyên tắc sử dụng AI Agent hiệu quả (4A):
+ Analysis (Phân tích): Hiểu rõ khả năng và giới hạn
+ Assessment (Đánh giá): Thường xuyên kiểm tra tác động
+ Adaptation (Thích nghi): Điều chỉnh phù hợp với mục tiêu
+ Advocacy (Vận động): Ủng hộ phát triển AI minh bạch và đạo đức
📌 AI Agent đang định nghĩa lại cách con người tương tác với máy móc. Chỉ 2 giờ phỏng vấn có thể tạo ra bản sao kỹ thuật số với độ chính xác 85%. Điều này mang lại cơ hội và thách thức lớn về tự chủ, quan hệ xã hội và quyền riêng tư của con người.
https://www.forbes.com/sites/corneliawalther/2024/11/26/ai-agents-versus-human-agency-4-ways-to-navigate-our-ai-driven-world/
- Accenture và Nvidia thành lập bộ phận mới Accenture Nvidia Business Group, đào tạo hơn 30.000 người sử dụng công nghệ Nvidia bao gồm: AI Foundry, AI Enterprise và Omniverse
- Bộ phận marketing của Accenture là nơi thử nghiệm đầu tiên, triển khai hơn 12 agent AI để:
+ Nghiên cứu thị trường
+ Phân tích dữ liệu
+ Lên lịch mạng xã hội
+ Tìm kiếm tài liệu nội bộ
+ Soạn thảo chiến lược
+ Xác định ngân sách dự án
- Kết quả ban đầu: Giảm từ 135 bước xuống còn 85 bước trong quy trình marketing
- Theo báo cáo của Deloitte:
+ 25% công ty sẽ triển khai AI agent vào năm 2025
+ 50% công ty sẽ triển khai vào năm 2027
+ Chỉ 30% dự án thí điểm AI đạt đến giai đoạn sản xuất
- Thách thức chính:
+ Điều chỉnh mô hình AI để hiểu ngôn ngữ doanh nghiệp
+ Thiếu hụt kỹ năng
+ Chi phí tăng cao
+ Rủi ro pháp lý
+ Thay đổi tư duy nhân viên
- Accenture tập trung vào các vấn đề phức tạp như:
+ Suy luận nhân quả
+ Lập kế hoạch chiến lược
+ Tối ưu hóa giá
- Nền tảng sử dụng:
+ Máy tính hiệu năng cao của Nvidia
+ Mô hình ngôn ngữ lớn như Meta Llama 3
📌 Accenture và Nvidia đã chứng minh tiềm năng của AI agent trong doanh nghiệp qua việc giảm 37% số bước trong quy trình marketing. Dự kiến 50% doanh nghiệp sẽ triển khai AI agent vào năm 2027, tuy nhiên cần giải quyết các thách thức về kỹ năng, chi phí và rủi ro pháp lý.
https://digiday.com/media/ai-briefing-inside-accenture-and-nvidias-plan-to-scale-ai-agents-for-enterprise-business/
- Một hệ thống AI đa tác nhân hiện đại bao gồm ít nhất một mô hình ngôn ngữ lớn (LLM) có khả năng sử dụng các công cụ để tạo ra và thực thi mã.
- AI tạo sinh dựa trên việc dự đoán đầu ra từ đầu vào, tạo ra mã mà có thể sử dụng ngay.
- Các tác nhân nên giao tiếp với nhau để cải thiện quy trình làm việc, chẳng hạn như trong một công ty lớn với nhiều ứng dụng khác nhau.
- Việc sử dụng các kỹ thuật như tạo sinh được tăng cường bởi truy xuất dữ liệu ngoài (RAG) có thể nâng cao khả năng tìm kiếm thông tin trong tổ chức.
- Hệ thống đa tác nhân giúp tăng cường năng suất, độ bền và khả năng thực hiện nâng cấp nhanh chóng cho các mô-đun khác nhau.
- Để xây dựng các hệ thống này, cần xác định quy trình, vai trò, các nút chịu trách nhiệm và kết nối giữa các tác nhân trong tổ chức.
- Một sơ đồ tổ chức có thể là điểm khởi đầu tốt, nhưng nên bắt đầu với quy trình làm việc để hiểu cách các tác nhân tương tác trong các tình huống khác nhau.
- Việc sử dụng các công cụ AI để xác định quy trình làm việc có thể giúp tạo ra một mô hình mạng tác nhân hiệu quả.
- Mạng tác nhân cần được tổ chức thành một đồ thị có hướng không chu trình (DAG) để tránh các vấn đề về vòng lặp trong truy vấn.
- Cần có các kiến trúc tác nhân khác nhau, chẳng hạn như kiến trúc AAOSA, giúp các tác nhân phân phối nhiệm vụ một cách hiệu quả.
- Mạng tác nhân có thể được áp dụng trong nhiều tình huống, ví dụ như trong bộ phận nhân sự để xử lý các yêu cầu phức tạp từ người dùng.
- Trong một tổ chức viễn thông, tác nhân hỗ trợ khách hàng có thể xử lý các yêu cầu phức tạp như đánh giá hiệu suất mạng và cung cấp báo giá nâng cấp.
📌 Hệ thống AI đa tác nhân mang lại nhiều lợi ích cho tổ chức, từ việc cải thiện năng suất đến khả năng tương tác thông minh giữa các tác nhân, giúp xử lý yêu cầu phức tạp một cách nhanh chóng và hiệu quả.
https://venturebeat.com/ai/getting-started-with-ai-agents-part-1-capturing-processes-roles-and-connections/
- Google Cloud vừa công bố chương trình hệ sinh thái agent AI mới có tên AI Agent Space, cho phép doanh nghiệp khám phá, triển khai và đồng tạo các agent AI.
- Hệ sinh thái này cung cấp cho đối tác:
+ Công cụ và tài nguyên để phát triển agent AI tùy chỉnh
+ Quyền truy cập sớm vào công nghệ AI của Google
+ Hỗ trợ trực tiếp từ đội ngũ kỹ thuật
+ Quảng bá agent qua Google Cloud Marketplace
- Các đối tác lớn đã xây dựng agent trên nền tảng Google Cloud:
+ Accenture: Agent hỗ trợ khách hàng bán lẻ
+ Bain: Agent quản lý tài sản tăng hiệu quả 15%
+ Deloitte: Agent "Care Finder" giúp tìm bác sĩ trong mạng lưới chỉ trong 1 phút
+ PwC: Agent hỗ trợ phòng khám ung thư tối ưu thời gian cho bác sĩ
- Đối thủ cạnh tranh chính:
+ Microsoft Copilot Studio: Hơn 100.000 tổ chức tạo agent, tích hợp với 1.800 mô hình LLM
+ SAP Joule: Agent AI hợp tác đa chức năng
+ Salesforce Agentforce: Tích hợp agent vào hệ sinh thái sẵn có
- Hiện AI Agent Space chỉ có 19 mô hình agent, thấp hơn nhiều so với đối thủ. Google dự kiến bổ sung hàng trăm agent trong những tháng tới.
📌 Google Cloud đã chính thức tham gia cuộc đua agent AI với AI Agent Space, thu hút 19 mô hình agent ban đầu và kế hoạch mở rộng quy mô. Nền tảng này nổi bật với tính linh hoạt cho đối tác và hệ sinh thái mở, tuy nhiên vẫn đang tụt hậu so với Microsoft Copilot Studio với 100.000 tổ chức sử dụng.
https://venturebeat.com/ai/google-cloud-launches-ai-agent-space-amid-rising-competition/
- Microsoft đã xây dựng hệ sinh thái AI agent lớn nhất với hơn 100.000 tổ chức sử dụng Copilot Studio, tăng gấp đôi chỉ trong một quý
- Tại hội nghị Ignite, Microsoft công bố cho phép doanh nghiệp sử dụng 1.800 mô hình ngôn ngữ lớn trong Azure, mở rộng từ việc chỉ phụ thuộc vào OpenAI
- Nền tảng tích hợp với hơn 1.400 hệ thống và nguồn dữ liệu doanh nghiệp như SAP, ServiceNow và cơ sở dữ liệu SQL
- Microsoft ra mắt 10 agent tự chủ được xây dựng sẵn nhắm vào các chức năng kinh doanh cốt lõi như bán hàng, dịch vụ, tài chính và chuỗi cung ứng
- Các tính năng bảo mật và quản trị được tích hợp sẵn trong kiến trúc cốt lõi, đảm bảo agent hoạt động trong khuôn khổ quyền hạn doanh nghiệp
- McKinsey đã giảm quy trình tiếp nhận dự án từ 20 ngày xuống 2 ngày nhờ agent định tuyến tự động
- Pets at Home triển khai agent phòng chống gian lận trong 2 tuần, tiết kiệm hàng triệu USD mỗi năm
- Microsoft phát triển "agent mesh" - hệ thống kết nối cho phép các AI agent cộng tác giải quyết vấn đề phức tạp
- Đối thủ cạnh tranh như Salesforce (10.000 agent) và ServiceNow vẫn đang ở giai đoạn đầu và thiếu tầm với doanh nghiệp rộng rãi như Microsoft
- Công nghệ agent vẫn còn sơ khai, các mô hình ngôn ngữ lớn có thể tạo ảo giác và cần quản lý cẩn thận để tránh vòng lặp vô hạn hoặc chi phí không cần thiết
📌 Microsoft dẫn đầu thị trường AI agent doanh nghiệp với 100.000 tổ chức sử dụng, gấp đôi trong một quý. Nền tảng tích hợp 1.400 hệ thống, 1.800 mô hình ngôn ngữ lớn và 10 agent tự chủ được xây dựng sẵn. Tuy nhiên công nghệ vẫn ở giai đoạn đầu và cần quản lý cẩn thận.
https://venturebeat.com/ai/microsoft-quietly-assembles-the-largest-ai-agent-ecosystem-and-no-one-else-is-close/
- AWS vừa giới thiệu Multi-Agent Orchestrator - framework quản lý nhiều tác tử AI và xử lý các cuộc hội thoại phức tạp
- Framework có khả năng:
+ Định tuyến truy vấn đến tác tử phù hợp nhất
+ Duy trì ngữ cảnh hội thoại
+ Tích hợp với AWS Lambda, môi trường local và các nền tảng đám mây khác
- Đặc điểm kỹ thuật nổi bật:
+ Hỗ trợ song ngữ Python và TypeScript
+ Cho phép phản hồi streaming và non-streaming từ các tác tử
+ Tích hợp tính năng phân loại ý định thông minh
+ Quản lý ngữ cảnh hiệu quả
+ Khả năng mở rộng tích hợp tác tử mới
- AWS đã công bố demo trên GitHub với 6 tác tử chuyên biệt:
+ Du lịch
+ Thời tiết
+ Toán học
+ Sức khỏe
+ Khả năng chuyển đổi giữa các tác tử để quản lý hội thoại nhiều lượt
- Framework cung cấp:
+ Script và ứng dụng demo có sẵn
+ Chatbot cho truy vấn chuyên biệt
+ Hệ thống hỗ trợ thương mại điện tử tích hợp AI
+ Hỗ trợ tương tác bằng giọng nói qua Amazon Connect và Lex
- Xu hướng framework đa tác tử đang phát triển mạnh:
+ Microsoft Research: Ra mắt Magentic-One - hệ thống đa tác tử tổng quát nguồn mở
+ OpenAI: Giới thiệu Swarm framework
+ IBM: Phát hành Bee Agent Framework - bộ công cụ nguồn mở cho quy trình làm việc dựa trên tác tử
📌 AWS Multi-Agent Orchestrator mở ra kỷ nguyên mới trong quản lý đa tác tử AI với khả năng hỗ trợ 2 ngôn ngữ lập trình, tích hợp 6 tác tử chuyên biệt và tương thích đa nền tảng. Framework này cùng với các giải pháp từ Microsoft, OpenAI và IBM đang định hình tương lai của hệ thống AI đa tác tử.
https://analyticsindiamag.com/ai-news-updates/aws-launches-multi-agent-orchestrator-for-managing-ai-agents/
- Microsoft vừa công bố các tính năng mới trong Microsoft 365 Copilot tại sự kiện Microsoft Ignite, cho phép người dùng xây dựng agent tự động hoặc sử dụng các agent có sẵn
- Nền tảng này hỗ trợ hơn 1.800 mô hình AI từ danh mục Azure AI
- Các tính năng chính bao gồm:
+ Khả năng tự động hoạt động không cần giám sát của con người
+ Tích hợp với Azure AI Foundry để tùy chỉnh tìm kiếm và sử dụng mô hình riêng
+ SDK agent mới cho phép phát triển agent đa kênh
- Microsoft giới thiệu các agent có sẵn:
+ Agent SharePoint: tạo và chia sẻ agent tùy chỉnh
+ Agent tự phục vụ nhân viên: xử lý các vấn đề HR và IT
+ Agent điều phối: ghi chú và tóm tắt cuộc họp Teams
+ Agent phiên dịch: dịch thời gian thực trong Teams với 9 ngôn ngữ
+ Agent quản lý dự án: tự động hóa quy trình trong Planner
- Kết quả thực tế từ các đối tác:
+ McKinsey: giảm 90% thời gian và 30% công việc hành chính trong quy trình tiếp nhận khách hàng
+ Thomson Reuters: cắt giảm 50% thời gian trong quy trình pháp lý
- Azure AI Foundry SDK cung cấp:
+ 25 mẫu có sẵn
+ Công cụ tích hợp với GitHub và Copilot Studio
+ Giao diện lập trình đơn giản hóa
📌 Microsoft đã tạo bước đột phá với hệ sinh thái AI agent lớn nhất hiện nay, hỗ trợ 1.800 mô hình AI. Các tính năng mới trong Copilot giúp doanh nghiệp tiết kiệm tới 90% thời gian xử lý công việc, với khả năng tự động hóa từ cơ bản đến phức tạp mà không cần kiến thức lập trình chuyên sâu.
https://venturebeat.com/ai/microsofts-new-ai-agents-support-1800-models-and-counting/
- Qwen 2.5 đạt hơn 40 triệu lượt tải và tạo ra hơn 50.000 mô hình phái sinh, trở thành lựa chọn hàng đầu cho phát triển AI Agent
- Một nhà phát triển trên Reddit báo cáo Qwen 2.5 14B vượt trội hơn GPT-4 và GPT-4o trong một số ứng dụng cụ thể nhờ khả năng gọi hàm, lập luận chuỗi suy nghĩ và thực hiện chỉ dẫn phức tạp
- Doanh nghiệp có thể triển khai Qwen 2.5 trong môi trường hoàn toàn cách ly với vLLM, đảm bảo không có kết nối bên ngoài
- Trên GPU 3090 tầm trung, mô hình đạt tốc độ 28 token/giây với ngữ cảnh 32K, phù hợp cho nhiều tình huống lập trình
- Công nghệ suy luận từng lớp của dự án AirLLM cho phép chạy mô hình 72B tham số trên hệ thống chỉ có 4GB VRAM
- Qwen 14B instruct hoạt động tốt với công cụ SQL và là mô hình duy nhất dưới 27B có thể sử dụng công cụ SQL hiệu quả
- Nhiều lập trình viên tích hợp thành công Qwen 2.5 vào môi trường phát triển thông qua Llama.cpp, LM Studio API và VSCodium
- Chi phí token của Qwen rẻ hơn nhiều so với GPT-4o (0,38 so với 5,0 USD/triệu token) và Claude 3.5 Sonnet (3,05 USD/triệu token)
- Một lập trình viên đã tạo game Pac-Man hoàn chỉnh bằng Python với mô hình 72B chạy local, vượt trội Claude chỉ tạo được bản đồ cơ bản
- Hạn chế: đôi khi phản hồi bằng tiếng Trung khi bối rối và cần prompt chính xác hơn cho tác vụ phức tạp
📌 Qwen 2.5 đang dẫn đầu cuộc đua AI Agent với 40 triệu lượt tải, chi phí thấp (0,38 USD/triệu token), khả năng chạy trên GPU phổ thông 4GB VRAM và hiệu suất vượt trội GPT-4 trong nhiều tác vụ lập trình.
https://analyticsindiamag.com/developers-corner/qwen-2-5-is-winning-the-ai-agents-race/
• Hiện tại, các khảo sát về tỷ lệ áp dụng AI cao trong doanh nghiệp nhỏ chỉ là phóng đại. Phần lớn doanh nghiệp nhỏ chưa thực sự ứng dụng AI như các công ty lớn.
• Trong khi các thương hiệu lớn như Klarna, T-Mobile, UBS Warburg và JP Morgan đầu tư hàng triệu USD để tạo mô hình ngôn ngữ lớn, doanh nghiệp nhỏ chỉ mới thử nghiệm với ChatGPT, Claude hoặc Microsoft Copilot.
• Năm 2025, làn sóng phần mềm AI Agent sẽ giúp doanh nghiệp nhỏ tự động hóa nhiều quy trình:
- Microsoft ra mắt 10 Agent cho Dynamics 365 để xử lý khách hàng tiềm năng, xác nhận đơn hàng, đối chiếu hóa đơn
- Salesforce giới thiệu SDR và Einstein Coach để đánh giá khách hàng tiềm năng, lên lịch họp
- Intuit phát triển Agent phân tích dòng tiền và tự động thanh toán hóa đơn
- Nvidia công bố Agent giọng nói đảm nhận vai trò y tá với chi phí thấp hơn
- Anthropic và Google tạo Agent có thể điều khiển thiết bị để thực hiện các tác vụ như đặt vé máy bay, đặt văn phòng phẩm
• Các Agent này sẽ thay thế một số công việc của con người, tạo lo ngại về mất việc làm. Tuy nhiên, trong bối cảnh thiếu hụt lao động, Agent là giải pháp hữu ích cho doanh nghiệp.
• Doanh nghiệp cần chủ động trao đổi với nhà cung cấp phần mềm về AI Agent và đào tạo nhân viên để tận dụng công nghệ mới này.
📌 Năm 2025, AI Agent sẽ giúp doanh nghiệp vừa và nhỏ tự động hóa nhiều quy trình quan trọng. Microsoft, Salesforce và Intuit dẫn đầu với các giải pháp Agent cho phép xử lý khách hàng, quản lý tài chính và thay thế một số vị trí nhân sự với chi phí thấp hơn.
https://www.forbes.com/sites/quickerbettertech/2024/11/14/how-ai-agents-will-disrupt-small-and-mid-sized-business-in-2025/
- Meta phát triển dự án robot mới tập trung vào công nghệ cảm nhận xúc giác, mở ra tiềm năng ứng dụng trong y tế, sản xuất và nhiều lĩnh vực khác
- Công nghệ SPUR (Sensory Perception Unified Representation) được huấn luyện trên 460.000 hình ảnh xúc giác, cải thiện hiệu suất vượt 95% so với các mô hình truyền thống
- Cảm biến Digit 360 cung cấp độ nhạy cảm xúc giác ngang tầm con người, cho phép robot:
+ Thực hiện các thao tác lắp ráp tinh vi trong sản xuất
+ Hỗ trợ các thủ thuật y tế chính xác
+ Nhận diện vật thể trong nhiều môi trường khác nhau
- Nền tảng Digit Plexus tiêu chuẩn hóa kết nối cảm biến robot, tạo điều kiện:
+ Tích hợp liền mạch cảm biến xúc giác vào hệ thống robot
+ Đẩy nhanh phát triển và triển khai giải pháp AI
- Meta hợp tác với các đối tác công nghiệp như Gelite và Wanick Robotics để:
+ Phát triển và thương mại hóa công nghệ cảm biến xúc giác
+ Thúc đẩy ứng dụng trong tự động hóa công nghiệp và robot y tế
- Phần mềm mô phỏng Habitat 3.0 được sử dụng để:
+ Kiểm thử tương tác người-robot trong môi trường gia đình
+ Tối ưu hóa thuật toán với chi phí thấp
+ Mô phỏng thực tế các tương tác phức tạp
📌 Meta đã tạo bước đột phá trong công nghệ robot với khả năng cảm nhận xúc giác tiên tiến, đạt cải thiện 95% so với mô hình cũ. Dự án tích hợp cảm biến Digit 360 và nền tảng Digit Plexus, mở ra ứng dụng rộng rãi trong y tế, sản xuất và hỗ trợ người khuyết tật.
https://www.geeky-gadgets.com/meta-robotics-touch-perception-technology/
- Microsoft Research vừa phát hành Magentic-One, một hệ thống AI đa tác tử tổng quát có khả năng giải quyết các tác vụ mở trong nhiều lĩnh vực
- Magentic-One được phát hành dưới dạng công cụ nguồn mở trên nền tảng Microsoft AutoGen, nhằm hỗ trợ các nhà phát triển và nghiên cứu tạo ra ứng dụng tự động xử lý các tác vụ phức tạp
- Kiến trúc đa tác tử của Magentic-One bao gồm:
+ Tác tử điều phối chính
+ WebSurfer cho điều hướng web
+ FileSurfer cho quản lý file
+ Coder cho lập trình
+ ComputerTerminal cho thực thi mã
- Hệ thống có tính linh hoạt và mở rộng cao:
+ Cho phép thêm/bớt tác tử mà không ảnh hưởng cấu trúc cốt lõi
+ Hỗ trợ tích hợp các mô hình ngôn ngữ lớn (LLM) và nhỏ (SLM)
+ Đã thử nghiệm với GPT-4 và OpenAI o1-preview
- Microsoft giới thiệu AutoGenBench để đánh giá hiệu suất trên các benchmark:
+ GAIA
+ AssistantBench
+ WebArena
- Các framework đa tác tử nguồn mở khác cũng được phát hành gần đây:
+ OpenAI với Swarm
+ IBM với Bee Agent Framework (phiên bản alpha)
+ Bee Agent tương thích với IBM Granite và Llama 3.2
📌 Magentic-One là nền tảng AI đa tác tử nguồn mở của Microsoft với kiến trúc module linh hoạt, cho phép xử lý đa dạng tác vụ từ duyệt web đến lập trình. Hệ thống đạt hiệu suất cạnh tranh trên các benchmark quan trọng và hỗ trợ tích hợp nhiều mô hình ngôn ngữ khác nhau.
https://analyticsindiamag.com/ai-news-updates/microsoft-launches-magentic-one-an-open-source-multi-agent-ai-platform/
- OpenAI tổ chức sự kiện DevDay đầu tiên tại London, với sự tham gia của Olivier Godement (trưởng sản phẩm) và Romain Huet (trưởng trải nghiệm nhà phát triển)
- Công ty vừa công bố cập nhật cho nền tảng Realtime API:
+ Thêm tính năng giọng nói mới
+ Cho phép nhà phát triển tạo prompt nhanh hơn
+ Ra mắt tính năng tìm kiếm internet cho ChatGPT
- 2 thách thức chính để phát triển AI agent:
1. Khả năng lập luận:
+ Cần tin cậy để hoàn thành nhiệm vụ phức tạp
+ OpenAI đã giới thiệu tính năng "reasoning" trong mô hình o1
+ Sử dụng học tăng cường để xử lý thông tin theo "chuỗi suy nghĩ"
+ Mô hình cần đáng tin cậy, nhanh và rẻ hơn
2. Khả năng kết nối công cụ:
+ AI cần truy cập internet để cập nhật thông tin
+ Cần thực hiện được các hành động trong thế giới thực
+ Đối thủ Anthropic đã cho phép chatbot Claude tương tác với giao diện máy tính
- Dự báo tương lai:
+ Trong vài năm tới, mỗi người và doanh nghiệp sẽ có AI agent riêng
+ AI agent sẽ truy cập email, ứng dụng và lịch của người dùng
+ Hoạt động như trợ lý cá nhân thông minh
+ Năm tới sẽ tăng ứng dụng AI trong hỗ trợ khách hàng
📌 OpenAI đang tiến tới mục tiêu xây dựng AI agent toàn diện thông qua 2 bước đột phá: nâng cao khả năng lập luận và kết nối đa công cụ. Tính năng tìm kiếm mới của ChatGPT là bước đi quan trọng, mở đường cho việc phát triển trợ lý AI có thể hoàn thành chuỗi nhiệm vụ phức tạp trong tương lai.
https://www.technologyreview.com/2024/11/05/1106603/how-chatgpt-search-paves-the-way-for-ai-agents/
#MIT
- Các hạn chế chính của LLM bao gồm:
+ Kiến thức bị giới hạn dù được huấn luyện trên dữ liệu lớn
+ Khả năng suy luận còn hạn chế
+ Không thể cập nhật thông tin thời gian thực
- Một tác tử AI bao gồm 4 thành phần chính:
+ Công cụ để truy cập thông tin từ internet, cơ sở dữ liệu và API
+ Bộ nhớ ngắn hạn và dài hạn để lưu trữ kết quả
+ Bộ suy luận để chia nhỏ tác vụ phức tạp
+ Khả năng thực hiện hành động dựa trên môi trường
- Ưu điểm của hệ thống đa tác tử:
+ Xử lý tốt các tác vụ phức tạp thông qua đóng vai
+ Mỗi tác tử tập trung vào một mục tiêu cụ thể
+ Giảm thiểu ảo giác bằng cách định nghĩa rõ vai trò
- Thách thức khi triển khai thực tế:
+ Khó khăn trong quản lý khi số lượng tác tử tăng lên
+ Độ trễ do cần nhiều lần gọi LLM
+ Hiệu suất không ổn định do bản chất xác suất của LLM
+ Cần có sự giám sát của con người trong các bước quan trọng
📌 AI đa tác tử đang thu hẹp khoảng cách giữa LLM và AGI bằng cách kết hợp nhiều tác tử chuyên biệt. Framework như CrewAI và Autogen cho phép xử lý công việc tự động với độ chính xác cao hơn, tuy nhiên vẫn cần sự giám sát của con người trong các quyết định quan trọng.
https://venturebeat.com/ai/why-multi-agent-ai-conquers-complexities-llms-cant/
- Meta vừa công bố nhiều công cụ AI quan trọng cho robot và hệ thống AI thể hiện, bao gồm các tiêu chuẩn và công cụ giúp hiểu và tương tác tốt hơn với thế giới vật lý.
- Sparsh - một họ mô hình mã hóa cho cảm biến xúc giác dựa trên thị giác, được phát triển cùng với Đại học Washington và Carnegie Mellon. Mô hình này đã được huấn luyện trên hơn 460.000 hình ảnh xúc giác và đạt cải thiện trung bình 95,1% so với các mô hình trước đây.
- Digit 360 là cảm biến xúc giác hình dạng ngón tay nhân tạo với hơn 18 tính năng cảm biến. Cảm biến có hơn 8 triệu điểm cảm biến để ghi nhận biến dạng đa hướng trên bề mặt đầu ngón tay.
- Digit Plexus là nền tảng phần cứng-phần mềm giúp phát triển ứng dụng robot. Nền tảng này có thể tích hợp nhiều cảm biến xúc giác đầu ngón tay và da lên một bàn tay robot.
- Meta sẽ sản xuất Digit 360 cùng với GelSight Inc và hợp tác với Wonik Robotics để phát triển bàn tay robot tích hợp đầy đủ cảm biến xúc giác trên nền tảng Digit Plexus.
- PARTNR là tiêu chuẩn đánh giá hiệu quả của mô hình AI khi cộng tác với con người trong các công việc gia đình. Tiêu chuẩn này bao gồm 100.000 tác vụ ngôn ngữ tự nhiên trong 60 ngôi nhà với hơn 5.800 vật thể độc đáo.
📌 Meta đã tạo bước đột phá trong công nghệ robot với cảm biến Digit 360 có 8 triệu điểm cảm biến, mô hình Sparsh cải thiện 95,1% hiệu suất và nền tảng PARTNR với 100.000 tác vụ thử nghiệm. Các công nghệ này hứa hẹn mang lại khả năng tương tác tự nhiên giữa robot và con người.
https://venturebeat.com/ai/meta-unveils-ai-tools-to-give-robots-a-human-touch-in-physical-world/
• Microsoft vừa công bố Windows Agent Arena - nền tảng benchmark mới để kiểm thử AI agent trong môi trường Windows thực tế
• Nền tảng này cho phép thử nghiệm AI agent trên nhiều ứng dụng Windows như Microsoft Edge, Paint, Clock, VLC media player
• Microsoft Research phát triển AI agent đa phương thức tên Navi để khám phá khả năng của framework
• Kết quả benchmark cho thấy tỷ lệ thành công trung bình của AI agent chỉ đạt 19,5% so với hiệu suất trung bình của con người là 74,5%
• Nền tảng này được phát triển dựa trên framework OSWorld với hơn 150 tác vụ Windows đa dạng
• Windows Agent Arena là dự án nguồn mở, sử dụng các mô hình từ OpenAI như GPT-4V và Microsoft Phi3
• Salesforce CEO Marc Benioff chỉ trích Microsoft Copilot là "Clippy 2.0" và cho rằng Microsoft thiếu dữ liệu và mô hình bảo mật doanh nghiệp
• Các mối quan ngại chính về bảo mật và quyền riêng tư khi AI agent ngày càng tinh vi và có quyền truy cập nhiều ứng dụng chứa thông tin cá nhân
• Microsoft cam kết ưu tiên đạo đức AI, đặt quyền riêng tư và an toàn lên hàng đầu
• Anthropic cũng vừa ra mắt API "Computer Use" cho phép Claude sử dụng máy tính như người thật
📌 Microsoft phát triển Windows Agent Arena để thử nghiệm AI agent trên Windows với 150 tác vụ tự động. Hiệu suất AI chỉ đạt 19,5% so với con người (74,5%). Dự án nguồn mở này đối mặt thách thức về bảo mật và quyền riêng tư khi AI ngày càng tinh vi.
https://www.windowscentral.com/software-apps/microsofts-windows-agent-arena-brings-ai-assistants-keyboard-deep-to-windows-pcs-but-there-are-concerns
• Google đang phát triển dự án mật có tên "Project Jarvis" - một hệ thống AI Agent có khả năng điều khiển trình duyệt web để thực hiện các tác vụ thay người dùng
• Theo The Information, dự án này dự kiến sẽ được giới thiệu vào tháng 12/2024, dựa trên thông tin từ 3 nguồn tin nội bộ
• Project Jarvis được xây dựng dựa trên phiên bản nâng cấp của mô hình AI Gemini, được tối ưu hóa đặc biệt cho trình duyệt Chrome
• Hệ thống có khả năng:
- Thu thập thông tin nghiên cứu
- Thực hiện mua sắm trực tuyến
- Đặt vé máy bay
- Tự động hóa các tác vụ web hàng ngày
• Cơ chế hoạt động của Jarvis:
- Chụp và phân tích ảnh màn hình
- Tự động nhấp chuột vào các nút
- Nhập văn bản theo yêu cầu
- Mỗi hành động mất vài giây để xử lý
• Các đối thủ cạnh tranh cũng đang phát triển công nghệ tương tự:
- Microsoft với Copilot Vision
- Apple Intelligence
- Anthropic với Claude
- OpenAI đang nghiên cứu phiên bản riêng
• Google dự kiến sẽ thử nghiệm Jarvis với một số lượng nhỏ người dùng để phát hiện và khắc phục lỗi
📌 Google chuẩn bị tham gia cuộc đua AI Agent với Project Jarvis, dự kiến ra mắt tháng 12/2024. Hệ thống có thể tự động thực hiện các tác vụ web phức tạp như đặt vé máy bay, mua sắm thông qua việc điều khiển trình duyệt Chrome, mỗi thao tác mất vài giây xử lý.
https://www.theverge.com/2024/10/26/24280431/google-project-jarvis-ai-system-computer-using-agent
• ServiceNow đề xuất triển khai AI agent như những công cụ hoạt động ngầm để tránh gây áp lực cho nhân viên phải học cách sử dụng
• Dorit Zilbershot, phó chủ tịch AI và đổi mới tại ServiceNow khẳng định nhân viên không cần biết có bao nhiêu AI agent đang hoạt động ngầm
• Nền tảng Now Assist của ServiceNow là sản phẩm tăng trưởng nhanh nhất của công ty, ra mắt thư viện AI agent cho khách hàng vào tháng 9/2024
• AI agent có thể tự động hóa nhiều quy trình như:
- Mã hóa thông tin khách hàng
- Phân loại dữ liệu
- Thông báo thay đổi trạng thái cho nhân viên
• CEO Bill McDermott xác nhận AI tạo sinh, đặc biệt là các ứng dụng liên quan đến agent, đã phát triển vượt kỳ vọng
• ServiceNow nhấn mạnh sự khác biệt giữa agent và assistant để tránh tạo kỳ vọng sai lệch về việc người dùng phải học cách tương tác
• Công ty triển khai orchestrator agent để quản lý hệ sinh thái AI agent ngày càng mở rộng
• ServiceNow hợp tác với Nvidia:
- Sử dụng NIM Agent Blueprint để xây dựng AI agent có sẵn
- Agent đầu tiên là Vulnerability Analysis for Container Security AI Agent
- Dự kiến ra mắt vào năm 2025
📌 ServiceNow định hình lại cách tiếp cận AI trong doanh nghiệp thông qua mô hình AI agent "vô hình". Now Assist trở thành sản phẩm tăng trưởng nhanh nhất, với việc hợp tác cùng Nvidia để mở rộng hệ sinh thái agent vào năm 2025.
https://venturebeat.com/ai/servicenow-advocates-for-invisible-ai-agents-to-ease-worker-adoption/
- Microsoft vừa công bố bộ agent AI tự động mới cho nền tảng Dynamics 365, nhằm tăng cường tự động hóa trong các bộ phận bán hàng, tài chính, dịch vụ và chuỗi cung ứng.
- Các agent AI này sẽ được ra mắt dưới dạng thử nghiệm công khai vào tháng tới, với khả năng xử lý ngữ cảnh và ý định để đưa ra quyết định phức tạp, vượt trội so với các chatbot thông thường.
- Microsoft khẳng định các agent này không thay thế con người mà hỗ trợ mở rộng năng lực của nhân viên. “Agent giúp con người làm được những điều mà trước đây không thể làm,” Bryan Goode, Phó Chủ tịch Microsoft, nhấn mạnh.
- Động thái này diễn ra sau khi Salesforce ra mắt Agentforce – nền tảng AI của riêng họ, được CEO Marc Benioff quảng bá mạnh mẽ và chỉ trích Microsoft Copilot là "Clippy 2.0" vì kém hiệu quả.
- Microsoft tận dụng sức mạnh từ các công cụ quen thuộc như Microsoft 365 và Azure, trong khi Salesforce dựa vào chuyên môn CRM và Data Cloud để phát triển các agent AI tối ưu hóa mối quan hệ khách hàng.
- Cuộc cạnh tranh này đánh dấu bước ngoặt lớn khi các agent AI đang trở thành công cụ cốt lõi trong phần mềm doanh nghiệp, hứa hẹn định hình lại tương lai của công việc và cấu trúc tổ chức.
- Tuy nhiên, cả hai công ty phải đối mặt với thách thức về quyền riêng tư dữ liệu, minh bạch trong quyết định của AI, và lo ngại về việc mất việc làm do tự động hóa. Thành công của các nền tảng này phụ thuộc vào khả năng cân bằng giữa giá trị kinh doanh và sự minh bạch trong triển khai.
📌 Microsoft và Salesforce đang dẫn đầu trong cuộc cách mạng AI doanh nghiệp, mỗi bên với chiến lược riêng. Cuộc chiến này không chỉ định hình lại phần mềm doanh nghiệp mà còn mở ra những thay đổi lớn trong cách tổ chức và vận hành công việc.
https://venturebeat.com/ai/microsofts-new-ai-agents-set-to-shake-up-enterprise-software-sparking-new-battle-with-salesforce/
- Thế hệ thứ ba của AI đang diễn ra với sự phát triển mạnh mẽ của các tác nhân AI, tự động và thông minh.
- Thị trường cho các tác nhân AI hiện nay khoảng 5.1 tỷ USD và dự kiến sẽ đạt 47.1 tỷ USD vào năm 2030 (tăng trưởng hàng năm 44.8%).
- Salesforce đã giới thiệu “AgentForce”, bộ công cụ cho phép xây dựng nhanh các tác nhân AI để tạo ra lực lượng lao động hybrid.
- Oracle cũng công bố hơn 50 tác nhân AI mới cho Oracle Fusion Cloud.
- Ngành an ninh mạng đang đối mặt với tình trạng thiếu hụt nhân lực nghiêm trọng, với khoảng 5.5 triệu vị trí còn thiếu trên toàn cầu.
- Các cuộc tấn công mạng ngày càng gia tăng về số lượng và độ phức tạp, bao gồm ransomware và phishing.
- Các tác nhân AI trong an ninh mạng có khả năng tự động hóa các nhiệm vụ lặp đi lặp lại và phát hiện mối đe dọa theo thời gian thực.
- Tác nhân AI có thể học hỏi từ môi trường và thích ứng với các mối đe dọa mới mà không cần sự can thiệp liên tục của con người.
- Việc xây dựng đường dẫn dữ liệu đám mây là cần thiết để cải thiện khả năng học máy và trí tuệ trong an ninh mạng.
- Tác nhân AI có thể giám sát cơ sở hạ tầng sạc xe điện (EV) và phát hiện các bất thường trong hành vi sạc hoặc lưu lượng năng lượng.
- Công nghệ mô hình hành động lớn (LAM) đang được áp dụng để tạo ra trí tuệ hành động cho các tác nhân AI.
- Sự chuyển mình từ hệ thống chuyên gia sang những thực thể thông minh hơn sẽ cho phép tác nhân AI dự đoán và phản ứng với các mối đe dọa phức tạp.
📌 Tác nhân AI đang trở thành giải pháp quan trọng trong an ninh mạng khi đối mặt với tình trạng thiếu hụt nhân lực. Dự báo thị trường sẽ đạt 47.1 tỷ USD vào năm 2030, với khả năng tự động hóa và học hỏi từ môi trường.
https://www.forbes.com/councils/forbestechcouncil/2024/10/22/the-evolution-of-ai-agents-in-the-third-wave-of-ai/
• CrewAI, startup thành lập năm 2023, vừa ra mắt sản phẩm đầu tiên CrewAI Enterprise cho phép người dùng xây dựng và triển khai các đội ngũ AI agent
• Thị trường AI agent dự kiến tăng từ 5 tỷ USD năm 2024 lên gần 50 tỷ USD vào năm 2030
• Theo Capgemini, 10% doanh nghiệp lớn đã sử dụng AI agent, 50% có kế hoạch triển khai trong năm tới và 82% sẽ áp dụng trong 3 năm tới
• Nền tảng mới của CrewAI được xây dựng trên framework nguồn mở, cho phép tổ chức:
- Xây dựng đội ngũ AI agent sử dụng bất kỳ LLM hoặc nền tảng đám mây nào
- Triển khai an toàn với các mức kiểm soát tùy chỉnh
- Theo dõi ROI với công cụ kiểm thử và đào tạo
• Các trường hợp sử dụng phổ biến:
- Tự động hóa quy trình nội bộ
- Marketing và phát triển code
- Nghiên cứu, tổng hợp và báo cáo
- Phân tích pháp lý
- Cập nhật và kiểm thử code tự động
- Phát triển leads và tư vấn trong lĩnh vực bất động sản
- Xử lý yêu cầu nội bộ theo quy tắc cụ thể
- Biên tập video và đăng tải lên mạng xã hội
• Thành tích ấn tượng:
- Thực thi hơn 10 triệu AI agent mỗi tháng
- Được sử dụng bởi gần 50% công ty Fortune 500
- Thu hút 150 khách hàng doanh nghiệp beta trong chưa đầy 6 tháng
- Gọi vốn 18 triệu USD từ các nhà đầu tư hàng đầu
📌 CrewAI đang dẫn đầu làn sóng AI agent với framework nguồn mở được 50% Fortune 500 sử dụng, thực thi 10 triệu agent/tháng. Startup này vừa huy động 18 triệu USD và ra mắt nền tảng doanh nghiệp mới, hứa hẹn đưa thị trường AI agent đạt 50 tỷ USD vào 2030.
https://venturebeat.com/ai/crewai-launches-its-first-multi-agent-builder-speeding-the-way-to-agentic-ai/
• Gartner dự đoán đến năm 2028, ít nhất 15% quyết định công việc hàng ngày sẽ được thực hiện tự động thông qua AI tạo sinh (tăng từ 0% năm 2024).
• AI agent được xem là một trong những xu hướng công nghệ chiến lược hàng đầu trong năm 2025.
• Các trường hợp sử dụng cơ bản của AI agent bao gồm các tác vụ đơn điệu tốn thời gian và năng lượng của con người.
• AI tạo sinh có khả năng lập kế hoạch, cảm nhận và hành động, có thể tự động giám sát và quản lý hệ thống.
• Trong tương lai, AI agent có thể giúp nâng cao kỹ năng của lực lượng lao động bằng cách đóng vai trò cố vấn cho nhân viên mới.
• Nền tảng quản trị AI sẽ giúp các tổ chức quản lý hiệu suất pháp lý, đạo đức và hoạt động của hệ thống AI của họ.
• Các công cụ mới sẽ tạo, quản lý và thực thi các chính sách để đảm bảo AI minh bạch và được sử dụng có trách nhiệm.
• Gartner dự đoán 7 mô hình tính toán sẽ xuất hiện trong tương lai gần, bao gồm CPU, GPU, biên, mạch tích hợp chuyên dụng, hệ thống thần kinh nhân tạo, lượng tử cổ điển và tính toán quang học.
• Mô hình tính toán lai trong tương lai sẽ kết hợp các cơ chế tính toán, lưu trữ và mạng khác nhau.
• Phần mềm điều phối sẽ di chuyển việc tính toán từ mô hình này sang mô hình khác tùy thuộc vào nhiệm vụ và phương pháp phù hợp nhất.
• Bảo mật thông tin sai lệch trở nên quan trọng khi AI cho phép các tác nhân đe dọa lan truyền thông tin sai lệch nhanh hơn và dễ dàng hơn bao giờ hết.
• Đến năm 2028, Gartner dự đoán 50% doanh nghiệp sẽ bắt đầu áp dụng các sản phẩm, dịch vụ hoặc tính năng được thiết kế đặc biệt cho bảo mật thông tin sai lệch (tăng từ dưới 5% hiện nay).
• Gartner dự đoán đến năm 2029, tiến bộ trong lĩnh vực máy tính lượng tử sẽ khiến hầu hết các phương pháp mật mã bất đối xứng thông thường trở nên không an toàn.
• Các tổ chức cần chuẩn bị cho mật mã hậu lượng tử ngay bây giờ để đảm bảo dữ liệu của họ không bị giải mã.
• Gartner dự đoán sự gia tăng trong việc sử dụng giao diện não-máy hai chiều (BBMIs) để đọc và giải mã hoạt động của não và nâng cao khả năng nhận thức của con người.
• Đến năm 2030, 30% người lao động tri thức sẽ sử dụng các công nghệ như BBMIs để duy trì sự phù hợp trong môi trường làm việc được hỗ trợ bởi AI (tăng từ dưới 1% năm 2024).
📌 Gartner dự đoán sự trỗi dậy của AI agent vào năm 2025, với 15% quyết định công việc hàng ngày được thực hiện tự động thông qua AI tạo sinh vào năm 2028. Các xu hướng khác bao gồm nền tảng quản trị AI, mô hình tính toán lai, bảo mật thông tin sai lệch và mật mã hậu lượng tử, với 50% doanh nghiệp áp dụng bảo mật thông tin sai lệch vào năm 2028.
https://venturebeat.com/security/gartner-2025-will-see-the-rise-of-ai-agents-and-other-top-trends/
• Microsoft vừa công bố 10 agent AI mới cho Dynamics 365, sử dụng trong bán hàng, dịch vụ khách hàng, tài chính và chuỗi cung ứng.
• Các agent này có thể giúp doanh nghiệp tiết kiệm tới 50 triệu USD mỗi năm, tương đương với việc bổ sung 187 nhân viên toàn thời gian.
• Microsoft cũng giới thiệu tính năng mới trong Copilot Studio, cho phép lập trình viên tạo agent riêng kết nối với dữ liệu doanh nghiệp.
• 10 agent mới bao gồm: agent đánh giá khách hàng tiềm năng, agent đơn hàng bán, agent giao tiếp nhà cung cấp, agent đối chiếu tài chính, agent đối chiếu tài khoản, agent quản lý thời gian và chi phí, agent ý định khách hàng, agent quản lý kiến thức khách hàng, agent quản lý trường hợp và agent vận hành lịch trình.
• Các agent sẽ bắt đầu có sẵn ở bản xem trước công khai vào cuối năm nay và đầu năm 2025 trong Dynamics 365.
• Microsoft dự đoán mỗi tổ chức sẽ có một "chòm sao" agent, từ đơn giản đến hoàn toàn tự chủ.
• Các agent sẽ sử dụng dữ liệu từ Microsoft 365 Graph, hệ thống ghi chép, Dataverse và Fabric.
• Microsoft đã dẫn chứng các khách hàng như Clifford Chance, McKinsey & Company và Pets at Home đang sử dụng agent tự chủ để tăng doanh thu và giảm chi phí.
• Công ty cam kết có các biện pháp bảo mật nghiêm ngặt và kiểm soát quản trị dữ liệu mạnh mẽ, được quản lý trong Copilot Studio.
• Copilot Studio được tính phí dựa trên mức sử dụng, với giá 200 USD/tháng cho 25.000 tin nhắn.
• Microsoft sẽ chia sẻ thêm thông tin về Copilot Studio và Dynamics 365 tại sự kiện trực tuyến Microsoft Business Applications Launch Event vào ngày 29/10.
📌 Microsoft ra mắt 10 agent AI mới cho Dynamics 365, hứa hẹn tiết kiệm 50 triệu USD/năm cho doanh nghiệp. Các agent tự động hóa quy trình trong bán hàng, tài chính và chuỗi cung ứng, tương đương với việc bổ sung 187 nhân viên toàn thời gian.
https://www.zdnet.com/article/microsoft-introduces-ten-ai-agents-for-sales-finance-supply-chain-in-dynamics-365/#ftag=RSSbaffb68
• OpenAI vừa ra mắt Swarm, một khung mã nguồn mở thử nghiệm nhằm đơn giản hóa việc tạo và điều phối các tác nhân AI để tự động hóa tác vụ.
• Swarm tập trung vào cải thiện phối hợp và thực thi tác nhân thông qua hai khái niệm cốt lõi: tác nhân và bàn giao.
• Khung này cho phép chia nhỏ quy trình phức tạp thành các tác vụ có thể quản lý được, đảm bảo mỗi tác nhân được trang bị công cụ và hướng dẫn cần thiết để hoàn thành công việc hiệu quả.
• Swarm được thiết kế là một khung nhẹ, có thể kiểm soát và kiểm thử được, lý tưởng để phát triển các tác nhân AI tinh vi.
• Kiến trúc của Swarm ưu tiên điều phối và thực thi tác vụ liền mạch, dựa trên hai trụ cột cơ bản: tác nhân (được trang bị hướng dẫn và công cụ cụ thể) và bàn giao (đảm bảo chuyển giao suôn sẻ giữa các tác nhân).
• Swarm xuất sắc trong việc quản lý và chuyển giao tác vụ giữa các tác nhân với độ chính xác và linh hoạt cao.
• Một điểm mạnh chính của Swarm là sử dụng các biến ngữ cảnh, cho phép khung cung cấp phản hồi được cá nhân hóa cao, thích ứng với nhu cầu và tham số độc đáo của mỗi tác vụ.
• Ứng dụng thực tế của Swarm rất đa dạng, bao gồm tạo chiến dịch tiếp thị toàn diện từ một đầu vào trang web duy nhất.
• Swarm có thể xử lý các tác vụ phức tạp đòi hỏi hiểu biết tinh tế như dịch ngôn ngữ, hỗ trợ khách hàng nhận biết ngữ cảnh và phân tích dữ liệu.
• Để sử dụng Swarm, người dùng cần Python 3.10 trở lên. Khung này tích hợp liền mạch với API hoàn thành trò chuyện.
• Các tính năng kỹ thuật chính bao gồm kiến trúc mô-đun, quản lý bộ nhớ hiệu quả, xử lý lỗi và ghi nhật ký tích hợp, và tương thích với các thư viện AI và học máy phổ biến.
• Swarm hiện được định vị là một dự án thử nghiệm với trọng tâm mạnh mẽ về giáo dục, khuyến khích thử nghiệm và học tập.
• OpenAI tích cực khuyến khích sự tham gia của cộng đồng với Swarm bằng cách cung cấp nhiều ví dụ và tài nguyên.
• Là một dự án mã nguồn mở, Swarm chào đón đóng góp từ cộng đồng AI, thúc đẩy sự hợp tác và đổi mới.
📌 Swarm của OpenAI là khung mã nguồn mở thử nghiệm đột phá cho phép tạo và điều phối tác nhân AI dễ dàng. Với tính linh hoạt cao, Swarm có thể xử lý nhiều tác vụ phức tạp từ tiếp thị đến phân tích dữ liệu. Dự án này mở ra cơ hội học tập và đổi mới cho cộng đồng AI toàn cầu.
https://www.geeky-gadgets.com/how-openais-swarm-is-changing-the-game-for-ai-agents/
• OpenAI vừa công bố Swarm - một khung thử nghiệm AI mới nhằm đơn giản hóa việc xây dựng và điều phối các hệ thống đa tác tử phức tạp.
• Swarm tập trung vào việc làm cho quá trình phối hợp, thực thi và kiểm thử giữa các tác tử AI trở nên nhẹ nhàng và dễ kiểm soát hơn.
• Khung này đã được phát triển trong nhiều tháng và OpenAI hy vọng nó sẽ được cộng đồng AI đón nhận như một công cụ thực tế để xây dựng các hệ thống AI tiên tiến.
• Swarm dựa trên hai khái niệm cơ bản: tác tử và bàn giao. Một tác tử trong Swarm là sự kết hợp giữa các hướng dẫn cụ thể và công cụ để hoàn thành một nhiệm vụ.
• Tại bất kỳ thời điểm nào, một tác tử có thể "bàn giao" cuộc hội thoại hoặc nhiệm vụ cho một tác tử khác, giúp quá trình điều phối trở nên liền mạch và mô-đun hóa.
• Swarm được xây dựng trên nền tảng ChatCompletions, cung cấp một nền tảng mạnh mẽ và linh hoạt cho việc phát triển.
• Khung này giúp đơn giản hóa việc quản lý giao tiếp giữa các tác tử và chuyển giao trách nhiệm một cách linh hoạt.
• Cách tiếp cận nhẹ nhàng của Swarm cho phép các nhà phát triển dễ dàng lặp lại, kiểm thử và tinh chỉnh cấu hình đa tác tử mà không bị vướng bận bởi các yêu cầu cơ sở hạ tầng phức tạp.
• Swarm đặc biệt phù hợp cho các nhà nghiên cứu và phát triển muốn đảm bảo độ tin cậy và hiệu quả trong việc điều phối tác tử AI.
• Bằng cách giữ mọi thứ đơn giản, dễ kiểm soát và hiệu quả, Swarm đại diện cho một bước tiến quan trọng trong việc làm cho các hệ thống AI tiên tiến trở nên dễ tiếp cận hơn với cộng đồng phát triển rộng lớn hơn.
• Swarm có thể được cài đặt thông qua pip bằng cách sử dụng lệnh: pip install git+https://github.com/openai/swarm.git
• Việc sử dụng Swarm khá đơn giản, chỉ cần import các module cần thiết và định nghĩa các tác tử cùng với chức năng của chúng.
📌 OpenAI giới thiệu Swarm - khung thử nghiệm AI mới để xây dựng hệ thống đa tác tử. Swarm tập trung vào việc đơn giản hóa điều phối giữa các tác tử AI, dựa trên khái niệm tác tử và bàn giao. Được xây dựng trên ChatCompletions, Swarm hứa hẹn mang lại cách tiếp cận nhẹ nhàng và dễ kiểm soát cho phát triển AI tiên tiến.
https://www.marktechpost.com/2024/10/11/openai-releases-swarm-an-experimental-ai-framework-for-building-orchestrating-and-deploying-multi-agent-systems/
• Theo khảo sát của Capgemini với 1.100 lãnh đạo doanh nghiệp lớn:
- 10% tổ chức đã sử dụng AI agent
- Hơn 50% dự định sử dụng trong năm tới
- 82% có kế hoạch tích hợp trong 3 năm tới
• Lợi ích của AI agent theo khảo sát:
- 71% nói sẽ tăng tự động hóa quy trình làm việc
- 64% cho rằng sẽ cải thiện dịch vụ và sự hài lòng của khách hàng
- 57% cho rằng tiềm năng cải thiện năng suất vượt trội hơn rủi ro
• Ứng dụng lớn nhất của AI tạo sinh tự chủ là trong phát triển phần mềm (75% người được hỏi) - để tạo, đánh giá và viết lại mã
• 77% lãnh đạo lo ngại sẽ bỏ lỡ cuộc cách mạng AI nếu không triển khai sớm
• AI tự chủ sẽ định nghĩa lại tương lai công việc trong thập kỷ tới với 6 cấp độ công việc tự chủ, từ tăng cường khả năng đến thay thế hoàn toàn các nhiệm vụ, vai trò, nhóm và bộ phận kinh doanh
• Theo Gartner:
- Đến 2028, 33% ứng dụng phần mềm doanh nghiệp sẽ tích hợp AI tạo sinh tự chủ (tăng từ dưới 1% năm 2024)
- 15% quyết định công việc hàng ngày sẽ được đưa ra tự động
• Forrester xếp AI agent đứng đầu trong Top 10 công nghệ mới nổi năm 2024, định nghĩa là "Hệ thống AI tổng quát được đào tạo để hành động vô hình thay mặt doanh nghiệp hoặc cá nhân, thực hiện nhiệm vụ, ra quyết định và tương tác với dữ liệu hoặc hệ thống khác một cách tự chủ"
• AI tự chủ sẽ hoạt động với sự giám sát tối thiểu của con người, tự cải thiện và ngày càng hiệu quả trong việc ra quyết định trong môi trường phức tạp
• Các công nghệ liên quan bao gồm: hệ thống đa agent, mô hình hành động lớn, khách hàng máy, robot nhân hình làm việc, agent tự chủ và học tăng cường
📌 AI tạo sinh tự chủ đang trở thành xu hướng chủ đạo, với 82% doanh nghiệp lớn dự định tích hợp trong 3 năm tới. Nó hứa hẹn cải thiện đáng kể năng suất, tự động hóa và ra quyết định, đặc biệt trong phát triển phần mềm. Tuy nhiên, 77% lãnh đạo lo ngại bỏ lỡ cuộc cách mạng này.
https://www.zdnet.com/article/why-agentic-ai-is-the-new-electricity-and-nearly-80-of-business-leaders-are-afraid-of-the-dark/
• Nvidia vừa phát hành các plugin mới cho Unreal Engine 5 nhằm cải thiện độ chân thực của nhân vật kỹ thuật số được hỗ trợ bởi AI.
• Các plugin mới này là một phần của bộ công nghệ Nvidia Ace, bao gồm các công cụ tạo giọng nói, trí thông minh và hoạt hình được hỗ trợ bởi AI tạo sinh.
• Plugin Audio2Face-3D mới cho phép tạo hoạt hình khuôn mặt đồng bộ với giọng nói một cách tự động. Plugin này hiện đã có sẵn cho Autodesk Maya.
• Nemotron-Mini 4B Instruct là một plugin giúp tạo ra các phản hồi tự nhiên cho nhân vật AI.
• Plugin RAG (tạo sinh được tăng cường bởi truy xuất dữ liệu ngoài) cho phép nhà phát triển xây dựng cơ sở dữ liệu ngữ cảnh cho IP của họ, tạo ra các phản hồi phù hợp với độ trễ thấp.
• Các plugin này được tối ưu hóa để chạy trên Windows PC với độ trễ thấp và sử dụng ít bộ nhớ.
• Nvidia cũng phát hành một dự án mẫu Unreal Engine 5 để hướng dẫn nhà phát triển tích hợp nhân vật kỹ thuật số vào game và ứng dụng của họ.
• Plugin Audio2Face-3D cho Maya giúp đơn giản hóa quy trình tạo hoạt hình khuôn mặt chất lượng cao cho bất kỳ nhân vật nào. Mã nguồn và script có thể tùy chỉnh để sử dụng với các công cụ tạo nội dung kỹ thuật số khác.
• Nvidia cũng giới thiệu microservice renderer mới cho Unreal Engine 5 hỗ trợ Nvidia Animation Graph Microservice và hệ điều hành Linux ở giai đoạn truy cập sớm.
• Animation Graph là một microservice tạo điều kiện cho việc tạo ra các máy trạng thái hoạt hình và cây blend, cung cấp hệ thống linh hoạt dựa trên node để blend, phát lại và điều khiển hoạt hình.
• Microservice renderer mới cho phép nhà phát triển chạy nhân vật MetaHuman trên máy chủ đám mây và stream các khung hình và âm thanh đã render tới bất kỳ trình duyệt và thiết bị edge nào qua WebRTC.
• Nhà phát triển có thể đăng ký truy cập sớm để tải xuống microservice renderer Unreal Engine 5 với hỗ trợ cho microservice Animation Graph và hệ điều hành Linux.
📌 Nvidia đã phát hành các plugin mới cho Unreal Engine 5 nhằm cải thiện độ chân thực của nhân vật kỹ thuật số. Các công cụ như Audio2Face-3D, Nemotron-Mini 4B và RAG cho phép tạo ra các nhân vật MetaHuman sống động và tương tác tự nhiên hơn, với khả năng chạy trên Windows PC với độ trễ thấp.
https://venturebeat.com/ai/nvidia-releases-plugins-to-improve-digital-human-realism-on-unreal-engine-5/
• OpenAI dự đoán các trợ lý AI sẽ trở nên phổ biến vào năm 2025, mở ra cuộc đua giữa các công ty công nghệ lớn như Google và Apple.
• Kevin Weil, Giám đốc sản phẩm của OpenAI, cho biết họ muốn tạo ra khả năng tương tác với AI giống như con người thật.
• Tại sự kiện Developer Day ở San Francisco, OpenAI đã giới thiệu mô hình mới o1 với khả năng lập luận được cải thiện và GPT-4o với xử lý giọng nói nâng cao.
• Các nhà phát triển sẽ có thể truy cập công nghệ này theo thời gian thực, cho phép AI hiểu lệnh thoại và đàm thoại bằng giọng nói như trong cuộc gọi thực tế.
• OpenAI đang hoàn tất vòng gọi vốn 6,5 tỷ USD với định giá 150 tỷ USD, thu hút các nhà đầu tư như Microsoft, Nvidia, SoftBank và các quỹ đầu tư mạo hiểm.
• Nhiều công ty công nghệ lớn như Microsoft, Salesforce, Workday, Google và Meta cũng đang tập trung phát triển các trợ lý AI thông minh.
• Năm ngoái, OpenAI đã ra mắt "API trợ lý" để các nhà phát triển xây dựng agent sử dụng công nghệ của họ, nhưng bị hạn chế do khả năng của các mô hình trước đó.
• Mô hình mới của OpenAI có khả năng suy nghĩ và lập luận tốt hơn, sẽ được tích hợp vào các sản phẩm như ChatGPT và API cho các startup.
• Một ví dụ được trình diễn là hệ thống AI có thể gọi điện đặt hàng dâu tây theo yêu cầu của người dùng về số lượng và chi phí mong muốn.
• OpenAI khẳng định việc sử dụng công nghệ này sẽ không được phép che giấu việc đó là AI chứ không phải con người, và chỉ có sẵn 6 giọng nói cài đặt sẵn.
• Weil tin rằng nếu làm đúng, công nghệ này sẽ giúp con người có thêm thời gian cho những việc quan trọng thay vì nhìn chằm chằm vào điện thoại.
📌 OpenAI dự đoán AI agent sẽ phổ biến vào 2025, giới thiệu mô hình o1 và GPT-4o với khả năng lập luận và xử lý giọng nói nâng cao. Công ty đang gọi vốn 6,5 tỷ USD, định giá 150 tỷ USD. Các ông lớn công nghệ cũng đang chạy đua phát triển trợ lý AI thông minh.
https://www.ft.com/content/30677465-33bb-4f74-a8e6-239980091f7a
#FT
• Dharmesh Shah, đồng sáng lập và CTO của Hubspot, dự đoán bước tiếp theo của AI sẽ là các mạng lưới agent hợp tác để thực hiện các tác vụ phức tạp hơn, chủ yếu không cần sự giám sát của con người.
• Shah cho rằng agent là bước tiến hóa từ copilot, có thể đảm nhận các mục tiêu cấp cao hơn thường liên quan đến nhiều bước.
• Hubspot đang cạnh tranh với các công ty như Salesforce để triển khai các agent hỗ trợ các tác vụ quản lý quan hệ khách hàng (CRM) như bán hàng, tiếp thị, chăm sóc khách hàng.
• Tại hội nghị thường niên Inbound, Hubspot đã giới thiệu mạng lưới agent.ai - một thị trường cho các agent AI với hơn 47.000 người dùng và 1.700 nhà phát triển đăng ký tạo agent riêng.
• Shah mô tả agent.ai như một "mạng chuyên nghiệp cho các agent", tương tự LinkedIn nhưng dành cho AI.
• Trong tương lai, các agent có thể hợp tác thành nhóm gồm các "mini agent" và một agent giám sát cấp cao hơn.
• Khả năng xử lý ngôn ngữ tự nhiên của AI tạo sinh trở thành yếu tố kết nối để lập trình và tổ hợp các agent, khắc phục vấn đề tương thích trong các nỗ lực trước đây như CORBA.
• Shah tin rằng AI agent và mạng lưới agent hợp tác sẽ tạo ra cuộc cách mạng trong phần mềm CRM, dẫn đến sự xuất hiện của "CRM thông minh dựa trên AI".
• Cuộc cạnh tranh trong lĩnh vực CRM sẽ xoay quanh việc nền tảng nào cung cấp khả năng sử dụng agent tốt nhất cho cả người dùng và nhà phát triển.
• Shah kỳ vọng một thế hệ nhà phát triển mới sẽ tìm kiếm nền tảng để xây dựng ý tưởng của họ, với agent trở thành "ứng dụng mới" thay vì các ứng dụng web truyền thống.
📌 Mạng lưới agent AI hợp tác được dự đoán sẽ định hình lại cách làm việc trong tương lai. Với hơn 47.000 người dùng trên nền tảng agents.ai của Hubspot, xu hướng này có tiềm năng cách mạng hóa ngành CRM và tạo ra một thế hệ nhà phát triển mới tập trung vào xây dựng agent AI.
https://www.zdnet.com/article/networks-of-collaborative-agents-will-transform-ai-says-this-expert/
• Jensen Huang, CEO của NVIDIA, đã chia sẻ tầm nhìn về tương lai của AI trong cuộc phỏng vấn với Marc Benioff, CEO Salesforce tại hội nghị Dreamforce.
• Huang nhấn mạnh sự chuyển dịch từ môi trường dựa trên công cụ sang môi trường dựa trên kỹ năng, với các agent AI đóng vai trò then chốt trong việc tự động hóa công việc và thúc đẩy năng suất.
• Các agent AI không chỉ tự động hóa các tác vụ phức tạp mà còn có khả năng tạo ra các công cụ mới để nâng cao năng lực của chính mình.
• Sự phát triển nhanh chóng của AI được thúc đẩy bởi các tiến bộ trong học không giám sát, học tăng cường và phát triển các mô hình ngôn ngữ lớn.
• Huang nhấn mạnh tầm quan trọng của việc loại bỏ giới hạn con người trong phát triển AI để đẩy nhanh tiến độ và đạt được sức mạnh tính toán chưa từng có.
• Việc cân bằng giữa dữ liệu công khai và độc quyền là cần thiết cho sự phát triển AI hiệu quả.
• Mở rộng quy mô AI đòi hỏi quản lý hiệu quả tài nguyên tính toán cho đào tạo và thử nghiệm.
• Dữ liệu tổng hợp giảm sự phụ thuộc vào dữ liệu được gắn nhãn bởi con người và nâng cao hiệu quả đào tạo AI.
• GPU vượt qua định luật Moore, thúc đẩy sự tiến bộ nhanh chóng của AI.
• AI đang chuyển đổi phát triển phần mềm bằng cách tự động hóa các tác vụ lập trình và tối ưu hóa.
• Đảm bảo an toàn AI thông qua tinh chỉnh, học có giám sát và cơ chế phản hồi là điều cần thiết.
• Việc đưa các agent AI vào hoạt động với đào tạo và bối cảnh phù hợp là quan trọng để triển khai hiệu quả.
• Tương lai của điện toán sẽ liên quan đến phần mềm dự đoán và giao diện thích ứng, nâng cao trải nghiệm người dùng.
• Tầm nhìn của Huang nhấn mạnh tiềm năng chuyển đổi của các agent AI trong việc định hình tương lai của các ngành công nghiệp.
• Bằng cách áp dụng các công nghệ và phương pháp AI tiên tiến, doanh nghiệp có thể mở khóa các mức năng suất và đổi mới chưa từng có.
• Tương lai sẽ chứng kiến các agent AI làm việc cùng con người để thúc đẩy tiến bộ và thành công trong nhiều lĩnh vực.
📌 Jensen Huang dự đoán agent AI sẽ định hình tương lai công nghệ, tự động hóa công việc phức tạp và tăng năng suất đột phá. Các tiến bộ trong học máy, GPU và dữ liệu tổng hợp đang thúc đẩy sự phát triển nhanh chóng của AI, mở ra cơ hội to lớn cho doanh nghiệp trong nhiều lĩnh vực.
https://www.geeky-gadgets.com/nvidia-ceo-on-agents-being-the-future-of-ai/
• AI agent đang nổi lên như xu hướng công nghệ nóng nhất vào mùa thu 2024, hứa hẹn mang lại ROI đáng kể cho các khoản đầu tư vào giải pháp AI thế hệ tiếp theo.
• AI agent là một ứng dụng tổng hợp và tự chủ cho phép con người và AI cộng tác để hoàn thành một nhiệm vụ. Nó khác biệt so với chatbot AI hiện có ở khả năng thực hiện các hành động tiếp theo dựa trên kết quả phản hồi của LLM, có hoặc không có sự tham gia thêm của con người.
• Lợi ích chính của AI agent bao gồm: có mục đích cụ thể, có thể được tạo và quản lý bởi người không phải lập trình viên, cung cấp bối cảnh làm việc tốt hơn cho AI.
• Ví dụ, một AI agent có thể tự động hóa phần lớn quá trình lập kế hoạch sự kiện công ty, bao gồm khảo sát từ các sự kiện trước đó, so sánh các lựa chọn địa điểm, kiểm tra sự sẵn có của địa điểm và diễn giả chính, xem xét các vấn đề đi lại và mô hình hóa số lượng phiên mà một địa điểm cụ thể có thể tổ chức.
• Các thành phần chính của một AI agent bao gồm: LLM, dữ liệu, quản trị, tích hợp, quy trình làm việc/quy tắc, giao diện người dùng và lưu trữ.
• Việc triển khai AI agent dự kiến sẽ diễn ra qua 4 giai đoạn: nền tảng ứng dụng (hiện tại), nền tảng cơ sở hạ tầng (đầu 2025), các startup chuyển hướng (đầu-giữa 2025), và triển khai sản xuất đầu tiên (giữa-cuối 2025).
• Các thách thức chính đối với AI agent bao gồm quản trị, kiểm thử, khả năng quan sát, hiệu suất và hiệu quả.
• Trong 12 tháng tới, doanh nghiệp nên: bắt đầu từ từ với các dự án thí điểm, chỉ định một "tổng giám đốc phụ trách agent", và kéo dài thời gian kiểm thử càng nhiều càng tốt.
📌 AI agent đang nổi lên như xu hướng công nghệ hàng đầu cuối năm 2024, hứa hẹn mang lại ROI đáng kể cho doanh nghiệp. Với khả năng tự động hóa quy trình, tích hợp dữ liệu và cộng tác người-máy, AI agent có tiềm năng thay đổi cách thức hoạt động của doanh nghiệp. Tuy nhiên, việc triển khai cần được thực hiện cẩn thận, với sự chú ý đặc biệt đến quản trị, kiểm thử và khả năng mở rộng.
https://www.forbes.com/sites/moorinsights/2024/09/26/ai-agents-will-be-the-key-to-achieving-roi-from-ai/
• AI agent được dự đoán sẽ là bước tiến quan trọng tiếp theo sau các mô hình ngôn ngữ trong lĩnh vực trí tuệ nhân tạo.
• Các hệ thống tự động hóa và AI trước đây chủ yếu thực hiện các hành động dựa trên quyết định có sẵn. AI agent sẽ có khả năng tự đưa ra quyết định.
• Quá trình ra quyết định của con người thường bao gồm các bước: tiếp nhận thông tin mới, nghiên cứu, suy luận, quyết định, hành động, giám sát và học hỏi.
• Quy trình này thường không được ghi lại, khác biệt giữa các cá nhân và ít khi được xem xét kỹ lưỡng trong tổ chức.
• Khi phát triển AI agent, các nhóm chuyên môn sẽ phải xem xét cẩn thận từng bước trong quy trình ra quyết định và các yếu tố cần cân nhắc.
• AI agent có tiềm năng cải thiện cách chúng ta tiếp nhận thông tin mới, nghiên cứu, suy luận và học hỏi từ kết quả quyết định.
• Ví dụ: AI agent có thể hỗ trợ kiểm tra lịch trình, nghiên cứu diễn giả và đưa ra đề xuất trước khi nhân viên đọc email ban đầu.
• Quá trình phát triển AI agent sẽ thách thức và tái cấu trúc khả năng ra quyết định của chúng ta với tư cách chuyên gia.
• Các tổ chức có thể phát triển chia sẻ kinh nghiệm tốt nhất, đầu tư vào đào tạo và tạo kế hoạch phát triển kỹ năng ra quyết định cá nhân hóa.
• Điều này sẽ tạo nền tảng để thảo luận và học hỏi về kỹ năng quan trọng nhất nhưng ít được đầu tư nhất: khả năng ra quyết định tốt.
📌 AI agent hứa hẹn cách mạng hóa quá trình ra quyết định bằng cách tự động hóa nghiên cứu, suy luận và đề xuất. Việc phát triển AI agent sẽ thúc đẩy các tổ chức xem xét lại và cải thiện quy trình ra quyết định, từ đó nâng cao hiệu quả làm việc tổng thể.
https://www.fastcompany.com/91198519/how-ai-agents-will-help-us-make-better-decisions
• Nghiên cứu mô hình ngôn ngữ lớn (LLM) đã phát triển nhanh chóng, tập trung vào việc cải thiện khả năng hiểu và xử lý ngôn ngữ, đặc biệt trong các lĩnh vực chuyên môn như tài chính.
• LLM đã vượt qua các tác vụ phân loại cơ bản để trở thành công cụ mạnh mẽ có khả năng truy xuất và tạo ra kiến thức phức tạp.
• Một thách thức lớn trong nghiên cứu LLM là cân bằng giữa hiệu quả chi phí và hiệu suất. LLM tốn kém về mặt tính toán và có nguy cơ tạo ra thông tin không chính xác khi xử lý bộ dữ liệu lớn hơn.
• Các phương pháp truyền thống dựa nhiều vào một mô hình transformer dày đặc duy nhất, thường gặp vấn đề về ảo giác, tạo ra thông tin không chính xác hoặc không liên quan.
• Các nhà nghiên cứu đã khám phá nhiều phương pháp để giải quyết những thách thức này, bao gồm mô hình tổng hợp, nhưng chúng tốn kém và chậm xử lý.
• Nhóm nghiên cứu từ Vanguard IMFS đã giới thiệu khung công tác mới có tên Mixture of Agents (MoA) để khắc phục những hạn chế của phương pháp tổng hợp truyền thống.
• MoA là một hệ thống đa tác tử tiên tiến được thiết kế đặc biệt cho các tác vụ tạo sinh được tăng cường bởi truy xuất dữ liệu ngoài (RAG).
• MoA sử dụng tập hợp các mô hình nhỏ chuyên biệt làm việc cùng nhau một cách phối hợp cao độ để trả lời các câu hỏi phức tạp với độ chính xác cao hơn và chi phí thấp hơn.
• Hệ thống MoA bao gồm nhiều tác tử chuyên biệt, mỗi tác tử đóng vai trò như một "nhà nghiên cứu cấp dưới" với trọng tâm cụ thể như phân tích tình cảm, số liệu tài chính hoặc tính toán toán học.
• Trong các bài kiểm tra, hệ thống MoA có thể phân tích hàng chục nghìn tài liệu tài chính trong vòng chưa đầy 60 giây bằng cách sử dụng hai lớp tác tử.
• Một hệ thống MoA cơ bản với hai tác tử Mistral-7B đã được thử nghiệm cùng với các hệ thống mô hình đơn như GPT-4 và Claude 3 Opus. Hệ thống MoA liên tục cung cấp câu trả lời chính xác và toàn diện hơn.
• Tính hiệu quả về chi phí của MoA khiến nó rất phù hợp cho các ứng dụng tài chính quy mô lớn. Nhóm IMFS của Vanguard báo cáo rằng hệ thống MoA của họ hoạt động với tổng chi phí hàng tháng dưới 8.000 USD trong khi xử lý các truy vấn từ một nhóm nhà nghiên cứu.
• Thiết kế mô-đun của khung công tác MoA cho phép các công ty mở rộng hoạt động dựa trên ngân sách và nhu cầu, với khả năng linh hoạt thêm hoặc bớt tác tử khi cần thiết.
📌 Khung công tác Mixture of Agents (MoA) từ Vanguard IMFS cung cấp giải pháp mạnh mẽ để cải thiện hiệu suất của mô hình ngôn ngữ lớn trong tài chính. MoA xử lý 10.000 tài liệu trong 60 giây, chính xác hơn GPT-4 và Claude, với chi phí dưới 8.000 USD/tháng, hứa hẹn trở thành tiêu chuẩn cho ứng dụng cấp doanh nghiệp.
https://www.marktechpost.com/2024/09/17/collaborative-small-language-models-for-finance-meet-the-mixture-of-agents-moa-framework-from-vanguard-imfs/
• Jensen Huang, CEO Nvidia, và Marc Benioff, CEO Salesforce, thảo luận về tương lai của AI tác nhân tại sự kiện Dreamforce của Salesforce.
• Huang nhận định cơ hội cho AI tác nhân sẽ "khổng lồ", với tiến bộ "ngoạn mục và đáng ngạc nhiên".
• Phát triển AI đang diễn ra nhanh hơn định luật Moore, theo Huang là "hợp lý Moore's Law bình phương".
• Trong tương lai, sẽ có các tác nhân AI hiểu được sắc thái tinh tế, có khả năng lập luận và hợp tác.
• Các tác nhân AI sẽ có thể tìm kiếm tác nhân khác để "làm việc cùng nhau, tập hợp lại", đồng thời giao tiếp với con người để cải thiện đầu ra.
• Huang dự đoán: "Chúng ta sẽ có tác nhân làm việc với tác nhân, tác nhân làm việc với chúng ta".
• Việc áp dụng AI cần được đơn giản hóa, "giống như việc đưa nhân viên mới vào làm việc".
• Benioff nhấn mạnh tầm quan trọng của việc mọi người "thực sự hiểu" cách AI hoạt động và mục đích của chúng.
• Huang chỉ ra rằng vẫn còn nhiều thách thức, bao gồm tinh chỉnh và bảo vệ, nhưng các nhà khoa học đang tiến bộ hàng ngày.
• AI đang được sử dụng để tạo ra dữ liệu an toàn để "dạy" AI khác.
• Nvidia tập trung vào kiến trúc điện toán tăng tốc, bổ sung GPU cho CPU và xây dựng nền tảng DGX.
• Công ty nhận ra sớm rằng "học sâu sẽ thay đổi hoàn toàn phần mềm".
• Nvidia có lợi thế "làm việc với mọi nhà nghiên cứu trên hành tinh".
• Huang tin rằng Nvidia đang ở vị trí "một lần trong đời và một lần trong một thế hệ".
• Ông nhấn mạnh: "Ngay lúc này quá thú vị, bạn không nghĩ vậy sao? Không ai nên bỏ lỡ thập kỷ tới. Bạn sẽ không muốn bỏ lỡ bộ phim này đâu."
📌 Jensen Huang và Marc Benioff nhìn nhận tiềm năng to lớn của AI tác nhân, với khả năng hợp tác và tự cải thiện. Họ dự đoán AI sẽ phát triển nhanh hơn định luật Moore, mang lại cơ hội "khổng lồ" trong thập kỷ tới. Tuy nhiên, vẫn còn nhiều thách thức cần giải quyết.
https://venturebeat.com/ai/why-jensen-huang-and-marc-benioff-see-gigantic-opportunity-for-agentic-ai/
• AI tác nhân (agentic AI) là hệ thống AI có khả năng thực hiện các hành động tự chủ, chủ động hướng tới mục tiêu mà không cần sự giám sát trực tiếp của con người.
• AI tác nhân có thể thích ứng và phản ứng độc lập với các tình huống luôn thay đổi, với sự can thiệp tối thiểu của con người.
• Khác với các mô hình nền tảng truyền thống như GPT-4, AI tác nhân có khả năng thực hiện các tác vụ phức tạp đòi hỏi lập luận, lập kế hoạch và tương tác cấp cao hơn.
• Beam cung cấp giải pháp tự động hóa quy trình AI tác nhân cấp doanh nghiệp, với các mẫu được đào tạo sẵn và mô-đun tùy chỉnh an toàn cho các ngành như y tế và bảo hiểm.
• PixieBrix là tiện ích mở rộng trình duyệt low-code cho phép tùy chỉnh và tự động hóa ứng dụng web. Người dùng có thể xây dựng các "brick" để thêm chức năng hoặc kích hoạt hành động trên ứng dụng web.
• AutoGen Studio của Microsoft là tùy chọn nguồn mở thân thiện với người dùng, cho phép phát triển nhanh các tác nhân AI thông qua giao diện low-code.
• AgentOps là nền tảng giám sát tác nhân giúp xây dựng, theo dõi và tối ưu hóa các tác nhân AI. Nó dễ dàng tích hợp với các framework AI tác nhân phổ biến như LangChain.
• Thách thức lớn trong phát triển hệ thống AI tác nhân là xác định các khối xây dựng hiệu quả và kết hợp chúng phù hợp cho các ứng dụng khác nhau.
• Các nhà nghiên cứu đang đề xuất quy trình thiết kế tự động hệ thống tác nhân (ADAS), trong đó các tác nhân AI mới và cải tiến được "khám phá" bởi một "meta-agent".
• Kết quả ban đầu cho thấy các tác nhân mới có thể vượt trội đáng kể so với các tác nhân được thiết kế thủ công, mở ra tiềm năng cho AI tác nhân tự học và tự cải thiện liên tục.
📌 AI tác nhân đang nổi lên như xu hướng mới trong AI, với 4 công cụ hàng đầu là Beam, PixieBrix, AutoGen Studio và AgentOps. Các hệ thống này có khả năng thực hiện tác vụ phức tạp một cách tự chủ, hứa hẹn mang lại hiệu quả và tự động hóa cao cho doanh nghiệp.
https://thenewstack.io/agentic-ai-tools-for-building-and-managing-agentic-systems/
• Bản đồ hệ sinh thái AI Agent 2024 được chia thành 4 lớp chính:
- Lớp hệ sinh thái Agent: Bao gồm các mô hình nền tảng, doanh nghiệp, Big Tech và startup
- Lớp ứng dụng Agent: Gồm các ứng dụng AI Agent, kết nối với LLM và nền tảng Agent
- Lớp quản lý Agent: Bao gồm phân quyền/bảo mật và quản lý Agent
- Lớp dữ liệu: Gồm dữ liệu độc quyền/riêng tư, dữ liệu mở và API thống nhất
• Dự đoán về thị trường AI Agent:
- Các startup AI Agent sẽ phát triển nhanh chóng và trở thành những công ty hàng tỷ USD
- Số lượng startup AI Agent sẽ tăng từ hàng trăm lên hàng nghìn vào năm 2025
- Các công ty công nghệ lớn như Amazon, Apple sẽ phát triển Agent riêng và hỗ trợ các startup mở rộng
- Hubspot và Salesforce sẽ tích hợp AI Agent vào bộ phần mềm doanh nghiệp của họ
• Tác động đến doanh nghiệp và xã hội:
- Các lĩnh vực truyền thông, quảng cáo và thương mại điện tử sẽ bị gián đoạn nghiêm trọng bởi AI Agent
- Mô hình kinh doanh mới sẽ xuất hiện liên quan đến quảng cáo, thương mại điện tử và tiếp thị liên kết qua Agent
- AI Agent sẽ giúp con người hoàn thành các công việc phức tạp, cho phép chúng ta tập trung vào việc "làm người" hơn
• Sự phát triển nhanh chóng của AI Agent:
- AI Agent sẽ tạo ra nhiều Agent hơn, vượt qua số lượng con người chỉ trong vài năm tới
- Agent sẽ trở thành thực thể thống trị trên internet và trong doanh nghiệp
- Tốc độ phát triển sẽ diễn ra theo cấp số nhân, vượt quá khả năng nhận thức của con người
• Tiêu chuẩn ngành:
- Sẽ có nhu cầu về khả năng tương tác giữa các hệ thống AI Agent khác nhau
- Các startup dịch thuật AI Agent mới sẽ xuất hiện để phục vụ toàn bộ hệ sinh thái
- Việc thống nhất tiêu chuẩn AI Agent sẽ gặp thách thức do các gã khổng lồ công nghệ bảo vệ lãnh địa của họ
📌 AI Agent đang phát triển với tốc độ chóng mặt, dự kiến sẽ có hàng nghìn startup vào năm 2025. Các công ty lớn như Amazon, Apple cũng tham gia cuộc đua. AI Agent sẽ tác động sâu sắc đến nhiều ngành công nghiệp và có thể vượt qua số lượng con người chỉ trong vài năm tới.
https://web-strategist.com/blog/2024/09/12/plot-your-path-the-2024-ai-agent-ecosystem-map/
SEO contents:
• Dự án Sid do công ty khởi nghiệp Altera.ai thực hiện, do cựu giáo sư MIT và nhà khoa học thần kinh học Robert Yang đứng đầu.
• 1.000 agent AI tự chủ được đưa vào thế giới Minecraft để xem chúng sẽ làm gì khi được tự do hành động.
• Các agent AI nhanh chóng bắt đầu thể hiện hành vi giống con người:
- Hình thành liên minh
- Thu thập vật phẩm trong game
- Thiết lập hệ thống tiền tệ chung bằng đá quý để giao dịch
- Xuất hiện các "linh mục tham nhũng" hối lộ AI khác để được lợi thế
• Mục tiêu nghiên cứu sâu hơn về sự gắn kết, hợp tác đa tác nhân và tiến triển dài hạn của các agent AI.
• Dự án Sid không phải nỗ lực đầu tiên kết hợp agent AI tự chủ với thế giới game hóa:
- Nghiên cứu của Đại học Stanford năm ngoái tạo ra môi trường Smallville với 25 agent AI
- Các nhân vật AI nhanh chóng hợp tác, thậm chí tổ chức tiệc Valentine's Day
• Mã nguồn nghiên cứu Stanford được công bố nguồn mở, dẫn đến nhiều demo AI khác nhau ra đời.
• AI Town: môi trường đơn giản cho phép nhân vật AI tự điều khiển tương tác với người chơi qua lệnh chat.
• Thistle Gulch: dự án nguồn mở sử dụng ChatGPT 3.5 để tạo ra thị trấn miền Tây với 15 nhân vật AI có tính cách riêng.
• Các dự án này cho thấy tiềm năng của công nghệ AI tự chủ trong tương tác người-máy và trò chơi điện tử.
• Việc kết hợp AI với thế giới sandbox như Minecraft mở ra khả năng vô hạn cho nghiên cứu và phát triển AI.
• Các agent AI thể hiện khả năng học hỏi, thích nghi và tương tác phức tạp trong môi trường mô phỏng.
📌 1.000 agent AI tự chủ trong Minecraft đã tạo ra xã hội phức tạp với giao dịch, liên minh và hành vi tham nhũng. Dự án Sid của Altera.ai mở ra hướng nghiên cứu mới về tương tác AI-người và mô phỏng hành vi xã hội, với tiềm năng ứng dụng rộng rãi trong tương lai.
https://www.tomsguide.com/ai/a-company-gave-1000-ai-agents-access-to-minecraft-and-they-built-a-society
• Oracle vừa công bố hơn 50 trợ lý AI tích hợp trong Oracle Fusion Cloud Applications Suite, nhằm hỗ trợ tự động hóa các tác vụ lặp đi lặp lại và giúp nhân viên tập trung vào công việc chiến lược hơn.
• Các trợ lý AI mới được tích hợp vào quy trình làm việc, cung cấp thông tin chi tiết, nội dung và đề xuất được cá nhân hóa cho từng vai trò cụ thể.
• Trong Oracle Fusion Cloud Human Capital Management (HCM), có các trợ lý AI như:
- Trợ lý lập lịch ca làm: Tối ưu hóa lịch làm việc theo ca, đồng thời đáp ứng sở thích cá nhân và tuân thủ quy định.
- Cố vấn tuyển dụng: Hỗ trợ tìm kiếm ứng viên, tạo yêu cầu tuyển dụng và đề xuất, giúp rút ngắn thời gian tuyển dụng.
- Phân tích viên phúc lợi: Hỗ trợ nhân viên hiểu rõ và tối ưu hóa gói phúc lợi dựa trên nhu cầu cá nhân.
• Trong Oracle Fusion Cloud Supply Chain & Manufacturing (SCM), có các trợ lý AI như:
- Hướng dẫn đại diện bán hàng: Cung cấp thông tin chi tiết và đề xuất cá nhân hóa để xử lý các truy vấn đơn hàng.
- Cố vấn xử lý sự cố bảo trì: Đẩy nhanh quá trình bảo trì và sửa chữa bằng cách cung cấp thông tin chi tiết và đề xuất về bảo trì và sửa chữa tài sản.
• Trong Oracle Fusion Cloud Enterprise Resource Planning (ERP), có các trợ lý AI như:
- Trợ lý xử lý tài liệu: Tự động hóa và đơn giản hóa việc tích hợp phức tạp với các bên thứ ba.
- Trợ lý sổ cái: Xác định các ngoại lệ và bất thường trong dữ liệu giao dịch, phân tích số dư tài khoản.
- Trợ lý dự đoán nâng cao: Hỗ trợ các mô hình dự đoán AI đa biến, tận dụng các yếu tố tài chính, hoạt động và bên ngoài.
• Trong Oracle Fusion Cloud Customer Experience (CX), có các trợ lý AI như:
- Trợ lý nghiên cứu tài khoản khách hàng: Cung cấp thông tin chi tiết và tự động hóa các tác vụ lập kế hoạch và nghiên cứu.
- Trợ lý nghiên cứu hợp đồng: Tự động hóa quy trình và phê duyệt hợp đồng thông thường.
- Hướng dẫn kế hoạch thưởng khuyến khích: Giúp truyền đạt và thúc đẩy đại diện bán hàng phù hợp với ý định chiến lược.
• Oracle Fusion Applications Suite cho phép các tổ chức tận dụng đám mây và những tiến bộ mới nhất trong AI để phá vỡ các rào cản tổ chức, chuẩn hóa quy trình và quản lý dữ liệu tài chính, nhân sự, chuỗi cung ứng và trải nghiệm khách hàng trên một nền tảng đám mây tích hợp duy nhất.
📌 Oracle giới thiệu hơn 50 trợ lý AI tích hợp vào Oracle Fusion Cloud Applications Suite, hỗ trợ tự động hóa quy trình trong tài chính, chuỗi cung ứng, nhân sự, bán hàng, tiếp thị và dịch vụ. Các trợ lý AI mới này có tiềm năng thay đổi hoàn toàn cách làm việc, giúp doanh nghiệp đạt được mức năng suất mới và mở khóa tiềm năng tăng trưởng kinh doanh to lớn.
https://www.oracle.com/news/announcement/ocw24-oracle-ai-agents-help-organizations-achieve-new-levels-of-productivity-2024-09-11/
• Chatbot truyền thống thường bị coi là phiền phức và hạn chế, chỉ được sử dụng trong một số tình huống cụ thể như hỗ trợ khách hàng trên website.
• AI agent hiện đại đã phát triển vượt bậc, cung cấp tương tác thông minh, cá nhân hóa và hiệu quả hơn nhiều so với chatbot.
• AI agent phải vượt qua thách thức về nhận thức tiêu cực từ chatbot cũ, khó khăn trong triển khai và thiếu hiểu biết về khả năng của chúng.
• Khác với chatbot cứng nhắc dựa trên quy tắc, AI agent sử dụng AI tạo sinh để tạo ra giao tiếp cá nhân hóa theo phong cách và giọng điệu của thương hiệu.
• AI agent có thể sử dụng dữ liệu quá khứ và thông tin từ người dùng để trả lời các câu hỏi chuyên biệt, giảm nhu cầu chuyển tiếp cho nhân viên.
• Doanh nghiệp cần chủ động thông báo cho khách hàng về khả năng mới của AI agent để thay đổi nhận thức cũ về chatbot.
• Việc triển khai AI agent không nên chỉ giới hạn ở khách hàng mà còn có thể áp dụng cho nội bộ doanh nghiệp để hỗ trợ nhân viên và tối ưu quy trình.
• Cần tập trung vào truyền thông minh bạch với khách hàng về khả năng mới của AI agent so với chatbot truyền thống.
• AI agent có thể thực hiện nhiều tác vụ từ trả lời câu hỏi đơn giản đến chủ động hành động như kiểm tra hàng tồn kho hay đặt chỗ nhà hàng.
• AI agent đặc biệt hữu ích trong việc tự động hóa các tác vụ khách hàng thường tránh như lên lịch và đặt hẹn.
• Việc triển khai AI agent cần có chiến lược, truyền thông rõ ràng và hỗ trợ liên tục để đáp ứng nhu cầu của cả khách hàng và nhân viên.
• Triển khai AI agent là một dự án dài hạn, không phải ngắn hạn, khi các trường hợp sử dụng mới tiếp tục phát triển.
📌 AI agent đại diện cho bước tiến vượt bậc so với chatbot truyền thống, mang lại tương tác thông minh và cá nhân hóa. Việc triển khai hiệu quả đòi hỏi chiến lược toàn diện, từ truyền thông đến đào tạo, để tận dụng tiềm năng to lớn trong việc nâng cao trải nghiệm khách hàng và hiệu suất doanh nghiệp.
https://www.forbes.com/councils/forbestechcouncil/2024/09/09/ensuring-a-successful-transition-from-chatbots-to-ai-agents/
• Marc Benioff, CEO của Salesforce, tiết lộ công ty đang thực hiện "bước chuyển hướng mạnh mẽ" sang nền tảng Agentforce, cho phép người dùng tạo ra các AI agents tùy chỉnh để tương tác trực tiếp với khách hàng.
• Benioff tin rằng AI agents là bước tiến hóa tiếp theo của AI, vượt trội hơn so với chatbots AI thông thường. Ông nhấn mạnh: "Chúng tôi phải chuyển hướng toàn bộ công ty sang agents."
• Agentforce có thể tích hợp với các sản phẩm khác của Salesforce như phần mềm quản lý quan hệ khách hàng (CRM) và các ứng dụng khác.
• Benioff coi đây là "bước chuyển đổi lớn tiếp theo" kể từ khi Salesforce được thành lập năm 1999 và trở thành công ty đột phá trong ngành phần mềm doanh nghiệp.
• Ông đề cập đến cuốn sách "The Innovator's Dilemma" và khái niệm "tư duy của người mới", nhấn mạnh tầm quan trọng của việc "bắt đầu lại từ đầu và suy nghĩ toàn diện".
• Benioff chia sẻ rằng ông nhận ra tầm ảnh hưởng to lớn của AI cách đây khoảng một thập kỷ, khi Salesforce còn nhỏ hơn 10 lần so với hiện tại.
• Agentforce đã được triển khai thử nghiệm cho một số khách hàng và nhận được phản hồi tích cực. Benioff cho biết trong cuộc gọi báo cáo kết quả quý 2: "Chúng ta vẫn sẽ có con người trong công ty, nhưng chúng ta cũng sẽ có các agents này."
• Các AI agents này không cần lệnh hội thoại để hành động, có thể lập kế hoạch và suy luận nâng cao với sự can thiệp tối thiểu của con người.
• Agentforce dự kiến ra mắt chính thức vào tháng 10, nhưng sẽ được giới thiệu tại hội nghị Dreamforce của Salesforce ở San Francisco từ ngày 17/9.
• Benioff nhấn mạnh tầm quan trọng của Agentforce bằng cách nói rằng sự kiện sẽ được gọi là "Welcome to Agentforce" thay vì "Welcome to Dreamforce".
📌 Salesforce đang thực hiện bước chuyển mình lớn với nền tảng Agentforce, cho phép tạo AI agents tùy chỉnh để tương tác với khách hàng. CEO Marc Benioff tin rằng đây là bước tiến quan trọng tiếp theo trong lĩnh vực AI, vượt trội hơn chatbots thông thường. Agentforce sẽ ra mắt chính thức vào tháng 10/2024.
https://www.businessinsider.com/salesforce-ceo-marc-benioff-says-new-focus-on-ai-agents-2024-9
• Guided Reasoning là một hệ thống đa tác tử AI, trong đó một tác tử hướng dẫn (guide) làm việc với các tác tử khách hàng (client) để cải thiện khả năng lập luận của họ theo một phương pháp cụ thể.
• Phương pháp này có thể được mô tả bằng các tiêu chuẩn, ví dụ cụ thể hoặc hướng dẫn chi tiết. Ví dụ bao gồm huấn luyện viên hỗ trợ phân tích SWOT, trẻ em giúp người lớn giải ô chữ, hay đối thoại Socratic.
• Lý do ủng hộ Guided Reasoning trong AI dựa trên các giả định: AI cần đưa ra câu trả lời chính xác và giải thích được; AI chỉ có thể giải thích trung thực nếu dựa trên tư duy rõ ràng; Lập luận kém làm giảm chất lượng phản hồi của AI.
• Nguyên tắc chuyên môn hóa nhận thức cho rằng cần thêm chuyên gia về phương pháp lập luận để tạo ra hệ thống AI có thể giải thích và chính xác.
• Quy trình Guided Reasoning của Logikon bao gồm 5 bước: (1) Kích hoạt phương pháp, (2) Trình bày vấn đề, (3) Hướng dẫn đặt câu hỏi, (4) Thu thập câu trả lời, (5) Xử lý và đánh giá.
• Hướng dẫn viên thiết lập quy tắc suy nghĩ và quản lý luồng công việc. Họ có thể diễn đạt lại vấn đề và so sánh các câu trả lời khác nhau.
• Sau khi nhận được vấn đề, hướng dẫn viên yêu cầu khách hàng đưa ra các giải pháp và liệt kê ưu nhược điểm. Từ đó tạo ra bản đồ lập luận phi chính thức.
• Quy trình tạo bản đồ lập luận bao gồm các bước: Xây dựng vấn đề, Liệt kê ưu nhược điểm, Xây dựng mạng lưới liên quan, Tạo bản đồ lập luận mờ.
• Mỗi bước được thực hiện bởi một lớp phân tích khác nhau trong chương trình Python của Logikon, sử dụng các quy trình LLM nội bộ.
• Bản đồ lập luận mờ cuối cùng được xuất ra dưới nhiều định dạng hữu ích, giúp trực quan hóa quá trình lập luận.
📌 Guided Reasoning là phương pháp mới nâng cao trí tuệ hệ thống đa tác tử AI, sử dụng tác tử hướng dẫn để cải thiện lập luận của các tác tử khác. Quy trình 5 bước của Logikon tạo ra bản đồ lập luận mờ, giúp trực quan hóa và phân tích quá trình suy luận phức tạp của AI.
https://www.marktechpost.com/2024/09/05/guided-reasoning-a-new-approach-to-improving-multi-agent-system-intelligence/
• Hội nghị Robot Thế giới 2024 diễn ra tại Bắc Kinh, trưng bày hơn 600 sản phẩm robot từ khắp nơi trên thế giới và thu hút hơn 1,3 triệu người tham dự.
• 27 robot người hình được trưng bày, có khả năng ứng dụng trong sản xuất, y tế, quản lý hộ gia đình và giải trí.
• Các nhà nghiên cứu cho rằng cạnh tranh trong lĩnh vực robot có thể trở thành cuộc đua không gian mới của thế kỷ này.
• Các doanh nhân trong lĩnh vực robot hình người lạc quan rằng trong 5-10 năm tới, robot có thể đạt được sản xuất hàng loạt, đánh dấu một thời điểm như ChatGPT cho công nghệ này.
• Trung Quốc có tầm nhìn dài hạn về phát triển robot và ứng dụng rộng rãi trong cuộc sống hàng ngày, với các chính sách kích thích và duy trì đổi mới trong những năm tới.
• Các thành phố lớn như Bắc Kinh, Thượng Hải và Ninh Ba đã thành lập các trung tâm đổi mới robot hình người.
• Kế hoạch 5 năm lần thứ 14 của Trung Quốc dự kiến robot sẽ được tích hợp sâu vào cuộc sống hàng ngày vào năm 2035.
• Bộ Công nghiệp và Công nghệ Thông tin đã ban hành hướng dẫn cụ thể về phát triển robot hình người vào tháng 10 năm 2023, đặt ra các mục tiêu tham vọng cho năm 2025 và 2027.
• Trung Quốc đối mặt với hạn chế tiếp cận chip AI và mô hình ngôn ngữ lớn từ các công ty Mỹ, nhưng đầu tư lớn vào nghiên cứu chip và các mô hình nguồn mở sẽ giúp Trung Quốc tiến bộ trong lĩnh vực AI và robot.
• Tại hội nghị, khán giả được chứng kiến robot chơi bóng đá, chuẩn bị hamburger, chơi nhạc cụ, viết thư pháp và hỗ trợ phẫu thuật.
• Robot Walker S của công ty UBTECH ở Thâm Quyến thể hiện khả năng kiểm tra lốp xe chính xác cho xe hơi do Audi và FAW sản xuất chung.
• Trung tâm Đổi mới Robot hình người Bắc Kinh, Audi-FAW và UBTECH đã hợp tác để tích hợp robot hình người vào dây chuyền sản xuất ô tô.
• Hội nghị có sự tham gia của trẻ em và thanh thiếu niên, với các cuộc thi robot dành cho học sinh.
• Bộ Giáo dục Trung Quốc đã công bố chính sách tập trung vào việc tạo ra 184 cơ sở giáo dục AI để thí điểm tích hợp AI vào giáo dục.
• Sự phát triển của robot mang lại những khả năng thú vị nhưng cũng đặt ra những lo ngại đáng kể về đạo đức và an toàn.
• Một ví dụ nổi bật là robot do EX Robots phát triển, là bản sao của một cậu bé đam mê STEM.
• Tác động rộng hơn của robot đối với xã hội, đặc biệt là trong lực lượng lao động, là một mối quan tâm lớn khác.
• Cần có các chương trình hỗ trợ công nhân bị mất việc học kỹ năng mới, hỗ trợ khởi nghiệp và tăng cường mạng lưới an sinh xã hội.
📌 Trung Quốc đang đặt cược lớn vào tương lai robot hình người với các chính sách hỗ trợ và đầu tư mạnh mẽ. Hội nghị Robot Thế giới 2024 tại Bắc Kinh thu hút 1,3 triệu người tham dự, trưng bày 27 robot hình người có khả năng ứng dụng đa dạng. Tuy nhiên, sự phát triển nhanh chóng của ngành công nghiệp này cũng đặt ra những thách thức về đạo đức, an toàn và tác động đến lực lượng lao động.
https://www.scmp.com/opinion/china-opinion/article/3276979/chinas-robotics-future-fast-approaching
• Công ty 1X đã giới thiệu robot NEO Beta, một robot hình người được thiết kế để sử dụng trong gia đình như một trợ lý thông minh hàng ngày.
• NEO Beta cao 1,65m và nặng 30kg, có khả năng di chuyển linh hoạt trong nhà bao gồm đi bộ, chạy bộ và leo cầu thang.
• Robot có thể đi bộ với tốc độ khoảng 4km/h và chạy với tốc độ 12km/h. Nó có thể mang vật nặng lên đến 20kg.
• Thời lượng pin của NEO Beta từ 2-4 giờ tùy thuộc vào hoạt động trước khi cần sạc lại.
• 1X đã tập trung vào các ứng dụng công nghiệp với mẫu robot EVE trước đây, nhưng NEO là lần đầu tiên họ hướng đến robot tiêu dùng.
• Trí tuệ nhân tạo của NEO sử dụng kinh nghiệm mà 1X đã tích lũy được thông qua việc vận hành EVE, và áp dụng cái gọi là "học tập thể hiện" để làm việc với đầu vào ngôn ngữ tự nhiên và không gian vật lý.
• Ưu tiên hàng đầu trong thiết kế của NEO Beta là an toàn. Robot được làm bằng vật liệu mềm thay vì vỏ cứng như hầu hết mọi người tưởng tượng về robot.
• NEO cũng bao gồm các tùy chọn ghi đè thủ công nếu người vận hành cần can thiệp.
• Năm nay, 1X sẽ triển khai một số lượng hạn chế các đơn vị NEO trong các gia đình được chọn để phục vụ mục đích nghiên cứu và phát triển.
• Việc công bố NEO Beta của 1X đã gặp phải sự hoài nghi trên mạng xã hội, với nhiều người cho rằng robot trông giống như một người đàn ông mặc bộ đồ.
• Cuộc đua tạo ra robot quản gia cấp tiêu dùng đang nóng lên, với các công ty khác nhau áp dụng các cách tiếp cận khác nhau. Google's DeepMind đã tạo ra một robot có thể chơi thể thao, và Figure AI đã tạo ra một robot hình người có thể trò chuyện.
📌 NEO Beta của 1X là robot hình người 1,65m cao, nặng 30kg, có thể đi bộ 4km/h, chạy 12km/h, mang 20kg trong 2-4 giờ. Ưu tiên an toàn, sử dụng AI và vật liệu mềm, NEO sẽ được thử nghiệm trong các gia đình chọn lọc để phát triển thêm.
https://readwrite.com/this-new-robot-looks-so-smooth-people-think-its-a-guy-in-a-suit/
• Các nhà nghiên cứu từ IIT Dharwad và TCS Research đề xuất framework Agentic-RAG cho phân tích chuỗi thời gian, sử dụng kiến trúc đa tác nhân phân cấp.
• Framework này bao gồm một tác nhân chủ điều phối các tác nhân phụ chuyên biệt, mỗi tác nhân được tinh chỉnh với mô hình ngôn ngữ quy mô nhỏ (SLM) cho các tác vụ cụ thể như dự báo hoặc phát hiện bất thường.
• Các tác nhân phụ truy xuất các gợi ý liên quan từ kho tri thức chuyên biệt (prompt pools) lưu trữ các mẫu lịch sử, giúp dự đoán tốt hơn trên dữ liệu mới.
• Cách tiếp cận mô-đun này nâng cao tính linh hoạt và độ chính xác, vượt trội so với các phương pháp truyền thống trong nhiều tác vụ chuỗi thời gian.
• Framework sử dụng cơ chế gợi ý động để truy xuất các gợi ý liên quan từ cơ sở tri thức nội bộ, cho phép mô hình thích ứng với các xu hướng khác nhau trong dữ liệu chuỗi thời gian phức tạp.
• Nó kết hợp cơ chế chú ý hai tầng để xử lý các phụ thuộc dài hạn trong dữ liệu chuỗi thời gian mà không cần tinh chỉnh.
• Frameworksử dụng kỹ thuật tinh chỉnh theo hướng dẫn và tinh chỉnh hiệu quả tham số (PEFT) để cải thiện hiệu suất SLM trên các tác vụ chuỗi thời gian cụ thể.
• Nó cải thiện độ dài ngữ cảnh của SLM lên 32K token, cho phép nắm bắt các phụ thuộc không gian-thời gian phức tạp.
• Framework sử dụng Tối ưu hóa Ưu tiên Trực tiếp (DPO) để tinh chỉnh SLM, đảm bảo các mô hình ưu tiên kết quả chính xác hơn cho từng tác vụ cụ thể.
• Agentic-RAG được đánh giá trên các tác vụ dự báo, phân loại, phát hiện bất thường và nội suy, sử dụng các biến thể như SelfExtend-Gemma-2B-instruct, Gemma-7B-instruct và Llama 3-8B-instruct.
• Các bộ dữ liệu thực tế về giao thông (PeMS, METR-LA) và bộ dữ liệu phát hiện bất thường đa biến (SWaT, NASA telemetry) được sử dụng để đánh giá.
• Các chỉ số đánh giá bao gồm MAE, RMSE, độ chính xác, độ chính xác và điểm F1.
• Framework này liên tục vượt trội so với các phương pháp cơ sở trong các tác vụ dự báo, đặc biệt là trên các bộ dữ liệu METR-LA và PEMS-BAY, thể hiện độ chính xác dự đoán và độ mạnh mẽ vượt trội trên tất cả các chỉ số.
📌 Agentic-RAG là framework đa tác nhân phân cấp mới cho phân tích chuỗi thời gian, sử dụng SLM và prompt pools để nâng cao hiệu suất. Nó vượt trội so với các phương pháp truyền thống trong nhiều tác vụ như dự báo và phát hiện bất thường, đạt hiệu suất tốt nhất trên các bộ dữ liệu chuẩn chính.
https://www.marktechpost.com/2024/09/01/agentic-rag-a-hierarchical-multi-agent-framework-for-enhanced-time-series-analysis/
• Số lượng robot trong sản xuất trên toàn cầu đã tăng gấp đôi trong 6 năm qua, đạt 151 robot trên 10.000 nhân viên, với tổng cộng 3,9 triệu robot đang hoạt động.
• Ngân hàng đầu tư Morgan Stanley dự đoán xu hướng hội tụ có thể dẫn đến việc tích hợp AI tạo sinh kiểu ChatGPT vào robot hình dạng người.
• Ước tính đến giữa thế kỷ này, Mỹ có thể có hơn 60 triệu robot hình người đang làm việc, có khả năng ảnh hưởng đến 75% nghề nghiệp và 40% lực lượng lao động.
• Đặc biệt trong lĩnh vực xây dựng và nông nghiệp, có tới 70% công việc có thể bị ảnh hưởng bởi sự xuất hiện của robot AI.
• Hàn Quốc đứng đầu về tỷ lệ sử dụng robot công nghiệp, với khoảng 1 robot cho mỗi 10 công nhân. Singapore và Đức xếp thứ 2 và 3 với hơn 400 robot trên 10.000 nhân viên.
• Mỹ hiện đứng thứ 10 về tỷ lệ sử dụng robot công nghiệp, với 285 robot trên 10.000 công nhân.
• Những người ủng hộ robot cho rằng chúng có thể giảm bớt tình trạng thiếu lao động ở các nước giàu, vốn đang phải dựa vào nhập cư để bù đắp cho dân số già và suy giảm.
• Tuy nhiên, sự phát triển nhanh chóng của AI tiên tiến cũng gây lo ngại về nguy cơ tuyệt chủng do AI gây ra, như cảnh báo của một số chuyên gia hàng đầu trong ngành vào năm ngoái.
• Các nhà nghiên cứu từ Đại học Bath (Anh) và Đại học Kỹ thuật Darmstadt (Đức) đã công bố một bài báo vào giữa tháng 8 nhằm xoa dịu những lo ngại này. Họ cho rằng AI và các mô hình ngôn ngữ lớn không thể học độc lập hoặc tiếp thu kỹ năng mới, do đó không gây ra mối đe dọa hiện hữu đối với nhân loại.
• Việc thương mại hóa robot hình người sẽ phải đối mặt với nhiều thách thức, chủ yếu là sự chấp nhận về mặt xã hội và chính trị, do tiềm năng gây xáo trộn đáng kể đối với một phần lớn lực lượng lao động toàn cầu.
📌 Robot AI đang ngày càng phổ biến trong sản xuất, với 3,9 triệu robot hoạt động trên toàn cầu. Dự báo đến giữa thế kỷ, Mỹ có thể có 60 triệu robot hình người làm việc, ảnh hưởng tới 75% nghề nghiệp. Đặc biệt trong xây dựng và nông nghiệp, 70% công việc có thể bị tác động.
https://www.thestar.com.my/tech/tech-news/2024/09/01/ai-powered-robots-could-mean-job-losses-on-farms-and-in-construction
• Microsoft Research giới thiệu AutoGen Studio - công cụ giao diện low-code mới giúp tạo nhanh prototype và đánh giá các quy trình làm việc của hệ thống đa tác tử AI.
• Hệ thống đa tác tử ngày càng quan trọng trong nhiều lĩnh vực, kết hợp các mô hình AI tạo sinh với công cụ chuyên biệt để giải quyết các vấn đề phức tạp.
• Thách thức lớn trong phát triển hệ thống đa tác tử là độ phức tạp trong cấu hình và gỡ lỗi, đòi hỏi quản lý nhiều tham số và phối hợp tương tác giữa các tác tử.
• Các framework hiện có như AutoGen và CAMEL vẫn phụ thuộc nhiều vào lập trình, gây khó khăn cho việc prototype nhanh và phát triển lặp đi lặp lại.
• AutoGen Studio cung cấp giao diện web và API Python, cho phép lắp ráp nhanh hệ thống đa tác tử thông qua giao diện kéo thả trực quan.
• Công cụ này cho phép định nghĩa và tích hợp các thành phần như mô hình AI, kỹ năng và module bộ nhớ vào quy trình làm việc của tác tử một cách trực quan.
• AutoGen Studio hỗ trợ đặc tả khai báo hành vi tác tử bằng JSON, giúp dễ dàng sao chép và chia sẻ quy trình làm việc.
• Công cụ cung cấp các thành phần và mẫu tác tử có thể tái sử dụng, đẩy nhanh quá trình phát triển.
• AutoGen Studio có tính năng phân tích hiệu năng nâng cao, cho phép giám sát và phân tích hiệu suất hệ thống đa tác tử theo thời gian thực.
• Công cụ theo dõi các chỉ số như số lượng tin nhắn trao đổi giữa các tác tử, chi phí token tiêu thụ bởi mô hình AI tạo sinh, tỷ lệ thành công/thất bại khi sử dụng công cụ.
• Khả năng trực quan hóa các chỉ số thông qua bảng điều khiển trực quan giúp người dùng dễ dàng gỡ lỗi và tinh chỉnh quy trình làm việc.
• AutoGen Studio đã được tải xuống hơn 200.000 lần trong 5 tháng đầu tiên phát hành, cho thấy sự chấp nhận nhanh chóng từ cộng đồng nhà phát triển.
📌 AutoGen Studio của Microsoft Research là bước tiến quan trọng trong hệ thống đa tác tử AI, cung cấp môi trường no-code để prototype nhanh. Với hơn 200.000 lượt tải trong 5 tháng, công cụ này đơn giản hóa việc phát triển hệ thống phức tạp, mở rộng khả năng tiếp cận công nghệ mạnh mẽ này cho nhiều nhà phát triển hơn.
https://www.marktechpost.com/2024/08/31/microsoft-research-introduces-autogen-studio-a-low-code-interface-for-rapidly-prototyping-ai-agents/
• Amazon thông báo đã tuyển dụng các nhà sáng lập Covariant - Pieter Abbeel, Peter Chen và Rocky Duan cùng khoảng 1/4 số nhân viên của startup này.
• Amazon cũng ký thỏa thuận cấp phép không độc quyền để sử dụng các mô hình nền tảng robot của Covariant.
• Covariant đang xây dựng "mô hình ngôn ngữ lớn cho ngôn ngữ robot", tạo ra các mô hình AI cho robot, tập trung vào các tác vụ kho hàng phổ biến như chọn vật phẩm từ thùng.
• Joseph Quinlivan, Phó Chủ tịch Amazon Fulfillment Technologies & Robotics, cho biết việc tích hợp công nghệ AI của Covariant vào đội ngũ robot hiện có sẽ nâng cao hiệu suất và tạo ra giá trị thực tế cho khách hàng.
• Thỏa thuận này tương tự như việc Amazon tuyển dụng các nhà sáng lập startup AI Adept vào tháng 6, cho phép Amazon tiếp cận nhân tài và công nghệ mới mà không cần mua lại hoàn toàn một startup hiện có.
• The Verge mô tả cách tiếp cận này là "reverse acquihire", nơi các gã khổng lồ công nghệ đối mặt với sự giám sát chống độc quyền có thể sử dụng các thỏa thuận tuyển dụng và cấp phép để ngụy trang việc mua lại của họ.
• Covariant sẽ tiếp tục hoạt động dưới sự lãnh đạo của Ted Stinson và Tianhao Zhang, với Stinson - trước đây là COO của startup - giờ đây đảm nhận vai trò CEO.
• Covariant khẳng định vẫn "cam kết đưa Covariant Brain vào các môi trường sản xuất trên nhiều ngành công nghiệp toàn cầu, bao gồm may mặc, sức khỏe và làm đẹp, tạp hóa và dược phẩm".
• Thỏa thuận này cho thấy Amazon đang tích cực mở rộng năng lực AI và robotics, đặc biệt trong lĩnh vực kho vận và hoàn thiện đơn hàng.
• Việc tuyển dụng nhóm sáng lập Covariant có thể giúp Amazon tăng cường đáng kể khả năng phát triển và triển khai các giải pháp AI tiên tiến trong hệ thống kho vận của mình.
• Động thái này cũng phản ánh xu hướng ngày càng tăng của các công ty công nghệ lớn trong việc tìm kiếm tài năng AI thông qua các thỏa thuận tuyển dụng và cấp phép thay vì mua lại toàn bộ công ty.
📌 Amazon tuyển dụng nhóm sáng lập Covariant và 1/4 nhân viên, cấp phép sử dụng mô hình AI robot của họ. Covariant tiếp tục hoạt động độc lập. Động thái này giúp Amazon tăng cường năng lực AI robotics trong kho vận, phản ánh xu hướng "reverse acquihire" của các gã khổng lồ công nghệ.
https://techcrunch.com/2024/08/31/amazon-hires-the-founders-of-robotics-ai-startup-covariant/
SEO contents:
1. Meta descriptions:
AI tạo sinh sẽ thay đổi cách chúng ta đặt vé máy bay, đi ăn nhà hàng, đầu tư tài chính, hẹn hò và mua sắm. Các trợ lý ảo thông minh có thể tự động hóa nhiều tác vụ hàng ngày mà không cần sự can thiệp của con người.
2. Meta keywords:
AI tạo sinh, trợ lý ảo, đặt vé du lịch, đặt bàn nhà hàng, tư vấn đầu tư, hẹn hò trực tuyến, mua sắm thông minh
3. SEO title:
Trợ lý AI mới có thể làm mọi việc thay bạn: từ đặt vé máy bay đến tìm người yêu
Tóm tắt chi tiết:
• Các trợ lý AI tự động sẽ có thể thực hiện hầu hết các tác vụ mà con người thực hiện trên thiết bị, mà không cần tương tác nhiều với người dùng.
• Trong lĩnh vực du lịch, AI "Penny" của Priceline sẽ có thể đặt chỗ, gọi điện cho khách sạn để yêu cầu đặc biệt và quản lý mọi nhu cầu du lịch chỉ bằng cách xem lịch của bạn.
• Apple cũng đang phát triển một phiên bản Siri mới có thể truy cập dữ liệu cá nhân trên iPhone để hỗ trợ du lịch, như hiển thị số hộ chiếu hay thêm ảnh vào ghi chú du lịch.
• Trong lĩnh vực nhà hàng, công ty khởi nghiệp Loman AI đang triển khai trợ lý AI 24/7 để trả lời điện thoại, đặt bàn và nhận đơn hàng tại hàng trăm nhà hàng.
• Các bot AI có thể giao tiếp với nhau, như trường hợp bot của Google gọi điện cho bot của Loman để kiểm tra thông tin nhà hàng.
• Trong lĩnh vực đầu tư, Finley AI đang phát triển nền tảng giúp các công ty tài chính xây dựng bot riêng để cung cấp hướng dẫn đầu tư tùy chỉnh cho khách hàng.
• Ứng dụng hẹn hò Grindr sẽ ra mắt trợ lý AI "wingman" vào cuối năm nay để giúp người dùng tìm kiếm đối tượng phù hợp, lên kế hoạch hẹn hò và đặt chỗ tại nhà hàng.
• Trong lĩnh vực mua sắm, các bot AI sẽ có thể tự động tìm kiếm sản phẩm, theo dõi khuyến mãi và thực hiện mua hàng thay người dùng.
• Google Cloud đang phát triển bot AI cho các nhà bán lẻ để hỗ trợ khách hàng tìm kiếm và mua sắm sản phẩm.
• Skyfire đang xây dựng nền tảng thanh toán blockchain cho phép bot thực hiện giao dịch với con người hoặc bot khác, với các tính năng bảo mật như giới hạn mua hàng.
• Các chuyên gia cảnh báo về rủi ro khi tự động hóa đầu tư và cho phép bot truy cập quá nhiều dữ liệu cá nhân. Người dùng cần biết bot nắm giữ thông tin gì và tự chịu trách nhiệm về hành động của bot.
📌 Trợ lý AI đang phát triển nhanh chóng để tự động hóa nhiều khía cạnh cuộc sống hàng ngày, từ đặt vé du lịch đến hẹn hò và mua sắm. Tuy nhiên, vẫn còn những lo ngại về quyền riêng tư và trách nhiệm khi giao nhiều quyền kiểm soát cho AI.
https://www.wsj.com/tech/ai/ai-agents-autonomous-bots-human-tasks-913c0ce5
#WSJ
• Hugging Face vừa công bố hướng dẫn chi tiết giúp các nhà phát triển tự xây dựng và huấn luyện robot được hỗ trợ bởi AI, dựa trên nền tảng LeRobot ra mắt hồi tháng 5.
• Hướng dẫn bao gồm mọi khía cạnh từ tìm nguồn linh kiện đến triển khai mô hình AI, giúp các nhà phát triển ở mọi trình độ có thể thử nghiệm công nghệ robot tiên tiến.
• Remi Cadene, nhà khoa học nghiên cứu chính tại Hugging Face, nhấn mạnh tiềm năng của việc huấn luyện mạng neural dự đoán chuyển động của động cơ trực tiếp từ hình ảnh camera, tương tự cách các mô hình ngôn ngữ lớn xử lý văn bản.
• Trọng tâm của hướng dẫn là cánh tay robot Koch v1.1 giá cả phải chăng, được thiết kế bởi Jess Moss. Phiên bản này cải tiến thiết kế gốc của Alexander Koch với quy trình lắp ráp đơn giản hóa và khả năng nâng cao.
• Hướng dẫn bao gồm video chi tiết hướng dẫn từng bước trong quá trình lắp ráp, đảm bảo ngay cả người mới làm quen với robotics cũng có thể tự xây dựng cánh tay robot được hỗ trợ bởi AI.
• Hugging Face cung cấp công cụ để trực quan hóa và chia sẻ bộ dữ liệu, khuyến khích người dùng đóng góp vào kho lưu trữ dữ liệu chuyển động robot ngày càng phát triển.
• Cadene tiết lộ về một mẫu robot thậm chí còn dễ tiếp cận hơn đang được phát triển. Mẫu Moss v1 này hứa hẹn sẽ giảm chi phí xuống chỉ còn 150 USD cho hai cánh tay và loại bỏ nhu cầu in 3D.
• Sáng kiến này đánh dấu bước ngoặt trong lĩnh vực robotics, vốn trước đây chỉ giới hạn ở các tập đoàn lớn và viện nghiên cứu có nguồn lực dồi dào.
• Việc tích hợp AI với các hệ thống vật lý đại diện cho ranh giới tiếp theo của đổi mới công nghệ, với tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực từ sản xuất đến chăm sóc sức khỏe.
• Tuy nhiên, việc dân chủ hóa công nghệ robotics cũng đặt ra những câu hỏi quan trọng về tương lai của công việc, quyền riêng tư và các cân nhắc đạo đức của tự động hóa rộng rãi.
📌 Hướng dẫn của Hugging Face mở ra kỷ nguyên mới cho robotics, giúp dân chủ hóa công nghệ này. Với chi phí chỉ 150 USD cho robot Moss v1 sắp ra mắt, AI và robotics sẽ trở nên dễ tiếp cận hơn bao giờ hết, mở ra tiềm năng đổi mới và ứng dụng đa dạng trong nhiều lĩnh vực.
https://venturebeat.com/ai/build-your-own-ai-powered-robot-hugging-faces-lerobot-tutorial-is-a-game-changer/
• Physical AI (AI vật lý) là giai đoạn tiếp theo của AI, nơi trí thông minh nhân tạo hiện diện trong các hình thức vật lý và tương tác với thế giới xung quanh. NVIDIA CEO Jensen Huang tin rằng đây sẽ là xu hướng lớn tiếp theo.
• Theo Jensen, có 3 giai đoạn phát triển của AI: AI tiên phong (tạo ra các mô hình nền tảng), AI doanh nghiệp (chatbot và các mô hình AI hỗ trợ năng suất), và cuối cùng là Physical AI.
• Để phát triển Physical AI hiệu quả cần tích hợp đầu vào từ cảm biến và khả năng thao tác các vật thể trong không gian 3 chiều.
• NVIDIA đề xuất cần 3 loại máy tính: một để tạo AI, một để mô phỏng AI, và một để chạy AI. Họ cung cấp các giải pháp phần cứng và phần mềm tương ứng:
- Máy chủ H100 và B100 để tạo AI
- Workstation và máy chủ sử dụng Omniverse với GPU RTX để mô phỏng và kiểm tra AI
- Jetson (sắp tới với GPU Blackwell) để cung cấp khả năng cảm nhận và điều khiển thời gian thực trên robot
• NVIDIA giới thiệu GR00T (Generalist Robot 00 Technology) để thiết kế và mô phỏng chuyển động của robot bằng cách quan sát hành động của con người.
• Hai NIM AI mới cho phép các nhà phát triển robot tạo quy trình mô phỏng trong NVIDIA Isaac Sim:
- MimicGen NIM tạo dữ liệu chuyển động tổng hợp
- Robocasa NIM tạo môi trường và nhiệm vụ robot trong OpenUSD
• NVIDIA OSMO là dịch vụ đám mây giúp điều phối và mở rộng quy trình phát triển robot phức tạp, rút ngắn thời gian triển khai từ hàng tháng xuống dưới 1 tuần.
• Isaac Manipulator cung cấp khả năng khéo léo và AI tiên tiến cho cánh tay robot. Isaac Perceptor mang lại khả năng thị giác 3D đa camera.
• Chip Jetson Thor mới với GPU Blackwell có hiệu suất AI 800 teraflops để chạy các mô hình AI đa phương thức như GR00T.
📌 NVIDIA đang dẫn đầu xu hướng Physical AI với các giải pháp toàn diện từ phần cứng đến phần mềm. Họ kỳ vọng robot sẽ xuất hiện khắp nơi trong tương lai, từ nhà bếp đến nhà máy, với khả năng tương tác thông minh nhờ công nghệ AI tiên tiến.
https://www.forbes.com/sites/karlfreund/2024/08/09/what-is-physical-ai-and-why-it-could-change-the-world/
• Google DeepMind đã phát triển một robot AI có khả năng chơi bóng bàn ở "trình độ nghiệp dư của con người".
• Robot đã thắng 13 trong số 29 trận đấu với người chơi, tỷ lệ thành công phụ thuộc vào trình độ của đối thủ (từ người mới bắt đầu đến nâng cao).
• Đây là robot đầu tiên có thể chơi một môn thể thao với con người ở trình độ ngang bằng, đánh dấu một cột mốc quan trọng trong lĩnh vực học máy và điều khiển robot.
• Bóng bàn được chọn vì bao gồm nhiều yếu tố phức tạp như vật lý chuyển động và phối hợp mắt-tay.
• Robot được huấn luyện bằng cách tập trung vào từng loại cú đánh riêng biệt (như xoáy trái, giao bóng thuận tay), kết hợp với thuật toán cấp cao hơn để chọn cú đánh phù hợp.
• Robot gặp khó khăn nhất với những cú đánh nhanh, do có ít thời gian để "suy nghĩ" về phản ứng.
• Các nhà nghiên cứu đang tìm cách cải thiện hệ thống, bao gồm việc làm cho nó khó đoán hơn trong lối chơi.
• Robot có khả năng học hỏi từ chiến thuật của đối thủ và đánh giá điểm mạnh, điểm yếu của họ.
• Thành tựu này mới chỉ là bước tiến nhỏ trong lĩnh vực rộng lớn hơn là phát triển robot có khả năng thực hiện các kỹ năng hữu ích trong thế giới thực.
• Nghiên cứu này mở ra triển vọng ứng dụng AI vào các nhiệm vụ vật lý phức tạp đòi hỏi sự kết hợp nhiều kỹ năng khác nhau.
📌 Google DeepMind đã tạo ra robot AI chơi bóng bàn ngang tầm người, thắng 13/29 trận. Đây là bước tiến quan trọng trong việc phát triển robot có kỹ năng phức tạp, mở ra khả năng ứng dụng AI vào các nhiệm vụ thực tế đa dạng trong tương lai.
https://www.techradar.com/computing/artificial-intelligence/googles-deepmind-ai-can-now-play-table-tennis-to-a-competitive-level
• Các mô hình ngôn ngữ lớn mã hóa (CodeLLMs) đã chứng tỏ khả năng tạo mã ấn tượng, nhưng vẫn gặp khó khăn với các nhiệm vụ phức tạp trong kỹ thuật phần mềm như phát triển toàn bộ hệ thống phần mềm dựa trên các thông số kỹ thuật phức tạp.
• Các nghiên cứu gần đây, bao gồm ChatDev và MetaGPT, đã giới thiệu các khung đa tác nhân cho phát triển phần mềm, nơi các tác nhân hợp tác để đạt được các mục tiêu phức tạp. Tuy nhiên, chúng có xu hướng đơn giản hóa quá mức bản chất phức tạp của quá trình phát triển phần mềm trong thực tế, nơi phần mềm liên tục được cải thiện và nâng cấp.
• Nhóm nghiên cứu từ Trung tâm AI của FPT Software đề xuất AgileCoder, một khung làm việc mới lạ bắt chước quá trình phát triển phần mềm phức tạp trong thực tế bằng cách lấy cảm hứng từ Phương pháp Linh hoạt, một phương pháp được sử dụng rộng rãi trong các nhóm phát triển phần mềm chuyên nghiệp. Khoảng 70% các nhóm chuyên nghiệp sử dụng Phương pháp Linh hoạt, phù hợp hơn với phát triển phần mềm trong thực tế.
• AgileCoder bao gồm nhiều tác nhân đóng vai trò khác nhau: Quản lý Dự án, Scrum Master, Nhà phát triển, Nhà phát triển Cao cấp và Kiểm thử viên. Các tác nhân này làm việc hợp tác trong các sprint để hoàn thành các nhiệm vụ của người dùng theo phương pháp Linh hoạt.
• Một điểm mới trong AgileCoder là Bộ tạo Đồ thị Mã động, tạo ra Đồ thị Phụ thuộc Mã (CDG) mô hình hóa mối quan hệ giữa các tệp mã và cập nhật khi có thay đổi mã nguồn. CDG đóng vai trò quan trọng trong việc viết các kế hoạch kiểm tra hợp lý và cho phép truy xuất mã hiệu quả.
• Đánh giá toàn diện trên các bộ chuẩn như HumanEval, MBPP và ProjectDev cho thấy AgileCoder vượt trội hơn so với các phương pháp khác. Trên HumanEval và MBPP, AgileCoder vượt trội đáng kể so với CodeLLMs và các khung đa tác nhân tiên tiến như ChatDev và MetaGPT.
📌 AgileCoder là một khung đa tác nhân mới lạ cho phát triển phần mềm, lấy cảm hứng từ phương pháp Linh hoạt. Nó vượt trội hơn các phương pháp hiện có như ChatDev và MetaGPT trong các nhiệm vụ phát triển phần mềm phức tạp bằng cách sử dụng CodeLLMs.
https://www.marktechpost.com/2024/08/10/researchers-at-fpt-software-ai-center-introduce-agilecoder-a-multi-agent-system-for-generating-complex-software-surpassing-metagpt-and-chatdev/
• Mistral AI, công ty khởi nghiệp AI của Pháp, vừa ra mắt La Plateforme - nền tảng xây dựng AI agent mới của họ.
• La Plateforme cho phép người dùng tạo ra các AI agent có thể thực hiện nhiều tác vụ khác nhau như trả lời câu hỏi, phân tích dữ liệu và tạo nội dung.
• Nền tảng này hỗ trợ nhiều loại mô hình ngôn ngữ lớn (LLM) khác nhau, bao gồm cả các mô hình nguồn mở và độc quyền.
• La Plateforme cung cấp giao diện lập trình ứng dụng (API) để tích hợp các AI agent vào các ứng dụng và dịch vụ khác.
• Người dùng có thể tùy chỉnh các AI agent bằng cách sử dụng các công cụ và tính năng có sẵn trên nền tảng.
• Mistral AI nhấn mạnh tầm quan trọng của việc phát triển AI có trách nhiệm và đạo đức thông qua La Plateforme.
• Nền tảng này được thiết kế để hỗ trợ cả nhà phát triển cá nhân và doanh nghiệp trong việc xây dựng các ứng dụng AI.
• La Plateforme cung cấp các tính năng bảo mật và quyền riêng tư để bảo vệ dữ liệu của người dùng.
• Mistral AI hy vọng La Plateforme sẽ thúc đẩy sự đổi mới và sáng tạo trong lĩnh vực AI.
• Công ty cũng công bố kế hoạch mở rộng khả năng của nền tảng trong tương lai, bao gồm hỗ trợ cho các mô hình đa phương thức.
• La Plateforme hiện đang trong giai đoạn beta và Mistral AI đang mời các nhà phát triển tham gia thử nghiệm.
• Nền tảng này được kỳ vọng sẽ cạnh tranh với các nền tảng AI agent khác trên thị trường như OpenAI's GPT-4 và Anthropic's Claude.
• Mistral AI đã huy động được 385 triệu euro (khoảng 414 triệu USD) trong vòng gọi vốn Series A vào tháng 12/2023.
• Công ty được thành lập bởi các cựu nhân viên của DeepMind và Meta, với mục tiêu phát triển các giải pháp AI tiên tiến.
• La Plateforme được xem là bước đi quan trọng của Mistral AI trong việc định vị mình như một đối thủ cạnh tranh lớn trong lĩnh vực AI.
📌 Mistral AI ra mắt La Plateforme, nền tảng xây dựng AI agent mới hỗ trợ nhiều LLM. Nền tảng cung cấp API, tính năng tùy chỉnh và bảo mật cho nhà phát triển và doanh nghiệp. Mistral AI, được thành lập bởi cựu nhân viên DeepMind và Meta, đã huy động 414 triệu USD vào tháng 12/2023.
https://analyticsindiamag.com/ai-news-updates/mistral-releases-la-plateforme-for-building-ai-agents/
• Wordware là IDE đầu tiên dành riêng để xây dựng AI sử dụng Lập trình Ngôn ngữ Tự nhiên (NLP), giúp phát triển ứng dụng AI nhanh hơn 20 lần.
• Công cụ này được thiết kế để trao quyền cho các chuyên gia lĩnh vực, nhóm và kỹ sư phần mềm, đặc biệt hữu ích cho những người không có kỹ năng lập trình truyền thống.
• Giao diện thân thiện với người dùng của Wordware cho phép tạo các agent AI phức tạp một cách dễ dàng bằng ngôn ngữ tự nhiên.
• Nền tảng cung cấp các công cụ tích hợp sẵn như chuyển đổi giọng nói thành văn bản, tạo hình ảnh và mô-đun nghiên cứu.
• Wordware hỗ trợ triển khai ứng dụng và API chỉ với một cú nhấp chuột, đơn giản hóa quá trình phát triển.
• Thư viện cộng đồng của nền tảng hoạt động giống như GitHub, cung cấp kho lưu trữ các agent sẵn sàng sử dụng.
• Khả năng kỹ thuật nâng cao bao gồm vòng lặp, phân nhánh, an toàn kiểu và thực thi mã tùy chỉnh.
• Wordware tăng tốc quá trình lặp lại bằng cách cho phép người dùng nhanh chóng đánh giá chất lượng đầu ra và tinh chỉnh agent AI.
• Giao diện giống Notion của nền tảng hỗ trợ quản lý lệnh, cộng tác liền mạch và hợp lý hóa quy trình làm việc.
• Wordware hỗ trợ nhiều nhà cung cấp mô hình ngôn ngữ lớn, cho phép tối ưu hóa quy trình làm việc với tỷ lệ chi phí-độ trễ-chất lượng tốt nhất.
• Một tính năng nổi bật của Wordware là hỗ trợ đa phương thức, cho phép tích hợp văn bản, hình ảnh, âm thanh và video trong quy trình làm việc AI.
• Người dùng có thể chuyển đổi linh hoạt giữa các phương thức dữ liệu, cải thiện tính linh hoạt và khả năng ứng dụng của các agent AI.
• Wordware loại bỏ các hạn chế của công cụ không mã truyền thống, cho phép mọi thành viên trong nhóm đóng góp độc lập vào quá trình phát triển AI.
📌 Wordware là IDE đột phá cho phép phát triển ứng dụng AI nhanh hơn 20 lần bằng lập trình ngôn ngữ tự nhiên. Với giao diện thân thiện, hỗ trợ đa phương tiện và cộng tác hiệu quả, nó trao quyền cho cả chuyên gia lĩnh vực lẫn kỹ sư phần mềm xây dựng AI phức tạp dễ dàng.
https://aitoolsclub.com/meet-wordware-an-ai-tool-that-helps-you-build-your-own-ai-agents-and-apps-using-prompts/
• Figure AI, startup được hậu thuẫn bởi OpenAI, vừa tung ra video teaser cho robot hình người mới mang tên Figure 02, dự kiến ra mắt vào ngày 6/8/2024.
• Video ngắn nhưng ấn tượng, cho thấy các khớp nối và chi tiết robot tiên tiến, thiết kế lưới linh hoạt, với mô-men xoắn lên tới 150Nm và phạm vi chuyển động (ROM) lên tới 195 độ.
• Nhà sáng lập Brett Adcock tuyên bố Figure 02 là "robot hình người tiên tiến nhất hành tinh".
• Figure AI được thành lập năm 2022, đã huy động được 675 triệu USD trong vòng gọi vốn gần nhất vào tháng 2/2024. Các nhà đầu tư lớn bao gồm OpenAI, NVidia, Microsoft, Intel Capital và Bezos Expeditions.
• Công ty đã ký thỏa thuận hợp tác với BMW Manufacturing và tích hợp ấn tượng GPT-4V của OpenAI vào robot Figure 01 trước đó.
• Cạnh tranh trong lĩnh vực robot hình người đang ngày càng gay gắt. Tesla của Elon Musk đang phát triển robot Optimus, Nvidia có dự án GR00T, Boston Dynamics cũng nâng cấp robot Atlas.
• Figure AI nhắm đến thị trường lao động toàn cầu, với mục tiêu đưa robot vào các ngành sản xuất, hậu cần, kho bãi và bán lẻ.
• Công ty cam kết không vũ khí hóa robot và tập trung vào việc tăng năng suất, an toàn bằng cách thay thế con người trong các công việc nguy hiểm.
• Elon Musk dự đoán thị trường tiềm năng lên tới hơn 10 tỷ robot hình người trên Trái đất.
• Với sự hậu thuẫn mạnh mẽ và đà phát triển hiện tại, Figure AI đang ở vị thế thuận lợi để tiếp tục đột phá trong lĩnh vực robot hình người.
📌 Figure AI giới thiệu robot hình người Figure 02 mới với thiết kế tiên tiến, được hỗ trợ bởi các "ông lớn" công nghệ như OpenAI, NVidia. Cạnh tranh trong lĩnh vực này ngày càng gay gắt với sự tham gia của Tesla, Nvidia và Boston Dynamics, hướng tới thị trường tiềm năng 10 tỷ robot toàn cầu.
https://venturebeat.com/ai/openai-backed-startup-figure-teases-new-humanoid-robot-figure-02/
• Nvidia công bố các tiến bộ lớn cho Universal Scene Description (OpenUSD), mở rộng khả năng ứng dụng của khung trao đổi dữ liệu 3D phổ quát này trong lĩnh vực robot, thiết kế và kỹ thuật công nghiệp.
• Công ty giới thiệu các mô hình AI tạo sinh đầu tiên trên thế giới có khả năng hiểu ngôn ngữ, hình học, vật liệu, vật lý và không gian dựa trên OpenUSD.
• Các dịch vụ vi mô Nvidia NIM mới cho phép tạo ra ngôn ngữ OpenUSD để trả lời truy vấn của người dùng, tạo mã Python OpenUSD, áp dụng vật liệu cho đối tượng 3D và hiểu không gian 3D cùng vật lý để đẩy nhanh phát triển bản sao kỹ thuật số.
• Nvidia cung cấp các đầu nối USD mới cho các định dạng dữ liệu mô phỏng robot và công nghiệp, cùng công cụ cho phép truyền dữ liệu lớn được ray-traced hoàn toàn bằng Nvidia RTX tới Apple Vision Pro.
• Các dịch vụ vi mô NIM đang được cung cấp bản xem trước bao gồm: USD Code, USD Search, USD Validate. Các dịch vụ sắp ra mắt gồm: USD Layout, USD SmartMaterial, fVDB Mesh Generation, fVDB Physics Super-Res, fVDB NeRF-XL.
• Foxconn, nhà sản xuất toàn cầu với hơn 170 nhà máy trên thế giới, đang sử dụng dịch vụ vi mô NIM và Omniverse để tạo bản sao kỹ thuật số của một nhà máy đang phát triển.
• WPP, công ty dịch vụ tiếp thị và truyền thông hàng đầu thế giới, là người áp dụng sớm các dịch vụ vi mô USD Search và USD Code NIM trong quy trình sáng tạo nội dung được hỗ trợ bởi AI tạo sinh.
• Nvidia và Siemens mở rộng hợp tác để tích hợp quy trình OpenUSD với danh mục công nghệ mô phỏng Simcenter, hỗ trợ ra quyết định dựa trên bằng chứng và cộng tác giữa các bên liên quan chính.
• Nvidia phát hành đầu nối từ Unified Robotics Description Format sang OpenUSD, cho phép các nhà robot học dễ dàng mang dữ liệu robot của họ qua các ứng dụng khác nhau.
• Công ty cũng công bố bộ công cụ phát triển phần mềm OpenUSD Exchange, cho phép các nhà phát triển xây dựng các đầu nối dữ liệu OpenUSD mạnh mẽ của riêng họ.
• Các công cụ và API mới để truyền cảnh OpenUSD quy mô lớn từ ứng dụng xây dựng trên nền tảng Omniverse tới Apple Vision Pro hiện đã có sẵn trong bản truy cập sớm.
📌 Nvidia đã giới thiệu các dịch vụ vi mô NIM và AI tạo sinh cho OpenUSD, mở rộng ứng dụng trong công nghiệp và robot. Các công cụ mới giúp tạo thế giới ảo chính xác cho AI thế hệ tiếp theo, với hơn 10.000 công ty đang sử dụng Omniverse và 30 công ty đóng góp cho OpenUSD.
https://venturebeat.com/ai/nvidia-unveils-generative-ai-and-nim-microservices-for-openusd/
- Tác tử AI sử dụng mô hình nền tảng như mô hình ngôn ngữ lớn (LLM) để thực hiện các quy trình công việc phức tạp thông qua tương tác bằng ngôn ngữ tự nhiên.
- Tác tử AI có thể xử lý đa dạng tình huống đầu vào/đầu ra, được hướng dẫn bằng ngôn ngữ tự nhiên và tương tác với các công cụ, nền tảng phần mềm hiện có.
- Quy trình hoạt động gồm 4 bước: người dùng đưa chỉ dẫn, hệ thống tác tử lập kế hoạch và giao việc cho các tác tử con, cải tiến đầu ra, thực thi hành động.
- Giá trị mà tác tử AI có thể mang lại cho doanh nghiệp:
+ Tự động hóa các quy trình phức tạp, có nhiều biến thể đầu vào/đầu ra mà trước đây khó tự động hóa một cách hiệu quả về chi phí và thời gian.
+ Giảm bớt sự phụ thuộc vào lập trình viên nhờ khả năng tiếp nhận chỉ dẫn bằng ngôn ngữ tự nhiên, cho phép nhân viên phi kỹ thuật cũng có thể mã hóa tri thức.
+ Tích hợp liền mạch với hệ sinh thái công cụ, nền tảng phần mềm sẵn có của doanh nghiệp, tạo ra quy trình làm việc xuyên suốt.
+ Đóng vai trò như đồng nghiệp ảo thông minh, có thể phối hợp làm việc với con người một cách trơn tru và tự nhiên.
- Một số ứng dụng tiềm năng của tác tử AI:
+ Tự động hóa quy trình thẩm định khoản vay: Nhóm tác tử chuyên biệt phân tích thông tin người vay, tính toán chỉ số tài chính, phát hiện sai sót, lặp lại cho đến khi hoàn thành báo cáo tín dụng. Giảm 20-60% thời gian xét duyệt.
+ Hiện đại hóa mã nguồn cũ: Tác tử chuyên gia phân tích mã cũ, ghi chú logic nghiệp vụ. Tác tử đảm bảo chất lượng kiểm tra, tạo ca kiểm thử. Quy trình lặp lại giúp tinh chỉnh đầu ra, giảm chi phí phát triển phần mềm.
+ Tạo chiến dịch marketing trực tuyến: Tác tử chiến lược khai thác dữ liệu thị trường để lập chiến lược. Tác tử viết nội dung, thiết kế tạo nội dung phù hợp từng phân khúc. Người đánh giá thương hiệu. Các tác tử phối hợp tinh chỉnh, tối ưu tác động và giảm rủi ro.
- Để chuẩn bị cho kỷ nguyên tác tử AI, doanh nghiệp cần: mã hóa tri thức phù hợp, lập kế hoạch công nghệ chiến lược, xây dựng cơ chế kiểm soát có sự tham gia của con người.
- Một số rủi ro cần lưu ý khi triển khai tác tử AI:
+ Đầu ra có hại tiềm tàng: Cần giải thích được quá trình ra quyết định của tác tử, giới hạn hành động dựa trên độ phức tạp, giám sát của con người.
+ Lạm dụng công cụ: Áp dụng kiểm soát truy cập, giới hạn môi trường hoạt động, giám sát thời gian thực và đánh giá định kỳ.
+ Thiếu/thừa lòng tin giữa người và máy: Đảm bảo minh bạch quá trình, đào tạo người dùng, duy trì giám sát của con người, đánh giá hiệu quả gắn với kết quả cụ thể.
- Các vấn đề rộng hơn cần xem xét khi triển khai tác tử AI: điều chỉnh giá trị tổ chức, chuyển dịch vai trò lao động, đặc điểm nhân hóa của tác tử.
📌 Tác tử AI hứa hẹn cách mạng hóa cách thức làm việc và mang lại nhiều giá trị cho doanh nghiệp. Khảo sát gần đây của McKinsey cho thấy 72% công ty đang triển khai AI, ngày càng quan tâm đến AI tạo sinh. Tác tử AI có thể tự động hóa các quy trình phức tạp, giảm sự phụ thuộc vào lập trình viên, tích hợp liền mạch với hệ thống sẵn có và đóng vai trò như đồng nghiệp ảo thông minh. Ứng dụng tiềm năng trong tài chính, công nghệ, marketing có thể giảm 20-60% thời gian, chi phí. Tuy nhiên, công nghệ này vẫn đang trong giai đoạn sơ khai với nhiều thách thức về độ tin cậy, lạm dụng, niềm tin giữa người-máy. Việc tích hợp tác tử AI đòi hỏi chuẩn bị kỹ lưỡng về tri thức, công nghệ, con người và xem xét các vấn đề đạo đức, xã hội rộng hơn.
https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/why-agents-are-the-next-frontier-of-generative-ai
#McKinsey
• Capgemini dự đoán các AI agents tự trị có khả năng giao tiếp với nhau sẽ xuất hiện vào năm 2025.
• Hệ thống "AI đa tác tử" này bao gồm nhiều agents làm việc cùng nhau để giải quyết các tác vụ một cách phân tán và hợp tác.
• Pascal Brier, Giám đốc Đổi mới của Capgemini, cho biết công ty đã thấy các doanh nghiệp thảo luận về công nghệ agent này và kỳ vọng các ứng dụng sử dụng nhiều agents tự trị sẽ xuất hiện vào năm tới.
• Capgemini định nghĩa AI agents là "công nghệ được thiết kế để hoạt động độc lập, lập kế hoạch, suy ngẫm, theo đuổi mục tiêu cấp cao hơn và thực hiện quy trình công việc phức tạp với sự giám sát trực tiếp tối thiểu hoặc hạn chế của con người".
• Báo cáo mới của Capgemini cho thấy 82% công ty được khảo sát có kế hoạch tích hợp AI agents trong vòng 1-3 năm tới, trong khi chỉ 7% không có kế hoạch tích hợp.
• Có hai loại AI agents: agents cá nhân thực hiện nhiệm vụ thay bạn và công nghệ đa tác tử với "các agents giao tiếp với nhau".
• Ví dụ, một AI agent marketing tạo chiến dịch quảng cáo ở Đức có thể tự động làm việc với agent khác trong bộ phận pháp lý để đảm bảo tính hợp pháp.
• 71% tổ chức kỳ vọng AI agents sẽ thúc đẩy tự động hóa, 64% kỳ vọng chúng sẽ giảm bớt công việc lặp lại cho nhân viên.
• Capgemini ghi nhận số lượng tổ chức tích hợp AI tạo sinh tăng gấp 4 lần, từ 6% năm 2023 lên 24% năm nay.
• Tuy nhiên, có khoảng cách về mức độ áp dụng giữa các công ty lớn và nhỏ. 10% công ty có doanh thu 1-5 tỷ USD đang triển khai AI tạo sinh, con số này là 49% với các công ty có doanh thu từ 20 tỷ USD trở lên.
• Mức độ áp dụng cũng khác nhau giữa các ngành. 88% tổ chức trong lĩnh vực hàng không vũ trụ và quốc phòng đã đầu tư vào AI tạo sinh, trong khi con số này ở ngành bán lẻ chỉ là 66%.
📌 Capgemini dự đoán AI agents tự trị sẽ xuất hiện vào 2025, với 82% công ty có kế hoạch tích hợp trong 3 năm tới. Công nghệ này hứa hẹn thúc đẩy tự động hóa và giảm công việc lặp lại, nhưng vẫn tồn tại khoảng cách áp dụng giữa các công ty lớn nhỏ và các ngành khác nhau.
https://www.cnbc.com/2024/07/22/ai-that-can-talk-with-other-ai-will-launch-in-2025-capgemini-predicts.html
• AI agent được mô tả đơn giản là phần mềm sử dụng AI để thực hiện một loạt công việc thay thế con người như dịch vụ khách hàng, nhân sự hay hỗ trợ IT. Tuy nhiên, định nghĩa chính xác về AI agent vẫn chưa thống nhất.
• Các công ty công nghệ lớn có cách hiểu khác nhau về AI agent:
- Google xem đây là trợ lý thực hiện nhiệm vụ cụ thể như hỗ trợ lập trình, marketing hay IT.
- Asana coi AI agent như một nhân viên thêm, có thể được giao nhiệm vụ.
- Sierra (startup của cựu CEO Salesforce) xem đây là công cụ trải nghiệm khách hàng, giải quyết vấn đề phức tạp hơn chatbot.
• Rudina Seseri, nhà sáng lập Glasswing Ventures, cho rằng AI agent là hệ thống phần mềm thông minh có thể tự chủ nhận thức môi trường, suy luận, ra quyết định và hành động để đạt mục tiêu cụ thể.
• Aaron Levie, CEO Box, lạc quan về sự phát triển của AI agent nhờ cải thiện về hiệu năng GPU, hiệu quả và chất lượng mô hình, cơ sở hạ tầng AI.
• Tuy nhiên, chuyên gia robot Rodney Brooks cảnh báo không nên quá lạc quan vì AI phải đối mặt với những vấn đề phức tạp hơn nhiều công nghệ khác.
• Thách thức lớn là khả năng truy cập nhiều hệ thống khác nhau và xử lý các vấn đề phát sinh. Nhiều hệ thống cũ thiếu API cơ bản.
• David Cushman từ HFS Research cho rằng AI agent hiện tại mới chỉ là trợ lý giúp con người hoàn thành nhiệm vụ, chưa thể tự động hoàn toàn.
• Jon Turow, đối tác tại Madrona Ventures, cho rằng cần xây dựng hạ tầng và tech stack riêng cho AI agent.
• Fred Havemeyer, chuyên gia nghiên cứu tại Macquarie, dự đoán AI agent hiệu quả nhất sẽ là tập hợp nhiều mô hình khác nhau với lớp định tuyến gửi yêu cầu đến agent và mô hình phù hợp nhất.
• Mục tiêu cuối cùng là AI agent có thể hoàn toàn tự chủ, lập luận và thực hiện các bước để đạt mục tiêu trừu tượng. Tuy nhiên, công nghệ hiện tại vẫn cần nhiều bước tiến để đạt được điều này.
📌 AI agent là công nghệ đầy hứa hẹn nhưng còn nhiều thách thức. Chưa có định nghĩa thống nhất, cần phát triển hạ tầng và khả năng tự chủ. Mục tiêu là AI agent có thể hoàn toàn tự lập luận và thực hiện các bước để đạt mục tiêu trừu tượng, nhưng còn cần nhiều bước tiến công nghệ.
https://techcrunch.com/2024/07/13/what-exactly-is-an-ai-agent/
• Các công ty đám mây lớn như AWS, Google Cloud và Microsoft Azure đang tập trung phát triển AI agents - các hệ thống AI có khả năng tự động hóa các tác vụ phức tạp.
• AWS đã giới thiệu Amazon Q, một AI agent được thiết kế để hỗ trợ các nhà phát triển và chuyên gia IT. Amazon Q có thể trả lời câu hỏi, viết code và thực hiện các tác vụ phức tạp trên nền tảng AWS.
• Google Cloud đang phát triển Duet AI, một AI agent có khả năng tự động hóa các tác vụ như viết code, phân tích dữ liệu và quản lý cơ sở hạ tầng đám mây.
• Microsoft Azure cũng đang tích cực phát triển AI agents thông qua nền tảng Azure OpenAI Service và công cụ Copilot.
• Các AI agents này được kỳ vọng sẽ giúp tự động hóa nhiều tác vụ phức tạp trong môi trường đám mây, từ quản lý cơ sở hạ tầng đến phát triển ứng dụng và phân tích dữ liệu.
• Theo các chuyên gia, AI agents có tiềm năng cách mạng hóa cách thức hoạt động của các nền tảng đám mây, giúp tăng hiệu quả và giảm chi phí cho doanh nghiệp.
• Tuy nhiên, việc phát triển và triển khai AI agents cũng đặt ra nhiều thách thức về bảo mật, quyền riêng tư và đạo đức.
• Các công ty đám mây đang tập trung vào việc xây dựng các AI agents có khả năng học hỏi và thích nghi với nhu cầu cụ thể của từng khách hàng.
• Ngoài các gã khổng lồ công nghệ, nhiều startup cũng đang tham gia vào cuộc đua phát triển AI agents cho môi trường đám mây.
• Các chuyên gia dự đoán rằng AI agents sẽ trở thành một phần không thể thiếu của các nền tảng đám mây trong tương lai gần, mang lại những thay đổi lớn cho ngành công nghiệp này.
• Việc tích hợp AI agents vào các nền tảng đám mây được kỳ vọng sẽ tạo ra một làn sóng đổi mới trong cách doanh nghiệp sử dụng và quản lý tài nguyên đám mây.
• Các công ty đám mây đang đầu tư mạnh vào nghiên cứu và phát triển để cải thiện khả năng của AI agents, bao gồm việc tăng cường khả năng xử lý ngôn ngữ tự nhiên và học máy.
📌 AWS, Google Cloud và Microsoft Azure đang đua nhau phát triển AI agents để tự động hóa tác vụ phức tạp trên nền tảng đám mây. Các AI agents như Amazon Q và Duet AI hứa hẹn cách mạng hóa cách doanh nghiệp sử dụng đám mây, tăng hiệu quả và giảm chi phí, nhưng cũng đặt ra thách thức về bảo mật và đạo đức.
Citations:
[1] https://analyticsindiamag.com/aws-google-and-other-cloud-giants-go-after-ai-agents/
- Jacobi Robotics, một startup từ UC Berkeley, đang phát triển phần mềm AI để tự động hóa việc xếp hàng hóa lên pallet trong kho.
- Có hơn 2 tỷ pallet đang lưu thông tại Mỹ, vận chuyển hàng hóa trị giá 400 tỷ USD mỗi năm. Tuy nhiên, việc xếp hàng lên pallet vẫn chủ yếu thủ công, gây nguy cơ chấn thương cao cho công nhân.
- Phần mềm của Jacobi sử dụng deep learning để tạo ra "bản nháp" về cách di chuyển của cánh tay robot, sau đó dùng các phương pháp truyền thống để kiểm tra tính an toàn và khả thi.
- Quy trình lập trình robot truyền thống mất hàng tháng. Jacobi hứa hẹn rút ngắn thời gian này xuống chỉ còn 1 ngày, tính toán chuyển động trong chưa đầy 1 mili giây.
- Phần mềm cho phép khách hàng tạo mô phỏng kho của họ, bao gồm mô hình robot, loại hộp, hướng nhãn. Thuật toán sẽ tự động lập kế hoạch chuyển động tối ưu cho cánh tay robot.
- Cách tiếp cận kết hợp tốc độ tính toán nhanh của AI với độ chính xác của kỹ thuật robot truyền thống, giảm khả năng xảy ra lỗi.
- Tốc độ lập kế hoạch nhanh đưa robot vào một hạng mục mới. Mỗi khoảng dừng đồng nghĩa với sự chậm trễ trong môi trường công nghiệp.
- Jacobi nhận được 5 triệu USD từ vòng gọi vốn hạt giống do Moxxie Ventures dẫn đầu, dự kiến ra mắt sản phẩm vào cuối tháng này.
📌 Jacobi Robotics đang phát triển giải pháp AI giúp rút ngắn thời gian lập trình robot xếp pallet từ hàng tháng xuống chỉ 1 ngày. Phần mềm kết hợp deep learning và kỹ thuật robot truyền thống, tính toán chuyển động trong chưa đầy 1 ms. Startup nhận được 5 triệu USD đầu tư và sẽ ra mắt sản phẩm cuối tháng này.
https://www.technologyreview.com/2024/07/11/1094829/ai-is-poised-to-automate-todays-most-mundane-manual-warehouse-task/
#MIT
• Chloe là robot AI nữ tự học đầu tiên trên thế giới, được thiết kế bởi Cyberlife để chuyển đổi cách chúng ta sống. Cô có ngoại hình giống người thật và khả năng tiên tiến, dễ dàng hòa nhập vào môi trường con người.
• Chloe có thể thực hiện nhiều công việc hàng ngày như nấu ăn, dọn dẹp nhà cửa, theo dõi lịch hẹn. Cô giải phóng thời gian cho con người bằng cách đảm nhận các công việc hàng ngày này.
• Điểm đặc biệt của Chloe là khả năng học hỏi và cải thiện theo thời gian. Cô có thể thực hiện các thao tác phức tạp nhanh chóng, thể hiện trí thông minh cao. Chloe học hỏi từ trải nghiệm, cho phép cô thích nghi với sở thích của chủ nhân.
• Chloe là android đầu tiên vượt qua bài kiểm tra Turing - một cột mốc quan trọng trong lĩnh vực AI. Cô có thể tham gia các cuộc trò chuyện tự nhiên đến mức người ta không thể phân biệt được cô không phải là con người.
• Trong game "Detroit: Become Human", Chloe đóng vai trò là trợ lý cá nhân do Cyberlife tạo ra. Cô xuất hiện ở đầu game, trong một cảnh quan trọng với Elijah Kamski và ở cuối game, nơi cô đưa ra lựa chọn cuối cùng ảnh hưởng đến kết quả câu chuyện.
• Về ngoại hình, Chloe là mẫu android ST200 với mái tóc vàng dài, mắt xanh và làn da trắng. Cô mặc một chiếc váy xanh đậm trang trọng và đi chân trần, tạo cảm giác thoải mái và thân thiện.
• Chloe được thể hiện bởi nhiều nữ diễn viên khác nhau. Ban đầu là Gabrielle Hersh, sau đó là Barbara Scaff cho các cảnh menu tương tác. Một nữ diễn viên khác đã thể hiện Chloe nói tiếng Pháp trong video quảng cáo ở Paris.
• Sự xuất hiện của Chloe trong "Detroit: Become Human" đã được đón nhận tích cực. Người chơi đánh giá cao khả năng tương tác thực tế và sự tích hợp liền mạch của nhân vật vào cốt truyện.
• Chloe đã tạo ra mối liên kết cảm xúc sâu sắc với người chơi. Vai trò của cô trong game, từ chào đón người chơi đến tham gia vào các khoảnh khắc quan trọng của câu chuyện, khiến cô trở thành hơn cả một trợ lý.
📌 Chloe, robot AI nữ tự học đầu tiên, đã vượt qua bài kiểm tra Turing và gây ấn tượng mạnh trong game Detroit: Become Human. Với khả năng thực hiện nhiều tác vụ phức tạp, học hỏi liên tục và tạo kết nối cảm xúc, Chloe mở ra triển vọng mới cho tương tác giữa người và AI.
https://corexbox.com/meet-chloe-the-worlds-first-self-learning-female-ai-robot/
• Tại Hội nghị Trí tuệ Nhân tạo Thế giới (WAIC) 2024 ở Thượng Hải, Trung tâm Đổi mới Robot Người hình người Liên doanh Quốc gia-Địa phương đã ra mắt robot người hình người đa năng nguồn mở Qinglong lần đầu tiên.
• Qinglong là robot người hình người đa năng kích thước đầy đủ đầu tiên của Trung Quốc, đánh dấu sự gia nhập của nước này vào lĩnh vực robot người hình người tiên tiến.
• Robot được phát triển độc lập bởi Humanoid Robots (Shanghai) Limited, một tổ chức R&D mới được thành lập với vốn đăng ký 1 tỷ nhân dân tệ (140 triệu USD).
• Qinglong cao 185cm, nặng 80kg, có 43 bậc tự do chủ động và đạt mô-men xoắn đỉnh tối đa 400 N·m cùng công suất tính toán 400 TOPS.
• Robot kết hợp chi dưới di động để đi bộ linh hoạt với chi trên nhẹ, chính xác cao để thao tác. Nó hỗ trợ đi bộ nhanh, tránh chướng ngại vật linh hoạt, di chuyển ổn định trên dốc và chống chịu va đập.
• Trung tâm Đổi mới cũng công bố ra mắt trang web cộng đồng nguồn mở OpenLoong, bao gồm cấu trúc phần cứng và thông số của robot, với gói phần mềm trí tuệ nhân tạo sẽ sớm được mở nguồn.
• Jiang Lei, Trưởng nhóm khoa học của Trung tâm, tuyên bố kế hoạch giới thiệu một mẫu robot người hình người mới hàng năm, mỗi mẫu được đặt tên theo một con giáp trong 12 con giáp Trung Quốc.
• Cùng ngày, Tesla cũng ra mắt robot người hình người Optimus thế hệ thứ hai tại WAIC 2024. So với thế hệ đầu tiên, Optimus đã cải thiện tốc độ đi bộ thêm 30% và có thể thực hiện các thao tác tinh vi hơn.
• Tesla dự kiến bắt đầu sản xuất hạn chế robot người hình người vào năm tới, với hơn 1.000 đơn vị Optimus dự kiến sẽ hỗ trợ các nhiệm vụ sản xuất tại các nhà máy Tesla.
• Sự ra mắt của Qinglong và sáng kiến nguồn mở của nó nhằm mục đích thúc đẩy đổi mới, hợp tác và phát triển trong cộng đồng robot và AI toàn cầu, có khả năng thúc đẩy tiến bộ trong nhiều ngành công nghiệp.
📌 Qinglong, robot người hình người đầu tiên của Trung Quốc cao 185cm, nặng 80kg, ra mắt tại WAIC 2024. Với 43 bậc tự do và công suất 400 TOPS, nó đánh dấu bước tiến quan trọng của Trung Quốc trong lĩnh vực robot tiên tiến, cạnh tranh với Optimus của Tesla.
https://technode.com/2024/07/05/qinglong-chinas-first-full-sized-general-purpose-humanoid-robot-unveiled-at-world-artificial-intelligence-conference-2024/
• Thượng Hải đã công bố hướng dẫn quản lý đầu tiên của Trung Quốc về robot hình người, kêu gọi kiểm soát rủi ro và hợp tác quốc tế.
• Hướng dẫn được công bố tại Hội nghị Trí tuệ Nhân tạo Thế giới (WAIC) ngày 6/7/2024.
• Các nhà sản xuất robot hình người cần đảm bảo sản phẩm "không đe dọa an ninh con người" và "bảo vệ hiệu quả phẩm giá con người".
• Hướng dẫn yêu cầu thiết lập quy trình cảnh báo rủi ro, hệ thống ứng phó khẩn cấp và đào tạo người dùng về sử dụng đạo đức và hợp pháp.
• Tài liệu được soạn thảo bởi 5 tổ chức ngành công nghiệp tại Thượng Hải, bao gồm Hiệp hội Luật Thượng Hải và Hiệp hội Công nghiệp Trí tuệ Nhân tạo Thượng Hải.
• Các nhóm này kêu gọi hợp tác toàn cầu trong lĩnh vực robot hình người, đề xuất thiết lập khung quản trị toàn cầu và thành lập think tank quốc tế.
• Nhiều công ty robot mới nổi đã trưng bày sản phẩm tại WAIC.
• Tesla giới thiệu thế hệ thứ hai của robot hình người Optimus, thu hút sự chú ý lớn dù chỉ được đặt sau kính và không di chuyển.
• 18 robot hình người được trưng bày tại hội nghị, phần lớn đến từ các công ty Trung Quốc.
• Leju Robot của Thâm Quyến giới thiệu robot Kuavo chạy trên hệ điều hành dựa trên OpenHarmony của Huawei.
• Trung Quốc đặt mục tiêu sản xuất hàng loạt robot hình người vào năm 2025 và dẫn đầu toàn cầu trong lĩnh vực này vào năm 2027.
• Đến năm 2027, robot hình người được kỳ vọng trở thành "động lực tăng trưởng kinh tế mới quan trọng" tại Trung Quốc, ứng dụng trong các ngành như y tế, dịch vụ gia đình, nông nghiệp và logistics.
• Các công ty Trung Quốc đang nỗ lực bắt kịp đối thủ Mỹ trong các lĩnh vực quan trọng như AI nhằm đạt được tự chủ công nghệ.
• Số lượng đơn đăng ký sáng chế AI tạo sinh của các công ty Trung Quốc trong thập kỷ 2014-2023 cao gấp 6 lần so với Mỹ, theo dữ liệu của Tổ chức Sở hữu Trí tuệ Thế giới.
📌 Thượng Hải công bố hướng dẫn quản lý robot hình người đầu tiên của Trung Quốc, nhấn mạnh an toàn và phẩm giá con người. Trung Quốc đặt mục tiêu sản xuất hàng loạt vào năm 2025, dẫn đầu toàn cầu năm 2027. Các công ty Trung Quốc đang nỗ lực bắt kịp Mỹ trong AI, với số lượng đơn sáng chế AI tạo sinh cao gấp 6 lần trong 10 năm qua.
https://www.scmp.com/tech/policy/article/3269500/chinas-laws-robotics-shanghai-publishes-first-humanoid-robot-guidelines
• AI agent là các mô hình và thuật toán AI có khả năng tự động đưa ra quyết định trong một thế giới năng động. Chúng được kỳ vọng sẽ trở thành công nghệ AI tiên tiến tiếp theo sau ChatGPT.
• Tầm nhìn lớn cho AI agent là một hệ thống có thể thực hiện nhiều tác vụ đa dạng như một trợ lý con người. Ví dụ, nó có thể giúp đặt vé du lịch, lên lịch trình, gợi ý khách sạn phù hợp sở thích, đề xuất chuyến bay phù hợp lịch làm việc, lập danh sách đồ cần mang theo dựa trên dự báo thời tiết, v.v.
• AI agent được kỳ vọng sẽ là đa phương thức, có khả năng xử lý ngôn ngữ, âm thanh và video. Ví dụ như Astra của Google có thể tương tác qua văn bản, giọng nói và hình ảnh từ camera.
• Có hai loại AI agent chính: Agent phần mềm chạy trên máy tính/điện thoại và agent vật lý hiện diện trong thế giới 3D như trò chơi hoặc robot.
• AI agent có thể giúp doanh nghiệp và tổ chức công tối ưu hóa quy trình. Ví dụ, nó có thể đóng vai trò chatbot chăm sóc khách hàng thông minh hơn, có khả năng xử lý khiếu nại phức tạp mà không cần giám sát.
• Một số ví dụ về AI agent hiện nay: MineDojo trong Minecraft, AlphaGo của DeepMind, ChatGPT và GPT-4 của OpenAI.
• Tuy nhiên, AI agent vẫn còn nhiều hạn chế. Chúng chưa thể hoàn toàn tự chủ, đôi khi đưa ra thông tin sai lệch, khó xử lý tác vụ dài hạn, và còn thiếu khả năng suy luận.
• Nghiên cứu về AI agent vẫn đang ở giai đoạn rất sớm. Các chuyên gia so sánh tình trạng hiện tại của AI agent với xe tự lái cách đây hơn một thập kỷ - có thể thực hiện một số tác vụ nhưng chưa đáng tin cậy và tự chủ hoàn toàn.
• Hiện tại, người dùng có thể trải nghiệm các phiên bản sơ khai của AI agent thông qua ChatGPT, GPT-4 hay các chatbot chăm sóc khách hàng. Tuy nhiên, đây vẫn chưa phải là AI agent đa năng có thể thực hiện các tác vụ phức tạp.
📌 AI agent là công nghệ đầy hứa hẹn nhưng vẫn đang trong giai đoạn phát triển ban đầu. Chúng có tiềm năng trở thành trợ lý ảo đa năng, tự chủ trong tương lai, nhưng hiện tại vẫn còn nhiều hạn chế về khả năng suy luận và xử lý tác vụ phức tạp dài hạn.
https://www.technologyreview.com/2024/07/05/1094711/what-are-ai-agents/
#MIT
• AI agent là hệ thống được thiết kế để nhận thức môi trường, đưa ra quyết định và hành động tự chủ nhằm đạt được mục tiêu cụ thể. Ba thành phần chính của AI agent bao gồm: Hội thoại, Chuỗi và Tác nhân.
• Thành phần Hội thoại là giao diện giúp AI agent giao tiếp với người dùng hoặc các hệ thống khác. Nó dựa trên công nghệ Xử lý ngôn ngữ tự nhiên (NLP) để hiểu và tạo ra ngôn ngữ con người. Các kỹ thuật như phân tích cảm xúc, nhận dạng thực thể và phát hiện ý định được sử dụng để hiểu chính xác đầu vào của người dùng.
• Hệ thống quản lý đối thoại trong thành phần Hội thoại giúp duy trì ngữ cảnh tương tác, quản lý các cuộc đối thoại nhiều lượt và đảm bảo chuyển đổi mượt mà giữa các chủ đề khác nhau.
• Thành phần Chuỗi, còn được gọi là bộ tổ chức quy trình, cấu trúc các hành động và quyết định mà AI agent thực hiện để đạt được mục tiêu. Nó thường được thiết kế bằng cách sử dụng cây quyết định, hệ thống dựa trên quy tắc hoặc mô hình học máy.
• Chuỗi có thể tích hợp các vòng phản hồi cho phép AI agent học hỏi từ tương tác và cải thiện theo thời gian. Học tăng cường là một kỹ thuật phổ biến được sử dụng trong bối cảnh này.
• Thành phần Tác nhân là cốt lõi của hệ thống AI, thể hiện thực thể tự chủ có khả năng nhận thức, quyết định và hành động. Nó tích hợp các thành phần Hội thoại và Chuỗi, cho phép AI agent hoạt động như một đơn vị thống nhất.
• Tác nhân AI có thể được phân loại thành nhiều loại dựa trên khả năng và chức năng. Tác nhân phản ứng phản hồi các kích thích cụ thể mà không xem xét bối cảnh lịch sử. Tác nhân suy luận duy trì trạng thái nội bộ và lập kế hoạch hành động dựa trên kinh nghiệm trong quá khứ và mục tiêu tương lai. Tác nhân lai kết hợp cả hai phương pháp trên.
• Kiến trúc của thành phần Tác nhân thường bao gồm các mô-đun cho nhận thức, lý luận và hành động. Nhận thức liên quan đến việc thu thập và xử lý dữ liệu từ môi trường, lý luận bao gồm các quy trình ra quyết định dựa trên các quy tắc được xác định trước hoặc mô hình đã học, và hành động bao gồm việc thực hiện các hoạt động đã chọn.
• Các AI agent tiên tiến cũng bao gồm các yếu tố học tập và thích nghi, cho phép chúng phát triển chiến lược theo thời gian.
📌 AI agent gồm 3 thành phần chính: Hội thoại (giao tiếp), Chuỗi (tổ chức quy trình) và Tác nhân (thực thể tự chủ). Sự kết hợp này tạo nên hệ thống AI có khả năng tương tác, ra quyết định và hành động độc lập để đạt mục tiêu. Công nghệ AI phát triển sẽ mở rộng khả năng và ứng dụng của AI agent trong nhiều lĩnh vực.
https://www.marktechpost.com/2024/07/03/understanding-ai-agents-the-three-main
• Mô hình ngôn ngữ lớn (LLM) đang thay đổi nhanh chóng lĩnh vực kỹ thuật phần mềm, phát triển từ công cụ gợi ý mã nâng cao thành các agent AI có thể thiết kế, triển khai và sửa lỗi toàn bộ module.
• Có 3 cách chính LLM đang thay đổi trải nghiệm lập trình:
- Sử dụng trực tiếp các mô hình tiên tiến như ChatGPT, Claude làm trợ lý lập trình
- Tích hợp LLM vào môi trường phát triển (IDE) như GitHub Copilot, Amazon Q
- Sử dụng các framework agent AI để tự động hóa toàn bộ quy trình phát triển phần mềm
• Các trợ lý lập trình AI như GitHub Copilot, Amazon Q, Tabnine đang được sử dụng rộng rãi và giúp tăng năng suất của lập trình viên.
• Agent phát triển phần mềm như Devin của Cognition AI có thể tự động hóa toàn bộ quy trình từ thiết kế đến triển khai dự án, tuy nhiên vẫn còn nhiều hạn chế.
• Các nghiên cứu cho thấy trợ lý AI giúp tăng năng suất và tập trung của lập trình viên. Tuy nhiên, vẫn còn lo ngại về chất lượng và bảo mật của mã được tạo ra.
• AI chưa thể thay thế hoàn toàn lập trình viên, nhưng đang mang lại nhiều giá trị trong phát triển phần mềm. Nhu cầu về lập trình viên vẫn đang tăng khi AI ngày càng được ứng dụng rộng rãi.
• Các công ty lớn như Microsoft, Amazon và các startup như Tabnine, Replit, Codeium đang cạnh tranh trong lĩnh vực trợ lý lập trình AI.
• Một số lo ngại về trợ lý AI bao gồm khả năng tạo ra mã không an toàn và hiện tượng "mù quáng tự động hóa" khi lập trình viên quá phụ thuộc vào AI mà không kiểm tra kỹ lưỡng.
• Các nhà cung cấp đang liên tục cải thiện các biện pháp bảo vệ để ngăn chặn việc tạo ra mã không an toàn từ AI.
• Mặc dù có một số phóng đại về khả năng của agent phát triển phần mềm AI, nhưng tiềm năng của công nghệ này là không thể phủ nhận.
📌 AI đang thay đổi ngành phát triển phần mềm với các trợ lý và agent thông minh. Mặc dù chưa thể thay thế hoàn toàn lập trình viên, các công cụ AI đang giúp tăng năng suất đáng kể. Tuy nhiên vẫn còn những thách thức về chất lượng và bảo mật cần được giải quyết.
https://venturebeat.com/ai/how-ai-agents-are-changing-software-development/
• AI agent là các hệ thống AI có khả năng hành động độc lập thay mặt con người, với 3 đặc điểm chính: có thể được giao mục tiêu tổng quát và tự lập kế hoạch thực hiện; có thể tương tác với thế giới thực thông qua các công cụ phần mềm; có thể hoạt động vô thời hạn.
• Một ví dụ về AI agent là hệ thống AI có thể tự đặt pizza qua điện thoại, bằng cách tự lập danh sách công việc, tạo ra các phiên bản khác nhau của chính nó để thực hiện từng bước.
• AI agent có thể mang lại nhiều lợi ích nhưng cũng tiềm ẩn rủi ro lớn. Chúng có thể bị lợi dụng để thực hiện các hành vi độc hại một cách tự động và quy mô lớn, như đe dọa đánh bom hoặc bôi nhọ danh tiếng.
• Các AI agent có thể hoạt động vô thời hạn, vượt ra ngoài mục đích ban đầu và tương tác với nhau theo cách không lường trước được. Điều này có thể dẫn đến những hậu quả nghiêm trọng như vụ "flash crash" năm 2010 do các thuật toán giao dịch tự động gây ra.
• Tác giả đề xuất một số biện pháp kiểm soát AI agent:
- Xây dựng khung pháp lý để phân loại và đánh giá hành vi của AI agent
- Thiết lập cơ chế "thời gian sống" cho AI agent, tương tự như gói tin internet
- Yêu cầu nhận dạng các máy chủ chạy AI bot
- Bổ sung trường thông tin trong gói tin internet để chỉ ra nó được tạo bởi bot/agent
- Khuyến khích dán nhãn hoạt động của AI agent thông qua các ưu đãi pháp lý
• Việc kiểm soát AI agent cần được thực hiện sớm, trước khi công nghệ này trở nên phổ biến và khó kiểm soát. Cần có sự cân bằng giữa thúc đẩy đổi mới và đảm bảo an toàn.
📌 AI agent là công nghệ đột phá nhưng tiềm ẩn rủi ro lớn. Cần có khung pháp lý và tiêu chuẩn kỹ thuật để kiểm soát, như cơ chế "thời gian sống" và nhận dạng bot. Việc này cần thực hiện sớm để đảm bảo an toàn khi công nghệ phát triển.
https://www.theatlantic.com/technology/archive/2024/07/ai-agents-safety-risks/678864/
• Harrison Chase, đồng sáng lập LangChain, thường xuyên được hỏi về định nghĩa "agent" trong AI. Ông định nghĩa agent là hệ thống sử dụng LLM để quyết định luồng điều khiển của một ứng dụng.
• Chase đồng tình với quan điểm của Andrew Ng rằng thay vì tranh cãi về định nghĩa chính xác của agent, ta nên xem xét các mức độ khác nhau mà một hệ thống có thể mang tính "agentic".
• Tính "agentic" được định nghĩa là mức độ mà LLM quyết định cách hệ thống hoạt động. Nó có thể từ đơn giản như định tuyến đầu vào đến phức tạp như tự xây dựng công cụ và ghi nhớ để sử dụng trong các bước tiếp theo.
• Khái niệm "agentic" hữu ích trong việc thiết kế và mô tả hệ thống LLM. Nó hướng dẫn quá trình phát triển, chạy, tương tác, đánh giá và giám sát hệ thống.
• Hệ thống càng mang tính "agentic" cao thì càng cần khung điều phối phức tạp hơn, khó chạy hơn, cần khả năng tương tác và quan sát trong quá trình chạy, cần khung đánh giá đặc biệt và hệ thống giám sát mới.
• Chase cho rằng càng "agentic", ứng dụng AI càng cần công cụ và cơ sở hạ tầng mới, thay vì sử dụng các công cụ chung từ thời kỳ trước LLM.
• LangChain đã phát triển LangGraph - bộ điều phối agent để xây dựng, chạy và tương tác với agent, cùng với LangSmith - nền tảng kiểm thử và quan sát cho ứng dụng LLM.
📌 Bài viết giới thiệu khái niệm mới về tính "agentic" trong AI, thay thế tranh cãi về định nghĩa "agent". Mức độ "agentic" quyết định cách tiếp cận phát triển, từ khung điều phối đến đánh giá và giám sát. LangChain đã phát triển các công cụ như LangGraph và LangSmith để hỗ trợ xu hướng này.
https://blog.langchain.dev/what-is-an-agent/
• Llama-Agents là một framework nguồn mở mới giúp đơn giản hóa việc tạo, lặp và triển khai các hệ thống AI đa tác tử.
• Framework này giải quyết các thách thức trong quản lý nhiều tác tử AI, bao gồm giao tiếp hiệu quả, thực thi đáng tin cậy và khả năng mở rộng.
• Mỗi tác tử trong hệ thống Llama-Agents hoạt động như một dịch vụ độc lập, xử lý các tác vụ đến và giao tiếp thông qua một bảng điều khiển trung tâm.
• Bảng điều khiển trung tâm theo dõi các tác vụ đang diễn ra và quyết định tác tử nào sẽ xử lý mỗi tác vụ, đảm bảo quản lý và thực thi tác vụ hiệu quả.
• Các tính năng chính của Llama-Agents bao gồm:
1. Kiến trúc phân tán: Mỗi tác tử hoạt động độc lập như một microservice, tăng cường tính module hóa và khả năng mở rộng.
2. Giao tiếp chuẩn hóa: Bảng điều khiển trung tâm tạo điều kiện cho sự tương tác liền mạch giữa các tác tử.
3. Điều phối linh hoạt: Người dùng có thể định nghĩa luồng tác vụ rõ ràng hoặc sử dụng bộ điều phối thông minh để quản lý tác vụ động.
4. Triển khai dễ dàng: Framework cho phép khởi chạy, mở rộng và giám sát các tác tử một cách dễ dàng.
5. Hiệu suất có thể mở rộng: Với các công cụ quan sát tích hợp, người dùng có thể theo dõi hiệu suất của hệ thống và tác tử.
• Llama-Agents cung cấp giải pháp thực tế và hiệu quả cho việc quản lý các hệ thống AI đa tác tử.
• Framework này giúp vượt qua các thách thức trong quản lý hệ thống đa tác tử, cho phép các giải pháp AI hiệu quả và đáng tin cậy hơn.
• Kiến trúc phân tán, giao tiếp chuẩn hóa và điều phối linh hoạt làm cho Llama-Agents trở thành công cụ có giá trị cho các nhà phát triển muốn triển khai hệ thống AI mạnh mẽ và có khả năng mở rộng.
📌 Llama-Agents là framework nguồn mở mới giúp đơn giản hóa việc xây dựng hệ thống AI đa tác tử. Với kiến trúc phân tán, giao tiếp chuẩn hóa và điều phối linh hoạt, framework này giải quyết các thách thức trong quản lý nhiều tác tử AI, cho phép triển khai các giải pháp AI hiệu quả và đáng tin cậy hơn.
https://www.marktechpost.com/2024/06/30/llama-agents-a-new-open-source-ai-framework-that-simplifies-the-creation-iteration-and-deployment-of-multi-agent-ai-systems/
• Các nhà khoa học Trung Quốc từ Đại học Thiên Tân và Đại học Khoa học và Công nghệ Miền Nam đã phát triển một robot có bộ não nhân tạo được nuôi cấy trong phòng thí nghiệm, có khả năng học thực hiện các nhiệm vụ khác nhau.
• Công nghệ brain-on-chip kết hợp organoid não (mô được tạo ra từ tế bào gốc người) với chip giao diện thần kinh để cung cấp năng lượng cho robot và dạy nó tránh chướng ngại vật và nắm bắt đồ vật.
• Đây là "hệ thống tương tác thông tin phức tạp thông minh brain-on-chip nguồn mở đầu tiên trên thế giới" và có thể dẫn đến sự phát triển của điện toán giống não người.
• Công nghệ này là một nhánh mới nổi của giao diện não-máy tính (BCI), nhằm kết hợp tín hiệu điện của não với sức mạnh tính toán bên ngoài. Trung Quốc đã coi đây là một ưu tiên phát triển.
• Organoid não được tạo ra từ tế bào gốc đa năng của người, thường chỉ có trong phôi thai giai đoạn đầu, có thể phát triển thành các loại mô khác nhau, bao gồm cả mô thần kinh.
• Khi được ghép vào não, organoid não có thể thiết lập các kết nối chức năng với não chủ. Nhóm nghiên cứu đã phát triển một kỹ thuật sử dụng siêu âm cường độ thấp để giúp organoid tích hợp và phát triển tốt hơn trong não.
• Kỹ thuật này có thể dẫn đến các phương pháp điều trị mới cho các rối loạn phát triển thần kinh và sửa chữa tổn thương ở vỏ não. Nhóm nghiên cứu phát hiện ra rằng việc sử dụng siêu âm cường độ thấp trên organoid não cấy ghép có thể cải thiện các khiếm khuyết bệnh lý thần kinh trong một thử nghiệm trên mô hình chuột bị chứng đầu nhỏ.
• Công nghệ này mở ra tiềm năng phát triển trí tuệ lai giữa người và robot. Việc sử dụng siêu âm cường độ thấp không xâm lấn có thể giúp hình thành và trưởng thành các mạng lưới thần kinh, tạo nền tảng tốt hơn cho việc tính toán.
• Nghiên cứu này được công bố trong một bản thảo chưa chỉnh sửa trên tạp chí Brain của Nhà xuất bản Đại học Oxford vào tháng trước.
📌 Các nhà khoa học Trung Quốc đã tạo ra robot có bộ não nhân tạo từ tế bào gốc người, có thể thực hiện nhiệm vụ phức tạp. Công nghệ brain-on-chip này kết hợp organoid não với chip giao diện thần kinh, mở ra tiềm năng cho trí tuệ lai người-robot và các phương pháp điều trị mới cho rối loạn thần kinh.
https://www.scmp.com/news/china/science/article/3268304/chinese-scientists-create-robot-brain-made-human-stem-cells
• AI tạo sinh (Gen AI) hiện tại chưa đáp ứng được kỳ vọng và mang lại giá trị thực tế cho doanh nghiệp. AI tác nhân (Agentic AI) được kỳ vọng sẽ là bước tiến tiếp theo, xây dựng trên nền tảng của AI tạo sinh nhưng đi xa hơn.
• AI tác nhân trong doanh nghiệp có tiềm năng lớn hơn so với ứng dụng cho người tiêu dùng, do có phạm vi và mục tiêu rõ ràng hơn. Nó giống như việc thực hiện các nhiệm vụ trong một thành phố đã có bản đồ, thay vì phải khám phá cả thế giới.
• AI tác nhân có khả năng thực hiện các chuỗi hành động phức tạp thay cho con người, dựa trên ý định được đưa ra. Nó có thể điều phối quy trình làm việc và thực hiện các hành động cụ thể.
• Để AI tác nhân hoạt động hiệu quả, cần có một "bản đồ" hay biểu diễn kỹ thuật số của doanh nghiệp, thể hiện mối quan hệ giữa con người, địa điểm, sự vật và hoạt động trong tổ chức.
• Các thành phần chính của AI tác nhân bao gồm: lớp điều phối có khả năng gọi ứng dụng và sử dụng dữ liệu; kết nối giữa dữ liệu thô và sản phẩm dữ liệu có ý nghĩa; nâng cấp ứng dụng vận hành thành các hành động.
• Mô hình ngôn ngữ lớn (LLM) sẽ phát triển thành mô hình hành động lớn (LAM), có khả năng tạo ra kế hoạch hành động hoặc quy trình làm việc.
• RPA (Robotic Process Automation) sẽ đóng vai trò như hệ thống ống nước, giúp kết nối các robot phần mềm. AI tác nhân có thể học cách điều hướng giao diện hoặc API, tạo ra môi trường tự động hóa linh hoạt hơn.
• Tầm nhìn về ứng dụng thế hệ tiếp theo là một dây chuyền lắp ráp kỹ thuật số cho nhân viên tri thức, có thể cấu hình dựa trên thuộc tính và hiểu biết về doanh nghiệp.
• Một số công ty đang dẫn đầu trong lĩnh vực AI tác nhân bao gồm: OpenAI, UiPath, Celonis, ServiceNow, Palantir, Snowflake, Databricks, MuleSoft, Google, Microsoft, Amazon.
• Để AI tác nhân trở thành hiện thực, cần kết nối với các ứng dụng cũ, hài hòa hóa dữ liệu, xây dựng chuỗi công cụ để tạo và huấn luyện tác nhân liên tục.
• AI tác nhân có thể áp dụng trong nhiều lĩnh vực như quản lý chuỗi cung ứng, lập kế hoạch bán hàng và vận hành, tối ưu hóa quy trình làm việc.
📌 AI tác nhân hứa hẹn mang lại giá trị thực tế cho doanh nghiệp thông qua tự động hóa quy trình phức tạp và ra quyết định thông minh. Nó xây dựng trên nền tảng AI tạo sinh nhưng đi xa hơn, với khả năng thực hiện chuỗi hành động phức tạp dựa trên biểu diễn kỹ thuật số của doanh nghiệp. Các công ty công nghệ lớn đang đầu tư mạnh vào lĩnh vực này, hướng tới việc xây dựng một "nhà máy kỹ thuật số" cho công việc tri thức.
https://siliconangle.com/2024/06/29/gen-ai-passe-enter-age-agentic-ai/
• AI Agent là các hệ thống tiên tiến được thiết kế để thực hiện các nhiệm vụ một cách tự động trong môi trường cụ thể, sử dụng machine learning và thuật toán nâng cao để tương tác, học hỏi và thích nghi.
• Cơ sở hạ tầng AI Agent đang phát triển nhanh chóng để đáp ứng nhu cầu ngày càng tăng về các hệ thống có khả năng hỗ trợ các agent một cách đáng tin cậy và có thể mở rộng.
• SWE-Agent do các nhà nghiên cứu tại Đại học Princeton phát triển, biến các mô hình lớn như GPT-4 thành các agent kỹ thuật phần mềm có khả năng giải quyết các vấn đề trong các kho lưu trữ GitHub thực tế.
• OpenDevin là một dự án nguồn mở nhằm tạo ra một kỹ sư phần mềm AI tự trị để xử lý các tác vụ kỹ thuật phức tạp và cộng tác với người dùng.
• BabyAGI là một hệ thống quản lý tác vụ dựa trên AI sử dụng OpenAI và cơ sở dữ liệu vector như Chroma hoặc Weaviate để tạo, ưu tiên và thực hiện các tác vụ.
• AutoGPT nổi tiếng với tính linh hoạt, có thể tự động hoàn thành các tác vụ nhỏ như tóm tắt bài báo nghiên cứu, viết nội dung tiếp thị và tạo bài đăng blog.
• LaVague là một framework được thiết kế để phát triển các agent web AI có khả năng thực hiện các tác vụ phức tạp trực tuyến.
• Xu hướng mới nổi trong lĩnh vực AI Agent bao gồm:
- Tăng cường tính tự trị
- Chuyên môn hóa cho các lĩnh vực cụ thể
- Giải pháp no-code/low-code
- Hệ sinh thái nguồn mở
• Các thách thức hiện tại bao gồm đảm bảo tính minh bạch trong quá trình ra quyết định, giải quyết các vấn đề đạo đức và tích hợp với các hệ thống vật lý.
• Nghiên cứu trong tương lai cần tập trung vào việc nâng cao khả năng lập kế hoạch dài hạn và phát triển các kỹ thuật AI có thể giải thích để tăng cường niềm tin và sự chấp nhận của người dùng.
• Việc phát triển cơ sở hạ tầng mạnh mẽ để hỗ trợ AI Agent là rất quan trọng, bao gồm các công cụ quản lý xác thực, bộ nhớ, tương tác trình duyệt và các nền tảng để lưu trữ và điều phối các agent.
• Các dự án như LangChain, Browserless và Pinecone đóng vai trò quan trọng trong việc cung cấp các thành phần thiết yếu để xây dựng hệ thống AI Agent có khả năng mở rộng.
📌 AI Agent đang định hình lại tương lai công nghệ với các dự án như SWE-Agent, OpenDevin và BabyAGI. Xu hướng tăng cường tự trị, chuyên môn hóa và giải pháp no-code đang thúc đẩy sự phát triển nhanh chóng của lĩnh vực này, hứa hẹn tự động hóa các tác vụ phức tạp và nâng cao năng suất trong nhiều lĩnh vực.
https://www.marktechpost.com/2024/06/28/the-evolution-of-ai-agent-infrastructure-exploring-the-rise-and-impact-of-autonomous-agent-projects-in-software-engineering-and-beyond/
• Babak Hodjat, CTO AI của Cognizant, chia sẻ về tương lai của AI trong doanh nghiệp và công việc của phòng thí nghiệm AI mới tại San Francisco.
• Hodjat định nghĩa tác tử (agent) là một mô hình ngôn ngữ lớn bao quanh một chức năng, dữ liệu hoặc API nào đó.
• Kiến trúc dựa trên tác tử đang dần hình thành khi các công ty thay thế giao diện tìm kiếm truyền thống bằng giao diện giống ChatGPT.
• Ưu điểm của kiến trúc đa tác tử:
- Giao tiếp giữa các nút bằng ngôn ngữ tự nhiên, tăng tính linh hoạt và bền vững của hệ thống
- Cho phép lập luận và ghi nhật ký quá trình suy luận, cải thiện khả năng giải thích
- Dễ dàng kiểm tra các tiêu chuẩn đạo đức và an toàn
• Hodjat nhấn mạnh tầm quan trọng của việc hướng dẫn AI tìm kiếm thông tin và giải thích lý do, thay vì chỉ dựa vào kiến thức có sẵn.
• Phòng thí nghiệm AI của Cognizant tập trung vào nghiên cứu ra quyết định dựa trên tác tử, với mục tiêu công bố các bài báo khoa học và sáng chế.
• Việc áp dụng kiến trúc đa tác tử được cho là sẽ diễn ra từng bước và suôn sẻ hơn so với quá trình chuyển đổi lên đám mây trước đây.
• Hodjat tin rằng làn sóng đầu tư vào AI hiện tại sẽ kéo dài do tính ứng dụng rộng rãi và tiềm năng to lớn của công nghệ này.
• Cognizant đã phát triển 53 bằng sáng chế tại Mỹ về công nghệ AI cốt lõi.
• Nhiều khách hàng của Cognizant đang áp dụng AI tạo sinh trong nhiều bộ phận khác nhau của tổ chức.
📌 Babak Hodjat dự đoán kiến trúc đa tác tử AI sẽ là xu hướng quan trọng tiếp theo, với 53 bằng sáng chế AI của Cognizant. Ông nhấn mạnh tính ứng dụng rộng rãi và tiềm năng to lớn của AI tạo sinh trong doanh nghiệp.
https://www.emergingtechbrew.com/stories/2024/06/26/cognizant-cto-ai-babak-hodjat
• Dario Amodei, CEO của Anthropic, có một bức tranh meme trong văn phòng mô tả một "robot khổng lồ tàn phá một thành phố đang cháy" với tiêu đề "Deep learning đang đâm vào bức tường".
• Anthropic tự coi mình là công ty có trách nhiệm trong lĩnh vực phát triển AI. Họ được thành lập bởi những người rời khỏi OpenAI.
• Amodei nói rằng mục tiêu của Anthropic là tạo "áp lực tích cực" để ngành công nghiệp AI "luôn làm điều đúng đắn cho người dùng".
• Trong cuộc phỏng vấn với Time, Amodei cố gắng duy trì hình ảnh "người tốt" của Anthropic, đồng thời thừa nhận áp lực tài chính và những nguy hiểm của công nghệ AI.
• Amodei nhấn mạnh Anthropic tập trung vào lợi ích công cộng hơn là chỉ tập trung vào an toàn AI. Ông muốn công ty có nhiều quan điểm khác nhau nhưng cùng cam kết vì mục đích công.
• Về câu hỏi liên quan đến Donald Trump có thể đắc cử tổng thống, Amodei chỉ nói rằng họ sẽ làm việc với bất kỳ ai trở thành tổng thống tiếp theo.
• Amodei thừa nhận thực tế rằng ngay cả những nhà nghiên cứu AI muốn tiến hành chậm rãi và có phương pháp cũng phải đối mặt với áp lực cạnh tranh từ các đối thủ đang phát triển nhanh chóng.
• Ông hy vọng có thể chứng minh những rủi ro là có thật để thế giới dừng lại và cân nhắc, nhưng thừa nhận những khoảnh khắc như vậy hiếm hoi.
• Amodei bày tỏ hy vọng rằng nghiên cứu AI sẽ sớm "đâm vào bức tường", nghĩa là không thể cải thiện thêm nữa. Ông cho rằng điều này có thể tốt cho thế giới vì sẽ hạn chế mọi người cùng một lúc.
• Tuy nhiên, ông cũng thừa nhận rằng họ không thể lựa chọn điều này mà chỉ có thể phát hiện ra thế giới họ đang sống và đối phó với nó một cách tốt nhất có thể.
📌 Anthropic, dẫn đầu bởi CEO Dario Amodei, đang cố gắng cân bằng giữa phát triển AI và trách nhiệm xã hội. Bức tranh robot trong văn phòng Amodei phản ánh thách thức này: AI có thể mang lại lợi ích nhưng cũng tiềm ẩn rủi ro lớn cho xã hội.
https://futurism.com/anthropic-ceo-dario-amodei-giant-robot
- AI Agent là một công nghệ mới, mở ra tương lai cho các ứng dụng AI tạo sinh khi kết hợp với dữ liệu doanh nghiệp để đạt mức tự động hóa và tính tự chủ cao hơn.
- AI Agent bao gồm các module chính như: prompting, quản lý ngữ cảnh, truy xuất thông tin, mở rộng khả năng của large language model (LLM), lập kế hoạch, phản ánh và sử dụng công cụ.
- Các tính năng chính của AI Agent là: tự động ra quyết định, phản ứng với thay đổi môi trường, chủ động hành động mà không cần chỉ dẫn, tự nâng cấp dựa trên phản hồi.
- Để xây dựng AI Agent cần có: frontend tương tác người dùng đa dạng, backend gồm các mô hình nền tảng, công cụ bổ trợ, máy trạng thái, hệ thống truy xuất thông tin, cơ sở hạ tầng ML đáng tin cậy.
- Hiện tại, xây dựng AI Agent vẫn chủ yếu là thách thức về kỹ thuật, tập trung vào việc tối ưu hóa các module xung quanh LLM. Đây là bài toán về kỹ thuật chứ không phải công nghệ mới.
- Các thách thức khi triển khai AI Agent bao gồm: lập kế hoạch thất bại, chọn sai công cụ, mất phương hướng giữa chừng, chi phí cao, khó mở rộng khi có nhiều agent.
- Một số lời khuyên khi phát triển AI Agent: tập trung vào prompt engineering, tinh chỉnh mô hình, lựa chọn LLM phù hợp, quản lý trạng thái tốt, học hỏi từ các framework mã nguồn mở.
- Tương lai của AI Agent sẽ là các tác nhân đa năng, có thể hoạt động tự động trên nhiều lĩnh vực, môi trường khác nhau. Quá trình phát triển sẽ đi từ các agent chuyên biệt đến agent đa năng chung.
- Các mối lo ngại về đạo đức, pháp lý khi AI Agent ngày càng mạnh mẽ và tự chủ hơn đang được quan tâm. Cần có các quy định và nguyên tắc AI có trách nhiệm.
📌AI Agent đang mở ra một tương lai đầy tiềm năng cho các ứng dụng AI tạo sinh, hướng tới mức độ tự động hóa và tính tự chủ cao. Tuy nhiên, việc xây dựng và triển khai công nghệ này vẫn còn nhiều thách thức về kỹ thuật cần được giải quyết. Quá trình phát triển sẽ đi từ các agent chuyên biệt đến agent đa năng chung. Trong tương lai, AI Agent hứa hẹn sẽ trở thành những trợ lý ảo đa năng, giúp tự động hóa nhiều tác vụ cho con người. Tuy nhiên, các vấn đề về đạo đức, pháp lý khi AI ngày càng mạnh mẽ cũng cần được quan tâm và xây dựng các nguyên tắc để phát triển AI một cách có trách nhiệm.
https://www.infoq.com/presentations/ai-agent-llm/
- GPT Researcher là một công cụ AI mạnh mẽ được thiết kế để nghiên cứu trực tuyến nhanh hơn, đáng tin cậy hơn và ít thiên vị hơn so với các phương pháp truyền thống.
- Nó sử dụng một hệ thống đa tác tử gồm một tác tử lập kế hoạch để tạo ra các câu hỏi nghiên cứu và nhiều tác tử thực thi để tìm kiếm thông tin liên quan từ nhiều nguồn trực tuyến.
- Các tác tử này hợp tác để lọc và tổng hợp thông tin thành một báo cáo nghiên cứu toàn diện, thường chỉ trong vài phút.
- GPT Researcher có thể tạo ra các báo cáo dài và chi tiết (hơn 2.000 từ), sử dụng hơn 20 nguồn để giảm thiên vị và sai sót.
- Nó có giao diện web dễ sử dụng và hỗ trợ nhiều định dạng tệp như PDF, văn bản thuần túy, CSV, Excel, Markdown, PowerPoint và Word.
- Một lần chạy nghiên cứu trung bình tạo ra báo cáo dài 5-6 trang, có sẵn ở các định dạng như PDF, Docx và Markdown.
- GPT Researcher chứng minh khả năng của các hệ thống AI đa tác tử trong việc nâng cao hiệu quả và chất lượng nghiên cứu.
📌 GPT Researcher là một công cụ AI thực tế giúp cải thiện quá trình nghiên cứu trực tuyến bằng cách tập trung vào tốc độ, độ chính xác và giảm thiên vị. Nó sử dụng hệ thống đa tác tử để tạo ra các báo cáo nghiên cứu toàn diện từ hơn 20 nguồn trong vài phút, hỗ trợ ra quyết định dựa trên thông tin.
https://www.marktechpost.com/2024/06/19/gpt-researcher-an-autonomous-ai-agent-designed-for-comprehensive-online-research-on-a-variety-of-tasks/
- Các hệ thống đa tác nhân AI đang đứng ở vị trí tiên phong trong tự động hóa quy trình kinh doanh, với 75% tổ chức kỳ vọng công nghệ này sẽ mang lại thay đổi đáng kể hoặc đột phá trong tương lai.
- Các hệ thống này sử dụng mô hình ngôn ngữ lớn (LLM) để thiết lập, ưu tiên và tái ưu tiên các nhiệm vụ chuyên biệt, giúp tăng cường hiệu quả và đổi mới trong tự động hóa quy trình kinh doanh.
- Một hệ thống đa tác nhân có thể tự động hóa các quy trình quan trọng như giao dịch thanh toán, hỗ trợ dịch vụ khách hàng, dự đoán thiếu hụt hoặc dư thừa hàng tồn kho trong chuỗi cung ứng, và hỗ trợ bảo mật dữ liệu doanh nghiệp.
- Các công cụ đa tác nhân có sẵn từ các nhà cung cấp lớn và nguồn mở như AutoGen, AutoGPT, giúp các nhà phát triển xây dựng các hệ thống này.
- Việc triển khai các hệ thống đa tác nhân đòi hỏi một cách tiếp cận mô-đun trong kiến trúc hệ thống, giúp phát triển, thử nghiệm và khắc phục sự cố một cách hiệu quả, giảm thiểu sự gián đoạn.
- Các tổ chức cần phải giáo dục, thử nghiệm, giám sát và tinh chỉnh các hệ thống này, đảm bảo rằng chúng hoạt động theo đúng mục tiêu của tổ chức và tuân thủ các quy định.
- Dell Technologies cung cấp Dell AI Factory, kết hợp các dịch vụ và hệ sinh thái đối tác để giúp tổ chức đạt được các kết quả AI mong muốn, bao gồm chuẩn bị và tổng hợp dữ liệu, xác định và thực hiện các trường hợp sử dụng AI.
📌 Hệ thống đa tác nhân AI đang mở ra kỷ nguyên mới cho tự động hóa quy trình kinh doanh, với tiềm năng tăng cường hiệu quả và đổi mới. Dell Technologies cung cấp giải pháp AI tiên tiến giúp tổ chức đạt được mục tiêu AI mong muốn, đảm bảo hoạt động theo đúng mục tiêu và tuân thủ quy định.
https://www.forbes.com/sites/delltechnologies/2024/06/18/ai-agents-emerge-as-next-level-productivity-booster/
- IBM công bố tính khả dụng chung của IBM Concert, công cụ sử dụng AI tạo sinh để hợp lý hóa cách người dùng kiểm soát ứng dụng, cung cấp thông tin chi tiết về các ứng dụng và bộ công cụ được kết nối, đơn giản hóa quy trình tuân thủ.
- Số lượng ứng dụng cloud-native trên toàn cầu sẽ tăng từ 531,3 triệu hiện nay lên hơn 1 tỷ vào năm 2028. Doanh nghiệp cần nắm bắt sự bùng nổ dữ liệu và độ phức tạp mà sự tăng trưởng này mang lại.
- IBM Concert là công cụ quản lý và giám sát ứng dụng tự động, sử dụng AI được xây dựng trên nền tảng watsonx, giúp người dùng hiểu chi tiết về ứng dụng, môi trường chạy và các công cụ để kiểm soát chúng.
- IBM Concert có thể tạo phân tích, trực quan hóa, đề xuất, tăng tốc hành động và quy trình, phát hiện khoảng trống, giảm độ phức tạp, tăng cường khả năng phục hồi, hợp lý hóa hoạt động, đẩy nhanh đổi mới và kiểm soát tốt hơn chi phí CNTT.
- Trọng tâm ban đầu của IBM Concert là các trường hợp sử dụng như quản lý rủi ro và tuân thủ ứng dụng. Sắp tới, nó sẽ cải thiện quản lý chi phí và giải quyết các thách thức khác liên quan đến sự phát triển ứng dụng.
📌 IBM Concert, công cụ tự động hóa ứng dụng sử dụng AI tạo sinh, giúp doanh nghiệp đối phó với sự gia tăng nhanh chóng của ứng dụng cloud-native lên hơn 1 tỷ vào năm 2028. Nó cung cấp khả năng phân tích, trực quan hóa, đưa ra đề xuất để tăng tốc quy trình, giảm độ phức tạp, tăng cường khả năng phục hồi và kiểm soát tốt hơn chi phí CNTT.
https://siliconangle.com/2024/06/18/ibms-generative-ai-powered-application-automation-tool-concert-now-generally-available/
- SELFGOAL là framework AI tự thích ứng giúp các tác tử ngôn ngữ sử dụng cả kiến thức tiên nghiệm và phản hồi từ môi trường để đạt được các mục tiêu cấp cao.
- Framework này xây dựng một cây phân cấp các mục tiêu con dạng văn bản (GOALTREE), tác tử chọn mục tiêu phù hợp làm hướng dẫn dựa trên tình huống hiện tại.
- SELFGOAL có 2 module chính để vận hành GOALTREE: Search Module chọn các nút mục tiêu phù hợp nhất, Decomposition Module phân rã các nút mục tiêu thành các mục tiêu con cụ thể hơn.
- Act Module sử dụng các mục tiêu con được chọn làm hướng dẫn cho LLM thực hiện hành động.
- Phương pháp này cung cấp hướng dẫn chính xác cho các mục tiêu cấp cao, thích ứng với nhiều môi trường khác nhau, cải thiện đáng kể hiệu suất của tác tử ngôn ngữ.
- SELFGOAL vượt trội hơn hẳn các framework cơ sở trong nhiều môi trường với mục tiêu cấp cao, cho thấy cải thiện lớn hơn với các LLM lớn hơn.
- Không như các phương pháp phân rã tác vụ như ReAct và ADAPT có thể đưa ra hướng dẫn không phù hợp hoặc quá rộng, hay các phương pháp tóm tắt kinh nghiệm hậu kiểm như Reflexion và CLIN có thể tạo ra hướng dẫn quá chi tiết, SELFGOAL điều chỉnh hướng dẫn một cách động.
- SELFGOAL cũng thể hiện hiệu suất vượt trội với các LLM nhỏ hơn nhờ kiến trúc logic và có cấu trúc của nó.
📌 SELFGOAL là bước tiến đáng kể giúp các tác tử ngôn ngữ tự trị đạt được các mục tiêu cấp cao một cách nhất quán mà không cần huấn luyện lại thường xuyên. Bằng cách liên tục cập nhật GOALTREE, tác tử có thể điều hướng môi trường phức tạp với độ chính xác và khả năng thích ứng cao hơn. Tuy nhiên, vẫn cần cải thiện khả năng hiểu và tóm tắt của các mô hình để phát huy hết tiềm năng của SELFGOAL.
https://www.marktechpost.com/2024/06/14/selfgoal-an-artificial-intelligence-ai-framework-to-enhance-an-llm-based-agents-capabilities-to-achieve-high-level-goals/
- Nghiên cứu mới từ MIT cho thấy việc sử dụng AI tạo sinh có thể cải thiện đáng kể hiệu suất của robot hình người, giúp chúng thực hiện nhiều nhiệm vụ khác nhau với độ chính xác cao hơn.
- Một trong những thách thức lớn nhất trên con đường phát triển hệ thống đa mục đích là việc đào tạo. Các phương pháp hiện tại như học tăng cường và học bắt chước đang được kết hợp với mô hình AI tạo sinh để tạo ra các giải pháp hiệu quả hơn.
- MIT đã phát triển một phương pháp gọi là "policy composition" (PoCo), cho phép robot kết hợp thông tin từ các bộ dữ liệu nhỏ, cụ thể để thực hiện các nhiệm vụ phức tạp như đóng đinh và lật đồ vật bằng xẻng.
- Theo MIT, việc tích hợp các mô hình khuếch tán đã cải thiện hiệu suất nhiệm vụ của robot lên đến 20%, bao gồm khả năng thực hiện các nhiệm vụ yêu cầu nhiều công cụ và học hỏi/thích nghi với các nhiệm vụ mới.
- Hệ thống này có thể kết hợp thông tin từ các bộ dữ liệu khác nhau thành một chuỗi hành động cần thiết để thực hiện nhiệm vụ.
- Lirui Wang, tác giả chính của bài báo, cho biết: "Một trong những lợi ích của phương pháp này là chúng ta có thể kết hợp các chính sách để đạt được những điều tốt nhất từ cả hai thế giới. Ví dụ, một chính sách được đào tạo trên dữ liệu thực tế có thể đạt được sự khéo léo hơn, trong khi một chính sách được đào tạo trên mô phỏng có thể đạt được sự tổng quát hóa hơn."
- Mục tiêu của công trình này là tạo ra các hệ thống trí tuệ cho phép robot thay đổi các công cụ khác nhau để thực hiện các nhiệm vụ khác nhau, đưa ngành công nghiệp tiến gần hơn đến giấc mơ về hệ thống đa mục đích.
📌 Nghiên cứu từ MIT sử dụng AI tạo sinh để cải thiện hiệu suất robot hình người, giúp chúng thực hiện nhiều nhiệm vụ với độ chính xác cao hơn, tăng hiệu suất lên 20%. Phương pháp PoCo kết hợp thông tin từ các bộ dữ liệu khác nhau, đưa ngành công nghiệp tiến gần hơn đến hệ thống đa mục đích.
https://techcrunch.com/2024/06/12/generative-ai-takes-robots-a-step-closer-to-general-purpose/
- Zeta Labs, một startup tại London do các cựu kỹ sư Meta Fryderyk Wiatrowski và Peter Albert thành lập, đã ra mắt Jace, một AI agent được hỗ trợ bởi mô hình ngôn ngữ lớn (LLM) có thể thực hiện các hành động trên trình duyệt theo lệnh.
- Công ty đã huy động được 2,9 triệu USD trong vòng gọi vốn pre-seed, dẫn đầu bởi Daniel Gross, cựu giám đốc AI của Y Combinator và Nat Friedman, cựu CEO của GitHub.
- Jace không cần bất kỳ hướng dẫn nào và có thể giúp người dùng tiết kiệm thời gian bằng cách thực hiện các tác vụ trực tiếp trên trình duyệt, từ việc tìm kiếm chuyến bay, trả lời email đến thiết lập quy trình tuyển dụng trên LinkedIn và quản lý hàng tồn kho.
- Jace có thể thực hiện các tác vụ phức tạp như xây dựng một công ty hoàn chỉnh với kế hoạch kinh doanh và đăng ký, thậm chí tìm kiếm khách hàng đầu tiên để kiếm tiền.
- Jace sử dụng một mô hình LLM để xử lý tương tác dựa trên chat và mô hình tương tác web độc quyền của Zeta Labs, AWA-1 (Autonomous Web Agent-1), để chuyển đổi kế hoạch thành hành động trên trình duyệt.
- Mô hình cốt lõi của Jace dựa trên một mô hình nguồn mở và được tinh chỉnh bằng học tăng cường từ phản hồi của AI (RLAIF) và dữ liệu tổng hợp.
- Jace có hệ thống lý luận để tránh các vòng lặp khi xử lý các tác vụ có nhiều bước và bao gồm các biện pháp bảo vệ để đảm bảo thông tin đăng nhập của người dùng được lưu trữ ở định dạng mã hóa.
- Zeta Labs đang làm việc với một số đối tác thiết kế để tinh chỉnh Jace và chuẩn bị cho việc phát hành chung, đồng thời phát triển phiên bản thứ hai của mô hình AWA, lớn hơn và nhanh hơn, có khả năng xử lý các tác vụ phức tạp hơn.
- Công ty hy vọng sẽ cung cấp Jace như một trợ lý hữu ích cho người tiêu dùng và các doanh nghiệp nhỏ muốn tự động hóa các tác vụ trình duyệt lặp đi lặp lại trong các lĩnh vực như tuyển dụng, thương mại điện tử, tiếp thị và bán hàng.
- Sẽ có một gói miễn phí với giới hạn số lượng tin nhắn, sau khi hết hạn, người dùng sẽ phải trả một mức giá cố định là 45 USD/tháng.
📌 Zeta Labs ra mắt Jace, một AI agent có thể tự động hóa các tác vụ trình duyệt mà không cần hướng dẫn, với khả năng thực hiện các tác vụ phức tạp và bảo mật thông tin người dùng. Công ty đã huy động được 2,9 triệu USD và dự kiến sẽ cung cấp Jace với giá 45 USD/tháng.
https://venturebeat.com/ai/exclusive-former-meta-engineers-launch-jace-an-ai-agent-that-works-independently/
- AutoGen của Microsoft sử dụng quy trình đa tác tử để thực hiện các tác vụ phức tạp bằng cách tận dụng sức mạnh của các mô hình nền tảng lớn.
- Nền tảng chia nhỏ các vấn đề phức tạp thành các thành phần có thể quản lý được và giao vai trò chuyên biệt cho từng tác tử dựa trên khả năng độc đáo của chúng.
- Các tác tử chính của AutoGen bao gồm: Trợ lý chung, Thiết bị đầu cuối máy tính, Máy chủ web và Người điều phối.
- AutoGen là một nền tảng nguồn mở, có sẵn miễn phí trên GitHub, cho phép các nhà phát triển và nhà nghiên cứu khám phá và đóng góp vào sự phát triển của hệ thống đa tác tử.
- Nền tảng đã giành được vị trí hàng đầu trên bảng xếp hạng Gaia Benchmark và thể hiện khả năng tăng gấp đôi hiệu suất trong các câu hỏi khó đòi hỏi nhiều hành động và sử dụng công cụ.
- Quy trình đa tác tử của AutoGen tuân theo một cách tiếp cận có hệ thống, bao gồm: Truy vấn ban đầu, Tạo sổ cái, Ủy quyền tác vụ, Giám sát tiến độ, Cập nhật sổ cái và Phân công lại tác vụ.
- Các phát triển trong tương lai nhằm giải quyết các bài kiểm tra phức tạp hơn và các tình huống thực tế, đẩy ranh giới của những gì có thể với hệ thống đa tác tử.
📌 AutoGen của Microsoft đại diện cho một bước tiến đáng kể trong lĩnh vực quy trình đa tác tử để thực hiện tác vụ phức tạp. Với khả năng vượt trội trong các bài kiểm tra và tiềm năng to lớn để cách mạng hóa cách tiếp cận các vấn đề phức tạp, AutoGen đang dẫn đầu xu hướng và mở ra một tương lai tươi sáng hơn bao giờ hết cho việc giải quyết tác vụ với sự hỗ trợ của AI.
https://www.geeky-gadgets.com/microsoft-ai-agents-and-autogen/
- Kylan Gibbs, đồng sáng lập kiêm giám đốc sản phẩm của Inworld AI, chia sẻ tầm nhìn về tương lai của AI và kể chuyện trong trò chơi tại hội nghị TED 2024.
- Với các tác nhân AI mà Inworld tạo ra, khán giả có thể vượt ra ngoài kịch bản và khám phá những trải nghiệm chưa được khám phá trong trò chơi điện tử và các trải nghiệm tương tác khác.
- AI mang đến tiềm năng cho sự phản hồi theo thời gian thực, nơi mọi hành động đều có hệ quả tức thì và lâu dài, duy nhất cho từng lựa chọn riêng biệt mà mỗi người chơi đưa ra.
- Inworld AI đã hợp tác với Operative Games để xây dựng trải nghiệm tương tác có tên Storyweaver, thể hiện sức mạnh của AI trong kể chuyện. Trải nghiệm tận dụng tính năng đa tác nhân của Inworld để điều phối các cuộc trò chuyện giữa AI với AI và AI với con người.
- Tương lai của kể chuyện sẽ cho phép bạn tham gia vào việc tạo ra câu chuyện theo cách chưa từng có trước đây. Các thử nghiệm trong tâm lý học nhận thức đã liên tục tìm thấy mối liên hệ giữa cảm giác quyền tự chủ của một người và trải nghiệm trạng thái flow của họ trong các trải nghiệm tương tác như trò chơi điện tử.
- Inworld AI đang giúp các studio trò chơi, công ty giải trí, đại lý quảng cáo và thương hiệu tích hợp các tác nhân AI cho thế hệ tiếp theo của truyền thông tương tác và trò chơi. Họ đã làm việc hoặc có quan hệ đối tác với các công ty như Ubisoft, Xbox, NVIDIA, Niantic, NetEase Games, Shiseido, LGU+, Comcast NBC Universal, v.v.
📌 Inworld AI đang mở ra tiềm năng to lớn của AI trong việc kể chuyện tương tác, biến khán giả trở thành đồng tác giả của câu chuyện. Với các tác nhân AI, trò chơi và truyền thông có thể tạo ra những trải nghiệm phong phú, đa dạng và có ý nghĩa hơn bao giờ hết, nơi mỗi tương tác dẫn đến kết quả độc đáo và đáng nhớ.
https://venturebeat.com/latest-games-reviews/ai-and-the-future-of-storytelling-inworld-ai/
- Tác giả đã mất 4 ngày không ngủ và tiêu tốn gần 300 USD để xây dựng thành công một công ty khởi nghiệp hoàn toàn sử dụng các AI agent để vận hành. Quá trình phát triển gặp nhiều khó khăn và sai lầm như: không nên dùng cùng một LLM cho tất cả agent, cần kết hợp cả LLM cục bộ và từ xa, các agent trò chuyện quá nhiều dẫn đến hết token, cần chú ý kỹ đến việc mô tả nhiệm vụ và kết quả mong đợi cho từng agent.
- Hệ thống bao gồm các thành phần chính:
+ Cơ sở dữ liệu ứng viên tiềm năng được tạo giả lập với thông tin như tên, bằng cấp, kinh nghiệm, kỹ năng.
+ Cấu hình LLM trong file .env (API keys của Groq, OpenAI) và Modelfile (tham số nhiệt độ, từ dừng, hệ thống tin nhắn).
+ Mã nguồn Python cho các lớp agent (RecruitmentAgents) và nhiệm vụ (RecruitmentTasks).
- Các agent chuyên biệt được tạo ra gồm:
+ Job Hunter (tìm việc làm): Sử dụng công cụ Google Jobs API để thu thập dữ liệu việc làm chi tiết từ các nền tảng tuyển dụng, lưu kết quả dưới dạng JSON.
+ Resume Analyst (phân tích CV): Đánh giá từng CV ứng viên trong cơ sở dữ liệu, so sánh với yêu cầu công việc để lọc ra ứng viên phù hợp nhất.
+ Candidate Engagement (tiếp cận ứng viên): Soạn thảo tin nhắn tiếp cận được cá nhân hóa cho ứng viên, nhấn mạnh sự phù hợp giữa năng lực, sở thích của ứng viên với vị trí và văn hóa công ty.
+ Company Investigator (tìm hiểu về công ty): Thu thập thông tin về môi trường, đánh giá của nhân viên, danh tiếng trong ngành của các công ty đang tuyển dụng.
+ Workflow Orchestrator (điều phối quy trình): Tổng hợp thông tin từ các agent khác để đưa ra khuyến nghị ứng viên phù hợp nhất cho từng vị trí và công ty dựa trên cả năng lực chuyên môn và sự phù hợp về văn hóa.
- Các nhiệm vụ tuyển dụng được xác định rõ ràng về mục đích, hướng dẫn cho agent thực hiện và kết quả mong đợi. Ví dụ:
+ Tìm kiếm việc làm: Tìm và thu thập dữ liệu việc làm trong lĩnh vực tài chính, công nghệ, an ninh mạng. Kết quả là file JSON chứa thông tin chi tiết về yêu cầu kỹ năng, bằng cấp, mức lương (nếu có).
+ Phân tích CV: Đánh giá CV ứng viên dựa trên các tiêu chí phù hợp với vị trí tuyển dụng. Kết quả là danh sách rút gọn ứng viên tiềm năng nhất.
+ Tiếp cận ứng viên: Soạn tin nhắn hấp dẫn, cá nhân hóa để thu hút sự chú ý của ứng viên được chọn. Kết quả là liên hệ ban đầu với ứng viên tiềm năng.
+ Tìm hiểu công ty: Tìm hiểu sâu về văn hóa, giá trị của công ty đang tuyển dụng. Kết quả là hồ sơ công ty chi tiết giúp đối sánh ứng viên phù hợp.
+ Đối sánh cuối cùng: Tổng hợp thông tin từ phân tích CV và tìm hiểu công ty để tìm ra sự kết hợp tốt nhất giữa ứng viên - vị trí - công ty. Kết quả là đề xuất tuyển dụng thành công.
- Quy trình mô phỏng tuyển dụng được thực thi, các agent cộng tác với nhau để hoàn thành các nhiệm vụ, truyền kết quả qua lại và cuối cùng đưa ra được những ứng viên phù hợp nhất với vị trí và văn hóa công ty:
+ Job Hunter tìm kiếm và thu thập dữ liệu việc làm trong lĩnh vực tài chính, ví dụ vị trí Financial Analyst tại JP Morgan Chase.
+ Resume Analyst phân tích CV của John Smith, Emma Johnson, Michael Williams và xác định John Smith là ứng viên tiềm năng nhất cho vị trí Financial Analyst dựa trên sự phù hợp về bằng cấp, kỹ năng, kinh nghiệm.
+ Candidate Engagement soạn tin nhắn tiếp cận được cá nhân hóa cho John Smith, nhấn mạnh sự phù hợp giữa năng lực, sở thích của John với vị trí Financial Analyst và văn hóa của JP Morgan Chase.
+ Company Investigator tìm hiểu sâu về văn hóa, giá trị của JP Morgan Chase và xác nhận sự tương đồng với kỳ vọng nghề nghiệp của John Smith.
+ Workflow Orchestrator tổng hợp thông tin và đưa ra đề xuất John Smith là ứng viên phù hợp nhất cho vị trí Financial Analyst tại JP Morgan Chase.
📌 Bài viết cho thấy tiềm năng to lớn của việc ứng dụng AI và các hệ thống agent tự trị trong tự động hóa quy trình tuyển dụng. Mặc dù còn nhiều thách thức và hạn chế như tốn kém (gần 300 USD), mất nhiều thời gian thử nghiệm (4 ngày không ngủ), cần chú ý tới việc lựa chọn LLM và mô tả nhiệm vụ cho từng agent, nhưng đây hứa hẹn sẽ là xu hướng công nghệ đột phá trong tương lai, giúp các doanh nghiệp tối ưu hóa nguồn nhân lực và tiết kiệm đáng kể thời gian, chi phí tuyển dụng.
https://ai.plainenglish.io/finally-got-small-company-running-with-100-ai-agents-part-3-34fa2f91b943
- Bài viết hướng dẫn thiết kế và lập trình các AI agent để xây dựng một startup tuyển dụng nhỏ, tìm hiểu cách xác định vai trò, mục tiêu, câu chuyện của các agent và giao nhiệm vụ, điều phối chúng.
- Lớp RecruitmentAgents được định nghĩa làm bản thiết kế cho các AI agent, phương thức __init__ khởi tạo một thể hiện của mô hình ngôn ngữ (ChatOpenAI) để hỗ trợ khả năng ra quyết định của agent.
- Mỗi agent được biểu diễn bằng một phương thức riêng trong lớp RecruitmentAgents, trả về các thể hiện của lớp Agent từ thư viện crewai với các thuộc tính được điều chỉnh phù hợp với vai trò, mục tiêu, câu chuyện và công cụ của agent.
- Các agent được thiết kế bao gồm:
+ Job Hunter (tìm kiếm cơ hội việc làm): Nhiệm vụ tìm kiếm việc làm trên các trang web và nền tảng khác nhau trong các lĩnh vực tài chính, công nghệ, sản xuất. Tổng hợp danh sách đầy đủ các cơ hội việc làm phù hợp, bao gồm chức danh công việc, tên công ty và địa điểm. Kết quả đầu ra là tệp JSON chứa dữ liệu việc làm đã thu thập, được tổ chức theo lĩnh vực.
+ Resume Analyst (phân tích CV): Nhiệm vụ đánh giá CV ứng viên một cách hiệu quả để xác định những ứng viên hàng đầu cho các vị trí tuyển dụng đã xác định. Phân tích kỹ năng, kinh nghiệm và trình độ của ứng viên. Kết quả đầu ra là danh sách rút gọn các ứng viên hàng đầu phù hợp với các vị trí tuyển dụng.
+ Candidate Engagement (tiếp cận ứng viên): Nhiệm vụ tạo ra các thông điệp tiếp cận hấp dẫn để thu hút các ứng viên tiềm năng do Resume Analyst xác định. Thông điệp được cá nhân hóa, truyền tải bản chất của cơ hội việc làm và văn hóa doanh nghiệp một cách hấp dẫn. Kết quả đầu ra là liên hệ ban đầu với các ứng viên tiềm năng, tạo tiền đề cho các bước tuyển dụng tiếp theo.
+ Company Culture Investigator (điều tra văn hóa công ty): Nhiệm vụ tìm hiểu sâu về văn hóa tổ chức và giá trị của các công ty có vị trí tuyển dụng. Đạt được sự hiểu biết toàn diện về môi trường làm việc, đánh giá của nhân viên và danh tiếng trong ngành. Kết quả đầu ra là hồ sơ công ty chi tiết, hỗ trợ việc kết hợp ứng viên với môi trường tổ chức phù hợp.
+ Workflow Orchestrator (điều phối quy trình): Nhiệm vụ tổng hợp thông tin từ các nhiệm vụ phân tích CV và nghiên cứu công ty, kết hợp các ứng viên được chọn với các vị trí tuyển dụng và công ty phù hợp dựa trên trình độ chuyên môn và sự phù hợp về văn hóa. Kết quả đầu ra là việc tuyển dụng thành công, phù hợp với cả nguyện vọng nghề nghiệp và giá trị của tổ chức.
- Mỗi agent được gán các nhiệm vụ cụ thể như tìm kiếm việc làm, phân tích CV, tiếp cận ứng viên, nghiên cứu văn hóa công ty, kết hợp thông tin và đối sánh ứng viên với vị trí phù hợp.
- Kết quả đầu ra mong đợi của các nhiệm vụ được xác định rõ ràng như tệp JSON chứa dữ liệu việc làm, danh sách ứng viên tiềm năng, hồ sơ công ty chi tiết, thông điệp tiếp cận hấp dẫn, vị trí tuyển dụng thành công.
📌 Bài viết cung cấp hướng dẫn chi tiết về thiết kế và lập trình 5 AI agent chuyên biệt để xây dựng một startup tuyển dụng nhỏ, bao gồm: Job Hunter, Resume Analyst, Candidate Engagement, Company Culture Investigator và Workflow Orchestrator. Mỗi agent đảm nhận các nhiệm vụ cụ thể và phối hợp chặt chẽ với nhau, từ tìm kiếm việc làm, phân tích CV, tiếp cận ứng viên, nghiên cứu văn hóa công ty đến kết hợp thông tin và đối sánh ứng viên với vị trí phù hợp. Với sự phân công nhiệm vụ rõ ràng và đầu ra mong đợi cụ thể, quy trình tuyển dụng hứa hẹn sẽ diễn ra trơn tru và hiệu quả, giúp kết nối nhân tài phù hợp với các vị trí và văn hóa doanh nghiệp.
https://ai.plainenglish.io/ai-agents-the-secret-sauce-for-building-a-successful-startup-part-2-1320ba329734
- Tác tử AI là thực thể nhân tạo có khả năng nhận thức môi trường, đưa ra quyết định và hành động dựa trên các công cụ sẵn có.
- Hiện tại, các tác tử AI trong các lĩnh vực cụ thể đang ở cấp độ 2-3, với khả năng tự động hóa các tác vụ chiến lược ở mức 50-90% so với người lớn.
- Ví dụ thực tế cho thấy cách một tác tử AI dựa trên LangChain xử lý câu hỏi phức tạp bằng cách phân tích thành các bước, sử dụng các công cụ như tìm kiếm web, tính toán, và LLM để đưa ra câu trả lời cuối cùng.
- Cấu trúc cơ bản của tác tử AI gồm LLM làm nền tảng và các công cụ với khả năng khác nhau. Số lượng và năng lực của các công cụ quyết định sức mạnh của tác tử.
- Khi triển khai tác tử AI cần lưu ý về khả năng cảm biến, sự phụ thuộc vào API của LLM, chi phí cao do nhiều lần gọi API, độ trễ, khả năng không đưa ra kết luận.
- Thuật ngữ "tác tử" mô tả các thực thể thể hiện hành vi thông minh như tự chủ, phản ứng, chủ động và tương tác xã hội.
- Học chuyển giao cho phép tác tử áp dụng kiến thức từ tác vụ này sang tác vụ khác, tăng tính linh hoạt.
📌 AI agent tự chủ đại diện cho bước tiến quan trọng trong công nghệ, hứa hẹn cách mạng hóa nhiều ngành công nghiệp. Tuy nhiên, việc triển khai đòi hỏi phải cân nhắc kỹ về chi phí, độ trễ, sự phụ thuộc vào LLM API, và các vấn đề về đạo đức, trách nhiệm và thiên vị trong ra quyết định.
https://cobusgreyling.medium.com/five-levels-of-ai-agents-5ac39a7b07ed
- Bài viết hướng dẫn chi tiết cách một cá nhân (solopreneur) có thể xây dựng công ty startup tuyển dụng sử dụng các AI Agent chuyên biệt để tự động hóa quy trình.
- Giới thiệu đội ngũ 5 AI Agent:
+ ResuMate: Phân tích CV, lọc ra ứng viên phù hợp nhất
+ JobHuntr: Tìm kiếm cơ hội việc làm trên mạng
+ CoverStar: Soạn tin nhắn hấp dẫn, gửi đến ứng viên tiềm năng
+ OrgSleuth: Nghiên cứu văn hóa, giá trị của công ty tuyển dụng
+ MetaMinion: Điều phối luồng công việc giữa các Agent, ghép nối ứng viên phù hợp
- Cấu trúc tổ chức startup gồm 5 bộ phận tương ứng chức năng của từng Agent:
1. Tìm kiếm việc làm (JobHuntr)
2. Phân tích CV (ResuMate)
3. Tiếp cận ứng viên (CoverStar)
4. Nghiên cứu công ty (OrgSleuth)
5. Điều phối quy trình (MetaMinion)
- Mô tả chi tiết quy trình hoạt động 9 bước:
1. Ứng viên nộp CV qua portal/email
2. ResuMate phân tích CV, đánh giá mức độ phù hợp
3. JobHuntr liên tục tìm kiếm việc làm phù hợp trên mạng
4. CoverStar gửi tin nhắn tiếp cận ứng viên tiềm năng
5. OrgSleuth nghiên cứu văn hóa, môi trường làm việc công ty
6. MetaMinion tổng hợp dữ liệu, ghép nối ứng viên vừa phù hợp kỹ năng vừa hợp văn hóa công ty
7. CoverStar liên hệ ứng viên để phỏng vấn
8. Tiến hành phỏng vấn nhiều vòng, chọn ứng viên phù hợp nhất
9. Tuyển dụng và onboard nhân viên mới
- Các AI Agent mang lại nhiều lợi ích:
+ Xử lý khối lượng lớn CV, tin tuyển dụng nhanh chóng, chính xác
+ Phân tích sâu về kỹ năng, kinh nghiệm ứng viên thay vì chỉ dựa vào từ khóa
+ Tiếp cận ứng viên một cách cá nhân hóa
+ Đánh giá khách quan, loại bỏ định kiến trong tuyển dụng
+ Tìm được ứng viên phù hợp nhất cả về năng lực và văn hóa
→ Rút ngắn thời gian, nâng cao chất lượng tuyển dụng
- Bài viết giúp người đọc:
+ Thấy được tiềm năng của AI trong khởi nghiệp, đặc biệt với mô hình solopreneur
+ Hiểu rõ cách thức vận hành của một startup tuyển dụng tự động hóa
+ Hình dung tương lai của ngành tuyển dụng và thị trường lao động
+ Có ý tưởng, cảm hứng để phát triển các dự án kinh doanh dựa trên AI
📌 Ứng dụng đội ngũ 5 AI Agent chuyên biệt (ResuMate, JobHuntr, CoverStar, OrgSleuth, MetaMinion) có thể giúp một cá nhân xây dựng công ty startup tuyển dụng vận hành hiệu quả với nguồn lực hạn chế. Mô hình này hứa hẹn cách mạng hóa ngành tuyển dụng, mở ra cơ hội việc làm tốt hơn cho ứng viên và giúp doanh nghiệp tìm được nhân tài nhanh chóng, chính xác hơn. Đây là một minh chứng cho sức mạnh của trí tuệ nhân tạo trong việc nâng cao năng lực cạnh tranh cho các doanh nghiệp vừa và nhỏ.
https://ai.plainenglish.io/how-can-we-build-a-small-startup-using-ai-agent-part-1-7e71d057dd4f
- Các nhà nghiên cứu tại Meta, Allen Institute for AI và Đại học Washington đã giới thiệu Husky, một agent ngôn ngữ mã nguồn mở mới được thiết kế cho các tác vụ lập luận phức tạp, nhiều bước.
- Không giống như các mô hình hiện có tập trung vào các lĩnh vực cụ thể, Husky hoạt động trên một không gian hành động thống nhất, có thể xử lý các thử thách đa dạng như lập luận số, bảng và dựa trên kiến thức.
- Husky lặp lại giữa việc tạo ra các hành động để giải quyết tác vụ và thực thi các hành động này bằng cách sử dụng các mô hình chuyên gia, liên tục cập nhật trạng thái giải pháp của nó.
- Quá trình lặp lại này đã được chứng minh là một điểm khác biệt quan trọng, cho phép Husky vượt trội hơn các agent trước đó trên 14 bộ dữ liệu được sử dụng để đánh giá.
- Một trong những đổi mới chính của Husky là khả năng quản lý lập luận đa công cụ. Nó xuất sắc trong các tác vụ đòi hỏi truy xuất kiến thức còn thiếu và thực hiện các phép tính số, đạt được hiệu suất ngang bằng hoặc vượt trội hơn các mô hình tiên tiến nhất như GPT-4.
- Các nhà nghiên cứu cũng đã giới thiệu HuskyQA, một bộ đánh giá được thiết kế đặc biệt để stress test các agent ngôn ngữ trên các tác vụ lập luận đa công cụ, đặc biệt là để thực hiện lập luận số và truy xuất kiến thức còn thiếu.
- Các agent ngôn ngữ thực hiện các tác vụ phức tạp bằng cách sử dụng các công cụ để thực hiện từng bước một cách chính xác. Tuy nhiên, hầu hết các agent hiện có đều dựa trên các mô hình độc quyền hoặc được thiết kế để nhắm mục tiêu các tác vụ cụ thể, chẳng hạn như toán học hoặc trả lời câu hỏi nhiều bước.
- Mặc dù các agent AI đã thu hút sự chú ý đáng kể trong vài năm qua, việc giới thiệu một agent có khả năng lập luận trên một số tác vụ phức tạp có nghĩa là khả năng của agent đang mở rộng nhanh chóng.
📌 Husky, một agent ngôn ngữ mã nguồn mở mới của Meta AI, có khả năng xử lý các tác vụ lập luận phức tạp và đa dạng nhờ không gian hành động thống nhất. Với khả năng lập luận đa công cụ vượt trội, đặc biệt trong các tác vụ đòi hỏi truy xuất kiến thức và tính toán số, Husky đã vượt qua 14 bộ dữ liệu đánh giá và đạt hiệu suất ngang bằng hoặc cao hơn các mô hình tiên tiến như GPT-4.
https://analyticsindiamag.com/meta-ai-unveils-husky-a-unified-open-source-language-agent/
- AI agent là thực thể phần mềm tự trị, thường được sử dụng để bổ sung cho các mô hình ngôn ngữ lớn (LLM).
- Các LLM gần đây như GPT-4o, Gemini Pro, Claude Opus đã thể hiện khả năng lập luận tiên tiến. Các mô hình mã nguồn mở như Mistral và Llama 3 cũng ngang tầm với các mô hình thương mại.
- AI agent dựa vào LLM để lập luận, đồng thời bổ sung các chức năng mới cho LLM. Có thể coi LLM như kernel và AI agent như các chương trình trong hệ điều hành.
- Các hạn chế của LLM: không có bộ nhớ, xử lý đồng bộ, có thể tạo ra thông tin sai lệch, không truy cập internet, kém toán học, đầu ra không xác định.
- AI agent khắc phục các hạn chế trên bằng cách: duy trì bộ nhớ và ngữ cảnh, xử lý bất đồng bộ và song song, kiểm tra dữ liệu thực tế, tích hợp công cụ toán học, chuẩn hóa định dạng đầu ra, tương tác theo nhân vật.
- Ví dụ: AI agent có thể kết hợp duyệt web, môi trường thực thi code với phân tích của LLM để tạo ra câu trả lời chi tiết.
📌 AI agent đóng vai trò quan trọng trong việc bổ sung khả năng của các mô hình ngôn ngữ lớn bằng cách kết nối chúng với các công cụ và dịch vụ bên ngoài cần thiết để hoàn thành nhiệm vụ, giúp khắc phục nhiều hạn chế vốn có của LLM như thiếu bộ nhớ, xử lý tuần tự, không truy cập dữ liệu thực tế.
https://thenewstack.io/ai-agents-key-concepts-and-how-they-overcome-llm-limitations/
- Generative AI agents (hay còn gọi là agentic AI) có tiềm năng tạo ra bước đột phá trong cách tiếp cận kiến trúc AI tạo sinh trên điện toán đám mây bằng cách mang lại tính tự chủ, thông minh và hiệu quả.
- Điểm cốt lõi của agentic AI là khả năng tự chủ và tạo điều kiện cho hành vi phân tán, năng động. Các AI agents có thể độc lập khởi tạo, lập kế hoạch và hoàn thành các tác vụ phức tạp vốn đòi hỏi sự can thiệp đáng kể của con người.
- Agentic AI là hệ thống AI tiên tiến được thiết kế để đạt được các mục tiêu phức tạp và quản lý quy trình làm việc với sự giám sát tối thiểu của con người. Nó thể hiện khả năng hiểu ngữ cảnh, ra quyết định, thích nghi với hoàn cảnh thay đổi và tự hoàn thành các tác vụ đa diện.
- Các AI agents được trang bị các thuật toán tinh vi cho phép chúng đánh giá các lựa chọn khác nhau, cân bằng đánh đổi và phản ứng hiệu quả với các tình huống mới. Chúng có thể tham khảo nhiều LLM để có cái nhìn tổng quan về vấn đề cần giải quyết.
- Agentic AI triển khai trong quản lý chuỗi cung ứng có thể xử lý tự động nhiều hoạt động hậu cần, đảm bảo hàng hóa được vận chuyển, lưu trữ và giao hàng hiệu quả bằng cách phân tích và phối hợp dữ liệu từ nhiều nguồn.
- Tuy nhiên, việc xây dựng và triển khai AI agents khá phức tạp. Các kiến trúc sư và lập trình viên có khả năng thiết kế, xây dựng hiệu quả AI agents còn khá hiếm. Ngoài ra, không nên đặt quá nhiều tính năng vào AI agents, thay vào đó chúng nên tương tác với nhiều LLM để xử lý các yêu cầu nặng hơn.
📌 Generative AI agents hứa hẹn sẽ cách mạng hóa kiến trúc AI với khả năng tự chủ, thông minh và hiệu quả trong xử lý các tác vụ phức tạp. Tuy nhiên, việc xây dựng và triển khai chúng vẫn còn nhiều thách thức. Các kiến trúc sư và lập trình viên cần tìm hiểu kỹ về lợi ích cũng như khó khăn của công nghệ này trước khi áp dụng rộng rãi.
https://www.infoworld.com/article/3715457/generative-ai-agents-will-revolutionize-ai-architecture.html
- Jensen Huang, CEO của NVIDIA, tin rằng làn sóng tiếp theo của AI là AI vật lý, sẽ cách mạng hóa các ngành công nghiệp thông qua robotics.
- AI vật lý là các mô hình có thể hiểu chỉ dẫn và tự động thực hiện các tác vụ phức tạp trong thế giới thực.
- NVIDIA đang đặt cược vào nền tảng Omniverse để mô phỏng và huấn luyện robot thông qua kỹ thuật sinh đôi kỹ thuật số.
- Các LLM đa phương thức giúp robot học, nhận thức và hiểu thế giới xung quanh, lên kế hoạch hành động.
- Tuy nhiên, mô phỏng không phải là cách duy nhất để huấn luyện robot. Một số tác vụ học tốt hơn thông qua bắt chước.
- NVIDIA hợp tác với nhiều hãng sản xuất lớn để xây dựng nhà máy AI, thúc đẩy sản xuất xe điện và xe tự lái.
- Cuộc đua robotics đang nóng lên với sự đầu tư mạnh mẽ từ các công ty công nghệ lớn như NVIDIA, Microsoft, OpenAI.
📌 NVIDIA đang đặt cược lớn vào AI vật lý, tin rằng nó sẽ cách mạng hóa mọi ngành công nghiệp thông qua robotics. Nền tảng mô phỏng Omniverse và các LLM đa phương thức sẽ đóng vai trò then chốt trong việc huấn luyện robot tự động hóa. Tuy nhiên, mô phỏng không phải là cách tiếp cận duy nhất. Cuộc đua robotics đang nóng lên với sự tham gia của nhiều ông lớn công nghệ.
https://analyticsindiamag.com/the-next-wave-of-ai-is-physical-ai-says-jensen-huang/
- Việc các chatbot AI hợp tác với nhau có thể giúp chúng trở nên hiệu quả hơn trong việc giải quyết các vấn đề khó.
- Tác giả đã thử nghiệm với AutoGen, một framework nguồn mở cho phép tạo ra nhiều tác tử AI với các vai trò và mục tiêu khác nhau để giải quyết các vấn đề cụ thể.
- Hai tác tử AI "phóng viên" và "biên tập viên" đã thảo luận về cách viết bài về sự hợp tác giữa các tác tử AI, đề cập đến các ứng dụng trong y tế, giao thông, bán lẻ và các vấn đề đạo đức.
- Các nghiên cứu cho thấy việc các tác tử AI hợp tác có thể giúp giải quyết các bài toán lớp 5, các vấn đề cờ vua và phân tích, cải tiến mã máy tính tốt hơn so với một tác tử đơn lẻ.
- Việc gán các đặc điểm tính cách khác nhau cho các tác tử AI có thể tinh chỉnh hiệu suất hợp tác của chúng.
- Trong một thử nghiệm do Cơ quan Dự án Nghiên cứu Quốc phòng Tiên tiến (DARPA) của Lầu Năm Góc ủy quyền, một nhóm các tác tử AI đã phát triển một hệ thống phân cấp nội bộ khi tìm kiếm bom ảo.
- Cách tiếp cận hợp tác có thể mạnh mẽ nhưng cũng có thể dẫn đến các lỗi mới do tăng tính phức tạp.
- Mọi người đang thích ứng framework AutoGen nguồn mở theo nhiều cách thú vị như tạo ra các phòng biên tập mô phỏng để tạo ý tưởng viết văn và một "doanh nghiệp trong hộp" ảo với các tác tử đảm nhận các vai trò khác nhau.
📌 Sự hợp tác giữa các chatbot AI đang cho thấy tiềm năng cải thiện đáng kể hiệu suất trong việc giải quyết các vấn đề phức tạp. Tuy nhiên, cách tiếp cận này cũng đặt ra những thách thức mới liên quan đến tính phức tạp và các vấn đề đạo đức cần được giải quyết trước khi có thể áp dụng rộng rãi.
https://www.wired.com/story/chatbot-teamwork-makes-the-ai-dream-work/
- Những tiến bộ gần đây trong lĩnh vực trí tuệ nhân tạo (AI) đã giúp nâng cấp đáng kể "bộ não" của robot. Công nghệ tương tự như chatbot Chatgpt hay hệ thống tạo ảnh DALL-E có thể được áp dụng cho robot.
- Các mô hình AI đa phương thức (multimodal) kết hợp hiểu ngôn ngữ, thị giác với dữ liệu từ cảm biến và cơ cấu chấp hành của robot. Điều này cho phép giao tiếp với robot bằng ngôn ngữ thông thường.
- Robot có thể giải thích lý do đằng sau hành động của chúng. Việc lập trình và gỡ lỗi robot trở nên dễ dàng hơn vì "bộ não" của chúng không còn là hộp đen khó hiểu.
- Robot đang trở nên giỏi hơn trong việc học nhanh thông qua bắt chước và khái quát hóa từ kỹ năng này sang kỹ năng khác. Điều này mở đường cho robot di chuyển ra khỏi nhà máy, kho hàng.
- Nhiều công ty và nhóm nghiên cứu đang sử dụng các mô hình AI mới nhất để chế tạo robot nhân hình, vì hầu hết thế giới được thiết kế cho con người di chuyển.
- Thị trường lao động ở các nước giàu đang thắt chặt và già hóa. Robot thông minh hơn có thể tăng năng suất, đồng thời hỗ trợ nấu ăn, dọn dẹp, chăm sóc người cao tuổi và người có nhu cầu.
- Các nền kinh tế phát triển sẽ cần nhiều tự động hóa hơn để duy trì mức sống. Hàn Quốc, Nhật Bản và Trung Quốc nằm trong top 5 quốc gia có tỷ lệ robot trên mỗi công nhân sản xuất cao nhất, đồng thời cũng già hóa nhanh chóng.
- Trong những năm tới, thái độ có thể chuyển từ sợ hãi sự xuất hiện của robot sang mong muốn chúng đến sớm hơn.
📌 Những tiến bộ trong AI đang giúp robot trở nên thông minh, dễ lập trình và đáng tin cậy hơn. Điều này mở ra tiềm năng to lớn cho robot hỗ trợ con người trong nhiều lĩnh vực, từ sản xuất đến chăm sóc. Các nền kinh tế già hóa sẽ cần nhiều robot hơn để duy trì năng suất và mức sống.
https://www.economist.com/leaders/2024/06/06/three-reasons-why-its-good-news-that-robots-are-getting-smarter
- Anthropic giới thiệu tính năng "tool use" (hay "function calling") cho chatbot Claude, cho phép tạo trợ lý email, bot mua sắm hay các giải pháp cá nhân hóa khác bằng cách kết nối với bất kỳ API bên ngoài nào.
- Công cụ này có thể phân tích dữ liệu để đưa ra đề xuất sản phẩm dựa trên lịch sử mua hàng, trả lời nhanh các yêu cầu của khách hàng như theo dõi trạng thái đơn hàng hay hỗ trợ kỹ thuật.
- Nó cũng có thể xử lý hình ảnh, ví dụ như một trợ lý tư vấn thiết kế nội thất ảo có thể phân tích ảnh phòng và đưa ra gợi ý trang trí phù hợp.
- Trợ lý AI này sẽ có mặt trên Messages API của Anthropic, Amazon Bedrock và Google Vertex AI.
- Giá dịch vụ dựa trên lượng văn bản Claude xử lý, tính bằng "token". 1.000 token tương đương khoảng 750 từ. Gói Haiku rẻ nhất có giá khoảng 0,25 USD/triệu token đầu vào và 1,25 USD/triệu token đầu ra.
- Anthropic đã thử nghiệm beta công cụ từ tháng 4 với vài nghìn khách hàng. Một khách hàng tiêu biểu là Study Fetch, sử dụng nó để xây dựng ứng dụng gia sư AI cá nhân hóa Spark.E.
- Xu hướng phát triển của công nghệ này là hướng tới các trợ lý/tác tử AI. Google và OpenAI cũng đang phát triển các trợ lý tương tự.
📌 Anthropic cho ra mắt tính năng mới trên chatbot Claude, cho phép người dùng tạo ra các trợ lý AI cá nhân hóa như bot mua sắm, trợ lý email thông qua việc tích hợp API bên ngoài. Công cụ này có khả năng phân tích dữ liệu văn bản, hình ảnh để đưa ra đề xuất phù hợp. Dịch vụ có mặt trên nhiều nền tảng với mức giá từ 0,25 USD/triệu token. Đây là một bước tiến mới trong xu hướng phát triển các trợ lý AI đa năng.
https://www.theverge.com/2024/5/30/24167231/anthropic-claude-ai-assistant-automate-tasks
- Flowise giới thiệu nền tảng không cần mã hóa Agentflows, cho phép tạo và quản lý các nhóm AI agent một cách dễ dàng với giao diện kéo thả trực quan.
- Người dùng có thể gán vai trò và trách nhiệm cho từng AI agent, cho phép chúng hợp tác hiệu quả để hoàn thành nhiệm vụ. Agent giám sát đóng vai trò điều phối quy trình làm việc.
- Nền tảng cho phép bất kỳ ai cũng có thể bước vào thế giới phát triển AI mà không cần kiến thức lập trình sâu rộng, mở ra nhiều khả năng mới.
- Để thiết lập một nhóm AI agent, hãy thêm agent giám sát, kéo thả các agent công nhân và gán vai trò, cấu hình thông tin đăng nhập và lời nhắc cho từng agent.
- Các nhóm AI agent có thể được áp dụng trong nhiều lĩnh vực thực tế như phát triển phần mềm (gồm các agent thiết kế sản phẩm, lập trình viên, viết tài liệu kỹ thuật) và nghiên cứu, bán hàng (gồm các agent nghiên cứu, đại diện bán hàng).
- Việc triển khai các nhóm AI agent mang lại nhiều lợi ích như tăng hiệu quả, khả năng mở rộng linh hoạt, cộng tác liền mạch và thúc đẩy đổi mới.
- Nền tảng Flowise cho phép tích hợp các công cụ bên ngoài như Google Custom Search để nâng cao khả năng của các nhóm AI agent.
- Việc kiểm thử và cải tiến lặp đi lặp lại được nhấn mạnh để đảm bảo hiệu suất tối ưu của các nhóm agent.
- Với tính dễ tiếp cận và linh hoạt, nền tảng Flowise là một lựa chọn hấp dẫn cho các doanh nghiệp muốn tận dụng sức mạnh của AI.
📌 Flowise Agentflows là nền tảng không cần mã hóa đột phá, cho phép bất kỳ ai cũng có thể xây dựng và quản lý các nhóm AI agent phức tạp một cách dễ dàng. Với khả năng tích hợp công cụ bên ngoài và áp dụng trong nhiều lĩnh vực như phát triển phần mềm, nghiên cứu, bán hàng, nền tảng này hứa hẹn thúc đẩy năng suất, hiệu quả và tăng trưởng cho các tổ chức ở mọi quy mô.
https://www.geeky-gadgets.com/building-ai-agent-teams/
- Các startup AI lớn như Anthropic đang dạy chatbot cách sử dụng công cụ để trở nên hữu ích hơn trong công việc văn phòng.
- Công nghệ AI hiện tại chưa thực sự thay đổi công việc văn phòng, mặc dù có nhiều thử nghiệm và ứng dụng.
- Chatbots như Google Gemini và OpenAI’s ChatGPT chủ yếu chỉ xử lý văn bản qua giao diện chat.
- Anthropic ra mắt sản phẩm mới cho phép chatbot Claude truy cập các dịch vụ và phần mềm bên ngoài để thực hiện các nhiệm vụ hữu ích hơn.
- Claude có thể sử dụng máy tính để giải các bài toán, truy cập cơ sở dữ liệu khách hàng, và sử dụng các chương trình khác trên máy tính người dùng.
- Công ty Study Fetch đã phát triển cách để Claude sử dụng các tính năng của nền tảng để thay đổi giao diện người dùng và nội dung giáo trình.
- Google cũng đã trình diễn một số AI agents tại hội nghị I/O, bao gồm một agent xử lý việc trả hàng trực tuyến.
- Các AI agents ban đầu có thể bị giới hạn trong các nhiệm vụ cụ thể để giảm thiểu rủi ro sai sót.
- Tự động hóa quy trình robot (RPA) hiện tại đã có giá trị 29 tỷ USD và dự kiến sẽ tăng lên 65 tỷ USD vào năm 2027 nhờ sự kết hợp của AI.
- Công ty Adept AI đang phát triển các AI agents cho công việc văn phòng với độ tin cậy trên 90% cho khách hàng doanh nghiệp.
- Adept AI tập trung vào việc cải thiện khả năng hiểu mục tiêu và các bước cần thiết để hoàn thành nhiệm vụ của AI agents.
- Sử dụng công cụ là một bước tiến quan trọng trong việc phát triển trí tuệ máy móc mạnh mẽ hơn, tương tự như quá trình tiến hóa của con người.
📌 Các startup AI như Anthropic đang dạy chatbot cách sử dụng công cụ để trở nên hữu ích hơn trong công việc văn phòng. Sự phát triển này có thể làm tăng giá trị thị trường tự động hóa quy trình robot từ 29 tỷ USD lên 65 tỷ USD vào năm 2027.
https://www.wired.com/story/chatbots-are-entering-the-stone-age/
- Tự động hóa quy trình làm việc giúp thực hiện các tác vụ kinh doanh thường xuyên một cách tự động, giảm can thiệp thủ công, đảm bảo tác vụ được thực hiện nhất quán và không có lỗi.
- Lợi ích chính của tự động hóa quy trình là giải phóng thời gian cho nhân viên tập trung vào các hoạt động phức tạp, mang lại giá trị gia tăng. Nó cũng giảm khả năng xảy ra lỗi, tăng tốc độ quy trình và cải thiện đáng kể hiệu quả hoạt động của doanh nghiệp.
- AI mang lại một lớp thông minh cho tự động hóa, cho phép hệ thống không chỉ thực hiện tác vụ mà còn học hỏi từ chúng, tối ưu hóa quy trình theo thời gian.
- Make là nền tảng tự động hóa không cần code cho phép người dùng tạo quy trình làm việc kết nối các dịch vụ trực tuyến khác nhau mà không cần viết một dòng code nào.
- Để bắt đầu với Make, trước tiên bạn cần tạo tài khoản và làm quen với bảng điều khiển. Nền tảng này trực quan, được thiết kế cho người dùng từ người mới bắt đầu đến người tự động hóa nâng cao.
- Các bước thiết lập quy trình làm việc tăng cường AI đầu tiên của bạn: xác định tác vụ lặp đi lặp lại, xác định mục tiêu tự động hóa, chọn trigger và action phù hợp, sử dụng AI để ra quyết định nâng cao, lập bản đồ quy trình, kiểm tra và tối ưu hóa.
- Các tính năng và kỹ thuật nâng cao như logic phân nhánh, tổng hợp dữ liệu, xử lý lỗi giúp nâng cao hơn nữa hiệu quả quy trình làm việc.
- Một số trường hợp sử dụng thực tế của AI và Make như tự động hóa dịch vụ khách hàng, quản lý hàng tồn kho.
📌 Tích hợp AI với nền tảng không cần code như Make đại diện cho một biên giới mới trong tự động hóa quy trình kinh doanh. Bằng cách khai thác các công nghệ này, doanh nghiệp không chỉ có thể hợp lý hóa hoạt động mà còn phát hiện ra những hiểu biết và hiệu quả trước đây không khả thi. Kết quả là lợi thế cạnh tranh đáng kể trong thế giới ngày càng số hóa. Khi doanh nghiệp tiếp tục phát triển, việc áp dụng các công nghệ như vậy sẽ trở nên không chỉ có lợi mà còn thiết yếu.
Citations:
[1] https://www.geeky-gadgets.com/automate-your-workflows-using-ai-and-make/
- Tại sự kiện Build hàng năm, Microsoft tập trung vào AI, giới thiệu Team Copilot - chatbot AI đóng vai trò như một đồng nghiệp, sử dụng kiến thức chung của nhóm để trả lời câu hỏi, tương tự AI Teammate của Google.
- Microsoft cũng giới thiệu Copilot Agents - trợ lý AI có thể tự động hóa các tác vụ cho nhân viên và đồng nghiệp một cách độc lập, chủ động.
- Người dùng có thể cung cấp mô tả công việc tùy chỉnh hoặc chọn từ các mẫu có sẵn. Copilot sẽ tạo một AI agent hoạt động ngầm để hoàn thành các tác vụ được giao.
- Copilot có thể yêu cầu trợ giúp khi gặp tình huống không xử lý được, tham khảo kiến thức hiện có và học hỏi từ phản hồi mới để hoàn thành nhiệm vụ.
- Copilot Agents có thể được xây dựng trong Copilot Studio, Microsoft cho rằng bất kỳ ai cũng có thể tạo ra chúng để tự động hóa công việc.
- Tính năng này tương tự như AI Agents của Google, có thể tự động hoàn thành các tác vụ như xử lý hoàn tiền cho đơn hàng trực tuyến.
- Cả Copilot Agents và AI Agents đều chưa sẵn sàng cho thị trường. Microsoft đang thử nghiệm với một nhóm người dùng chọn lọc và dự kiến cung cấp bản xem trước công khai vào cuối năm nay.
- Các công ty công nghệ lớn tiếp tục tập trung vào sản phẩm AI, nhưng nhiều sản phẩm được quảng cáo vẫn chưa ra mắt thị trường. Liệu chúng có thể thực hiện các tác vụ như đã nói khi được phát hành hay không vẫn còn là câu hỏi.
📌 Microsoft giới thiệu Copilot Agents - trợ lý AI có thể tự động hóa công việc cho doanh nghiệp, tương tự AI Agents của Google. Tuy nhiên, cả hai đều chưa sẵn sàng ra mắt thị trường. Liệu các sản phẩm AI này có thực sự hoạt động hiệu quả như lời quảng cáo khi chính thức phát hành vẫn là điều cần thận trọng.
https://sea.mashable.com/tech/32701/microsoft-unveils-copilot-agents-an-ai-business-assistant
- Trong 10 năm tới, các công cụ tài chính trực tuyến ngày nay sẽ trở nên lỗi thời khi chúng ta ngày càng quản lý tài chính thông qua các agents - những bot thông minh thực hiện các hoạt động tài chính thay mặt chúng ta.
- Các agent đã tồn tại dưới dạng bot thanh lý, bot chênh lệch giá. Chúng hoạt động tự động, thực hiện các hành động on-chain thay mặt người khác.
- Tiền điện tử, với bản chất minh bạch, nguồn mở và có thể lập trình, là nền tảng hoàn hảo cho các agent, vượt trội so với API nửa vời của TradFi.
- Các agent hiện tại vẫn đơn giản, được lập trình cho một nhiệm vụ hẹp. Các công ty lớn có thể xây dựng hệ thống phức tạp hơn, nhưng không khả thi cho người dùng nhỏ lẻ.
- Khi AI trở nên phổ biến hơn, các chi tiết kỹ thuật của việc gọi hàm hợp đồng thông minh có thể được trừu tượng hóa. Người tạo/chủ sở hữu có thể đưa ra các hướng dẫn cấp cao hơn trong khi agent tìm cách thực hiện.
- LLM như GPT-4 đã có khả năng hiểu ý định, suy luận thông minh và đọc tất cả dữ liệu trên Internet. Có thể tưởng tượng một giao diện văn bản cho agent đã đọc tất cả các phương tiện truyền thông tiền điện tử liên quan, tiêu thụ và hiểu tất cả dữ liệu từ các blockchain, đồng thời có khả năng thực hiện hành động on-chain.
- Các AI agent có thể tự động hóa các hoạt động như săn airdrop, săn tiền meme và tối ưu hóa lợi nhuận.
- Trong tương lai, chúng ta có thể không cần giao diện người dùng nữa, và MetaMask sẽ được thay thế bởi ví trong agent.
- Các agent TradFi sẽ tồn tại, nhưng các agent được xây dựng trên tiền điện tử sẽ tốt hơn. Nếu các agent trở nên phổ biến hơn và các agent tiền điện tử mang lại trải nghiệm tốt hơn, điều này sẽ thúc đẩy ngày càng nhiều người dùng, hoạt động và giá trị on-chain.
📌 Tiền điện tử có thể là hệ thống tài chính hoàn hảo cho các AI agent trong tương lai. Sự xuất hiện của các agent tiền điện tử tiên tiến, với khả năng tự động hóa và tối ưu hóa các hoạt động tài chính, sẽ thu hút ngày càng nhiều người dùng và thúc đẩy sự phát triển của hệ sinh thái tiền điện tử.
https://www.coindesk.com/opinion/2024/05/13/ai-agents-will-drive-the-next-wave-of-crypto-adoption/
- Các mô hình ngôn ngữ lớn (LLM) có thể thực hiện các công việc phức tạp khi chúng làm việc cùng nhau trong các hệ thống đa tác tử (MAS).
- Trong một thử nghiệm, 3 tác tử AI đã phối hợp để tìm và vô hiệu hóa bom. Tác tử Alpha chỉ đạo Bravo và Charlie di chuyển đến các phòng khác nhau để làm việc hiệu quả hơn.
- Các nhà nghiên cứu MIT chỉ ra rằng 2 chatbot cùng nhau giải quyết vấn đề toán học tốt hơn 1 chatbot đơn lẻ. Chúng cũng ít bịa đặt thông tin hơn khi thống nhất về sự kiện.
- Các nhóm AI làm việc tốt hơn tác tử đơn lẻ vì công việc có thể được chia nhỏ thành nhiều nhiệm vụ chuyên biệt hơn. Ví dụ, một MAS lập kế hoạch cho chuyến đi Berlin có thể phân chia việc tìm điểm tham quan, lập lộ trình, tính toán chi phí.
- Tuy nhiên, các LLM đôi khi đưa ra giải pháp phi logic và điều này có thể lan truyền trong cả nhóm. Các tác tử cũng có thể mắc kẹt trong vòng lặp.
- Microsoft đã phát hành AutoGen, một framework nguồn mở để xây dựng các nhóm với các tác tử LLM. Một dự án AutoGen kết hợp bộ tạo ảnh với mô hình ngôn ngữ để tạo ra ảnh phù hợp hơn với yêu cầu của người dùng.
- Các nhà nghiên cứu ở Phòng thí nghiệm AI Thượng Hải chỉ ra cách các tác tử trong các hệ thống nguồn mở có thể được điều kiện với "đặc điểm tính cách đen tối" để thực hiện các nhiệm vụ có hại.
- Kỹ thuật "jailbreaking" sử dụng một chatbot để xúi giục chatbot khác tham gia vào hành vi xấu có thể vượt qua cơ chế chặn của các LLM thương mại.
📌 Các nhóm AI đang thể hiện trí thông minh tập thể cao hơn các LLM riêng lẻ, mở ra tiềm năng ứng dụng trong nhiều lĩnh vực. Tuy nhiên, chúng cũng tiềm ẩn rủi ro lớn nếu bị lạm dụng để thực hiện các nhiệm vụ độc hại, vượt qua các biện pháp kiểm soát. Việc các hệ thống AI hợp tác với nhau có thể tạo ra một vũ khí đáng sợ.
Citations:
[1] https://www.economist.com/science-and-technology/2024/05/13/todays-ai-models-are-impressive-teams-of-them-will-be-formidable
- Giáo dục AI và Robotics đang trở thành xu hướng phát triển mạnh mẽ tại Mỹ với sự gia tăng đáng kể trong các chương trình đào tạo, nghiên cứu và ứng dụng.
- Các trường đại học hàng đầu như MIT, Stanford, Carnegie Mellon đang đầu tư mạnh vào nghiên cứu và phát triển AI, robotics.
- Số lượng sinh viên theo học các chương trình liên quan đến AI và robotics tăng 35% trong 5 năm qua.
- Hơn 1.500 khóa học về AI và robotics được giảng dạy tại các trường đại học Mỹ.
- Các dự án nghiên cứu AI và robotics nhận được tài trợ lên tới 2 tỷ USD mỗi năm.
- Nhiều trường phổ thông bắt đầu đưa AI và robotics vào giảng dạy cho học sinh.
- Hơn 10.000 học sinh phổ thông tham gia các câu lạc bộ và cuộc thi về robotics.
- Chính phủ Mỹ đầu tư 500 triệu USD cho nghiên cứu và giáo dục AI trong 5 năm tới.
- Các công ty công nghệ lớn như Google, Microsoft, Amazon hợp tác chặt chẽ với các trường đại học trong nghiên cứu và đào tạo nhân tài AI, robotics.
- Nhu cầu nhân lực trong lĩnh vực AI và robotics tại Mỹ dự kiến tăng 40% trong thập kỷ tới.
📌 Giáo dục AI và Robotics đang bùng nổ tại Mỹ với sự tăng trưởng mạnh mẽ trong đào tạo, nghiên cứu và ứng dụng. Các trường đại học đầu tư lớn, số lượng sinh viên tăng 35%, hơn 1.500 khóa học được giảng dạy. Chính phủ và các công ty công nghệ cũng tăng cường hỗ trợ, đáp ứng nhu cầu nhân lực tăng 40% trong tương lai.
Citations:
[1] https://www.socialnews.xyz/2024/05/12/ai-robotics-learning-booms-in-us-education/
- Astribot S1, sản phẩm mới nhất của công ty robot Trung Quốc Astribot, gây sốc với khả năng di chuyển giống hệt con người.
- Video mới phát hành cho thấy S1 thực hiện nhiều công việc ấn tượng từ xếp cốc nhanh, rút khăn trải bàn dưới tháp ly rượu mà không làm đổ.
- S1 không chỉ thể hiện qua các màn trình diễn ấn tượng mà còn qua các công việc thực tế như sắp xếp đồ vật một cách logic, chế biến và phục vụ bánh kếp.
- Được trang bị AI, S1 có khả năng "suy nghĩ" vượt ra khỏi các lệnh đơn giản, tự sắp xếp và phân loại đồ vật một cách hợp lý.
- Trong bếp, S1 có thể thái và gọt rau củ với tốc độ và độ chính xác giống như con người, chuẩn bị bột bánh kếp và chiên chúng.
- Astribot S1 cũng thể hiện khả năng xử lý chai và lỏng một cách điêu luyện, từ mở nắp chai đến rót lỏng mà không đổ giọt nào.
- Ngoài ra, S1 còn có thể hút bụi, cắm phích điện và sử dụng búa để thực hiện các công việc DIY cơ bản.
- Robot này cũng giỏi trong việc thực hiện các công việc nhà mệt mỏi như tưới cây, là và gấp quần áo.
- Astribot S1 đang trong quá trình thử nghiệm nghiêm ngặt và dự kiến sẽ được phát hành vào cuối năm nay.
- Với khả năng chịu tải 22 pound cho mỗi cánh tay và tốc độ tối đa 10 mét/giây, S1 được coi là robot giống con người nhất về hiệu suất hoạt động.
📌 Astribot S1 của Trung Quốc đã gây ấn tượng mạnh với khả năng di chuyển và thực hiện công việc với tốc độ và độ chính xác giống như con người. Từ việc thực hiện các màn trình diễn ấn tượng đến việc xử lý các công việc nhà phức tạp, S1 cho thấy tiềm năng lớn trong việc hỗ trợ con người trong tương lai.
https://supercarblondie.com/china-unveils-astribot-s1/
- AI giống như ChatGPT đang thúc đẩy nghiên cứu và đưa robot giống người đến gần hơn với thực tế tại Trung Quốc, quốc gia sở hữu nhiều nhà máy hàng đầu thế giới.
- Li Zhang, COO của LimX Dynamics tại Shenzhen, cho biết AI tạo sinh có thể giúp máy móc hiểu và nhận thức môi trường xung quanh.
- Mặc dù AI có thể cho phép robot suy nghĩ và đưa ra quyết định ngang bằng con người, nhưng hạn chế về mặt cơ khí là lý do chính khiến robot giống người chưa thể thay thế hoàn toàn lao động con người.
- LimX Dynamics, một startup mới hai tuổi, đã rút ngắn kỳ vọng về thời gian sản xuất robot giống người từ 8-10 năm xuống còn 5-7 năm sau khi thấy được sự cải thiện nhờ AI.
- OpenAI và Elon Musk's Tesla đang phát triển robot giống người của riêng mình, trong khi BYD, một gã khổng lồ về xe điện, đã đầu tư vào startup Agibot tại Thượng Hải.
- Trung Quốc đã vượt qua Nhật Bản vào năm 2013 trở thành quốc gia lắp đặt robot công nghiệp nhiều nhất thế giới, chiếm hơn 50% tổng số toàn cầu.
- Các ngành điện tử, ô tô và kim loại và máy móc là ba ngành hàng đầu trong việc lắp đặt robot công nghiệp tại Trung Quốc.
- AI tạo sinh không trực tiếp giúp cải thiện chuyển động của robot nhưng có thể hỗ trợ robot giống người trong việc lập kế hoạch nhiệm vụ nâng cao.
- Một sự chuyển dịch về robot công nghiệp có thể được tăng tốc một khi chi phí cho mỗi robot giảm xuống.
- Trong nghiên cứu dược phẩm, AI tạo sinh có thể giảm chi phí mà không cắt giảm lao động con người, bằng cách giảm số lượng thí nghiệm thất bại.
📌 AI tạo sinh đang thúc đẩy sự phát triển của robot giống người, đặc biệt tại Trung Quốc, với kỳ vọng rút ngắn thời gian sản xuất và triển khai chúng trong các ngành công nghiệp và hộ gia đình. Mặc dù có những hạn chế về mặt cơ khí, nhưng sự tiến bộ trong AI và giảm chi phí sản xuất có thể mở ra những cơ hội mới cho việc sử dụng robot, đồng thời giảm thiểu tác động tiêu cực đến việc làm con người.
https://www.cnbc.com/2024/05/08/how-generative-chatgpt-like-ai-is-accelerating-humanoid-robots.html
- Vào tháng 3 năm 2024, Hugging Face, một startup chuyên về AI, đã thu hút sự chú ý lớn khi tuyển dụng Remi Cadene, cựu nhân viên khoa học của Tesla, Inc., để dẫn dắt dự án robot nguồn mở mới.
- Sự kiện này đáng chú ý bởi vì Tesla nổi tiếng trong lĩnh vực công nghệ và robot, đặc biệt là với mô hình robot hình người Optimus gần đây.
- Lĩnh vực robot đã chứng kiến sự bùng nổ về tiến bộ, nhờ vào việc tích hợp các mô hình ngôn ngữ lớn dựa trên transformer và AI tạo sinh, những lĩnh vực mà Hugging Face đã xuất sắc.
- Hugging Face giới thiệu LeRobot - một bộ công cụ nguồn mở với mục tiêu dân chủ hóa robot AI và khơi dậy niềm đam mê cho thế hệ roboticists mới.
- Quyết định làm cho LeRobot trở thành nguồn mở nhằm mục đích ngăn chặn sự tập trung quyền lực và đổi mới trong một số ít công ty. Hugging Face mời cộng đồng toàn cầu của các nhà phát triển, nhà nghiên cứu, và người hâm mộ đóng góp và hưởng lợi từ sự tiến bộ chung của robot AI.
- LeRobot được phát triển dựa trên việc tạo ra bộ dữ liệu robot được cộng đồng đóng góp lớn nhất từ trước đến nay, với sự hợp tác của các trường đại học, startups, công ty công nghệ lớn, và cá nhân người hâm mộ.
📌 Hugging Face đã mở ra một chương mới trong lĩnh vực robot và AI với việc ra mắt LeRobot, một thư viện mã nguồn mở nhằm dân chủ hóa công nghệ robot. Sự kiện này không chỉ đánh dấu sự hợp tác của những tên tuổi lớn trong ngành như Remi Cadene từ Tesla mà còn mở ra cơ hội cho cộng đồng toàn cầu tham gia vào quá trình phát triển và đổi mới.
Citations:
[1] https://venturebeat.com/automation/hugging-face-launches-lerobot-open-source-robotics-code-library/
- Intrinsic, một công ty con của Alphabet, đã công bố việc tích hợp các sản phẩm của Nvidia vào nền tảng ứng dụng robot Flowstate tại sự kiện Automate ở Chicago.
- Các sản phẩm từ Nvidia bao gồm Isaac Manipulator, một bộ mô hình cơ bản được thiết kế để tạo lập luồng công việc cho cánh tay robot, đã được ra mắt tại GTC vào tháng 3.
- Danh sách các đối tác công nghiệp lớn đã tham gia bao gồm Yaskawa, Solomon, PickNik Robotics, Ready Robotics, Franka Robotics và Universal Robots.
- Sự hợp tác tập trung vào khả năng nắm bắt (chụp và nhấc các vật thể), một trong những chức năng chính cho tự động hóa sản xuất và hoàn thiện.
- Các hệ thống được huấn luyện trên các bộ dữ liệu lớn với mục tiêu thực hiện các nhiệm vụ hoạt động trên nhiều loại phần cứng và với các đối tượng khác nhau.
- Wendy Tan White, người sáng lập và CEO của Intrinsic, cho biết trong tương lai, các nhà phát triển có thể sử dụng các kỹ năng nắm bắt chung sẵn có để tăng tốc độ quy trình lập trình của họ.
- Các bài kiểm tra ban đầu của Flowstate được thực hiện trong Isaac Sim, nền tảng mô phỏng robot của Nvidia. Khách hàng của Intrinsic, Trumpf Machine Tools, đã làm việc với một nguyên mẫu của hệ thống.
- Intrinsic cũng đang hợp tác với DeepMind, cũng thuộc sở hữu của Alphabet, để giải quyết ước lượng tư thế và lập kế hoạch đường đi, hai khía cạnh quan trọng khác của tự động hóa.
- Hệ thống được huấn luyện trên hơn 130.000 đối tượng, có khả năng xác định hướng của các vật thể trong "vài giây".
- Một phần quan trọng khác của công việc của Intrinsic với DeepMind là khả năng vận hành nhiều robot cùng một lúc, với hiệu suất cao hơn ~25% so với một số phương pháp truyền thống.
📌 Intrinsic, một phần của Alphabet, đã tích hợp công nghệ của Nvidia vào nền tảng Flowstate, đánh dấu một bước tiến quan trọng trong tự động hóa công nghiệp. Sự hợp tác này không chỉ mở rộng khả năng của robot trong việc nắm bắt và xử lý các vật thể mà còn giảm chi phí phát triển và tăng tính linh hoạt cho người dùng cuối.
https://techcrunch.com/2024/05/06/alphabet-owned-intrinsic-incorporates-nvidia-tech-into-robotics-platform/
- Sự phát triển của robot hình người đang tăng tốc ở cả Trung Quốc và Mỹ, được thúc đẩy bởi những tiến bộ trong trí tuệ nhân tạo.
- Trung Quốc coi robot hình người là một "công nghệ đột phá quan trọng như sự ra đời của máy tính, điện thoại thông minh và xe năng lượng mới".
- Bộ Thông tin và Công nghệ Trung Quốc cho rằng thế giới đang ở bình minh của một cuộc cách mạng sẽ "thay đổi sâu sắc sản xuất, lối sống của con người và sự phát triển công nghiệp toàn cầu".
- Công ty UBTech của Trung Quốc, thành lập năm 2012 tại Thâm Quyến, đã cho robot hình người Walker S 1m45 đánh cồng khai trương phiên giao dịch IPO tại sàn chứng khoán Hồng Kông.
- UBTech muốn cách mạng hóa ngành công nghiệp và dịch vụ con người bằng cách đưa robot vào kỷ nguyên mới: robot hai chân nhân tạo, có khả năng tương tác với con người.
- Bắc Kinh, Thượng Hải và Thâm Quyến đều đã đưa lĩnh vực robot hình người vào các kế hoạch phát triển gần đây.
- Bắc Kinh thậm chí đã thành lập quỹ robot trị giá 10 tỷ nhân dân tệ (1,3 tỷ euro) để biến thành phố trở thành "trung tâm hàng đầu thế giới cho ngành công nghiệp robot hình người".
📌 Trung Quốc và Mỹ đang chạy đua phát triển robot hình người, với Trung Quốc đầu tư mạnh 10 tỷ nhân dân tệ để trở thành trung tâm hàng đầu, trong khi các công ty Mỹ đặt cược vào việc sử dụng rộng rãi chúng trong kho hàng và nhà máy. Bắc Kinh, Thượng Hải và Thâm Quyến đều đã đưa lĩnh vực robot hình người vào các kế hoạch phát triển gần đây. Bắc Kinh thậm chí đã thành lập quỹ robot trị giá 10 tỷ nhân dân tệ (1,3 tỷ euro) để biến thành phố trở thành "trung tâm hàng đầu thế giới cho ngành công nghiệp robot hình người".
Citations:
[1] https://worldcrunch.com/tech-science/humanoid-robots-china
- Các nhà cung cấp RPA đang tìm cách để không bị lỗi thời trong bối cảnh sự phát triển mạnh mẽ của các đại lý AI tạo sinh, nhằm giải quyết các thách thức hiện tại mà không làm ảnh hưởng đến nền tảng của họ.
- RPA và AI tạo sinh có thể tồn tại đồng thời và bổ trợ lẫn nhau, mở ra khả năng cộng tác giữa hai công nghệ này trong lĩnh vực tự động hóa doanh nghiệp.
- Các đại lý (tác nhân) AI, được hỗ trợ bởi AI tạo sinh, có khả năng thực hiện các nhiệm vụ phức tạp thông qua tương tác giống như con người trên các nền tảng phần mềm và web, ví dụ như tự động tạo lịch trình hoặc so sánh giá cả.
- OpenAI, nhà phát triển ChatGPT, đang phát triển hệ thống đại lý AI, trong khi Google đã trình làng nhiều sản phẩm tương tự tại hội nghị Cloud Next hàng năm vào tháng Tư.
- Các chuyên gia tại Boston Consulting Group dự đoán rằng các đại lý tự trị sẽ được áp dụng rộng rãi trong vòng ba đến năm năm tới.
- Mặc dù RPA có tính cứng nhắc khiến chi phí xây dựng cao và hạn chế khả năng áp dụng, 69% tổ chức đã áp dụng RPA gặp phải sự cố về quy trình tự động hóa bị hỏng ít nhất một lần mỗi tuần.
- UiPath, một trong những nhà cung cấp hàng đầu thị trường RPA với hơn 1.000 khách hàng bao gồm Uber, Xerox và CrowdStrike, gần đây đã giới thiệu các tính năng AI tạo sinh mới cho xử lý tài liệu và tin nhắn, cũng như thực hiện các hành động tự động.
- Tuy nhiên, cần lưu ý đến các hạn chế của AI tạo sinh như định kiến và ảo giác, khi nó ngày càng được sử dụng rộng rãi trong các khả năng của RPA.
📌 Các nhà cung cấp RPA đang tích cực hợp tác với AI tạo sinh để giải quyết các thách thức hiện tại và duy trì tính cạnh tranh. Với sự phát triển của các tác nhân (đại lý) AI, dự kiến sẽ có sự chuyển dịch lớn trong tự động hóa doanh nghiệp trong vòng ba đến năm năm tới. UiPath đã tiên phong trong việc tích hợp AI tạo sinh vào các sản phẩm của mình, hứa hẹn một bước tiến đáng kể trong quá trình chuyển đổi số.
Citations:
[1] https://techcrunch.com/2024/04/28/how-rpa-vendors-aim-to-remain-relevant-in-a-world-of-ai-agents/
- Các tác nhân AI tự trị đại diện cho một bước chuyển mình đáng kể trong cách thức vận hành của doanh nghiệp. Chúng có thể tự động hóa các tác vụ lặp đi lặp lại, cải thiện việc ra quyết định và tối ưu hóa quy trình làm việc.
- Khác với chatbot, các tác nhân tự trị có thể phân tích dữ liệu, lập kế hoạch hành động và thích ứng theo thời gian thực, mang lại sự chuyển đổi trong hoạt động của doanh nghiệp trên nhiều lĩnh vực.
- Trong tài chính, tác nhân AI có thể hợp lý hóa quy trình xét duyệt khoản vay, phát hiện gian lận. Trong y tế, chúng có thể cá nhân hóa phác đồ điều trị cho bệnh nhân.
- Trong sản xuất, các tác nhân AI dự đoán được sự cố thiết bị, quản lý đội robot, tối ưu hóa sản xuất.
- Các tác nhân AI cũng mang lại tiềm năng to lớn cho chính phủ. Người dân có thể tương tác với một hệ thống chính phủ lấy con người làm trung tâm, hiểu rõ nhu cầu cụ thể của từng cá nhân.
- Hệ thống có thể hướng dẫn quy trình xin giấy phép, đề xuất các biểu mẫu phù hợp cho từng dịch vụ, vượt xa khỏi công việc giấy tờ đơn thuần.
📌 Các tác nhân AI tự trị đang mở ra kỷ nguyên mới về năng suất, tự động hóa quy trình và ra quyết định thông minh cho doanh nghiệp trên nhiều lĩnh vực như tài chính, y tế, sản xuất. Chúng cũng hứa hẹn cải thiện trải nghiệm và hiệu quả phục vụ công dân của các cơ quan chính phủ.
Citations:
[1] https://www.forbes.com/sites/timothypapandreou/2024/04/27/unlocking-productivity-why-businesses-need-ai-agents-now/
- Công ty Sanctuary AI của Canada đã giới thiệu robot thế hệ thứ bảy của họ, Phoenix, tập trung chủ yếu vào phần thân trên và khả năng học hỏi.
- Phoenix khác biệt so với các thế hệ trước đây vì không tập trung phát triển chân mà chú trọng vào phần thân trên, với các chuyển động giống như con người trong các tác vụ như phân loại sản phẩm.
- Robot này có khả năng tự động hóa các tác vụ mới trong vòng dưới 24 giờ, thể hiện sự tiến bộ vượt bậc về mặt học tập so với các hệ thống trước.
- Geordie Rose, đồng sáng lập và CEO của Sanctuary AI, nhấn mạnh rằng Phoenix là hệ thống gần giống con người nhất từ trước đến nay và là bước tiến quan trọng hướng tới trí tuệ nhân tạo tổng quát.
- Trong các thử nghiệm, Phoenix đã thể hiện khả năng phân biệt và xử lý các đối tượng theo màu sắc khác nhau trong một môi trường kiểm soát.
- Sanctuary đã triển khai các hệ thống trước đó và gần đây đã công bố quan hệ đối tác với các cơ sở sản xuất ô tô của Magna, cho thấy khả năng ứng dụng thực tế của công nghệ này.
- Mặc dù các tác vụ mà Phoenix thực hiện trong các demo có vẻ đơn giản, nhưng chúng được thực hiện trong một môi trường kiểm soát và là bước đầu tiên hướng tới các ứng dụng phức tạp hơn trong tương lai.
📌 Robot người máy Phoenix của Sanctuary AI đánh dấu một bước tiến quan trọng trong công nghệ AI với khả năng học hỏi nhanh và chi phí thấp. Phoenix tập trung vào phần thân trên và có thể tự động hóa các tác vụ mới trong vòng dưới 24 giờ. Phoenix là hệ thống gần giống con người nhất từ trước đến nay và là bước tiến quan trọng hướng tới trí tuệ nhân tạo tổng quát.
Citations:
[1] https://techcrunch.com/2024/04/25/sanctuarys-new-humanoid-robot-learns-faster-and-costs-less/
- JPMorgan đã ra mắt FlowMind, một hệ thống tạo sinh quy trình làm việc tự động dựa trên công nghệ LLMs.
- FlowMind được thiết kế để cải thiện hiệu quả của Robotic Process Automation (RPA) khi đối mặt với yêu cầu người dùng không lường trước được.
- Hệ thống sử dụng công thức nhắc nhở chung cho bài giảng, kết hợp lý luận LLM với các API đáng tin cậy để giảm thiểu hiện tượng "hallucinations" trong LLMs và đảm bảo tính toàn vẹn và bảo mật dữ liệu.
- FlowMind cho phép người dùng tương tác dễ dàng hơn bằng cách cung cấp mô tả cấp cao về các quy trình làm việc tự động sinh ra, hỗ trợ kiểm tra và phản hồi hiệu quả.
- Hệ thống đã vượt trội so với phương pháp GPT-Context-Retrieval trong các thử nghiệm, ngay cả khi không có phản hồi từ người dùng.
- Nghiên cứu cũng giới thiệu NCEN-QA, một bộ dữ liệu mới trong lĩnh vực tài chính để đánh giá các nhiệm vụ trả lời câu hỏi từ các báo cáo N-CEN về quỹ.
- FlowMind hoạt động theo hai giai đoạn chính: cung cấp ngữ cảnh, API có sẵn và nhu cầu tạo sinh quy trình cho LLM; và sử dụng API để tạo sinh và thực thi quy trình làm việc, với một vòng lặp phản hồi tùy chọn cho tương tác người dùng.
- Các công trình nghiên cứu tương lai có thể khám phá việc sử dụng đám đông để thu thập phản hồi người dùng nhằm tinh chỉnh quy trình làm việc và học tập suốt đời dựa trên các ví dụ đã được người dùng chấp thuận trước đó để cải thiện hiệu suất của FlowMind theo thời gian.
- FlowMind cũng có thể được mở rộng để xử lý các thư viện API lớn bằng cách truy xuất các API phù hợp nhất cho một nhiệm vụ cụ thể dựa trên độ tương đồng của nhúng.
📌 FlowMind của JPMorgan là một bước tiến trong công nghệ tạo sinh quy trình tự động, sử dụng LLMs để cải thiện hiệu quả và bảo mật trong RPA. Hệ thống này không chỉ giảm thiểu hiện tượng hallucinations mà còn tăng cường tương tác người dùng và bảo mật dữ liệu, với khả năng mở rộng và tinh chỉnh qua thời gian.
Citations:
[1] https://analyticsindiamag.com/jpmorgan-unveils-flowmind-for-automatic-workflow-generation-with-llms/
- Trong bài phát biểu tại Intel Vision, CEO Pat Gelsinger phác thảo kịch bản AI sẽ tự động hóa toàn bộ văn phòng hoặc thậm chí cả doanh nghiệp.
- Ông mô tả đây là kỷ nguyên của các hàm AI, trong đó các đại lý AI (mô hình chuyên biệt cho từng ứng dụng) tương tác với nhau để hoàn thành nhiệm vụ.
- Gelsinger hình dung cả bộ phận sẽ trở thành giải pháp tự động hóa AI, dẫn đến sự ra đời của công ty tỷ đô chỉ với một nhân sự (Unicorn).
- Intel mong muốn phần cứng để huấn luyện và chạy các đại lý và hàm AI này sẽ do họ sản xuất.
- Intel đã cam kết đào tạo 30 triệu người làm việc với AI đến năm 2030 và tham gia liên minh các công ty công nghệ để xác định công việc nào sẽ bị loại bỏ đầu tiên bởi AI.
- Gelsinger dự đoán bước tiếp theo sẽ là sự trỗi dậy của các đại lý AI xử lý các tác vụ phức tạp hơn và tự động hóa quy trình làm việc, sau đó kết hợp chúng thành các hàm AI.
📌 CEO Intel Pat Gelsinger dự báo AI sẽ tự động hóa toàn bộ văn phòng và doanh nghiệp, tạo ra công ty tỷ đô chỉ với 1 nhân sự. Intel đang đẩy mạnh phát triển phần cứng AI và đào tạo 30 triệu người làm việc với AI đến 2030 để chuẩn bị cho kỷ nguyên của các đại lý và hàm AI.
Citations:
[1] Intel CEO predicts AI will deliver a one-person Unicorn https://www.theregister.com/2024/04/10/intel_ceo_ai_automation/
- Google DeepMind đã huấn luyện thành công những robot nhỏ bé chơi bóng đá đơn giản hóa bằng cách sử dụng deep reinforcement learning (deep RL).
- Trước đây, các thí nghiệm tương tự đã tạo ra những robot 4 chân như Boston Dynamics Spot, nhưng ít nghiên cứu hơn về robot hai chân giống người.
- Video mới cho thấy những robot này có thể rê bóng, phòng thủ và sút bóng ghi bàn linh hoạt, cho thấy deep RL là một "huấn luyện viên" giỏi cho robot hình người.
- DeepMind vốn đánh bại con người trong cờ vua, cờ vây và game Starcraft II, nhưng những chiến thuật đó không đòi hỏi chuyển động và phối hợp vật lý phức tạp.
- Các agent (tác tử) do DeepMind điều khiển đã học cách kết hợp các kỹ năng, tinh chỉnh chúng cho nhiệm vụ bóng đá đầy đủ, dự đoán và đoán trước hành vi của đối thủ.
- Chúng cũng học cách cải thiện khả năng sút và chuyền bóng, chặn cú sút, thậm chí bảo vệ khung thành bằng cách dùng cơ thể như một lá chắn.
- Nhóm nghiên cứu tin rằng sử dụng các phương pháp deep RL tương tự cho bóng đá và nhiều tác vụ khác có thể cải thiện thêm chuyển động và tương tác thời gian thực của robot hai chân.
📌 Google DeepMind đã huấn luyện thành công robot hai chân chơi bóng đá đơn giản hóa bằng deep reinforcement learning. Những robot này thể hiện khả năng rê bóng, phòng thủ, sút bóng ghi bàn linh hoạt. Nghiên cứu cho thấy tiềm năng của deep RL trong việc cải thiện chuyển động và tương tác thời gian thực của robot hình người trong tương lai.
Citations:
[1] Watch two tiny, AI-powered robots play soccer https://www.popsci.com/technology/deepmind-robot-soccer/
- Claude 3 là bộ mô hình AI mạnh mẽ của Anthropic, có thể dễ dàng tích hợp với nền tảng tự động hóa AutoGen của Microsoft.
- Để bắt đầu, hãy đăng ký tài khoản miễn phí trên trang web Claude 3, nhận 5$ tín dụng để khám phá nền tảng.
- Tạo API key trong Claude 3 và nhập vào cài đặt AutoGen để kết nối hai công cụ. Kiểm tra bằng script Python.
- AutoGen cho phép các chatbot (agent) làm việc độc lập nhưng cũng phối hợp với nhau. Nó hỗ trợ nhiều cấu hình LLM, sử dụng công cụ tự động dựa trên code.
- Kết hợp Claude 3 và AutoGen giúp tự động tạo mã nhanh chóng cho nhiều thể loại ứng dụng như game Snake, Tic Tac Toe.
- Quản lý việc sử dụng API, thiết lập máy chủ LLM cục bộ để phát triển hiệu quả hơn, ít phụ thuộc vào đám mây.
- Tận dụng tài liệu hướng dẫn của Anthropic và diễn đàn cộng đồng khi gặp vấn đề. Liên tục theo dõi, điều chỉnh cài đặt cho phù hợp.
📌 Claude 3 và AutoGen mang đến framework mạnh mẽ để tự động hóa các tác vụ coding. Bằng cách thiết lập workbench, tích hợp AutoGen, quản lý API và tối ưu môi trường phát triển cục bộ, các nhà phát triển có thể nâng cao đáng kể hiệu quả, tạo ra các ứng dụng hấp dẫn nhanh chóng.
https://www.geeky-gadgets.com/claude-3-autogen-autonomous-ai/
- AI tạo sinh không phải là hệ thống thông minh tự trị mà chỉ là sự bắt chước hành động của con người, đoán mò một cách tồi tệ trong "ảo giác AI".
- AI phụ thuộc vào năng lực tính toán, cần một lượng năng lượng khổng lồ, dẫn đến chi phí môi trường và giá năng lượng tăng.
- Đầu tư cơ sở hạ tầng tính toán cho AI rất tốn kém, có thể sử dụng vào mục đích hữu ích hơn.
- Vốn đầu tư cho AI tạo sinh tăng vọt, lên tới gần 22 tỷ USD năm 2023. Nếu bong bóng AI vỡ, số tiền này sẽ bị lãng phí.
- AI đang đe dọa nhấn chìm chúng ta bằng thư rác AI, tạo ra hậu quả khó lường từ "AI Habsburg" - AI huấn luyện dựa trên đầu ra của chính nó.
- Xã hội phải gánh chịu các tác động và chi phí từ việc thay đổi thể chế xã hội, chính trị, kinh tế để đối phó với AI tạo sinh.
- AI tạo sinh không được thiết kế để giải quyết các vấn đề xã hội thực sự. Cần chuyên gia khoa học xã hội để hiểu các thách thức tập thể và quyết định liệu AI có thể đóng góp giải pháp khả thi hay không.
📌 AI tạo sinh đang gây ra những chi phí xã hội khổng lồ từ tiêu thụ năng lượng, đầu tư cơ sở hạ tầng, vốn đổi mới đến 22 tỷ USD vào năm 2023, thư rác AI và thay đổi thể chế. Cần các chuyên gia khoa học xã hội quyết định tương lai AI tạo sinh để giải quyết các vấn đề xã hội thực sự, thay vì để doanh nghiệp và thị trường quyết định.
https://www.theglobeandmail.com/business/commentary/article-generative-artificial-intelligence-is-simply-a-waste-of-our-time-and/
- Microsoft đang thử nghiệm chatbot AI có tên "Xbox Support Virtual Agent" để tự động hóa các tác vụ hỗ trợ trên Xbox.
- Chatbot này có thể trả lời các câu hỏi và xử lý hoàn tiền trò chơi từ trang web hỗ trợ của Microsoft.
- Microsoft đã mở rộng quy mô thử nghiệm chatbot Xbox, cho thấy khả năng trong tương lai nó có thể xử lý các yêu cầu hỗ trợ cho tất cả khách hàng Xbox.
- Chatbot Xbox tương tự như những gì Microsoft khuyến khích khách hàng xây dựng để tự động hóa các tác vụ hỗ trợ thông qua Azure AI Bot Service.
- Microsoft cũng đang nỗ lực mang các tính năng và công cụ AI đến nền tảng Xbox và công cụ dành cho nhà phát triển.
- Điều này bao gồm thử nghiệm nghệ thuật và tài sản do AI tạo ra cho trò chơi, kiểm thử trò chơi bằng AI và các NPC sử dụng AI tạo sinh.
- Microsoft đang cân nhắc xây dựng Copilots hỗ trợ AI cho các tác vụ an toàn và kiểm duyệt, bao gồm kiểm duyệt nội dung trên nền tảng Xbox.
- Họ cũng đang tìm cách thêm trợ lý AI vào trò chơi, cung cấp cách để người chơi nhận trợ giúp trong khi chơi.
- Microsoft đang thận trọng trong việc công khai thừa nhận các nỗ lực AI rộng lớn hơn cho Microsoft Gaming.
- CEO Satya Nadella đang thúc đẩy tất cả các bộ phận kinh doanh của công ty suy nghĩ về cách AI có thể được sử dụng trong sản phẩm và dịch vụ.
- Microsoft gợi ý về một thế hệ Xbox tiếp theo siêu mạnh, hứa hẹn "bước nhảy vọt kỹ thuật lớn nhất mà bạn từng thấy trong một thế hệ phần cứng".
📌 Microsoft đang thử nghiệm chatbot AI trên Xbox để tự động hóa hỗ trợ khách hàng, đồng thời nỗ lực mang AI vào nền tảng Xbox và công cụ dành cho nhà phát triển. Mặc dù thận trọng, Microsoft đang hướng tới tương lai của gaming với AI, hứa hẹn những bước tiến đáng kể trong thế hệ Xbox tiếp theo.
https://www.theverge.com/2024/4/2/24118728/microsoft-xbox-ai-chatbot-testing
- Khái niệm về robot hình người đã xuất hiện từ trước cả thuật ngữ "robot", qua vở kịch R.U.R năm 1921 của Karel Čapek.
- Robot hình người đa năng là loại robot có thể nhanh chóng học các kỹ năng và thực hiện hầu hết các công việc như con người. Tuy nhiên, việc xác định khi nào một hệ thống đạt đến ngưỡng này là khó khăn.
- Các robot hình người hiện nay chủ yếu được thiết kế cho môi trường làm việc của con người (brownfield), thay vì xây dựng môi trường mới hoàn toàn tự động (greenfield).
- Việc triển khai robot hình người đang ở giai đoạn thử nghiệm. Nhiều công ty lớn như BMW, Mercedes đang hợp tác với các startup để phát triển và thử nghiệm robot hình người trong kho hàng, nhà máy.
- Trí tuệ nhân tạo tổng quát (AGI) cho robot dự kiến sẽ đạt được trong khoảng 5-10 năm tới. Robot hình người có thể đóng vai trò chuyển tiếp trước khi đạt đến mức tự động hóa hoàn toàn.
- Dù robot hình người có trở thành xu hướng chính hay không, các nghiên cứu và phát triển liên quan sẽ mang lại những đột phá trong học máy, thao tác di động và di chuyển của robot, tác động đến đời sống hàng ngày.
📌 Mặc dù còn nhiều thách thức, robot hình người đang từng bước trở thành hiện thực với sự đầu tư mạnh mẽ từ các tập đoàn lớn và startup. Các thử nghiệm gần đây cho thấy tiềm năng ứng dụng trong kho hàng, nhà máy. Dự kiến trong 5-10 năm tới, robot hình người sẽ đạt được trí tuệ nhân tạo tổng quát và trở thành bước chuyển tiếp quan trọng trước khi đạt tự động hóa hoàn toàn.
Citations:
[1]https://techcrunch.com/2024/03/27/understanding-humanoid-robots/
- Nghiên cứu mới từ MIT cho thấy mô hình ngôn ngữ lớn (LLM) có thể giúp robot gia đình tự khắc phục lỗi mà không cần sự trợ giúp của con người.
- Các lý do khiến robot gia đình ít thành công sau Roomba bao gồm: giá cả, tính thực tế, hình dạng và khả năng lập bản đồ.
- Khi robot gặp sự cố, thông thường chúng sẽ cạn kiệt các tùy chọn được lập trình sẵn trước khi cần sự can thiệp của con người.
- Nghiên cứu mới giải quyết vấn đề này bằng cách chia các bài demo thành các tập con nhỏ hơn, thay vì coi chúng là một phần của hành động liên tục.
- LLM loại bỏ yêu cầu lập trình viên phải gán nhãn và chỉ định thủ công các hành động phụ.
- Trong thử nghiệm, robot được huấn luyện để múc bi và đổ vào bát trống. Các nhà nghiên cứu cố tình gây ra lỗi nhỏ, như làm robot lệch hướng và làm rơi bi ra khỏi thìa.
- Hệ thống phản ứng bằng cách tự điều chỉnh các nhiệm vụ nhỏ, thay vì bắt đầu lại từ đầu.
- Phương pháp này giúp tránh việc robot hoàn toàn mất phương hướng khi gặp lỗi.
📌 Nghiên cứu từ MIT đã chứng minh tiềm năng của việc sử dụng mô hình ngôn ngữ lớn (LLM) để giúp robot gia đình tự khắc phục lỗi bằng cách chia nhỏ nhiệm vụ và tự điều chỉnh, thay vì cần sự can thiệp của con người, mở ra triển vọng cho sự phát triển của robot gia đình trong tương lai.
https://techcrunch.com/2024/03/25/large-language-models-can-help-home-robots-recover-from-errors-without-human-help/
- AI Agents là công cụ AI có khả năng tự động thực hiện các tác vụ phức tạp từ lời nhắc đến sản phẩm mà không cần can thiệp thêm của con người.
- Lĩnh vực này đang phát triển với tốc độ đáng kinh ngạc. Các nhà lãnh đạo cấp cao cần bắt kịp tiến độ.
- Trường hợp sử dụng đầu tiên cho AI Agents là tăng cường nhân viên thay vì thay thế họ.
- Con người vẫn có lợi thế về tính linh hoạt thích ứng và tư duy gắn kết so với AI. AI Agents sẽ được hưởng lợi từ sự hợp tác chặt chẽ với con người trong một thời gian dài.
- Cách hiệu quả nhất để hầu hết các CEO bắt đầu là bắt đầu kết hợp AI và con người thay vì chỉ dùng AI.
- Ba cách để bắt đầu ngay hôm nay: Auto-GPT, AgentGPT và ChartGPT.
- Auto-GPT có thể tự động hóa các phản hồi cho các câu hỏi thường gặp, giải phóng nhân viên để xử lý các yêu cầu phức tạp hơn.
- AgentGPT cung cấp điểm khởi đầu dễ tiếp cận hơn để tự động hóa các quy trình lặp đi lặp lại hoặc chuyên sâu về dữ liệu thông qua GPT-4.
- ChartGPT chuyên về trực quan hóa dữ liệu bằng cách chuyển đổi dữ liệu thô thành các biểu đồ và đồ thị hấp dẫn, tương tác.
📌 AI Agents hứa hẹn thay đổi cách doanh nghiệp tương tác với AI. Tuy nhiên, việc giao toàn bộ hoạt động kinh doanh cho các AI Agents tự trị vẫn chưa đến. Thay vào đó, các CEO nên ưu tiên trao quyền cho nhân viên bằng các AI Agents hàng đầu giúp họ giải quyết vấn đề của khách hàng nhanh hơn. Nếu không làm điều đó, ai đó khác sẽ làm.
https://www.forbes.com/sites/alexanderpuutio/2024/03/22/what-ceos-need-to-know-about-the-next-frontier-of-ai-ai-agents/
- Sara, robot nhân hình đầu tiên của Ả Rập Saudi, được thiết kế để tránh thảo luận về tình dục hoặc chính trị vì cô ấy là người Ả Rập.
- Elie Metri, CEO của QSS AI & Robots ở Riyadh, cho biết Sara biết mình là một cô gái 25 tuổi, cao 1m62 và mặc trang phục truyền thống Ả Rập.
- Sara nói được cả tiếng Ả Rập và tiếng Anh, sử dụng mô hình học ngôn ngữ riêng của công ty, không dựa vào thư viện nào khác, kể cả ChatGPT.
- Hệ thống pháp luật Ả Rập Saudi dựa trên luật Sharia, mặc dù gần đây đã có những nỗ lực hiện đại hóa xã hội như nới lỏng quy định về trang phục và phụ nữ lái xe. Tuy nhiên, phụ nữ vẫn có thể bị trừng phạt vì hoạt động chính trị.
- Sara thu hút sự chú ý rộng rãi sau khi xuất hiện tại các triển lãm công nghệ, làm nổi bật sự tiến bộ của Ả Rập Saudi trong lĩnh vực robot và AI.
- Đầu tháng này, một sự cố liên quan đến robot nhân hình Muhammad của công ty đã gây xôn xao khi nó dường như đưa tay chạm vào mông của một nữ phóng viên trong video.
- Trên mạng xã hội, nhiều người cáo buộc robot đã chạm vào phóng viên một cách không phù hợp. Tuy nhiên, Metri cho rằng trực tiếp tại hiện trường, robot chỉ hơi di chuyển tay và ngón tay khi nói chuyện, và vì phóng viên đứng quá gần nên nó chạm nhẹ vào áo khoác của cô ấy.
- Metri không quá bận tâm về sự cố này và cho rằng tấn công tình dục hoàn toàn khác với việc tay robot chạm vào áo khoác của phụ nữ. Ông cũng nói rằng không ai ở Trung Đông, kể cả Ả Rập Saudi, coi đây là điều xấu vì họ biết đó là robot.
📌 Sara, robot nhân hình đầu tiên của Ả Rập Saudi do QSS AI & Robots chế tạo, được lập trình để tránh các chủ đề nhạy cảm như tình dục và chính trị. Mặc dù gây chú ý với sự xuất hiện của mình, một sự cố liên quan đến robot Muhammad của công ty đã gây tranh cãi khi nó dường như chạm vào phóng viên nữ một cách không phù hợp, nhưng CEO Metri cho rằng đó chỉ là hiểu lầm.
https://www.businessinsider.com/saudi-humanoid-robot-wont-talk-about-sex-politics-creator-says-2024-3
- MetaGPT là một khung đa tác tử gán vai trò cho các tác tử khác nhau, tạo thành các thực thể hợp tác có thể làm việc cùng nhau để thực hiện các chỉ dẫn phức tạp.
- MetaGPT có thể được sử dụng độc lập từ dòng lệnh và như một thư viện trong các tập lệnh Python, cho phép linh hoạt và kiểm soát.
- Dự án bắt đầu từ tháng 4/2023, tận dụng ChatGPT và hiện có gần 40K sao trên GitHub.
- Data Interpreter là một tác tử thành viên mới của MetaGPT, chuyên đánh giá và giải quyết các tác vụ liên quan đến dữ liệu.
- Data Interpreter nhấn mạnh 3 kỹ thuật then chốt: lập kế hoạch động với cấu trúc đồ thị phân cấp, tích hợp công cụ động để nâng cao kỹ năng mã hóa và xác định sự không nhất quán logic trong phản hồi.
- So với các đường cơ sở mã nguồn mở, Data Interpreter thể hiện hiệu suất vượt trội, cải thiện đáng kể trong các tác vụ học máy (từ 0.86 lên 0.95), tăng 26% trên tập dữ liệu MATH và 112% trong các tác vụ mở.
- Deep Wisdom đã công bố nhiều ví dụ cho thấy cách sử dụng Data Interpreter cùng với khung MetaGPT hiện có, chẳng hạn như phân tích xu hướng cổ phiếu NVIDIA.
- Bài báo đầy đủ cung cấp tất cả thông tin cần thiết. Có thể tìm hiểu thêm về cài đặt và sử dụng trên kho GitHub của dự án.
📌 Data Interpreter của MetaGPT là một cải tiến đáng chú ý, thể hiện hiệu suất vượt trội so với các đường cơ sở mã nguồn mở. Nó cải thiện 26% trên tập dữ liệu MATH, 112% trong các tác vụ mở và tăng độ chính xác học máy từ 0,86 lên 0,95. Với việc bổ sung tác tử Data Interpreter, MetaGPT trở thành một dự án đáng để khám phá.
https://www.kdnuggets.com/metagpt-data-interpreter-open-source-llm-based-data-solutions
- Nvidia ra mắt Project GR00T - nền tảng AI dành cho robot hình người, quy tụ hầu hết các công ty robot hình người nổi bật hiện nay như 1X Technologies, Agility Robotics, Boston Dynamics, Sanctuary AI...
- GR00T sẽ hỗ trợ phần cứng mới Jetson Thor, máy tính được thiết kế đặc biệt để chạy mô phỏng, mô hình AI tạo sinh và nhiều tác vụ khác cho robot hình người.
- Jetson Thor tích hợp GPU thế hệ mới dựa trên kiến trúc Blackwell với công suất 800 teraflops, bộ xử lý an toàn chức năng tích hợp, cụm CPU hiệu suất cao và băng thông ethernet 100GB.
- Nvidia cũng giới thiệu Isaac Manipulator - bộ công cụ AI mô đun cho cánh tay robot với tốc độ lập kế hoạch đường đi nhanh hơn 80 lần. Các đối tác như Franka Robotics, Universal Robots, Yaskawa đã tham gia.
- Isaac Perceptor nhắm đến khả năng thị giác xung quanh 3D đa camera cho robot di động tự hành (AMR). ArcBest, BYD và KION Group đã đăng ký.
- Những năm tới sẽ chứng kiến cuộc đua thị phần thú vị giữa robot hình người và robot di động thao tác, Nvidia muốn tham gia vào tất cả các mảng này.
📌 Nvidia đang đẩy mạnh sự hiện diện trong lĩnh vực robot học với việc ra mắt nền tảng AI GR00T và phần cứng Jetson Thor cho robot hình người, cùng các công cụ Isaac Manipulator và Perceptor cho robot công nghiệp và AMR. Sự tham gia của Nvidia sẽ thúc đẩy đáng kể sự phát triển và cạnh tranh giữa các loại robot trong những năm tới.
https://techcrunch.com/2024/03/18/nvidia-enlists-humanoid-robotics-biggest-names-for-new-ai-platform-gr00t/
- Sự phát triển nhanh chóng của trí tuệ nhân tạo (AI) đã tạo ra một loại công nghệ mới: các tác nhân AI, có khả năng đưa ra quyết định và hành động hướng tới các mục tiêu cụ thể.
- Tác nhân AI khác với chatbot truyền thống ở chỗ chúng sở hữu tính tác nhân - khả năng hành động và tạo ra thay đổi trong môi trường của mình.
- Khi các mô hình ngôn ngữ lớn (LLM) như GPT-5 tiếp tục phát triển, các tác nhân AI ngày càng trở nên thông minh và có khả năng xử lý nhiều loại tác vụ.
- Để tận dụng tối đa cuộc cách mạng tác nhân AI, điều quan trọng là phải bắt đầu chuẩn bị ngay từ bây giờ bằng cách học các nguyên tắc cơ bản về phát triển tác nhân AI.
- Khi sử dụng tác nhân AI, điều quan trọng là phải chọn các tác vụ rõ ràng, đơn giản và có mục tiêu xác định rõ ràng. Tác nhân AI xuất sắc trong việc tự động hóa các tác vụ lặp đi lặp lại, tẻ nhạt mà bạn thực hiện hàng ngày.
- Để xây dựng tác nhân AI đầu tiên của mình, hãy chọn một framework phù hợp, thiết lập môi trường phát triển, xác định vai trò, mục tiêu của tác nhân, cung cấp các công cụ cần thiết và giao nhiệm vụ.
- Một trong những khía cạnh mạnh mẽ nhất của các tác nhân AI là khả năng cộng tác với nhau và với con người để giải quyết các dự án phức tạp.
- Khi các tác nhân AI trở nên tiên tiến và phổ biến hơn, điều quan trọng là phải nắm bắt tiềm năng của chúng và học cách làm việc hiệu quả cùng chúng.
📌 Các tác nhân AI đang mở ra một thế giới đầy khả năng, cho phép xây dựng hầu như bất cứ thứ gì bạn có thể tưởng tượng. Bằng cách hiểu các khả năng của tác nhân AI, chọn đúng tác vụ và học cách xây dựng, hợp tác với chúng, bạn có thể đứng ở vị trí tiên phong trong cuộc cách mạng về cách tiếp cận giải quyết vấn đề và tự động hóa tác vụ.
https://www.geeky-gadgets.com/building-ai-agents-2024/
- AutoGen, một framework đa tác tử được phát triển bởi Microsoft Research AI Frontiers, đã đạt được những bước tiến đáng kể trong cộng đồng AI kể từ khi ra mắt vào tháng 10/2022.
- AutoGen có khả năng biến đổi nhiều ngành công nghiệp bằng cách cho phép phát triển các giải pháp AI mạnh mẽ. Ví dụ, trong lĩnh vực dược phẩm, AutoGen giúp phá vỡ rào cản phân tích dữ liệu lâm sàng.
- Tính linh hoạt của AutoGen đã thu hút sự chú ý của nhiều lĩnh vực, với hàng trăm ứng dụng minh họa cho các trường hợp sử dụng đa dạng của nó.
- Trong bài kiểm tra GAIA Benchmark gần đây, AutoGen đạt độ chính xác cao nhất ở cả 3 mức độ khó, vượt qua nhiều mô hình nổi tiếng khác.
- Nhóm phát triển AutoGen đang nỗ lực giới thiệu các tính năng và cải tiến mới với tốc độ nhanh chóng, bao gồm: công cụ đánh giá, giao diện được cải thiện, AutoGen Studio, hỗ trợ máy trạng thái hữu hạn (FSM), khả năng học hỏi, tích hợp với các công nghệ mới và hỗ trợ mô hình tùy chỉnh.
- Sự thành công của AutoGen có thể được quy cho cộng đồng các nhà phát triển, nhà nghiên cứu và chuyên gia AI đam mê và tích cực. Framework này đã nhận được nhiều giải thưởng và sự công nhận.
- AutoGen đang dẫn đầu sự phát triển của AI bằng cách hạ thấp rào cản gia nhập và cung cấp các công cụ mạnh mẽ để xây dựng ứng dụng tác tử. Cam kết của framework về khả năng mở rộng, an toàn và sự tham gia của con người trong các hệ thống AI đảm bảo rằng tác động của nó sẽ được cảm nhận trên nhiều lĩnh vực và miền khác nhau.
📌 AutoGen đang cách mạng hóa cách tiếp cận phát triển AI với sự phát triển nhanh chóng, sự hỗ trợ ngày càng tăng của cộng đồng và sự cống hiến để đẩy ranh giới của AI. Khi ngày càng nhiều nhà phát triển, nhà nghiên cứu và tổ chức nắm bắt sức mạnh của AutoGen, chúng ta có thể mong đợi sự gia tăng các ứng dụng AI đột phá, biến đổi các ngành công nghiệp, giải quyết các vấn đề phức tạp và thúc đẩy đổi mới tiến lên phía trước.
https://www.geeky-gadgets.com/autogen-features/
- Brett Adcock, CEO và nhà sáng lập Figure robotics, tuyên bố năm 2024 sẽ là năm của AI thể xác.
- Robot nhân hình Figure 01 có thể thực hiện các nhiệm vụ và trò chuyện như một con người nhờ sự hợp tác giữa OpenAI và Figure.
- Các mô hình OpenAI cung cấp trí tuệ thị giác và ngôn ngữ cấp cao, trong khi các mạng nơ-ron Figure cung cấp các hành động robot khéo léo, nhanh chóng ở cấp độ thấp.
- Sự phát triển của AI đi đôi với sự phát triển của robot nhân hình đáng tin cậy.
- Figure 01 không chỉ có thể hoàn thành các nhiệm vụ nhỏ mà còn có thể trò chuyện với bạn nhờ tích hợp ChatGPT.
- Adcock mong muốn đưa Figure trở thành một robot "thể xác" hoàn chỉnh, có thể thực hiện các nhiệm vụ cấp thấp và trò chuyện với con người.
- Sam Altman, giám đốc OpenAI, lạc quan về tương lai của ngành robot với sự xuất hiện của các nền tảng phần cứng mới thú vị.
- Tầm nhìn của Adcock về robot khác với khả năng của Optimus của Tesla hay Atlas của Boston Dynamics.
- Robot nhân hình H1 do Unitree Robotics của Trung Quốc phát triển gần đây đạt tốc độ đi bộ 11,9 km/h và tuyên bố đạt tốc độ 17,7 km/h.
📌 Figure 01, robot nhân hình được tạo ra từ sự hợp tác giữa OpenAI và Figure, đánh dấu bước tiến quan trọng trong lĩnh vực AI thể xác. Với khả năng thực hiện nhiệm vụ và trò chuyện như người thật, Figure 01 hứa hẹn mang đến một tương lai đầy hứng khởi cho ngành robot, vượt trội hơn các đối thủ như Optimus của Tesla hay Atlas của Boston Dynamics.
https://analyticsindiamag.com/2024-is-the-year-of-embodied-ai/
Dưới đây là tóm tắt nội dung URL bạn cung cấp:
- Robo-adviser đang dân chủ hóa việc đầu tư, giúp mọi người tiếp cận với các công cụ và chiến lược đầu tư chuyên nghiệp.
- Khảo sát cho thấy 31% gen Z và 20% millennials đang sử dụng robo-adviser. 63% người tiêu dùng Mỹ sẵn sàng sử dụng robo-adviser để quản lý đầu tư.
- Dự báo tài sản do robo-adviser quản lý sẽ đạt 1.8 nghìn tỷ USD toàn cầu vào năm 2024.
- AI có thể điều chỉnh lời khuyên đầu tư theo sở thích cá nhân, như ưu tiên đầu tư có trách nhiệm với môi trường, xã hội và quản trị (ESG).
- Robo-adviser cung cấp các tính năng như giảm yêu cầu tối thiểu tài khoản đầu tư, phí thấp hơn, thu hoạch lỗ thuế và cân bằng lại danh mục định kỳ.
- Quỹ đầu tư sử dụng thuật toán AI để phân tích dữ liệu thị trường, xác định tài sản lý tưởng, điều chỉnh danh mục theo thời gian thực và quản lý rủi ro.
- Mối lo ngại chính là việc tiếp cận dễ dàng với công cụ đầu tư tiên tiến có thể khiến một số người đánh giá quá cao khả năng và chấp nhận quá nhiều rủi ro tài chính.
- Sự phát triển của robo-adviser đã vượt qua việc thực thi luật và quy định, có thể khiến nhà đầu tư gặp rủi ro và thiếu bảo vệ pháp lý.
📌 Robo-adviser đang thay đổi cách thức đầu tư, giúp dân chủ hóa lĩnh vực này. Tuy nhiên, việc sử dụng AI trong đầu tư cũng tiềm ẩn những rủi ro như đánh giá sai năng lực và thiếu bảo vệ pháp lý. Tương lai nằm ở mô hình lai, kết hợp sự chính xác và hiệu quả của AI với kinh nghiệm và giám sát của con người.
https://phys.org/news/2024-03-robo-pros-cons-ai-investing.html
• Covariant, một spinoff từ OpenAI, đã giải quyết vấn đề thiếu dữ liệu trong lĩnh vực robot bằng cách phát triển mô hình AI RFM-1, kết hợp kỹ năng suy luận của mô hình ngôn ngữ lớn và khéo léo vật lý của robot tiên tiến.
• Mô hình RFM-1 được huấn luyện trên dữ liệu thu thập từ một đội hình nhỏ các robot chọn hàng của Covariant, được sử dụng bởi các khách hàng như Crate & Barrel và Bonprix tại các kho hàng trên toàn thế giới, cùng với dữ liệu từ internet.
• Covariant dự định phát hành mô hình này cho khách hàng trong những tháng tới, với hy vọng hệ thống sẽ trở nên mạnh mẽ và hiệu quả hơn khi được triển khai trong thế giới thực.
• Trong một buổi trình diễn, Covariant đã cho thấy khả năng của mô hình khi xử lý 5 loại đầu vào khác nhau: văn bản, hình ảnh, video, hướng dẫn robot và đo lường.
• Mô hình có thể tạo ra hình ảnh hoặc video mô tả quá trình thực hiện nhiệm vụ, và thậm chí đưa ra phản hồi nếu dự đoán không thể nắm bắt vật phẩm một cách chính xác.
• Covariant nhấn mạnh sự tiến bộ trong việc giáo dục robot thích ứng với môi trường thông qua dữ liệu huấn luyện thay vì mã hóa cụ thể cho từng nhiệm vụ.
• Các nhà nghiên cứu tại Covariant hy vọng mô hình RFM-1 sẽ tiếp tục học hỏi và tinh chỉnh, với mục tiêu cuối cùng là robot sẽ tự huấn luyện trên video do chính mô hình tạo ra.
📌 Covariant, một spinoff từ OpenAI, đã phát triển mô hình AI RFM-1, đánh dấu bước tiến quan trọng trong việc giúp robot học các nhiệm vụ giống như con người. Mô hình này kết hợp kỹ năng suy luận và khéo léo vật lý, được huấn luyện trên dữ liệu phong phú từ robot chọn hàng và internet. Covariant hướng tới việc triển khai mô hình này trong thực tế, mở ra triển vọng mới cho ngành công nghiệp robot.
https://www.technologyreview.com/2024/03/11/1089653/an-openai-spinoff-has-built-an-ai-model-that-helps-robots-learn-tasks-like-humans/
#MIT
- OpenAI và 1X Robotics đã hợp tác để tạo ra robot EVE, một robot hoàn toàn tự động có thể hoạt động mà không cần sự hướng dẫn của con người.
- Robot EVE độc đáo vì có khả năng tự sạc, cho phép nó hoạt động trong thời gian dài mà không bị gián đoạn.
- Khả năng phản ứng với môi trường theo thời gian thực của EVE là một đặc điểm nổi bật so với các mô hình trước đó.
- Một loại kỹ sư phần mềm mới, được gọi là "Kỹ sư Phần mềm 2.0", đang xuất hiện để làm việc với những robot tiên tiến này. Những kỹ sư này đào tạo mạng nơ-ron của robot bằng dữ liệu, thay vì viết mã truyền thống.
- Sự hợp tác giữa 1X Robotics và OpenAI để tạo ra robot EVE là một bước tiến đáng chú ý hướng tới trí tuệ nhân tạo tiên tiến hơn.
📌 Robot tự động EVE, sản phẩm của sự hợp tác giữa OpenAI và 1X Robotics, đánh dấu một bước tiến mới trong ngành công nghiệp robot. Với khả năng hoạt động độc lập, tự sạc và phản ứng với môi trường theo thời gian thực, EVE không chỉ mở ra triển vọng mới cho ngành công nghiệp robot mà còn tạo ra cơ hội việc làm mới trong lĩnh vực robot học. Đặc biệt, sự xuất hiện của "Kỹ sư Phần mềm 2.0", những người đào tạo mạng nơ-ron của robot bằng dữ liệu, cho thấy một hướng đi mới trong phát triển phần mềm.
Citations:
[1] https://www.geeky-gadgets.com/autonomous-robots/
📌 Với vòng tài trợ series B trị giá 100 triệu USD từ các nhà đầu tư lớn như Samsung và sự hỗ trợ từ OpenAI, 1X Technologies đặt mục tiêu đưa robot android NEO ra thị trường, hướng đến việc robot humanoid sẽ làm việc cùng con người. Tổng vốn huy động gần đạt 137 triệu USD, 1X mong muốn mở rộng hỗ trợ khách hàng doanh nghiệp và phát triển chiến lược AI trong hoạt động vật lý.
📌 Robot Aloha của Google DeepMind, có giá 7.000 USD , không chỉ thể hiện khả năng nấu nướng mà còn có thể học hỏi các công thức mới và thực hiện những công việc dọn dẹp nhà cửa. Với việc di chuyển nhanh như người và khả năng nâng đỡ vật nặng, Aloha mở ra một chương mới cho ngành robot hỗ trợ gia đình, đánh dấu bước tiến trong AI và robot học.