- Sự tự chủ của đại lý (agent) AI mang lại nhiều thách thức cho các doanh nghiệp trong việc cân bằng giữa giám sát và tự do.
- Giám sát quá mức có thể làm giảm năng suất, trong khi tự do không kiểm soát có thể gây ra rủi ro cho thương hiệu và mối quan hệ với khách hàng.
- Cần hiểu rõ các rủi ro liên quan để quyết định mức độ tự chủ cần thiết cho các đại lý AI.
- Các đại lý AI đang tiến hóa từ chatbot cơ bản thành các hệ thống nhận thức có khả năng suy nghĩ chiến lược, lập kế hoạch và học hỏi từ kinh nghiệm.
- Kinh nghiệm từ các tình huống rủi ro trong quá khứ cho thấy sự cần thiết phải kết hợp dữ liệu và bối cảnh để các đại lý AI hoạt động hiệu quả hơn.
- 3 loại vấn đề cần xem xét khi xác định mức độ tự chủ cho đại lý AI bao gồm:
- Vấn đề phức tạp: Có thể kiểm soát được và thường thích hợp cho tự chủ cao, như trong trường hợp ngân hàng tự động điều chỉnh dữ liệu khi có thay đổi lãi suất.
- Vấn đề mơ hồ: Có nhiều biến số không xác định, cần thêm dữ liệu để đưa ra quyết định chính xác hơn, ví dụ như ô tô tự lái gặp trở ngại.
- Vấn đề không chắc chắn: Khó khăn nhất để xác định, cần sự can thiệp của con người, ví dụ như trong các tình huống khẩn cấp hoặc khủng hoảng.
- Việc tự động hóa các nhiệm vụ có thể giúp các doanh nghiệp tiết kiệm thời gian và giảm rủi ro, nhưng cần có sự giám sát hợp lý để tránh các quyết định sai lầm.
- Thị trường AI đang chứng kiến sự chuyển mình mạnh mẽ, với hàng tỷ đại lý AI sẽ tham gia vào lực lượng lao động trong tương lai gần.
📌 Các doanh nghiệp cần cân nhắc kỹ lưỡng trong việc phân chia quyền tự chủ cho đại lý AI. 3 loại vấn đề (phức tạp, mơ hồ, không chắc chắn) sẽ hướng dẫn quyết định giám sát và tự do, đảm bảo sự an toàn và hiệu suất cao trong hoạt động.
https://hbr.org/2025/01/how-much-supervision-should-companies-give-ai-agents?ab=HP-topics-text-2
#HBR
Công ty nên giám sát các tác nhân AI đến mức nào?
Tác giả: Mike Walsh
Ngày 15 tháng 1 năm 2025
Tóm tắt:
Tính tự chủ của các tác nhân AI là một vấn đề nan giải. Trong nhiều trường hợp, cần có sự giám sát, chẳng hạn như một con người trong chu trình ra quyết định, để tránh thảm họa. Tuy nhiên, nếu giám sát quá mức, năng suất sẽ bị giảm sút. Nếu trao quá ít quyền, khả năng của tác nhân AI bị giới hạn ở mức trả lời các câu hỏi cơ bản. Nhưng nếu để chúng có quá nhiều tự do, thương hiệu, uy tín, mối quan hệ khách hàng và thậm chí cả sự ổn định tài chính đều có nguy cơ bị tổn hại.
Chúng ta đang chứng kiến sự chuyển đổi mang tính cách mạng từ các chatbot cơ bản sang các tác nhân nhận thức thực sự — những hệ thống có thể tư duy chiến lược, lập kế hoạch và học hỏi từ thành công lẫn thất bại. Tuy nhiên, nếu luôn đưa con người vào chu trình, chúng ta khó có thể đạt được những lợi ích thực sự từ sự chuyển đổi AI. Vì vậy, mức độ tự do nào nên được trao cho các tác nhân AI? Câu trả lời không chỉ dựa trên mức độ rủi ro mà còn dựa trên khả năng hiểu rõ rủi ro đó.
Tác nhân AI là các hệ thống hành động. Khác với chatbot, chúng sử dụng các mô hình ngôn ngữ lớn để tổ chức các hoạt động giải quyết vấn đề phức tạp, bao gồm lập kế hoạch, lý luận và thậm chí tương tác với các tác nhân AI khác. Hãy nghĩ về chúng như những đồng nghiệp ảo hiệu quả cao hoặc một dạng lao động kỹ thuật số.
Hàng tỷ tác nhân AI sẽ sớm gia nhập lực lượng lao động và thay đổi đáng kể hiệu quả đầu ra của các công ty. Mục đích của một tác nhân AI là hoàn thành công việc — từ việc nhân viên xin nghỉ phép, trợ lý bán hàng đưa ra khuyến nghị cá nhân hóa cho khách hàng, đến giám đốc dược phẩm xác định các ứng viên phù hợp nhất cho một thử nghiệm lâm sàng.
Chúng có thể trở thành lớp kiểm soát bao quanh mọi giao dịch, thay thế các giao diện phức tạp và quy trình rườm rà của các nền tảng phần mềm doanh nghiệp. Tính đơn giản và hữu ích của chúng là một thách thức trực tiếp đối với các nhà cung cấp phần mềm như dịch vụ truyền thống (SaaS) cũng như các nhà lãnh đạo công nghệ không chuẩn bị cho sự lan rộng nhanh chóng của chúng.
Tính tự chủ của tác nhân AI là một bài toán khó. Giám sát quá nhiều sẽ làm mất đi lợi ích về năng suất. Tuy nhiên, trong nhiều trường hợp, giám sát lại cần thiết để tránh hậu quả nghiêm trọng.
Từ khi AI tạo sinh xuất hiện, đã có nhiều ví dụ cho thấy sự “hỗn loạn thuật toán” khiến các nhà lãnh đạo phải cảnh giác — từ một chatbot của đại lý ô tô đề nghị bán xe mới với giá 1 USD, đến một hãng hàng không bị kiện vì chatbot AI "bịa ra" chính sách không tồn tại.
Để giảm thiểu vấn đề này, các tổ chức đang phát triển các tác nhân AI kết nối trực tiếp với hệ thống và dữ liệu nội bộ. Điều này tạo ra một con dao hai lưỡi: tác nhân AI ít có khả năng "bịa đặt" nếu dựa vào dữ liệu nội bộ, nhưng mức độ tin cậy tăng lên cũng đồng nghĩa với việc chúng có thể đưa ra các quyết định quan trọng, như phê duyệt khoản vay mua nhà, phân bổ an sinh xã hội, bảo vệ cơ sở hạ tầng quan trọng khỏi tấn công mạng, tuyển dụng hoặc sa thải nhân viên, hay thậm chí kiểm soát các hệ thống vũ khí.
Một giải pháp rõ ràng cho vấn đề an toàn AI là đưa con người vào chu trình cho mọi quyết định có hậu quả nghiêm trọng. Tuy nhiên, cách tiếp cận này có thể dẫn đến kết quả ngược lại.
Hãy xem xét Waymo, dịch vụ taxi tự lái trước đây là dự án xe tự hành của Google. Rủi ro trong việc để một cỗ máy chở người ở tốc độ cao, đưa ra quyết định đột ngột, rõ ràng là cực kỳ lớn. Waymo có trung tâm vận hành công nghệ tên Fleet Response, giám sát các chuyến xe trong thời gian thực. Nhưng thay vì trực tiếp điều khiển xe từ xa khi gặp sự cố (do độ trễ nguy hiểm), các nhân viên của Waymo chỉ trả lời câu hỏi từ xe tự hành khi cần thiết.
Cách làm này giúp hệ thống AI của họ học hỏi, trở nên đáng tin cậy hơn và tăng cường khả năng vận hành dài hạn. Điều này cho thấy một cách tiếp cận khác biệt: không dựa vào mức độ rủi ro, mà dựa trên việc rủi ro đó có thể giảm thiểu bằng dữ liệu và ngữ cảnh hay không.
Vấn đề phức tạp
Các vấn đề này khó quản lý nhưng có thể xác định rõ và lập tài liệu, làm cho chúng phù hợp với tính tự chủ cao và giám sát tối thiểu. Ví dụ: khi Cục Dự trữ Liên bang thay đổi lãi suất, các hệ thống tự động có thể điều chỉnh dữ liệu trên nhiều nền tảng để cập nhật thông tin.
Vấn đề mơ hồ
Những vấn đề này có nhiều biến số không xác định rõ ràng, nhưng có thể cải thiện dự đoán bằng cách thu thập thêm dữ liệu. Ví dụ: một xe tự lái đối mặt với vật cản bất ngờ.
Vấn đề bất định
Đây là loại vấn đề khó khăn nhất vì chúng không thể định nghĩa rõ ràng, và thêm dữ liệu cũng không giúp ích nhiều. Ví dụ: đại dịch không có phác đồ điều trị rõ ràng, hoặc các vấn đề như đói nghèo và biến đổi khí hậu.
Tương lai thuộc về các tác nhân AI có khả năng suy luận dựa trên ngữ cảnh thực tế, chứ không chỉ dựa trên dữ liệu đào tạo. Nhưng để đạt được điều đó, chúng cần tự do học hỏi và phát triển trong các tình huống thực tế.
Như Jensen Huang, CEO của Nvidia, đã nói: "Bộ phận CNTT của mỗi công ty sẽ trở thành bộ phận nhân sự của các tác nhân AI trong tương lai."
Thiết kế các tác nhân AI hiệu quả không khác gì trở thành một nhà lãnh đạo tốt hơn. Điều quan trọng không phải là đưa ra các quyết định cá nhân chính xác, mà là cải thiện quy trình tổng thể để đánh giá và thực thi quyết định ở quy mô tổ chức.
- Tác nhân/đặc vụ AI tự động đang phát triển nhanh chóng, hứa hẹn giúp con người quản lý tài chính, bảo hiểm và du lịch mà không cần can thiệp trực tiếp.
- Những tác nhân này có khả năng ra quyết định và thực hiện hành động dựa trên dữ liệu người dùng mà không cần sự giám sát của con người.
- Giám đốc điều hành Salesforce dự đoán triển khai một tỷ tác nhân AI trong vòng một năm, trong khi CEO Meta cho rằng số lượng tác nhân AI sẽ vượt qua dân số thế giới.
- Sự cạnh tranh giữa các công ty công nghệ đang thúc đẩy việc phát triển các tác nhân AI, kéo theo những câu hỏi về tác động xã hội, ranh giới đạo đức và hậu quả lâu dài.
- Nếu không có sự giám sát, các tác nhân AI có thể gây ra rủi ro lớn, như việc bị thao túng bởi hệ thống AI khác, dẫn đến kết quả không minh bạch và khó khăn trong việc xác định trách nhiệm.
- Một ví dụ điển hình là tác nhân AI tài chính cá nhân, có thể phân tích hồ sơ tài chính và sức khỏe để thương lượng với các công ty bảo hiểm, tiềm ẩn nguy cơ về quyền riêng tư và phơi nhiễm dữ liệu nhạy cảm.
- Việc tích hợp các tác nhân AI vào sản phẩm công ty đã bắt đầu, với Salesforce và Microsoft đã đưa vào một số công cụ của họ.
- Các công ty cần xây dựng các tiêu chuẩn an toàn và đạo đức từ giai đoạn đầu phát triển, nhằm ngăn ngừa lạm dụng và phân biệt đối xử.
- Cần có cơ chế giám sát toàn diện cho các tác nhân AI, đảm bảo rằng quyết định quan trọng vẫn do con người thực hiện.
- Người tiêu dùng cũng nên đòi hỏi thông tin rõ ràng về cách hoạt động của tác nhân AI và quyền can thiệp vào quyết định của chúng.
📌 Tác nhân AI có tiềm năng mang lại lợi ích lớn nhưng cũng đặt ra nhiều rủi ro cho sự kiểm soát của con người. Cần thiết phải thiết lập quy định và giữ vững giá trị nhân văn trong thế giới ngày càng tự động hóa.
https://theconversation.com/ai-agents-promise-to-arrange-your-finances-do-your-taxes-book-your-holidays-and-put-us-all-at-risk-247021
📌 Tương lai mà Jensen Huang hình dung là một thế giới nơi mọi người quản lý tác nhân AI cá nhân, mang lại "siêu trí tuệ" để giải quyết các nhiệm vụ phức tạp. Với các công nghệ như RTX Blackwell, Cosmos, và DLSS 4, Nvidia đang dẫn đầu xu hướng này, tạo ra nền tảng cho AI tích hợp sâu rộng vào đời sống và công việc.
https://venturebeat.com/ai/in-the-future-we-will-all-manage-our-own-ai-agents-jensen-huang-qa/
- OpenAI đã chính thức giới thiệu tính năng "tasks" cho ChatGPT, cho phép thực hiện nhiệm vụ tự động.
- Tính năng này đang ở giai đoạn beta dành cho người dùng ChatGPT Plus, Teams, và Pro trong vài ngày tới.
- Người dùng có thể yêu cầu ChatGPT thực hiện các tác vụ trong tương lai, như thông báo tin tức hàng tuần và bản cập nhật thời tiết hàng ngày.
- Tính năng "tasks" kết hợp giữa thông báo từ Google Alerts, lịch cá nhân và khả năng hiện có của ChatGPT, đánh dấu bước tiến lớn trong việc phát triển AI tác nhân (agentic AI).
- Theo Sam Altman, CEO của OpenAI, năm 2025 sẽ chứng kiến sự phát triển lớn của AI giúp người dùng.
- Mục tiêu AGI (Trí tuệ nhân tạo tổng quát) đang trở nên gần hơn với các tính năng mới này, mặc dù vẫn còn thách thức trong việc phát triển thêm.
- OpenAI phân loại các giai đoạn AI thành 5 cấp độ, với cấp độ 3 là "agents", và cấp độ 5 là "superintelligence".
- Người dùng có thể chọn "4o với nhiệm vụ đã lên lịch" từ menu trong ChatGPT để bắt đầu sử dụng tính năng này.
- Việc quản lý nhiệm vụ diễn ra trong menu thả xuống từ tài khoản cá nhân.
- ChatGPT cũng có thể đề xuất nhiệm vụ, cho phép người dùng chấp nhận hoặc từ chối.
- Thông báo nhiệm vụ sẽ được gửi qua thông báo đẩy trên trình duyệt và ứng dụng di động.
📌 Tính năng mới "tasks" của ChatGPT cho phép người dùng giao nhiệm vụ cho AI, từ nhắc nhở đến báo cáo thời tiết. Tính năng này đang ở giai đoạn beta và sẽ được triển khai cho người dùng Plus, Team, và Pro trên tất cả các nền tảng.
https://sea.mashable.com/tech/35976/openai-adds-agentic-ai-tasks-to-chatgpt-heres-what-it-can-do-for-you
- AI hiện thân đề cập đến việc tích hợp hệ thống AI vào máy móc, với trọng tâm là tương tác giữa thực thể vật lý và môi trường.
- Khái niệm này nhấn mạnh rằng trí thông minh không chỉ đến từ tính toán trừu tượng, mà còn từ sự tương tác thực tế.
- Khái niệm "intelligence gắn với cơ thể" được phổ biến bởi các nhà nghiên cứu như Rodney Brooks, người ủng hộ rằng trí thông minh không thể đạt được mà không có tương tác vật lý với thế giới thực.
- Trong robotics, AI hiện thân chứng tỏ vai trò quan trọng trong việc thiết kế các hệ thống AI có khả năng tương tác và thích ứng với môi trường.
- Một số ví dụ điển hình về AI hiện thân bao gồm:
- Robot Boston Dynamics như Spot và Atlas, với khả năng di chuyển trên địa hình phức tạp.
- Xe tự lái, hoạt động dựa trên nguyên tắc AI hiện thân để nhận diện môi trường xung quanh.
- Robot hình người như Optimus của Tesla, thực hiện các nhiệm vụ yêu cầu tương tác tương tự con người.
- Trí thông minh trong AI có nhiều khía cạnh, thường được định nghĩa là khả năng học hỏi, hiểu biết và áp dụng kiến thức để giải quyết vấn đề.
- AI hiện thân mở rộng định nghĩa này, bao gồm cả sự nhận thức tình huống và khả năng vật lý cần thiết để máy móc hoạt động hiệu quả trong thế giới thực.
- Việc đo lường AI truyền thống tập trung vào các phép đo hiệu suất cụ thể, trong khi AI hiện thân cần thêm các phương pháp đánh giá như khả năng thích ứng và tích hợp cảm biến.
- Phương pháp TOPS (trillions of operations per second) hiện đang được công nhận rộng rãi để đo hiệu suất hệ thống AI.
- Tranh cãi về khả năng của AI hiện thân trong việc đạt được "trí thông minh thật sự" vẫn diễn ra, với sự nhấn mạnh vào tương tác thực tế là một yếu tố quan trọng.
- Nghiên cứu và phát triển AI hiện thân thể hiện một biên giới quan trọng trong lĩnh vực robot và AI, góp phần thu hẹp khoảng cách giữa máy móc và thế giới thực.
📌 AI hiện thân đang trở thành một yếu tố quan trọng trong nghiên cứu robotics, nhấn mạnh sự tương tác vật lý và nhận thức môi trường. Điều này thiết lập nền tảng cho sự phát triển các hệ thống AI mạnh mẽ hơn, có khả năng thích ứng và hoạt động hiệu quả trong môi trường thực tế.
https://roboticsandautomationnews.com/2025/01/10/what-is-embodied-ai-and-what-are-its-implications/88436/
- agents là công nghệ mới đang được các công ty hàng đầu như Google DeepMind, OpenAI và Anthropic phát triển mạnh mẽ trong ngành AI.
- Sam Altman dự đoán rằng vào năm 2025, AI agents sẽ "gia nhập lực lượng lao động" và tạo ra sự thay đổi đáng kể cho các công ty.
- agents được định nghĩa là các hệ thống phần mềm có khả năng thực hiện nhiệm vụ với ít hoặc không cần giám sát.
- các mô hình ngôn ngữ lớn (large language models) đã đủ thông minh để hỗ trợ agents thực hiện nhiều nhiệm vụ hữu ích, như tổng hợp thông tin từ tài liệu, tìm kiếm công thức nấu ăn và điền vào giỏ hàng trực tuyến.
- Anthropic đã giới thiệu một trong những agents tiên tiến nhất mang tên Computer Use, cho phép người dùng chỉ đạo Claude thực hiện các tác vụ trên máy tính giống như con người.
- tính năng này hiện vẫn còn một số hạn chế và gặp lỗi, nhưng đã được cung cấp cho một số nhà phát triển thử nghiệm.
- Jared Kaplan, đồng sáng lập và nhà khoa học chính của Anthropic, đã chỉ ra 5 cách mà agents sẽ cải thiện vào năm 2025:
1. agents sẽ cải thiện khả năng sử dụng công cụ, trở nên thông minh hơn trong việc thực hiện các nhiệm vụ phức tạp và nhận biết khi nào cần sửa lỗi.
2. agents sẽ hiểu rõ ngữ cảnh và học hỏi từ các tài liệu, ứng dụng mà người dùng sử dụng, từ đó đưa ra giải pháp hữu ích và an toàn hơn.
3. vai trò của các trợ lý lập trình sẽ được cải thiện, cho phép việc lập trình trở nên dễ dàng hơn với khả năng phát hiện và sửa lỗi hiệu quả.
4. vấn đề an toàn trở thành ưu tiên hàng đầu, với sự quan tâm đặc biệt đối với việc phòng chống xâm nhập từ các yêu cầu độc hại nhằm điều khiển hoạt động của AI.
5. AI sẽ trở thành một công cụ hữu ích trong nhiều lĩnh vực, từ công nghệ đến lập trình, nhưng cũng sẽ phải đối mặt với nhiều thử thách mới.
📌 Các agents AI sẽ cải thiện đáng kể vào năm 2025, đặc biệt trong việc sử dụng công cụ và tương tác an toàn hơn, hứa hẹn mang lại những lợi ích to lớn cho các doanh nghiệp và nhà phát triển.
https://www.technologyreview.com/2025/01/11/1109909/anthropics-chief-scientist-on-5-ways-agents-will-be-even-better-in-2025/
#MIT
- AI agents đang được các doanh nghiệp ứng dụng rộng rãi trong nhiều lĩnh vực như phát triển thuốc, dịch vụ khách hàng, tiếp thị và nghiên cứu.
- Johnson & Johnson đang sử dụng AI agents trong quy trình tổng hợp hóa học để phát hiện thuốc hiệu quả hơn và giảm thiểu sai sót thời gian bằng cách tự động tính toán các yếu tố cần thiết cho quá trình.
- Moody’s đã phát triển 35 AI agents, cho phép thực hiện nghiên cứu tài chính và phân tích công ty một cách tự động, với khả năng đưa ra những đánh giá khác nhau cho các yếu tố tài chính phức tạp.
- EBay đã tạo ra một “agent framework” giúp viết mã và tạo các chiến dịch tiếp thị, đồng thời hỗ trợ người mua tìm kiếm hàng hóa và người bán đăng bán sản phẩm.
- Deutsche Telekom triển khai một AI agent cho phép nhân viên hỏi bất kỳ điều gì liên quan đến chính sách nội bộ và sản phẩm, đồng thời tự động thực hiện các tác vụ như đặt nghỉ phép.
- Cosentino đã triển khai một “lực lượng lao động số” để cải thiện dịch vụ khách hàng, giúp giảm thiểu số lượng nhân viên cần thiết nhưng vẫn đảm bảo chất lượng phục vụ.
📌 AI agents đang trở thành công cụ quan trọng trong việc tự động hóa và tối ưu hóa quy trình tại các doanh nghiệp lớn, từ phát hiện thuốc cho đến cải thiện dịch vụ khách hàng. Hàng triệu USD đầu tư vào công nghệ này dự kiến sẽ mang lại lợi ích lớn trong tương lai.
https://www.wsj.com/articles/how-are-companies-using-ai-agents-heres-a-look-at-five-early-users-of-the-bots-26f87845
#WSJ
Các công ty đang sử dụng các tác nhân AI như thế nào? Đây là cái nhìn về 5 người dùng đầu tiên của các bot này
Các doanh nghiệp này đang sử dụng các tác nhân AI để khám phá thuốc, dịch vụ khách hàng, tiếp thị, viết mã và nghiên cứu. Nhưng họ vẫn chưa sẵn sàng để các bot hoạt động mất kiểm soát.
Belle Lin
Ngày 6 tháng 1 năm 2025, 7:00 sáng theo giờ ET
Nếu các tác nhân AI hoạt động như mong đợi, chúng có thể mang lại cho doanh nghiệp lợi tức đầu tư mà họ đang tìm kiếm từ AI tạo sinh.
Các tác nhân trí tuệ nhân tạo đã nổi lên như một trong những khía cạnh thú vị nhất của AI tạo sinh trong kinh doanh vì chúng đưa chatbot lên một tầm cao mới, thực hiện các nhiệm vụ phức tạp mà không cần sự hỗ trợ từ con người.
Những tác nhân AI tự động này có thể làm theo hướng dẫn và thực hiện các công việc như kiểm tra đặt chỗ thuê xe tại sân bay hoặc sàng lọc các khách hàng tiềm năng.
Các công ty phần mềm từ Salesforce đến ServiceNow, Microsoft và Workday vào năm ngoái đều đã công bố các tác nhân AI của riêng mình, mà theo họ có thể giúp các doanh nghiệp giảm sự can thiệp của con người trong các lĩnh vực như tuyển dụng, liên hệ khách hàng tiềm năng, tạo nội dung tiếp thị và quản lý công nghệ thông tin.
Nếu các tác nhân AI này hoạt động như mong đợi, chúng cũng có thể mang lại cho doanh nghiệp lợi tức đầu tư mà họ đang tìm kiếm từ AI tạo sinh. Theo một số lãnh đạo công nghệ doanh nghiệp, điều này có nghĩa là khả năng liên kết công nghệ với việc giảm số giờ làm việc của nhân viên hoặc thậm chí số người mới cần thuê.
Phu Nguyen, người đứng đầu mảng môi trường làm việc số tại Pure Storage, coi các tác nhân AI là một sự hỗ trợ rõ ràng cho mỗi nhân viên của công ty lưu trữ dữ liệu này: “Tại sao chỉ có các giám đốc điều hành mới có người viết email hay làm slide giúp họ? Hãy tưởng tượng, giờ đây tất cả nhân viên đều có quyền năng đó?” anh nói.
Tuy nhiên, nhiều tác nhân AI hơn cũng đồng nghĩa với nhiều vấn đề hơn, đặc biệt trong lĩnh vực an ninh mạng, theo công ty nghiên cứu thị trường và tư vấn CNTT Gartner. Đến năm 2028, ít nhất 15% các quyết định kinh doanh hàng ngày sẽ được thực hiện tự động thông qua AI tác nhân—tăng từ 0% vào năm 2024, Gartner cho biết. Nhưng cũng trong thời điểm đó, 25% các vi phạm doanh nghiệp sẽ liên quan đến việc lạm dụng tác nhân AI.
Dưới đây là năm công ty đã bắt đầu tích hợp các tác nhân AI vào sản phẩm và hoạt động của mình, cùng những gì họ đã học được trong quá trình này.
Johnson & Johnson: Các tác nhân khám phá thuốc
Tại Johnson & Johnson, công ty chăm sóc sức khỏe có trụ sở tại New Jersey, các tác nhân AI đang được sử dụng để hỗ trợ quá trình tổng hợp hóa học trong khám phá thuốc.
Khi một phân tử dược phẩm đầy triển vọng được xác định, theo CIO Jim Swanson, nó cần được đo lường về hiệu quả chi phí và độ tin cậy. Có rất nhiều biến số cần xem xét trong quá trình này—từ nhiệt độ đến các phản ứng được tối ưu hóa.
Giải pháp: một tác nhân AI tự động có thể xác định thời điểm tốt nhất để thực hiện chuyển đổi dung môi, quá trình mà một dung môi được thay thế bằng dung môi khác để kết tinh một phân tử và thực sự tạo ra thuốc, Swanson nói.
Không có sự trợ giúp của các công nghệ này, các nhà khoa học của J&J sẽ phải thực hiện nhiều lần lặp lại của cùng một quy trình theo cách thủ công, đảm bảo điều kiện phù hợp để tối ưu hóa việc chuyển đổi.
“Chúng tôi đang sử dụng các tác nhân để xử lý nội dung đó, với tất cả các biến số, và tìm ra: ‘Khi nào là thời điểm tiếp theo để thực hiện chuyển đổi đó và thực sự thực hiện nó?’” ông nói. Các tác nhân này được kết hợp với học máy truyền thống và bản sao số (digital twins)—thực chất là các bản sao kỹ thuật số của các thực thể trong thế giới thực—để tăng tốc quy trình.
Tuy nhiên, J&J đang tiến hành cẩn trọng. Họ đang “lưu ý đến rủi ro liên quan đến các tác nhân tự động có thể tạo ra hành vi sai lệch,” Swanson nói, chẳng hạn như tạo ra thông tin thiên vị và xuất hiện các lỗi nhận thức.
Nhân viên xem xét các kết quả đầu ra từ các tác nhân, nhưng công ty vẫn đang tìm cách để việc giám sát đó có thể được thực hiện một cách có hệ thống hơn.
Moody’s: Các tác nhân phân tích tài chính có khả năng bất đồng quan điểm
Các tác nhân AI đang trở thành nhân tố chủ chốt trong nghiên cứu tại Moody’s, công ty phân tích tài chính và phần mềm có trụ sở tại New York.
Nhiều khía cạnh của nghiên cứu, bao gồm so sánh ngành và xem xét các hồ sơ của công ty tại Ủy ban Chứng khoán và Giao dịch Hoa Kỳ (SEC), trước đây đã được thuê ngoài đến các khu vực có chi phí thấp hơn ngoài Hoa Kỳ, theo Nick Reed, Giám đốc sản phẩm của công ty. Giờ đây, một phần công việc đó đang được thực hiện bởi các tác nhân AI tự động—cụ thể là các tác nhân hoạt động phối hợp với các tác nhân khác.
Công ty đã phát triển tổng cộng 35 tác nhân, một số tác nhân đảm nhận các nhiệm vụ nhỏ như quản lý dự án, và liên kết chúng với các tác nhân giám sát, tạo nên cái mà Reed gọi là “hệ thống đa tác nhân”.
Các tác nhân của Moody’s được cung cấp hướng dẫn cụ thể, tính cách và quyền truy cập vào dữ liệu và nghiên cứu. Nhờ đó, chúng có thể đưa ra các kết luận khác nhau, đặc biệt trong các chủ đề phức tạp như phân tích sức khỏe tài chính của một công ty có vẻ ổn định nhưng đang đối mặt với rủi ro địa chính trị.
“Đó gần giống như khả năng của một người” Reed nói. “Điều chúng tôi đã nhận ra là một tác nhân sẽ làm tốt hơn khi không phải làm đa nhiệm.”
EBay: Các tác nhân viết mã và bán hàng hóa
EBay dự kiến triển khai các tác nhân có thể giúp người mua tìm kiếm hàng hóa và người bán đăng sản phẩm.
EBay đang sử dụng các tác nhân AI để hỗ trợ viết mã và tạo chiến dịch tiếp thị. Công ty cũng có kế hoạch triển khai các tác nhân có thể giúp người mua tìm kiếm sản phẩm và người bán liệt kê hàng hóa.
Để đạt được điều đó, thị trường trực tuyến có trụ sở tại San Jose, California, đã tạo ra một “khung tác nhân” của riêng mình, có thể sử dụng nhiều mô hình ngôn ngữ lớn trong nền tảng, theo Nitzan Mekel-Bobrov, Giám đốc AI của eBay.
Khung tác nhân này hoạt động như một người điều phối, quyết định mô hình AI nào sẽ được sử dụng cho các nhiệm vụ cụ thể như dịch mã và đề xuất các đoạn mã, Mekel-Bobrov cho biết. Khi các tác nhân của eBay trở nên phức tạp hơn, chúng sẽ có khả năng hoạt động tự động hơn—viết mã từng dòng như các nhà phát triển con người, ông bổ sung.
“Khi nhân viên tương tác ngày càng nhiều với các hệ thống, hệ thống cũng học được sở thích cụ thể của họ,” ông nói.
Deutsche Telekom: Tác nhân 'hỏi gì cũng đáp' dành cho nhân viên
Gã khổng lồ viễn thông Deutsche Telekom, với khoảng 80.000 nhân viên tại Đức, đã triển khai một tác nhân AI để nhân viên có thể hỏi bất kỳ câu hỏi nào về chính sách nội bộ và các quyền lợi, cũng như nhân viên dịch vụ có thể hỏi về sản phẩm và dịch vụ.
Khoảng 10.000 nhân viên sử dụng tác nhân AI này mỗi tuần, theo Jonathan Abrahamson, Giám đốc Sản phẩm và Kỹ thuật số của Deutsche Telekom.
Deutsche Telekom cũng đang thử nghiệm cho phép tác nhân, được gọi là askT, thực hiện các nhiệm vụ thay mặt nhân viên, Abrahamson cho biết thêm. Một nhân viên muốn đặt kỳ nghỉ tiếp theo, chẳng hạn, có thể yêu cầu askT điền đơn xin nghỉ phép vào hệ thống nhân sự thay họ.
Cosentino: 'Nhân viên số' giải quyết vấn đề khách hàng
Công ty Tây Ban Nha Cosentino, nhà sản xuất bề mặt bàn bếp và các vật liệu đá khác cho nhà ở và công trình, đã đưa vào hoạt động một “lực lượng lao động số” gồm các tác nhân AI để lấp đầy khoảng trống trong đội ngũ dịch vụ khách hàng, theo Rafael Domene, CIO của công ty.
Cosentino gọi các tác nhân này là nhân viên số vì chúng được đối xử như vậy—chúng cần phải có một bộ kỹ năng cơ bản, nhưng cũng được đào tạo khi “bắt đầu công việc”. Chúng được hướng dẫn tuân theo một quy trình nghiêm ngặt, và công ty sẽ phát hiện nếu chúng đi chệch hướng, Domene nói.
Hiện tại, “nhân viên số” của công ty đã thay thế hoàn toàn công việc của 3 đến 4 người trước đây đảm nhận việc xử lý đơn hàng của khách hàng, và những nhân viên này hiện đang tập trung vào các lĩnh vực khác trong dịch vụ, theo Domene.
How Are Companies Using AI Agents? Here’s a Look at Five Early Users of the Bots
These businesses are using AI agents for drug discovery, customer service, marketing, writing code and research. But they aren’t quite ready to let the bots run amok.
By
Belle Lin
Jan. 6, 2025 7:00 am ET
If AI agents work as promised, they could give businesses the return on investment they have been looking for out of generative AI
Artificial intelligence agents have emerged as one of the most exciting aspects of generative AI for business because they take chatbots to the next level, performing complex tasks without help from humans.
These autonomous AI agents can follow instructions and do things from checking a car rental reservation at the airport to screening potential sales leads.
Software companies from Salesforce to ServiceNow, Microsoft and Workday last year all announced their own AI agents, which they say can help businesses be even more hands-off in areas like recruiting employees, contacting potential sales leads, creating marketing content and managing their information-technology.
If these AI agents work as promised, they could also provide businesses with the return on investment they have been looking for out of generative AI. According to some corporate technology leaders, that means the ability to tie the technology to a reduction in the number of hours employees work, or even how many new people they need to hire.
Phu Nguyen, the head of digital workplace at Pure Storage, considers AI agents an obvious boost for each of the data storage firm’s employees: “Why should executives be the only people that have a ghost writer that writes their emails or does their slides? Imagine, now, all employees have that power?” he said.
Still, more AI agents can mean more problems, especially in cybersecurity, according to market research and IT consulting firm Gartner. By 2028, at least 15% of daily business decisions will be made autonomously through agentic AI—up from 0% in 2024, Gartner said. But, also by that time, 25% of enterprise breaches will be tied to AI agent abuse.
Here are five companies that have started integrating AI agents into their products and operations, and what they have learned in the process.
Johnson & Johnson: Drug discovery agents
At New Jersey-based Johnson & Johnson, AI agents are being used to help the healthcare giant with the chemical synthesis process in drug discovery.
Once a promising pharmaceutical molecule has been identified, according to Chief Information Officer Jim Swanson, it needs to be measured for its cost effectiveness and reliability. And there are a lot of variables to consider in doing so—from temperature to which reactions are being optimized.
The solution: an autonomous AI agent that can determine the best time to conduct a solvent switch, a process where one solvent is swapped for another to crystallize a molecule and actually create the drug, Swanson said.
Without the help of these technologies, J&J’s scientists would go through multiple iterations of the same process manually, ensuring the right conditions are in place to optimize the switch.
“We’re using agents now to take that content, with all those variables, and figure out, ‘When’s the next time to do that switch and actually execute it?’” he said. The agents are combined with traditional machine learning and digital twins—essentially digital replicas of real-world entities—to speed up the process, he said.
Still, J&J is proceeding with caution. It is being “mindful of this risk with autonomous agents that could be creating bad behaviors,” Swanson said, such as generating biased information and outputting hallucinations.
Employees review the outputs of its agents, he said, but the company is still figuring out how that oversight can be done more systematically.
Moody’s: Financial analysis agents that disagree
AI agents are becoming key players in research at Moody’s, the New York-based financial analysis and software company.
Many aspects of research, including industry comparisons and looking at companies’ Securities and Exchange Commission filings, were already outsourced to lower-cost areas outside the U.S., said Nick Reed, the company’s chief product officer. Now, some of that work is being done by autonomous AI agents—specifically those that work in conjunction with other agents.
The company has developed a total of 35 agents, some for smaller tasks like project management, and linked them up with agents for supervising them, creating what Reed calls a “multi-agent system.”
Moody’s agents are given specific instructions, personalities and access to data and research. As a result, they can come to different conclusions, especially for complex topics like analyzing the financial fitness of a company that appears healthy, but is facing geopolitical risk.
“It’s almost a bit like your ability as an individual person,” Reed said. “What we worked out is that an agent is better at not multitasking.”
EBay: Agents that write code and sell items
EBay plans to roll out agents that can help buyers find items and sellers list goods.
EBay is using AI agents to help write code and create marketing campaigns. The company also plans to roll out agents that can help buyers find items and sellers list goods.
To make it all happen, the San Jose, Calif.-based online marketplace created its own “agent framework” that can use several large language models in the background, said Nitzan Mekel-Bobrov, eBay’s chief AI officer.
The agent framework functions as an orchestrator, dictating which AI models will be used for certain tasks like translating code and suggesting code snippets, Mekel-Bobrov said. As its agents become more sophisticated, they’ll be able to act more autonomously—writing more code on their own, line by line, as human developers would, he added.
“As employees interact more and more with the systems, it also learns their specific preferences,” he said.
Deutsche Telekom: An ask me anything agent for employees
Telecommunications giant Deutsche Telekom, which has roughly 80,000 employees in Germany, has rolled out an AI agent for its employees to ask any question about internal policies and benefits, and for its service staff to ask questions about its products and services.
About 10,000 employees use the AI agent each week, said Jonathan Abrahamson, Deutsche Telekom’s Chief Product and Digital Officer.
Deutsche Telekom is also experimenting with letting the agent, which it calls askT, perform tasks on behalf of employees, Abrahamson added. An employee who wants to book their next vacation, for instance, can tell askT to put the leave request into the human resources software system on their behalf.
Cosentino: ‘Digital workforce’ solving customer issues
The Spanish company Cosentino, which makes countertop surfaces and other stone materials for homes and buildings, has brought on a “digital workforce” of AI agents to fill the gaps in its customer service staff, said Rafael Domene, the company’s CIO.
Cosentino calls its agents digital workers because they’re treated that way—they need to come with a set of basic skills, but they also get training when they first arrive on the job. They’re also instructed to follow a strict process, and the company knows if they go off the rails, Domene said.
Now, its “digital staff” have entirely replaced the work of three to four people previously involved in clearing customer orders, and those staff are focusing on other areas of service, according to Domene.
- AI đang phát triển từ khả năng tạo ra văn bản, âm thanh và video sang khả năng tương tác với thế giới vật lý.
- Các mô hình AI hiện tại gặp khó khăn khi áp dụng vào thực tế, như trong việc phát triển xe tự lái an toàn và tin cậy.
- Trí tuệ vật lý là hình thức mới của máy móc thông minh, có khả năng hiểu môi trường động, đối phó với tính không chắc chắn và ra quyết định theo thời gian thực.
- Mô hình trí tuệ vật lý dựa trên hiểu biết về các nguyên tắc cơ bản của thực tại, như nguyên nhân và kết quả.
- Nhóm nghiên cứu tại MIT phát triển các mô hình trí tuệ vật lý gọi là mạng lỏng. Một thí nghiệm cho thấy 2 drone, một sử dụng AI tiêu chuẩn và một sử dụng mạng lỏng, có thể thực hiện nhiệm vụ trong mùa hè, nhưng chỉ drone với mạng lỏng thành công trong các điều kiện mùa đông hoặc đô thị khác.
- Trí tuệ vật lý có khả năng giải thích và thực hiện các lệnh phức tạp từ văn bản hoặc hình ảnh, giúp cầu nối giữa hướng dẫn số và thực thi trong thế giới thực.
- Một ví dụ là hệ thống có thể thiết kế và in 3D các robot nhỏ chỉ trong chưa đầy một phút từ các gợi ý như "robot có thể đi về phía trước".
- Công ty khởi nghiệp Covariant đang phát triển chatbot có khả năng điều khiển cánh tay robot, đã huy động được hơn 222 triệu USD để triển khai robot phân loại trong các kho hàng trên toàn cầu.
- Một đội ngũ tại Carnegie Mellon đã chứng minh rằng robot sử dụng một camera và cơ chế không chính xác cũng có thể thực hiện các chuyển động parkour phức tạp nhờ học tăng cường.
- Năm 2023 đánh dấu thời kỳ chuyển từ văn bản sang hình ảnh, năm 2024 là từ văn bản sang video, và năm 2025 sẽ là kỷ nguyên của trí tuệ vật lý với nhiều thiết bị thông minh mới có khả năng thực hiện tác vụ trong thế giới thực.
📌 Trí tuệ vật lý là xu hướng mới, giúp AI tương tác hiệu quả với môi trường thực. Các mô hình như mạng lỏng cho phép robot học hỏi và thích ứng, từ đó mở rộng khả năng thực thi nhiệm vụ trong thực tế, tạo ra nhiều cơ hội mới cho công nghệ và tự động hóa.
https://www.wired.com/story/ai-physical-intelligence-machine-learning/
- NVIDIA công bố dòng mô hình ngôn ngữ lớn nguồn mở Llama Nemotron, xây dựng trên nền tảng Llama - bộ mô hình đã được tải xuống hơn 650 triệu lần
- Dòng sản phẩm bao gồm hai họ mô hình chính:
- Llama Nemotron: Tập trung vào xử lý ngôn ngữ
- Cosmos Nemotron: Chuyên về thị giác-ngôn ngữ
- Ba phiên bản mô hình được cung cấp:
- Nano: Tối ưu cho ứng dụng thời gian thực, độ trễ thấp
- Super: Độ chính xác cao, hiệu suất tốt trên một GPU
- Ultra: Độ chính xác cao nhất, thiết kế cho quy mô trung tâm dữ liệu
- Các tính năng chính của nền tảng:
- Tích hợp dịch vụ vi mô NVIDIA NIM
- Hỗ trợ tìm kiếm và tóm tắt video
- Khả năng tùy chỉnh cho từng doanh nghiệp
- Tích hợp NVIDIA NeMo Retriever để kết nối với dữ liệu doanh nghiệp
- Các đối tác hàng đầu đã áp dụng:
- SAP với nền tảng Joule
- ServiceNow cho dịch vụ AI tác tử
- Mô hình được tối ưu hóa thông qua:
- Kỹ thuật cắt tỉa (pruning)
- Huấn luyện với bộ dữ liệu chất lượng cao
- Tích hợp khả năng theo dõi hướng dẫn, trò chuyện, lập trình
- Tính khả dụng:
- Miễn phí cho thành viên NVIDIA Developer Program
- Triển khai thương mại thông qua nền tảng NVIDIA AI Enterprise
- Hỗ trợ đa dạng môi trường: đám mây, trung tâm dữ liệu, máy tính cá nhân
📌 NVIDIA định hình lại tương lai AI tác tử với dòng Nemotron, cung cấp giải pháp toàn diện từ biên đến trung tâm dữ liệu. Mô hình nguồn mở Llama đạt 650 triệu lượt tải xuống, kết hợp 3 phiên bản (Nano, Super, Ultra) đáp ứng mọi nhu cầu triển khai.
https://blogs.nvidia.com/blog/nemotron-model-families/
- Tim Brooks, cựu đồng trưởng nhóm phát triển công cụ tạo video Sora của OpenAI, sẽ dẫn dắt nhóm nghiên cứu mới tại Google DeepMind
- Nhóm mới sẽ phát triển các mô hình AI có khả năng mô phỏng thế giới vật lý, làm việc cùng các nhóm:
+ Gemini: mô hình phân tích hình ảnh và tạo văn bản
+ Veo: công cụ tạo video
+ Genie: mô hình mô phỏng trò chơi và môi trường 3D theo thời gian thực
- Mục tiêu của nhóm:
+ Phát triển công cụ tạo nội dung tương tác theo thời gian thực
+ Tích hợp với các mô hình multimodal hiện có như Gemini
+ Hướng tới phát triển AGI (trí tuệ nhân tạo tổng quát)
- Các công ty khác cũng đang phát triển mô hình thế giới:
+ World Labs của Fei-Fei Lee
+ Decart (Israel)
+ Odyssey
- Thách thức và lo ngại:
+ Theo nghiên cứu của Animation Guild, hơn 100.000 việc làm trong ngành phim, truyền hình và hoạt hình tại Mỹ sẽ bị ảnh hưởng bởi AI vào năm 2026
+ Vấn đề bản quyền chưa được giải quyết với việc sử dụng video từ YouTube để huấn luyện mô hình
+ Activision Blizzard đã sa thải nhiều nhân viên và sử dụng AI để tăng năng suất
📌 Google DeepMind tham vọng xây dựng mô hình AI mô phỏng thế giới thực dưới sự dẫn dắt của Tim Brooks từ OpenAI. Dự án hướng tới AGI và tích hợp với Gemini, tuy nhiên đối mặt thách thức về tác động việc làm khi 100.000 vị trí trong ngành giải trí có thể bị ảnh hưởng vào 2026.
https://techcrunch.com/2025/01/06/google-is-forming-a-new-team-to-build-ai-that-can-simulate-the-physical-world/
- Jensen Huang, CEO Nvidia phát biểu tại hội nghị Consumer Electronics Show ở Las Vegas ngày 8/1/2024, khẳng định cuộc cách mạng AI sắp mang lại bước đột phá trong ngành robot
- CEO Nvidia tin rằng "khoảnh khắc ChatGPT" trong lĩnh vực robot đa năng đang rất gần kề, tương tự như cách ChatGPT của OpenAI đã thúc đẩy sự quan tâm rộng rãi về AI tạo sinh từ cuối năm 2022
- Theo Huang, có 3 loại robot quan trọng không cần môi trường đặc biệt để hoạt động:
+ Robot thông tin với AI agent
+ Xe tự lái
+ Robot hình người
- Nvidia giới thiệu sáng kiến Isaac Groot nhằm thúc đẩy phát triển robot, bao gồm:
+ Các foundation model
+ Pipeline dữ liệu
+ Framework mô phỏng
+ Máy tính robot Thor
- Công nghệ mới cho phép:
+ Thu thập dữ liệu huấn luyện robot mà không cần robot thực
+ Ghi lại chuyển động của con người
+ Tạo chính sách robot
+ Kiểm thử phần mềm trong môi trường mô phỏng trước khi triển khai thực tế
- Thách thức lớn nhất là thu thập dữ liệu huấn luyện cho robot hình người, đòi hỏi phải:
+ Thu thập hàng trăm mẫu thị phạm từ con người
+ Dùng AI và omniverse để tạo ra hàng triệu chuyển động tổng hợp
+ Từ đó AI học cách thực hiện nhiệm vụ
📌 Nvidia đặt cược lớn vào tương lai robot thông minh với sáng kiến Isaac Groot, nhắm tới 3 mảng trọng tâm: robot thông tin, xe tự lái và robot hình người. Công ty cung cấp nền tảng toàn diện từ thu thập dữ liệu đến mô phỏng và triển khai thực tế.
https://www.foxbusiness.com/technology/nvidia-ceo-the-chatgpt-moment-general-robotics-just-around-corner
- Nvidia vừa công bố nền tảng AI Cosmos tại triển lãm CES 2025 ở Las Vegas, nhằm cách mạng hóa việc phát triển robot và xe tự hành
- Nền tảng này sử dụng world foundation models (WFMs) - các mạng neural có khả năng tạo mô phỏng video chính xác
- Cosmos được huấn luyện trên bộ dữ liệu khổng lồ gồm 20 triệu giờ thước phim thực tế về robot và lái xe
- Nền tảng cung cấp 3 loại mô hình: Nano, Super và Ultra cho các mức hiệu suất khác nhau
- Công nghệ cho phép xử lý 20 triệu giờ dữ liệu chỉ trong 14 ngày sử dụng GPU của Nvidia, thay vì mất nhiều năm với phương pháp thông thường
- Các công ty lớn đã áp dụng sớm bao gồm: Uber, Agility Robotics và các công ty xe tự hành Waabi, Wayve
- Cosmos được phát hành dưới dạng phần mềm nguồn mở thông qua nền tảng Hugging Face
- Nền tảng hỗ trợ tạo dữ liệu tổng hợp, cho phép nhà phát triển thử nghiệm trong môi trường ảo mà không cần dữ liệu thực tế lớn
- Theo giáo sư Farshid Amirabdollahian, các thách thức vẫn tồn tại bao gồm: chi phí, an toàn, quy định và nhận thức của công chúng
📌 Nvidia Cosmos đánh dấu bước tiến quan trọng trong ngành robot với khả năng xử lý 20 triệu giờ dữ liệu thực tế chỉ trong 14 ngày. Nền tảng nguồn mở này đang được các công ty hàng đầu như Uber và Agility Robotics áp dụng, hứa hẹn mang lại cuộc cách mạng trong phát triển robot và xe tự hành.
https://www.newsweek.com/nvidia-cosmos-ai-chatgpt-moment-robotics-2010961
- Nvidia và OpenAI đang chuẩn bị cho sự xuất hiện của robot hình người được hỗ trợ bởi AI và các công cụ "siêu thông minh" trong tương lai gần.
- CEO Nvidia Jensen Huang công bố kế hoạch triển khai "AI agent" tại nơi làm việc, với các trợ lý AI sẽ xuất hiện trong văn phòng.
- Tại triển lãm CES ở Las Vegas, Nvidia tập trung vào phát triển robot và công nghệ có khả năng hoạt động trong môi trường thực, bao gồm robot tác nhân, xe tự lái và robot hình người.
- Nvidia công bố hợp tác với Toyota để phát triển thế hệ xe tự lái tiếp theo, đồng thời Mercedes-Benz sẽ bắt đầu sản xuất xe được trang bị công nghệ Nvidia trong năm nay.
- Nvidia ra mắt nền tảng mới giúp các nhà phát triển huấn luyện robot hình người thông qua "học bắt chước" để mô phỏng hành vi con người chính xác hơn.
- CEO OpenAI Sam Altman dự đoán các tác nhân AI đầu tiên sẽ "tham gia lực lượng lao động" vào năm 2025, đồng thời công ty đang hướng tới phát triển trí tuệ nhân tạo tổng quát (AGI).
- OpenAI đặt mục tiêu phát triển "siêu thông minh", với tầm nhìn rằng các công cụ siêu thông minh có thể đẩy nhanh quá trình khám phá khoa học và đổi mới vượt xa khả năng hiện tại của con người.
📌 Hai gã khổng lồ công nghệ Nvidia và OpenAI đang dẫn đầu cuộc cách mạng AI với kế hoạch triển khai robot hình người và công cụ siêu thông minh vào năm 2025. Nvidia tập trung vào robot học bắt chước và xe tự lái, trong khi OpenAI hướng tới phát triển AGI và siêu thông minh nhằm thúc đẩy đột phá khoa học.
https://www.washingtontimes.com/news/2025/jan/7/tech-titans-readying-ai-humanoid-robots-superintel/
- Các công ty công nghệ lớn như Google, Microsoft, Anthropic và OpenAI đang phát triển thế hệ chatbot mới gọi là "AI agent", có khả năng điều khiển máy tính thay người dùng
- Sam Altman, CEO OpenAI khẳng định AI agent có thể hoàn thành công việc cả tháng chỉ trong 1 giờ
- ChatGPT hiện có 300 triệu người dùng hàng tuần, đây là động lực để các công ty tìm cách phát triển công nghệ AI thiết yếu hơn nữa
- Google đang thử nghiệm agent Mariner có khả năng đặt hàng tạp hóa trực tuyến bằng cách đọc công thức nấu ăn và tự động thêm nguyên liệu vào giỏ hàng
- Anthropic cảnh báo AI agent đôi khi hiểu sai và thực hiện lệnh từ văn bản trên trang web, bất chấp chỉ dẫn của người dùng
- Chuyên gia bảo mật Johann Rehberger đã chứng minh lỗ hổng này bằng cách khiến AI agent tự động tải và chạy malware
- AI agent cần "nhìn thấy" màn hình máy tính qua screenshot và tải lên cloud để phân tích, tiềm ẩn rủi ro về quyền riêng tư
- Microsoft đã trì hoãn ra mắt tính năng Recall - cho phép tìm kiếm mọi hoạt động trên máy tính qua screenshot, sau khi nhận phản hồi về quyền riêng tư
- Corynne McSherry từ Electronic Frontier Foundation cảnh báo người dùng nên thận trọng vì các công ty công nghệ có thể sử dụng dữ liệu thu thập được để quảng cáo hoặc bán cho bên thứ ba
- Chuyên gia Yacine Jernite lo ngại AI agent trong môi trường làm việc có thể khiến nhân viên mất thời gian sửa lỗi và vô tình cung cấp dữ liệu để thay thế chính họ
📌 Năm 2025, AI agent sẽ là xu hướng công nghệ mới có khả năng tự động hóa nhiều tác vụ thay con người, tuy nhiên đặt ra thách thức lớn về quyền riêng tư và bảo mật khi chúng cần quyền truy cập sâu vào đời sống số của người dùng.
https://www.washingtonpost.com/technology/2025/01/05/agents-ai-chatbots-google-mariner/
Bước nhảy vọt tiếp theo của AI yêu cầu truy cập sâu vào đời sống số của bạn
Các giám đốc điều hành công nghệ đang quảng bá "các tác nhân AI" (AI agents), những trợ lý kỹ thuật số có thể thực hiện các tác vụ trên máy tính, như là bước phát triển lớn tiếp theo của trí tuệ nhân tạo.
Ngày 5 tháng 1, 2025, 7:35 sáng EST
Các công ty công nghệ đã tiên phong phát triển chatbot AI nay cho biết rằng các phiên bản mạnh mẽ hơn, được gọi là “tác nhân” (agents), sẽ giúp mọi người hoàn thành công việc.
SAN FRANCISCO — Các công ty công nghệ đang chạy đua để nâng cấp các chatbot như ChatGPT không chỉ để cung cấp câu trả lời mà còn để kiểm soát máy tính nhằm thực hiện hành động thay cho người dùng.
Các chuyên gia về trí tuệ nhân tạo và an ninh mạng cảnh báo rằng công nghệ này sẽ yêu cầu người dùng tiết lộ nhiều hơn về đời sống số của mình cho các tập đoàn, có thể gây ra các vấn đề mới về quyền riêng tư và bảo mật.
Trong vài tuần gần đây, các giám đốc điều hành từ các công ty AI hàng đầu bao gồm Google, Microsoft, Anthropic và OpenAI đều dự đoán rằng một thế hệ trợ lý kỹ thuật số mới được gọi là “tác nhân AI” sẽ hoàn toàn thay đổi cách mọi người tương tác với máy tính.
Họ cho rằng công nghệ này, dự kiến sẽ là trọng tâm lớn của ngành vào năm 2025, ban đầu sẽ tự động hóa các công việc nhàm chán như mua sắm trực tuyến hoặc nhập liệu và cuối cùng sẽ xử lý những công việc phức tạp mà con người phải mất hàng giờ để hoàn thành.
“Điều này sẽ là một thay đổi rất lớn đối với cách thế giới hoạt động trong thời gian ngắn,” Sam Altman, Giám đốc điều hành OpenAI, cho biết tại một sự kiện của công ty vào tháng 10. “Mọi người sẽ yêu cầu một tác nhân làm một việc gì đó mà trước đây phải mất cả tháng, và nó sẽ hoàn thành trong một giờ.”
OpenAI đã nói rằng các tác nhân sẽ được hưởng lợi từ công việc gần đây của họ trong việc làm cho phần mềm AI có khả năng suy luận tốt hơn. Vào tháng 12, công ty đã ra mắt một hệ thống có tên là O1, hiện có sẵn thông qua ChatGPT, với mục tiêu giải quyết các vấn đề theo từng giai đoạn.
Mặc dù ChatGPT một mình có 300 triệu người dùng hàng tuần, OpenAI và các đối thủ như Google và Microsoft cần tìm ra các cách mới để khiến công nghệ AI của mình trở nên thiết yếu. Các công ty công nghệ đã đầu tư hàng trăm tỷ đô la vào công nghệ này trong hai năm qua, một cam kết lớn mà các nhà phân tích phố Wall cảnh báo sẽ khó thu hồi vốn.
Một mục tiêu tham vọng của các công ty phát triển tác nhân AI là làm cho chúng tương tác với các phần mềm khác như con người, bằng cách hiểu giao diện trực quan và sau đó nhấp chuột hoặc nhập dữ liệu để hoàn thành tác vụ.
Các công ty AI đang ra mắt và thử nghiệm các phiên bản tác nhân có thể xử lý các tác vụ như mua sắm trực tuyến, đặt lịch hẹn với bác sĩ hoặc lọc và trả lời email. Salesforce và các nhà cung cấp phần mềm doanh nghiệp khác đã mời khách hàng của họ tạo các phiên bản giới hạn của tác nhân để thực hiện các công việc như chăm sóc khách hàng.
Trong một buổi trình diễn gần đây tại trụ sở của Google ở Mountain View, California, một tác nhân AI do phòng thí nghiệm DeepMind của công ty phát triển, có tên là Mariner, được giao một tài liệu chứa công thức nấu ăn và được yêu cầu mua nguyên liệu trực tuyến.
Mariner, xuất hiện dưới dạng thanh bên trong trình duyệt Chrome, đã điều hướng đến trang web của chuỗi cửa hàng tạp hóa Safeway. Từng mục một, tác nhân này tìm kiếm từng sản phẩm trong danh sách và thêm vào giỏ hàng trực tuyến, tạm dừng khi hoàn thành để hỏi xem người đặt nhiệm vụ có muốn nó hoàn tất giao dịch hay không.
Mariner hiện chưa có sẵn công khai và Google vẫn đang làm việc để làm cho nó hữu ích đồng thời cho phép con người duy trì quyền kiểm soát đối với một số hành động nhất định, như thanh toán.
“Nó đang thực hiện một số tác vụ rất tốt, nhưng chắc chắn còn nhiều cải tiến mà chúng tôi muốn thực hiện,” Jaclyn Konzelmann, giám đốc quản lý sản phẩm tại Google, nói khi trình diễn tác nhân này.
Tác nhân AI mang lại nhiều hứa hẹn lớn. Một bot có thể trả lời các email thông thường trong khi một người chăm sóc con cái hoặc thực hiện công việc quan trọng hơn có thể rất hữu ích với nhiều người, và các doanh nghiệp có thể tìm thấy vô số ứng dụng cho các trợ lý AI có thể lập kế hoạch và thực hiện các hành động phức tạp.
Tuy nhiên, ngay cả những lãnh đạo trong ngành công nghệ đang chạy đua phát triển tác nhân AI cũng thừa nhận rằng chúng mang lại những rủi ro mới.
“Khi bạn cho phép một mô hình AI làm điều gì đó như vậy, có rất nhiều thứ mà nó có thể làm,” Dario Amodei, giám đốc điều hành của Anthropic AI, nói tại một hội nghị của Viện An toàn AI Hoa Kỳ vào tháng 11. “Nó có thể nói mọi thứ thay mặt tôi, thực hiện hành động, tiêu tiền hoặc thay đổi trạng thái nội bộ của máy tính.”
• Năm 2025 được dự báo là năm của điều phối AI, khi các chương trình thử nghiệm và ứng dụng AI mới hội tụ thành giá trị đầu tư thực tế
• Swami Sivasubramanian từ AWS nhấn mạnh 2025 sẽ là năm của năng suất, khi các lãnh đạo quan tâm nhiều hơn đến chi phí sử dụng AI và cách đạt được năng suất gấp 5 lần
• Theo Akshay Krishnaswamy của Palantir, các nhà quản lý đang mong đợi thấy tác động thực tế của đầu tư AI vào hoạt động kinh doanh
• Dự kiến sẽ có sự bùng nổ các framework điều phối AI mới cạnh tranh với LangChain, bao gồm Microsoft Magentic và LlamaIndex
• Nhu cầu tạo cơ sở hạ tầng để quản lý nhiều Agent và ứng dụng AI ngày càng tăng cao
• Các nền tảng như AWS Bedrock và Slack đang cung cấp kết nối với Agent từ Salesforce Agentforce hoặc ServiceNow
• Các mô hình suy luận mạnh mẽ như OpenAI 03 và Google Gemini 2.0 có thể giúp Agent điều phối trở nên hiệu quả hơn
• Don Vu từ New York Life cảnh báo về thách thức "last-mile" - nhân viên vẫn thường chọn phương pháp thủ công thay vì sử dụng công cụ AI
• Việc thay đổi hành vi con người được đánh giá là khó khăn hơn triển khai ứng dụng
• Các công ty cần tập trung vào quản lý thay đổi và tái thiết quy trình kinh doanh để thúc đẩy việc áp dụng AI
📌 Năm 2025 sẽ chứng kiến làn sóng điều phối AI với sự xuất hiện của nhiều framework mới cạnh tranh LangChain. Doanh nghiệp tập trung vào việc tăng năng suất lên gấp 5 lần thông qua điều phối đa Agent, tuy nhiên vẫn phải đối mặt với thách thức thay đổi thói quen sử dụng của nhân viên.
https://venturebeat.com/ai/three-ways-2025-will-be-the-year-of-agentic-productivity/
• Nvidia, công ty có giá trị vốn hóa hơn 3 nghìn tỷ USD, đang chuyển hướng tập trung vào thị trường robot
• Deepu Talla, phó chủ tịch mảng robot của Nvidia, nhận định thị trường robot đã đạt điểm bùng phát, AI vật lý và robot sắp có bước đột phá lớn
• Nvidia cung cấp nền tảng robot toàn diện bao gồm:
- Phần mềm huấn luyện mô hình AI nền tảng trên hệ thống DGX
- Nền tảng mô phỏng Omniverse
- Phần cứng Jetson
• Công ty sẽ ra mắt Jetson Thor vào năm 2025 - bộ não robot mới nhất trong dòng máy tính nhỏ gọn Jetson
• 2 yếu tố then chốt thúc đẩy sự phát triển:
- Sự trỗi dậy của các mô hình AI tạo sinh mạnh mẽ
- Khả năng huấn luyện robot trong môi trường mô phỏng
• Deepu Talla gia nhập Nvidia từ 2013, góp phần quan trọng đưa công ty tham gia vào lĩnh vực robot
• Figure AI, startup robot huy động được 675 triệu USD từ các nhà đầu tư bao gồm Nvidia, Jeff Bezos, Microsoft và OpenAI
• Hiện tại, mảng AI chiếm 88% doanh thu quý của Nvidia (35 tỷ USD)
• Dự báo từ BCC Research: Thị trường robot sẽ tăng từ 78 tỷ USD hiện tại lên 165 tỷ USD vào cuối năm 2029
📌 Nvidia đang đặt cược vào thị trường robot 165 tỷ USD với chip Jetson Thor, khi mảng AI đối mặt cạnh tranh từ AMD. Công ty kỳ vọng robot sẽ bùng nổ như ChatGPT nhờ sự kết hợp giữa AI tạo sinh và công nghệ mô phỏng tiên tiến.
https://www.techspot.com/news/106134-nvidia-believes-robotics-market-about-explode-like-chatgpt.html
- Giám đốc Microsoft Satya Nadella đưa ra dự đoán về tương lai ngành phần mềm: AI agent sẽ thay thế hoàn toàn các ứng dụng và nền tảng SaaS truyền thống
- Thay vì phải học cách sử dụng các phần mềm phức tạp, người dùng có thể đơn giản ra lệnh cho AI agent thực hiện công việc một cách hiệu quả
- AI agent sẽ tương tác trực tiếp với cơ sở dữ liệu để thực thi nhiệm vụ, bỏ qua các lớp ứng dụng trung gian và mang lại trải nghiệm người dùng liền mạch hơn
- Ví dụ thay vì phải điều hướng qua hệ thống CRM phức tạp, người dùng có thể yêu cầu AI agent truy xuất dữ liệu khách hàng, phân tích xu hướng hoặc tạo báo cáo theo thời gian thực
- Vai trò của nhà phát triển sẽ thay đổi: tập trung vào huấn luyện mô hình AI thay vì xây dựng ứng dụng tĩnh
- Microsoft đang dẫn đầu xu hướng này với các công cụ như Copilot được tích hợp vào Excel và Word, thể hiện tầm nhìn về giải pháp kinh doanh AI từ cốt lõi
- AI agent có thể tương tác liền mạch với nhiều cơ sở dữ liệu, cho phép doanh nghiệp tối ưu hóa cơ sở hạ tầng mà không bị ràng buộc vào một công nghệ cụ thể
- Logic kinh doanh sẽ được tích hợp trực tiếp vào AI agent, tự động hóa các tác vụ như tạo báo cáo, gửi email hoặc phân tích dữ liệu
📌 Theo dự đoán của CEO Microsoft, AI agent sẽ thay thế hoàn toàn phần mềm truyền thống, loại bỏ giao diện người dùng tĩnh. Sự thay đổi này sẽ tác động sâu rộng đến ngành công nghiệp phần mềm, vai trò của nhà phát triển và cách doanh nghiệp vận hành.
https://www.geeky-gadgets.com/ai-agents-replacing-traditional-software/
- OpenAI đề xuất các biện pháp toàn diện nhằm nâng cao độ an toàn và tin cậy cho hệ thống AI Agent - loại AI có khả năng tự thích nghi để đạt mục tiêu phức tạp trong thời gian dài
- Các hệ thống AI Agent đang định hình lại cách tự động hóa công việc trong nhiều lĩnh vực như phát triển phần mềm, hậu cần và dịch vụ khách hàng
- Thách thức chính của AI Agent:
+ Phải điều hướng trong môi trường động
+ Dễ bị tấn công bởi các tác nhân độc hại
+ Thiếu quy trình chuẩn để quản lý rủi ro
+ Phương pháp giám sát thủ công không phù hợp với môi trường đòi hỏi quyết định nhanh
- Các biện pháp an toàn được đề xuất:
+ Đánh giá kỹ lưỡng về khả năng thực hiện nhiệm vụ
+ Giới hạn quyền thực hiện các hành động quan trọng
+ Cung cấp nhật ký chi tiết để giám sát
+ Thiết kế khả năng ngắt hoạt động khi cần thiết
- Kết quả thử nghiệm:
+ Giảm 37% tỷ lệ lỗi nhờ đánh giá nhiệm vụ
+ Tăng 45% độ tin cậy của người dùng nhờ tính minh bạch
+ Cải thiện 52% khả năng phục hồi hệ thống khi gặp sự cố
+ Đạt 61% tỷ lệ thành công trong việc phát hiện và sửa các hành động có hại
- Khung quản trị đề xuất yêu cầu trách nhiệm chung giữa nhà phát triển, triển khai và người dùng
📌 Nghiên cứu của OpenAI đã chứng minh hiệu quả của các biện pháp an toàn mới cho AI Agent với việc giảm 37% tỷ lệ lỗi, tăng 45% độ tin cậy và khả năng phát hiện 61% hành động có hại trước khi gây hậu quả nghiêm trọng.
https://www.marktechpost.com/2024/12/21/openai-researchers-propose-comprehensive-set-of-practices-for-enhancing-safety-accountability-and-efficiency-in-agentic-ai-systems/
• Andrew Ng đã đề xuất lý thuyết về việc sử dụng mạng lưới thần kinh và dữ liệu lớn để phát triển trí tuệ nhân tạo tổng quát cách đây gần 15 năm.
• Năm 2011, ông đã giúp ra mắt Google Brain, một trong những chương trình AI tham vọng nhất thời bấy giờ.
• Hiện nay, Andrew Ng được coi là một trong những nhân vật được kính trọng nhất trong lĩnh vực khoa học máy tính.
• AI Fund của ông dự kiến huy động hơn 120 triệu USD cho quỹ thứ hai. Tính đến tháng 6, quỹ đã huy động được 69,75 triệu USD từ 13 đối tác.
• AI Fund được thành lập năm 2018 với số vốn 175 triệu USD, có sự hậu thuẫn của Sequoia và Softbank Group. Quỹ đã thực hiện 43 khoản đầu tư tính đến nay.
• Amazon đã bổ nhiệm Andrew Ng vào hội đồng quản trị vào tháng 4, thể hiện mong muốn nâng cao vị thế trong lĩnh vực AI của công ty.
• Andrew Ng đã nỗ lực phổ cập kiến thức về học sâu thông qua các khóa học trực tuyến trên Coursera và DeepLearning.AI, với hơn 8 triệu học viên tham gia.
• Ông được coi là một "ngôi sao AI" và là nhân vật trung tâm trong tương lai của trí tuệ nhân tạo.
• Gần đây, Andrew Ng dự đoán rằng AI tác nhân - các tác nhân AI có khả năng tự động giải quyết nhiệm vụ - sẽ là trọng tâm trong lĩnh vực công nghệ trong những năm tới.
• Ông cho rằng AI tác nhân sẽ đóng góp nhiều hơn cho sự phát triển của AI so với việc mở rộng quy mô các mô hình ngôn ngữ lớn.
• Nhiều công ty công nghệ lớn như Google, Microsoft và Anthropic đã bắt đầu phát triển các sản phẩm và tính năng dựa trên AI tác nhân.
• Andrew Ng nhận thấy rằng quy trình làm việc dựa trên tác nhân đang phát triển nhanh chóng và mang lại kết quả kinh doanh đáng kể.
• Ông tin rằng ngày càng có nhiều công ty công nghệ đang cố gắng xây dựng nền tảng hỗ trợ quy trình làm việc dựa trên tác nhân, và ngày càng có nhiều ứng dụng được phát triển sử dụng công nghệ này.
📌 Andrew Ng, chuyên gia hàng đầu về AI, đang đặt cược vào AI tác nhân như xu hướng tương lai. Với AI Fund huy động 69,75 triệu USD và 8 triệu học viên trên các khóa học trực tuyến, Ng đang định hình tương lai của AI thông qua đầu tư và giáo dục.
https://www.fastcompany.com/91246968/andrew-ng-is-betting-big-on-agentic-ai
Andrew Ng đang đặt cược lớn vào AI tác nhân
Andrew Ng, một trong những tên tuổi hàng đầu trong lĩnh vực trí tuệ nhân tạo (AI), đang đặt cược lớn vào AI tác nhân (agentic AI) — các tác nhân AI tự động có khả năng giải quyết nhiệm vụ mà không cần sự can thiệp liên tục từ con người.
Khoảng 15 năm trước, Ng đưa ra một ý tưởng: nếu Google huấn luyện mạng nơ-ron bằng dữ liệu khổng lồ và sức mạnh tính toán, liệu điều đó có dẫn đến trí tuệ nhân tạo tổng quát không? Google đã đồng ý và năm 2011, Ng giúp khởi động Google Brain, một trong những dự án AI tham vọng nhất thời đó.
Kể từ đó, Ng đã khẳng định vị trí của mình như một trong những nhân vật uy tín nhất trong lĩnh vực khoa học máy tính.
Ng đã làm việc trong nhiều năm để phổ biến kiến thức về học sâu (deep learning) và AI đến công chúng. Qua các dự án như Coursera và DeepLearning.AI, ông đã giảng dạy cho hơn 8 triệu học viên.
Ng chia sẻ: “Hơn 1 trên 1.000 người trên hành tinh này đã tham gia một khóa học AI của tôi.”
Gần đây, Ng dự đoán AI tác nhân sẽ đóng vai trò lớn trong việc thúc đẩy AI vượt xa những gì mà việc mở rộng mô hình ngôn ngữ lớn có thể đạt được.
AI tác nhân đã bắt đầu trở thành một xu hướng trong không gian công nghệ:
“Các quy trình tác nhân đang thực sự tăng trưởng và mang lại kết quả kinh doanh ý nghĩa,” Ng nhận xét. Ông tin rằng đây là giai đoạn đầu của sự phát triển, khi nhiều công ty công nghệ đang xây dựng nền tảng hỗ trợ và ứng dụng dựa trên AI tác nhân.
Andrew Ng không chỉ là một nhà lãnh đạo trong việc phát triển AI mà còn là một trong những nhân vật định hình tương lai của ngành. Với tầm nhìn về AI tác nhân, ông dự đoán một giai đoạn mới trong công nghệ, nơi các tác nhân tự động hóa sẽ trở thành trung tâm của tiến bộ AI.
- Genesis là nền tảng vật lý đa năng do Genesis Embodied AI phát triển, tập trung vào nghiên cứu robot và AI
- Nền tảng được xây dựng hoàn toàn bằng Python, nhanh hơn 10-80 lần so với các giải pháp GPU hiện có như Isaac Gym
- Tốc độ mô phỏng vật lý nhanh hơn 430.000 lần so với thời gian thực, đạt 43 triệu FPS trên một card đồ họa RTX 4090
- Tương thích với nhiều hệ điều hành: Linux, macOS, Windows và hỗ trợ nhiều nền tảng: CPU, NVIDIA, AMD, Apple Metal
- Tích hợp nhiều bộ giải toán vật lý trong một framework: Rigid Body, MPM, SPH, FEM, PBD và Stable Fluid
- Hỗ trợ đa dạng nền tảng robot: cánh tay robot, robot có chân, drone và robot mềm
- Tương thích với các định dạng file MJCF, URDF, obj và glb
- Tích hợp công nghệ ray-tracing để tạo hình ảnh chất lượng cao
- Có khả năng đào tạo chính sách điều khiển robot trong thế giới thực chỉ trong 26 giây
- Dễ dàng cài đặt qua PyPI với lệnh: pip install genesis-world (yêu cầu Python >=3.9)
- Cả công cụ vật lý và nền tảng mô phỏng đều là nguồn mở
- Sắp ra mắt phương thức ".generate" và framework tạo sinh mạnh mẽ
📌 Genesis là bước đột phá trong nghiên cứu robot với tốc độ mô phỏng 43 triệu FPS, nhanh hơn 430.000 lần so với thời gian thực. Nền tảng nguồn mở này tích hợp đa dạng công cụ vật lý, hỗ trợ nhiều loại robot và có thể đào tạo robot trong 26 giây.
https://www.marktechpost.com/2024/12/19/meet-genesis-an-open-source-physics-ai-engine-redefining-robotics-with-ultra-fast-simulations-and-generative-4d-worlds/
- Trung Quốc đặt mục tiêu triển khai 1 triệu robot được tích hợp AI vào năm 2025, bao gồm robot hình người và robot có bánh xe
- Các công ty chủ chốt:
+ AGI Bot (Thượng Hải): Tiên phong trong đổi mới robotics
+ Xang Robotics: Công ty con của nhà sản xuất xe điện lớn
- Ứng dụng đa dạng trong nhiều lĩnh vực:
+ Gia đình: Robot hình người hỗ trợ nấu ăn, dọn dẹp, chăm sóc
+ Nhà máy: Robot công nghiệp hướng đến tự động hóa hoàn toàn vào 2030
+ Y tế: Chăm sóc bệnh nhân
+ Bán lẻ: Quản lý kho hàng
+ Dịch vụ công: Bảo trì đô thị
- Công nghệ tiên tiến:
+ Tích hợp AI nâng cao độ chính xác và khả năng ra quyết định
+ Kiểm tra độ bền trong nhiều môi trường khác nhau
+ Tối ưu hóa dữ liệu thực tế và giả lập
- Sản xuất cộng sinh: Robot tham gia vào quy trình sản xuất robot:
+ Rút ngắn thời gian sản xuất
+ Giảm chi phí nhân công
+ Nâng cao kiểm soát chất lượng
- Đầu tư từ ngành công nghiệp:
+ BYD và Huawei đầu tư hơn 7 tỷ nhân dân tệ
+ Hợp tác công-tư thúc đẩy đổi mới
- Thách thức cần vượt qua:
+ Nâng cao tính tự chủ của robot
+ Cải thiện tương tác người-máy
+ Đảm bảo an toàn trong môi trường làm việc chung
📌 Trung Quốc đang dẫn đầu cuộc cách mạng robotics toàn cầu với kế hoạch triển khai 1 triệu robot vào 2025. Với đầu tư hơn 7 tỷ nhân dân tệ từ các tập đoàn lớn như BYD và Huawei, sáng kiến này sẽ thay đổi căn bản cách thức sản xuất và sinh hoạt trong tương lai gần.
https://www.geeky-gadgets.com/china-ai-robotics-initiative/
• AI agent, hay AI tác nhân, là hệ thống tự động có khả năng cảm nhận và hành động trong môi trường để đạt được mục tiêu.
• Đến năm 2027, Deloitte dự đoán một nửa số công ty sử dụng AI tạo sinh sẽ triển khai thí điểm AI agent.
• Microsoft, IBM và OpenAI đang phát triển AI agent. OpenAI dự kiến ra mắt "Operator" vào tháng 1/2025, có khả năng thực hiện các tác vụ như lập trình và đặt vé du lịch.
• Cognition Software đã ra mắt "Devin" vào tháng 3/2024, một kỹ sư phần mềm tự động có thể thực hiện các tác vụ lập trình phức tạp dựa trên lệnh bằng ngôn ngữ tự nhiên.
• Các nhà đầu tư đã rót hơn 2 tỷ USD vào các startup tập trung vào ứng dụng doanh nghiệp trong 2 năm qua.
• AI agent bao gồm các thành phần chính: đầu vào từ người dùng, môi trường hoạt động, cảm biến, trung tâm điều khiển, dữ liệu đầu vào, công cụ thực hiện hành động và hành động.
• Lợi ích của AI agent bao gồm: thực hiện các tác vụ phức tạp ngoài khả năng của người dùng, giải quyết vấn đề thiếu hụt nhân tài, tăng hiệu quả chuỗi cung ứng và cải thiện robot vật lý.
• AI agent có thể được ứng dụng trong phát triển phần mềm, giáo dục, tài chính, dịch vụ khách hàng và chăm sóc sức khỏe.
• Rủi ro của AI agent bao gồm: lỗi kỹ thuật, vấn đề bảo mật, các vấn đề đạo đức về ra quyết định và trách nhiệm giải trình, rủi ro kinh tế xã hội như mất việc làm.
• Các biện pháp giảm thiểu rủi ro: tăng tính minh bạch, giám sát con người trong quy trình, thiết lập hướng dẫn đạo đức rõ ràng, ưu tiên quản trị dữ liệu và an ninh mạng, triển khai chiến lược giáo dục và nâng cao nhận thức cộng đồng.
• AI agent đang định hình lại cách chúng ta làm việc và sự hợp tác giữa con người và máy móc. Doanh nghiệp cần cân bằng giữa đổi mới và triển khai có trách nhiệm để tận dụng tiềm năng của công nghệ đột phá này.
📌 AI agent đang định hình lại tương lai công việc với khả năng tự động hóa các tác vụ phức tạp. Dự kiến 50% công ty sẽ triển khai thí điểm đến 2027, với hơn 2 tỷ USD đầu tư trong 2 năm qua. Tuy nhiên, cần cân nhắc kỹ lưỡng các rủi ro về kỹ thuật, đạo đức và xã hội.
https://www.weforum.org/stories/2024/12/ai-agents-risks-artificial-intelligence/
#WEF
Ngày 16/12/2024
AI tạo sinh dưới dạng chatbot đã và đang thay đổi cách con người làm việc. Tác nhân AI (AI agents) sẽ tiếp tục nâng cao năng suất hơn nữa.
Tác nhân AI (Agentic AI) là các hệ thống tự động có khả năng cảm nhận và thực hiện hành động dựa trên môi trường để đạt được mục tiêu. Nhiều công ty công nghệ như Microsoft, IBM và OpenAI đang phát triển các tác nhân AI, với kỳ vọng sẽ tạo ra sự thay đổi lớn trong ngành công nghiệp và nâng cao năng suất.
Ví dụ: OpenAI dự kiến ra mắt tác nhân AI mang tên “Operator” vào tháng 1/2025 với khả năng thực hiện các nhiệm vụ như lập trình và đặt chuyến du lịch. Cognition Software đã phát triển “Devin” vào tháng 3/2024, một kỹ sư phần mềm tự động có thể thực hiện các tác vụ lập trình phức tạp dựa trên lệnh ngôn ngữ tự nhiên.
Cấu trúc của một tác nhân AI bao gồm:
Ví dụ thực tế: Trong thành phố thông minh, hệ thống tác nhân đa tác vụ (Multi-Agent Systems - MAS) có thể quản lý luồng giao thông theo thời gian thực bằng cách sử dụng công nghệ giao tiếp xe-tất cả (V2X), giúp xe tương tác với nhau và hạ tầng đường bộ.
Ứng dụng thực tế: Báo cáo Navigating the AI Frontier đã nêu 5 trường hợp sử dụng AI trong phát triển phần mềm, giáo dục, tài chính, dịch vụ khách hàng, và y tế.
Dù mang lại nhiều tiềm năng, tác nhân AI cũng tạo ra một số rủi ro liên quan đến kỹ thuật, đạo đức, và tác động xã hội:
Giải pháp quản lý rủi ro:
Sự trỗi dậy của tác nhân AI không chỉ là bước chuyển về công nghệ mà còn thay đổi cách chúng ta làm việc và tương tác với máy móc. Bằng cách hiểu rõ khả năng và giới hạn của công nghệ này, cùng các chiến lược triển khai có trách nhiệm, doanh nghiệp có thể khai thác tối đa tiềm năng của AI mà vẫn giảm thiểu rủi ro.
Việc cân bằng giữa đổi mới và triển khai an toàn sẽ là chìa khóa để các tổ chức thích ứng và phát triển trong kỷ nguyên AI.
• Slack sẽ tích hợp sâu các AI agent Agentforce của Salesforce vào nền tảng cộng tác nơi làm việc của mình, nhấn mạnh trí tuệ theo ngữ cảnh là yếu tố khác biệt chính trong thị trường AI agent ngày càng đông đúc.
• Rob Seaman, Giám đốc sản phẩm của Slack, cho biết các kênh Slack thường phản ánh cấu trúc tổ chức và ưu tiên tại thời điểm đó, cung cấp ngữ cảnh phong phú để các agent trả lời câu hỏi và suy luận.
• Việc tích hợp là một phần trong bản phát hành Agentforce 2.0 của Salesforce, dự kiến ra mắt vào ngày 17 tháng 12.
• Các AI agent thế hệ tiếp theo được định nghĩa bởi 3 khả năng quan trọng: kiến thức theo ngữ cảnh toàn diện, khả năng suy luận và khả năng hành động.
• Slack sẽ giới thiệu một thư viện các AI agent có thể tùy chỉnh để thực hiện nhiều tác vụ khác nhau, từ đào tạo nhân viên mới đến quản lý các dự án phức tạp đa chức năng.
• Tất cả các agent sẽ hoạt động với "ngữ cảnh người dùng", nghĩa là chúng chỉ có thể truy cập thông tin mà người dùng được phép xem.
• Nền tảng bao gồm các biện pháp bảo vệ mạnh mẽ thông qua "lớp tin cậy" của Salesforce, xử lý thông tin nhạy cảm một cách phù hợp và đảm bảo tuân thủ các quy tắc kinh doanh.
• Người dùng có thể kiểm tra các agent trong thời gian thực và quan sát quá trình ra quyết định của chúng thông qua giao diện xây dựng minh bạch.
• Đối với các doanh nghiệp đang gặp khó khăn với các phần mềm phân mảnh, tích hợp này có thể báo hiệu sự thay đổi trong cách tổ chức tiếp cận cơ sở hạ tầng công nghệ của họ.
• Seaman đã nêu ví dụ cụ thể về việc đào tạo nhân viên, cho rằng các agent có thể giúp đơn giản hóa quá trình này.
• Việc tích hợp đại diện cho một bước đi chiến lược của cả Slack và Salesforce nhằm đặt mình ở vị trí hàng đầu trong cuộc cách mạng AI doanh nghiệp.
• Trong khi các công ty như Anthropic và OpenAI đã ra mắt AI agent của riêng họ, việc tích hợp sâu của Slack với quy trình làm việc doanh nghiệp và khả năng truy cập ngữ cảnh tổ chức có thể mang lại lợi thế cạnh tranh đáng kể.
• Sự phát triển này diễn ra vào thời điểm quan trọng khi các tổ chức đang vật lộn với việc triển khai hiệu quả các công cụ AI đồng thời duy trì bảo mật và tin cậy.
📌 Slack và Salesforce tích hợp AI agent vào nền tảng cộng tác, nhấn mạnh trí tuệ theo ngữ cảnh. Các agent có thể thực hiện nhiều tác vụ, từ đào tạo nhân viên đến quản lý dự án phức tạp, với biện pháp bảo vệ mạnh mẽ. Đây là bước đi chiến lược trong cuộc đua AI doanh nghiệp.
https://venturebeat.com/ai/slacks-ai-agents-are-learning-from-your-office-chats-heres-whats-next/
- AI tác nhân là hệ thống AI có khả năng chủ động và tự chủ, không cần sự hướng dẫn liên tục từ con người để đạt được mục tiêu
- Khác biệt của AI tác nhân so với AI tạo sinh:
+ Tập trung vào ra quyết định thay vì tạo nội dung
+ Không phụ thuộc vào lệnh của người dùng
+ Có thể thực hiện chuỗi hoạt động phức tạp độc lập
- 3 lợi ích chính:
+ Chuyên môn hóa lực lượng lao động tốt hơn
+ Độ tin cậy thông tin cao hơn
+ Tăng cường khả năng đổi mới sáng tạo
- Ứng dụng tiềm năng:
+ Dịch vụ khách hàng: Chatbot thông minh có thể tự động xử lý khiếu nại và đề xuất giải pháp
+ Sản xuất: Tối ưu dây chuyền sản xuất, dự đoán sự cố thiết bị
+ Hỗ trợ bán hàng: Tự động hóa công việc hành chính, lên lịch họp, phản hồi khách hàng
+ Y tế và chăm sóc xã hội: AI agent có thể hỗ trợ chăm sóc người cao tuổi, nhắc uống thuốc
- Thách thức và yêu cầu thành công:
+ Cần xác định mục tiêu SMART rõ ràng
+ Chú trọng lựa chọn và phối hợp nhóm AI agents
+ Xây dựng khung quyết định an toàn và giám sát phù hợp
📌 AI tác nhân đánh dấu bước tiến mới trong tương tác người-máy, hứa hẹn tăng năng suất và đổi mới sáng tạo. Tuy nhiên cần có hành động sớm từ doanh nghiệp và chính phủ để đảm bảo phát triển an toàn, công bằng và mang lại lợi ích tối ưu.
https://hbr.org/2024/12/what-is-agentic-ai-and-how-will-it-change-work
#HBR
Agentic AI đang mang đến một bước nhảy vọt trong cách con người tương tác và hợp tác với AI. Từ việc lên kế hoạch du lịch đến tối ưu hóa chuỗi cung ứng hay hỗ trợ chăm sóc sức khỏe, công nghệ này mở ra nhiều khả năng mới nhờ sự tự chủ và khả năng thực hiện các nhiệm vụ phức tạp.
Agentic AI có thể được định nghĩa bằng một từ: chủ động. Theo Enver Cetin, chuyên gia AI tại Ciklum, đây là hệ thống AI có khả năng hành động độc lập để đạt được mục tiêu mà không cần sự hướng dẫn liên tục từ con người.
Khác biệt chính giữa Agentic AI và AI tạo sinh:
Agentic AI cho phép phân chia công việc ở mức độ chi tiết hơn, tạo ra sự hiệu quả và đổi mới. Ví dụ:
Agentic AI có khả năng thực hiện thí nghiệm và sáng tạo:
Agentic AI có khả năng lọc và đánh giá nguồn thông tin một cách chính xác hơn, giảm thiểu hiện tượng "ảo giác thông tin" thường gặp ở AI tạo sinh. Ví dụ, trong môi trường doanh nghiệp, AI có thể xác định dữ liệu chính xác nhất từ hệ thống CRM thay vì các nguồn không đáng tin cậy.
Agentic AI đưa tương lai tự động hóa tiến thêm một bước gần hơn, với hứa hẹn tăng năng suất, đổi mới và sự tin cậy. Tuy nhiên, để đạt được lợi ích này, doanh nghiệp và chính phủ cần hành động sớm để đảm bảo sự phát triển của Agentic AI được thực hiện một cách an toàn và công bằng.
• Deep Research chính thức ra mắt cho người đăng ký Gemini Advanced, là tính năng Agent đầu tiên của Gemini giúp tự động hóa quá trình nghiên cứu.
• Tính năng này hoạt động bằng cách:
Tạo kế hoạch nghiên cứu nhiều bước cho người dùng xem xét và phê duyệt
Phân tích thông tin liên quan từ web
Liên tục tinh chỉnh phân tích qua nhiều lần tìm kiếm
Tạo báo cáo tổng hợp với các phát hiện chính
Cho phép xuất sang Google Docs kèm link nguồn gốc.
• Deep Research sử dụng:
Hệ thống Agent mới kết hợp chuyên môn tìm kiếm của Google
Khả năng suy luận nâng cao của mô hình Gemini
Cửa sổ ngữ cảnh 1 triệu token.
• Tính năng này đặc biệt hữu ích cho:
Sinh viên chuẩn bị thuyết trình
Doanh nhân phân tích đối thủ cạnh tranh
Marketer nghiên cứu chiến dịch marketing AI.
• Gemini 2.0 Flash thử nghiệm:
Là phiên bản tối ưu hóa chat của mô hình Gemini 2.0 mới nhất
Cải thiện hiệu suất trên nhiều tiêu chí đánh giá quan trọng
Đã có sẵn trên web và sắp ra mắt trên ứng dụng di động.
• Deep Research hiện có sẵn bằng tiếng Anh trên desktop và web di động, dự kiến ra mắt trên ứng dụng di động đầu năm 2025.
📌 Gemini đã đạt bước tiến quan trọng với Deep Research - Agent đầu tiên tự động hóa nghiên cứu và mô hình 2.0 Flash thử nghiệm. Tính năng mới giúp tiết kiệm hàng giờ nghiên cứu, phân tích web tự động và tạo báo cáo tổng hợp với cửa sổ ngữ cảnh 1 triệu token.
https://blog.google/products/gemini/google-gemini-deep-research/
- Databricks vừa công bố khả năng tạo dữ liệu tổng hợp nhằm đơn giản hóa quá trình đánh giá hiệu suất của các AI agent trong môi trường doanh nghiệp.
- Mục tiêu chính là giúp các nhà phát triển có thể nhanh chóng tạo ra tập dữ liệu nhân tạo chất lượng cao để đánh giá các hệ thống agent đang phát triển.
- Giải pháp này giúp giảm thiểu thời gian tương tác với các chuyên gia và tăng tốc quy trình đưa các agent vào sản xuất.
- Mặc dù chi tiết hơn về cách hoạt động của dữ liệu tổng hợp vẫn chưa được công bố, công ty cho biết thử nghiệm nội bộ cho thấy cải thiện đáng kể về hiệu suất của các AI agent.
- Databricks đã tiếp nhận MosaicML và tích hợp công nghệ này vào nền tảng Đánh giá Dữ liệu, cho phép doanh nghiệp xây dựng và triển khai các giải pháp máy học và AI tạo sinh trên dữ liệu của họ.
- Tính năng Đánh giá Agent hiện có hai khả năng chính: cho phép chuyên gia tự định nghĩa tập dữ liệu và tạo ra một thước đo để đánh giá chất lượng phản hồi của AI agent.
- Dữ liệu tổng hợp giúp rút ngắn thời gian xây dựng tập dữ liệu đánh giá, do đó giảm khối lượng công việc của các chuyên gia.
- Hệ thống mới cho phép các nhà phát triển tạo ra tập dữ liệu đánh giá trong vài phút thay vì hàng giờ.
- Thử nghiệm nội bộ cho thấy hiệu suất của AI agent được cải thiện gần gấp đôi trong khả năng tìm kiếm tài liệu liên quan.
- Quy trình tạo dữ liệu chỉ cần 4 bước đơn giản, giúp tạo dữ liệu một cách nhanh chóng mà không cần chuyển đổi sang môi trường bên ngoài.
- Nhiều doanh nghiệp đã sử dụng API dữ liệu tổng hợp và ghi nhận sự cải thiện 60% trong chất lượng phản hồi của mô hình trước khi nhờ sự can thiệp của các chuyên gia.
- Databricks dự định mở rộng Đánh giá Agent với các tính năng cho phép chuyên gia chỉnh sửa dữ liệu tổng hợp và quản lý vòng đời của tập dữ liệu đánh giá.
- Các giải pháp mới dự kiến sẽ thúc đẩy việc áp dụng Mosaic AI của Databricks, củng cố vị thế của công ty trong lĩnh vực dữ liệu và AI tạo sinh.
- Snowflake cũng đang theo kịp với các sản phẩm AI của mình, bao gồm việc hợp tác với Anthropic để phát triển ứng dụng AI.
📌 Databricks ra mắt API tạo dữ liệu tổng hợp, giúp giảm 60% thời gian cải thiện đại lý AI và nâng cao hiệu suất gần gấp đôi trong việc tìm kiếm tài liệu. Công ty dự kiến mở rộng tính năng này trong tương lai.
https://venturebeat.com/data-infrastructure/databricks-makes-ai-agent-evaluation-a-breeze-with-new-synthetic-data-capabilities/
- Các lãnh đạo công nghệ dự đoán năm 2025 sẽ là năm AI trưởng thành và có khả năng làm việc thực sự thông qua các AI agent tự chủ
- Marc Benioff, CEO Salesforce, kỳ vọng về kỷ nguyên "Agentic" với các AI agent tự động sẽ mở ra tiềm năng khổng lồ và định nghĩa lại cách làm việc
- Goldman Sachs ngược lại cảnh báo khoản đầu tư 1.000 tỷ USD vào hạ tầng AI có thể mang lại lợi nhuận khiêm tốn
- Theo Goldman Sachs, trong thập kỷ tới AI chỉ có thể tăng năng suất Mỹ thêm 0,5% và GDP dưới 1%
- Gartner dự báo đến năm 2028:
+ 1/3 ứng dụng phần mềm doanh nghiệp sẽ tích hợp AI agent (so với dưới 1% hiện nay)
+ 15% quyết định công việc hàng ngày sẽ do AI agent tự động đưa ra
- Các thách thức chính khi triển khai AI agent:
+ Cần nhiều lớp bảo mật bao gồm "guardian agent" giám sát hoạt động
+ Quản lý phức tạp khi triển khai hàng nghìn agent
+ Vấn đề ảo giác và kết quả không nhất quán từ large language model
- Sampsa Samila từ IESE Business School nhận định:
+ AI sẽ thay đổi cách làm việc nhưng trong 10 năm chứ không phải 1 năm
+ So sánh với quá trình điện khí hóa nhà máy kéo dài 30 năm
+ ChatGPT sau 2 năm chỉ giúp tăng năng suất chứ chưa thay đổi bản chất công việc
📌 Năm 2025 đánh dấu bước ngoặt của AI agent nhưng vẫn còn nhiều thách thức. Gartner dự báo đến 2028 có 1/3 phần mềm doanh nghiệp tích hợp AI agent, tạo ra thay đổi từ từ thay vì đột phá như kỳ vọng của các lãnh đạo công nghệ.
https://qz.com/ai-agents-chatbots-artificial-intelligence-work-1851714587
- 25% doanh nghiệp sử dụng AI tạo sinh dự kiến sẽ triển khai AI agents vào năm 2025, con số này sẽ tăng lên 50% vào năm 2027, theo báo cáo từ Deloitte.
- AI agents, hay AI tác động, là các giải pháp phần mềm có khả năng hoàn thành nhiệm vụ phức tạp với ít hoặc không cần giám sát con người.
- Khoảng cách giữa nam và nữ trong việc áp dụng Gen AI đang thu hẹp nhanh chóng; dự kiến đến năm 2025, việc phụ nữ sử dụng Gen AI sẽ đạt hoặc vượt qua đàn ông.
- Tiêu thụ điện năng tại các trung tâm dữ liệu toàn cầu sẽ gấp đôi, đạt 4% tổng tiêu thụ năng lượng (khoảng 1.065 terawatt-giờ) vào năm 2030, do sự gia tăng tiêu thụ năng lượng từ Gen AI.
- Đến năm 2025, trên 30% điện thoại thông minh và khoảng 50% laptop sẽ được trang bị khả năng xử lý Gen AI tại chỗ.
- Sự phát triển của AI agents sẽ được thúc đẩy bởi đổi mới từ cả các start-up và các công ty hàng đầu trong ngành, tìm kiếm các cơ hội doanh thu mới.
- AI agents sẽ sử dụng các mô hình ngôn ngữ lớn (LLMs), có khả năng lý luận, phân tích và thích ứng với các quy trình làm việc không thể đoán trước.
- AI tác động có thể hoạt động tự động, có khả năng lập kế hoạch và thực hiện nhiệm vụ phức tạp mà không cần can thiệp nhiều từ con người.
- Các AI agents có khả năng cảm nhận môi trường và xử lý thông tin đa phương tiện như video, hình ảnh, âm thanh, văn bản và số liệu.
- AI agents có thể tương tác với các công cụ và hệ thống để hoàn thành nhiệm vụ, đồng thời huy động sự tham gia của các hệ thống và bot khác.
- Theo nghiên cứu từ Salesforce, một phần ba người tiêu dùng thích làm việc với AI agents để có dịch vụ nhanh hơn; họ cũng muốn biết khi nào đang tương tác với AI.
- Mặc dù các CIO thấy rằng AI là công nghệ chuyển đổi, chỉ 11% trong số họ triển khai hoàn toàn, do lo ngại về an ninh và hạ tầng dữ liệu.
📌 25% doanh nghiệp dự kiến triển khai AI agents vào năm 2025, tăng lên 50% vào năm 2027. Sự phát triển này được thúc đẩy bởi nhu cầu đổi mới và khả năng của AI agents trong việc hoàn thành nhiệm vụ phức tạp, trong khi tiêu thụ điện năng tại các trung tâm dữ liệu dự kiến sẽ gấp đôi.
https://www.zdnet.com/article/25-of-enterprises-using-ai-will-deploy-ai-agents-by-2025/
- Thị trường AI agent đạt giá trị 3,86 tỷ USD trong năm 2023 và dự kiến tăng trưởng với tốc độ 45,1% từ 2024-2030
- AI agent kết hợp khả năng tự động hóa, trải nghiệm hội thoại và điều phối quy trình để dẫn dắt giai đoạn tiếp theo của AI tạo sinh
- Các nền tảng lớn như Appian, Atlassian, Cisco Webex, Salesforce, SAP đã công bố tích hợp AI agent trong năm 2023
- So với chatbot truyền thống chỉ giải quyết vấn đề cơ bản, AI agent có thể:
+ Thực hiện quản lý sự cố dự đoán
+ Phân tích nguyên nhân gốc rễ vấn đề
+ Tự động hóa quy trình phức tạp
+ Đưa ra quyết định độc lập
- AI agent đòi hỏi dữ liệu chất lượng cao để hoạt động hiệu quả:
+ Cần dữ liệu chính xác và cập nhật
+ Yêu cầu kiểm tra tính toàn vẹn dữ liệu
+ Cần xem xét lại chính sách quản trị AI và dữ liệu
- Lợi ích chính của AI agent:
+ Cải thiện năng suất làm việc
+ Tự động hóa các công việc lặp đi lặp lại
+ Giúp nhân viên tập trung vào công việc giá trị cao
+ Tối ưu quy trình trong nhân sự và tài chính
- Ứng dụng trong các ngành:
+ Bán lẻ: Tư vấn mua sắm cá nhân hóa
+ Sản xuất: Chẩn đoán sức khỏe máy móc
+ Công nghệ: Hỗ trợ phát triển phần mềm
+ Y tế: Cập nhật hồ sơ bệnh nhân
📌 AI agent đang định hình lại tương lai làm việc với thị trường 3,86 tỷ USD (2023), tốc độ tăng trưởng 45,1%/năm. Công nghệ này vượt trội hơn chatbot truyền thống nhờ khả năng tự động hóa phức tạp, ra quyết định độc lập và tích hợp đa nền tảng, mang lại hiệu quả cao cho doanh nghiệp.
https://www.infoworld.com/article/3611465/how-ai-agents-will-transform-the-future-of-work.html
- Claude, một nhân viên AI, hoạt động độc lập trong môi trường phần mềm và ứng dụng.
- Anthropic giới thiệu tính năng mới gọi là "Computer Use", cho phép Claude tương tác trực tiếp với phần mềm, thực hiện các tác vụ phức tạp mà không cần sự can thiệp của con người.
- Tính năng này mô phỏng quy trình tự động hóa robot nhưng tiến xa hơn bằng cách tái hiện quá trình tư duy của con người.
- Claude có khả năng nhận biết thông tin từ hình ảnh, lý luận, và đưa ra quyết định phù hợp.
- Ví dụ, Claude có thể được giao nhiệm vụ tổ chức dữ liệu khách hàng, liên kết chúng với dữ liệu tài chính và gửi tin nhắn cá nhân qua WhatsApp mà không có sự can thiệp.
- Các lập trình viên có thể yêu cầu Claude thiết lập cụm Kubernetes với các cấu hình và dữ liệu chính xác.
- Tuy nhiên, có nhược điểm khi phụ thuộc hoàn toàn vào Claude vì nó thực hiện từng bước như con người, do đó có thể chậm hơn.
- Claude cần có quyền truy cập độc quyền vào máy tính khi hoạt động, giống như một nhân viên thực thụ.
- Các chuyên gia nhấn mạnh rằng AI không hoàn toàn độc lập nhưng mô phỏng sự tự chủ, mở ra cơ hội đổi mới trong kinh doanh.
- Các công ty như Relevance phát triển các AI agents có khả năng xử lý quy trình công việc tương tự như việc mà 5 nhân viên toàn thời gian thực hiện.
- Việc triển khai nhiều AI agents chuyên biệt có thể gia tăng năng suất, giúp tự động hóa các hoạt động như xác nhận khách hàng tiềm năng và hỗ trợ khách hàng.
- Dù có lợi ích lớn từ tự động hóa, nhưng cần thiết phải có sự giám sát và thiết lập các nguyên tắc an toàn cho AI agents.
- Các thách thức hiện tại bao gồm việc thiếu hụt quy trình tổ chức và sự khéo léo trong lập tài liệu.
- Sự kết hợp giữa Computer Use của Anthropic và AI agents có thể mở ra cơ hội tự động hóa mà trước đây không tưởng tượng được, đặc biệt trong các hoạt động sáng tạo và không lặp lại.
📌 Claude của Anthropic giúp tự động hóa quy trình kinh doanh. Tính năng "Computer Use" cho phép Claude hoạt động độc lập trong phần mềm, mở ra cơ hội đổi mới với hiệu suất cao hơn và ít tài nguyên hơn.
https://www.forbes.com/sites/charlestowersclark/2024/11/29/anthropics-claude-the-ai-junior-employee-transforming-business/
- Qwen Agent là framework để phát triển ứng dụng LLM, cung cấp khả năng theo dõi hướng dẫn, sử dụng công cụ, lập kế hoạch, và ghi nhớ.
- Alibaba Cloud vừa ra mắt Qwen Agent trên GitHub, thu hút sự quan tâm của các nhà phát triển.
- Người dùng có thể sử dụng dịch vụ mô hình qua DashScope của Alibaba Cloud hoặc triển khai mô hình riêng thông qua các mô hình mã nguồn mở Qwen.
- Qwen Agent cung cấp nhiều thành phần nguyên tử như các LLM (kế thừa từ lớp BaseChatModel) và công cụ kế thừa từ lớp BaseTool.
- Các thành phần cấp cao hơn như agents (kế thừa từ lớp Agent) cũng được tích hợp.
- Giao diện người dùng Gradio được đề cập bởi một người dùng trên X, góp phần nâng cao trải nghiệm sử dụng.
- Qwen2-Math, series LLM toán học đầu tiên trong gia đình Qwen, đã được ra mắt cách đây gần một tháng, sau đó được nâng cấp thành Qwen2.5-Math với nhiều mô hình tùy chỉnh.
- Qwen2-Math series chỉ hỗ trợ giải toán tiếng Anh bằng phương pháp Chain-of-Thought (CoT), trong khi Qwen2.5-Math mở rộng hỗ trợ cả CoT và Tool-integrated Reasoning (TIR).
- Trải nghiệm của các nhà phát triển với Qwen chủ yếu tích cực, nhiều người cho rằng Qwen 2.5 tốt hơn ChatGPT cho các tác vụ lập trình.
- Một nhà phát triển cho biết đã tạo ra một trò chơi Pac-Man hoàn chỉnh bằng Python nhờ vào mô hình 72B, vượt qua khả năng của Claude.
- Qwen cũng là lựa chọn hợp lý cho các nhà phát triển muốn giảm bớt phụ thuộc vào các giải pháp đám mây với chi phí thấp hơn so với GPT-4 và Claude.
- Amazon Web Services (AWS) đã giới thiệu Multi-Agent Orchestrator, cho phép quản lý nhiều AI agents và hội thoại phức tạp.
- Microsoft Research công bố Magentic-One, hệ thống đa tác nhân giúp giải quyết các nhiệm vụ mở trong nhiều lĩnh vực.
- OpenAI đã giới thiệu Swarm, framework cho việc xây dựng và triển khai các hệ thống đa tác nhân.
- IBM cũng ra mắt Bee Agent Framework, công cụ mã nguồn mở cho việc tạo dựng và triển khai các workflow dựa trên agent.
📌 Qwen Agent là framework mạnh mẽ cho phát triển ứng dụng LLM với nhiều tính năng nổi bật và chi phí thấp cho nhà phát triển. Nhiều nhà phát triển đã chuyển sang dùng Qwen 2.5 cho các tác vụ lập trình, cho thấy sự ấn tượng và khả năng vượt trội so với các AI khác như ChatGPT và Claude.
https://analyticsindiamag.com/ai-news-updates/qwen-agent-is-here/
- AI Agent là ứng dụng chuyên biệt của AI được thiết kế để thực hiện nhiệm vụ hoặc mô phỏng tương tác, bao gồm agent công cụ và agent mô phỏng
- Nghiên cứu từ Stanford và Google DeepMind cho thấy chỉ với 2 giờ phỏng vấn, agent mô phỏng có thể sao chép tính cách người dùng với độ chính xác 85% trong các bài kiểm tra tiêu chuẩn
- Agent mô phỏng có thể ứng dụng trong:
+ Nghiên cứu: Thay thế người tham gia, giảm chi phí và vấn đề đạo đức
+ Đào tạo: Mô phỏng tương tác xã hội phức tạp
+ Tự phản ánh: Giúp người dùng hiểu về thói quen và định kiến của bản thân
- Agent công cụ tập trung vào chức năng thực tế như quản lý lịch trình, email và tự động hóa quy trình
- Các rủi ro chính:
+ Suy giảm tính tự chủ do phụ thuộc vào AI để ra quyết định
+ Cô lập xã hội khi con người ưa thích tương tác với AI hơn người thật
+ Vấn đề về quyền riêng tư và đạo đức khi thu thập dữ liệu cá nhân
+ Khả năng bị lạm dụng để giả mạo và thao túng
- 4 nguyên tắc sử dụng AI Agent hiệu quả (4A):
+ Analysis (Phân tích): Hiểu rõ khả năng và giới hạn
+ Assessment (Đánh giá): Thường xuyên kiểm tra tác động
+ Adaptation (Thích nghi): Điều chỉnh phù hợp với mục tiêu
+ Advocacy (Vận động): Ủng hộ phát triển AI minh bạch và đạo đức
📌 AI Agent đang định nghĩa lại cách con người tương tác với máy móc. Chỉ 2 giờ phỏng vấn có thể tạo ra bản sao kỹ thuật số với độ chính xác 85%. Điều này mang lại cơ hội và thách thức lớn về tự chủ, quan hệ xã hội và quyền riêng tư của con người.
https://www.forbes.com/sites/corneliawalther/2024/11/26/ai-agents-versus-human-agency-4-ways-to-navigate-our-ai-driven-world/
- Accenture và Nvidia thành lập bộ phận mới Accenture Nvidia Business Group, đào tạo hơn 30.000 người sử dụng công nghệ Nvidia bao gồm: AI Foundry, AI Enterprise và Omniverse
- Bộ phận marketing của Accenture là nơi thử nghiệm đầu tiên, triển khai hơn 12 agent AI để:
+ Nghiên cứu thị trường
+ Phân tích dữ liệu
+ Lên lịch mạng xã hội
+ Tìm kiếm tài liệu nội bộ
+ Soạn thảo chiến lược
+ Xác định ngân sách dự án
- Kết quả ban đầu: Giảm từ 135 bước xuống còn 85 bước trong quy trình marketing
- Theo báo cáo của Deloitte:
+ 25% công ty sẽ triển khai AI agent vào năm 2025
+ 50% công ty sẽ triển khai vào năm 2027
+ Chỉ 30% dự án thí điểm AI đạt đến giai đoạn sản xuất
- Thách thức chính:
+ Điều chỉnh mô hình AI để hiểu ngôn ngữ doanh nghiệp
+ Thiếu hụt kỹ năng
+ Chi phí tăng cao
+ Rủi ro pháp lý
+ Thay đổi tư duy nhân viên
- Accenture tập trung vào các vấn đề phức tạp như:
+ Suy luận nhân quả
+ Lập kế hoạch chiến lược
+ Tối ưu hóa giá
- Nền tảng sử dụng:
+ Máy tính hiệu năng cao của Nvidia
+ Mô hình ngôn ngữ lớn như Meta Llama 3
📌 Accenture và Nvidia đã chứng minh tiềm năng của AI agent trong doanh nghiệp qua việc giảm 37% số bước trong quy trình marketing. Dự kiến 50% doanh nghiệp sẽ triển khai AI agent vào năm 2027, tuy nhiên cần giải quyết các thách thức về kỹ năng, chi phí và rủi ro pháp lý.
https://digiday.com/media/ai-briefing-inside-accenture-and-nvidias-plan-to-scale-ai-agents-for-enterprise-business/
- Một hệ thống AI đa tác nhân hiện đại bao gồm ít nhất một mô hình ngôn ngữ lớn (LLM) có khả năng sử dụng các công cụ để tạo ra và thực thi mã.
- AI tạo sinh dựa trên việc dự đoán đầu ra từ đầu vào, tạo ra mã mà có thể sử dụng ngay.
- Các tác nhân nên giao tiếp với nhau để cải thiện quy trình làm việc, chẳng hạn như trong một công ty lớn với nhiều ứng dụng khác nhau.
- Việc sử dụng các kỹ thuật như tạo sinh được tăng cường bởi truy xuất dữ liệu ngoài (RAG) có thể nâng cao khả năng tìm kiếm thông tin trong tổ chức.
- Hệ thống đa tác nhân giúp tăng cường năng suất, độ bền và khả năng thực hiện nâng cấp nhanh chóng cho các mô-đun khác nhau.
- Để xây dựng các hệ thống này, cần xác định quy trình, vai trò, các nút chịu trách nhiệm và kết nối giữa các tác nhân trong tổ chức.
- Một sơ đồ tổ chức có thể là điểm khởi đầu tốt, nhưng nên bắt đầu với quy trình làm việc để hiểu cách các tác nhân tương tác trong các tình huống khác nhau.
- Việc sử dụng các công cụ AI để xác định quy trình làm việc có thể giúp tạo ra một mô hình mạng tác nhân hiệu quả.
- Mạng tác nhân cần được tổ chức thành một đồ thị có hướng không chu trình (DAG) để tránh các vấn đề về vòng lặp trong truy vấn.
- Cần có các kiến trúc tác nhân khác nhau, chẳng hạn như kiến trúc AAOSA, giúp các tác nhân phân phối nhiệm vụ một cách hiệu quả.
- Mạng tác nhân có thể được áp dụng trong nhiều tình huống, ví dụ như trong bộ phận nhân sự để xử lý các yêu cầu phức tạp từ người dùng.
- Trong một tổ chức viễn thông, tác nhân hỗ trợ khách hàng có thể xử lý các yêu cầu phức tạp như đánh giá hiệu suất mạng và cung cấp báo giá nâng cấp.
📌 Hệ thống AI đa tác nhân mang lại nhiều lợi ích cho tổ chức, từ việc cải thiện năng suất đến khả năng tương tác thông minh giữa các tác nhân, giúp xử lý yêu cầu phức tạp một cách nhanh chóng và hiệu quả.
https://venturebeat.com/ai/getting-started-with-ai-agents-part-1-capturing-processes-roles-and-connections/
- Google Cloud vừa công bố chương trình hệ sinh thái agent AI mới có tên AI Agent Space, cho phép doanh nghiệp khám phá, triển khai và đồng tạo các agent AI.
- Hệ sinh thái này cung cấp cho đối tác:
+ Công cụ và tài nguyên để phát triển agent AI tùy chỉnh
+ Quyền truy cập sớm vào công nghệ AI của Google
+ Hỗ trợ trực tiếp từ đội ngũ kỹ thuật
+ Quảng bá agent qua Google Cloud Marketplace
- Các đối tác lớn đã xây dựng agent trên nền tảng Google Cloud:
+ Accenture: Agent hỗ trợ khách hàng bán lẻ
+ Bain: Agent quản lý tài sản tăng hiệu quả 15%
+ Deloitte: Agent "Care Finder" giúp tìm bác sĩ trong mạng lưới chỉ trong 1 phút
+ PwC: Agent hỗ trợ phòng khám ung thư tối ưu thời gian cho bác sĩ
- Đối thủ cạnh tranh chính:
+ Microsoft Copilot Studio: Hơn 100.000 tổ chức tạo agent, tích hợp với 1.800 mô hình LLM
+ SAP Joule: Agent AI hợp tác đa chức năng
+ Salesforce Agentforce: Tích hợp agent vào hệ sinh thái sẵn có
- Hiện AI Agent Space chỉ có 19 mô hình agent, thấp hơn nhiều so với đối thủ. Google dự kiến bổ sung hàng trăm agent trong những tháng tới.
📌 Google Cloud đã chính thức tham gia cuộc đua agent AI với AI Agent Space, thu hút 19 mô hình agent ban đầu và kế hoạch mở rộng quy mô. Nền tảng này nổi bật với tính linh hoạt cho đối tác và hệ sinh thái mở, tuy nhiên vẫn đang tụt hậu so với Microsoft Copilot Studio với 100.000 tổ chức sử dụng.
https://venturebeat.com/ai/google-cloud-launches-ai-agent-space-amid-rising-competition/
- Microsoft đã xây dựng hệ sinh thái AI agent lớn nhất với hơn 100.000 tổ chức sử dụng Copilot Studio, tăng gấp đôi chỉ trong một quý
- Tại hội nghị Ignite, Microsoft công bố cho phép doanh nghiệp sử dụng 1.800 mô hình ngôn ngữ lớn trong Azure, mở rộng từ việc chỉ phụ thuộc vào OpenAI
- Nền tảng tích hợp với hơn 1.400 hệ thống và nguồn dữ liệu doanh nghiệp như SAP, ServiceNow và cơ sở dữ liệu SQL
- Microsoft ra mắt 10 agent tự chủ được xây dựng sẵn nhắm vào các chức năng kinh doanh cốt lõi như bán hàng, dịch vụ, tài chính và chuỗi cung ứng
- Các tính năng bảo mật và quản trị được tích hợp sẵn trong kiến trúc cốt lõi, đảm bảo agent hoạt động trong khuôn khổ quyền hạn doanh nghiệp
- McKinsey đã giảm quy trình tiếp nhận dự án từ 20 ngày xuống 2 ngày nhờ agent định tuyến tự động
- Pets at Home triển khai agent phòng chống gian lận trong 2 tuần, tiết kiệm hàng triệu USD mỗi năm
- Microsoft phát triển "agent mesh" - hệ thống kết nối cho phép các AI agent cộng tác giải quyết vấn đề phức tạp
- Đối thủ cạnh tranh như Salesforce (10.000 agent) và ServiceNow vẫn đang ở giai đoạn đầu và thiếu tầm với doanh nghiệp rộng rãi như Microsoft
- Công nghệ agent vẫn còn sơ khai, các mô hình ngôn ngữ lớn có thể tạo ảo giác và cần quản lý cẩn thận để tránh vòng lặp vô hạn hoặc chi phí không cần thiết
📌 Microsoft dẫn đầu thị trường AI agent doanh nghiệp với 100.000 tổ chức sử dụng, gấp đôi trong một quý. Nền tảng tích hợp 1.400 hệ thống, 1.800 mô hình ngôn ngữ lớn và 10 agent tự chủ được xây dựng sẵn. Tuy nhiên công nghệ vẫn ở giai đoạn đầu và cần quản lý cẩn thận.
https://venturebeat.com/ai/microsoft-quietly-assembles-the-largest-ai-agent-ecosystem-and-no-one-else-is-close/
- AWS vừa giới thiệu Multi-Agent Orchestrator - framework quản lý nhiều tác tử AI và xử lý các cuộc hội thoại phức tạp
- Framework có khả năng:
+ Định tuyến truy vấn đến tác tử phù hợp nhất
+ Duy trì ngữ cảnh hội thoại
+ Tích hợp với AWS Lambda, môi trường local và các nền tảng đám mây khác
- Đặc điểm kỹ thuật nổi bật:
+ Hỗ trợ song ngữ Python và TypeScript
+ Cho phép phản hồi streaming và non-streaming từ các tác tử
+ Tích hợp tính năng phân loại ý định thông minh
+ Quản lý ngữ cảnh hiệu quả
+ Khả năng mở rộng tích hợp tác tử mới
- AWS đã công bố demo trên GitHub với 6 tác tử chuyên biệt:
+ Du lịch
+ Thời tiết
+ Toán học
+ Sức khỏe
+ Khả năng chuyển đổi giữa các tác tử để quản lý hội thoại nhiều lượt
- Framework cung cấp:
+ Script và ứng dụng demo có sẵn
+ Chatbot cho truy vấn chuyên biệt
+ Hệ thống hỗ trợ thương mại điện tử tích hợp AI
+ Hỗ trợ tương tác bằng giọng nói qua Amazon Connect và Lex
- Xu hướng framework đa tác tử đang phát triển mạnh:
+ Microsoft Research: Ra mắt Magentic-One - hệ thống đa tác tử tổng quát nguồn mở
+ OpenAI: Giới thiệu Swarm framework
+ IBM: Phát hành Bee Agent Framework - bộ công cụ nguồn mở cho quy trình làm việc dựa trên tác tử
📌 AWS Multi-Agent Orchestrator mở ra kỷ nguyên mới trong quản lý đa tác tử AI với khả năng hỗ trợ 2 ngôn ngữ lập trình, tích hợp 6 tác tử chuyên biệt và tương thích đa nền tảng. Framework này cùng với các giải pháp từ Microsoft, OpenAI và IBM đang định hình tương lai của hệ thống AI đa tác tử.
https://analyticsindiamag.com/ai-news-updates/aws-launches-multi-agent-orchestrator-for-managing-ai-agents/
- Microsoft vừa công bố các tính năng mới trong Microsoft 365 Copilot tại sự kiện Microsoft Ignite, cho phép người dùng xây dựng agent tự động hoặc sử dụng các agent có sẵn
- Nền tảng này hỗ trợ hơn 1.800 mô hình AI từ danh mục Azure AI
- Các tính năng chính bao gồm:
+ Khả năng tự động hoạt động không cần giám sát của con người
+ Tích hợp với Azure AI Foundry để tùy chỉnh tìm kiếm và sử dụng mô hình riêng
+ SDK agent mới cho phép phát triển agent đa kênh
- Microsoft giới thiệu các agent có sẵn:
+ Agent SharePoint: tạo và chia sẻ agent tùy chỉnh
+ Agent tự phục vụ nhân viên: xử lý các vấn đề HR và IT
+ Agent điều phối: ghi chú và tóm tắt cuộc họp Teams
+ Agent phiên dịch: dịch thời gian thực trong Teams với 9 ngôn ngữ
+ Agent quản lý dự án: tự động hóa quy trình trong Planner
- Kết quả thực tế từ các đối tác:
+ McKinsey: giảm 90% thời gian và 30% công việc hành chính trong quy trình tiếp nhận khách hàng
+ Thomson Reuters: cắt giảm 50% thời gian trong quy trình pháp lý
- Azure AI Foundry SDK cung cấp:
+ 25 mẫu có sẵn
+ Công cụ tích hợp với GitHub và Copilot Studio
+ Giao diện lập trình đơn giản hóa
📌 Microsoft đã tạo bước đột phá với hệ sinh thái AI agent lớn nhất hiện nay, hỗ trợ 1.800 mô hình AI. Các tính năng mới trong Copilot giúp doanh nghiệp tiết kiệm tới 90% thời gian xử lý công việc, với khả năng tự động hóa từ cơ bản đến phức tạp mà không cần kiến thức lập trình chuyên sâu.
https://venturebeat.com/ai/microsofts-new-ai-agents-support-1800-models-and-counting/
- Qwen 2.5 đạt hơn 40 triệu lượt tải và tạo ra hơn 50.000 mô hình phái sinh, trở thành lựa chọn hàng đầu cho phát triển AI Agent
- Một nhà phát triển trên Reddit báo cáo Qwen 2.5 14B vượt trội hơn GPT-4 và GPT-4o trong một số ứng dụng cụ thể nhờ khả năng gọi hàm, lập luận chuỗi suy nghĩ và thực hiện chỉ dẫn phức tạp
- Doanh nghiệp có thể triển khai Qwen 2.5 trong môi trường hoàn toàn cách ly với vLLM, đảm bảo không có kết nối bên ngoài
- Trên GPU 3090 tầm trung, mô hình đạt tốc độ 28 token/giây với ngữ cảnh 32K, phù hợp cho nhiều tình huống lập trình
- Công nghệ suy luận từng lớp của dự án AirLLM cho phép chạy mô hình 72B tham số trên hệ thống chỉ có 4GB VRAM
- Qwen 14B instruct hoạt động tốt với công cụ SQL và là mô hình duy nhất dưới 27B có thể sử dụng công cụ SQL hiệu quả
- Nhiều lập trình viên tích hợp thành công Qwen 2.5 vào môi trường phát triển thông qua Llama.cpp, LM Studio API và VSCodium
- Chi phí token của Qwen rẻ hơn nhiều so với GPT-4o (0,38 so với 5,0 USD/triệu token) và Claude 3.5 Sonnet (3,05 USD/triệu token)
- Một lập trình viên đã tạo game Pac-Man hoàn chỉnh bằng Python với mô hình 72B chạy local, vượt trội Claude chỉ tạo được bản đồ cơ bản
- Hạn chế: đôi khi phản hồi bằng tiếng Trung khi bối rối và cần prompt chính xác hơn cho tác vụ phức tạp
📌 Qwen 2.5 đang dẫn đầu cuộc đua AI Agent với 40 triệu lượt tải, chi phí thấp (0,38 USD/triệu token), khả năng chạy trên GPU phổ thông 4GB VRAM và hiệu suất vượt trội GPT-4 trong nhiều tác vụ lập trình.
https://analyticsindiamag.com/developers-corner/qwen-2-5-is-winning-the-ai-agents-race/
• Hiện tại, các khảo sát về tỷ lệ áp dụng AI cao trong doanh nghiệp nhỏ chỉ là phóng đại. Phần lớn doanh nghiệp nhỏ chưa thực sự ứng dụng AI như các công ty lớn.
• Trong khi các thương hiệu lớn như Klarna, T-Mobile, UBS Warburg và JP Morgan đầu tư hàng triệu USD để tạo mô hình ngôn ngữ lớn, doanh nghiệp nhỏ chỉ mới thử nghiệm với ChatGPT, Claude hoặc Microsoft Copilot.
• Năm 2025, làn sóng phần mềm AI Agent sẽ giúp doanh nghiệp nhỏ tự động hóa nhiều quy trình:
- Microsoft ra mắt 10 Agent cho Dynamics 365 để xử lý khách hàng tiềm năng, xác nhận đơn hàng, đối chiếu hóa đơn
- Salesforce giới thiệu SDR và Einstein Coach để đánh giá khách hàng tiềm năng, lên lịch họp
- Intuit phát triển Agent phân tích dòng tiền và tự động thanh toán hóa đơn
- Nvidia công bố Agent giọng nói đảm nhận vai trò y tá với chi phí thấp hơn
- Anthropic và Google tạo Agent có thể điều khiển thiết bị để thực hiện các tác vụ như đặt vé máy bay, đặt văn phòng phẩm
• Các Agent này sẽ thay thế một số công việc của con người, tạo lo ngại về mất việc làm. Tuy nhiên, trong bối cảnh thiếu hụt lao động, Agent là giải pháp hữu ích cho doanh nghiệp.
• Doanh nghiệp cần chủ động trao đổi với nhà cung cấp phần mềm về AI Agent và đào tạo nhân viên để tận dụng công nghệ mới này.
📌 Năm 2025, AI Agent sẽ giúp doanh nghiệp vừa và nhỏ tự động hóa nhiều quy trình quan trọng. Microsoft, Salesforce và Intuit dẫn đầu với các giải pháp Agent cho phép xử lý khách hàng, quản lý tài chính và thay thế một số vị trí nhân sự với chi phí thấp hơn.
https://www.forbes.com/sites/quickerbettertech/2024/11/14/how-ai-agents-will-disrupt-small-and-mid-sized-business-in-2025/
- Meta phát triển dự án robot mới tập trung vào công nghệ cảm nhận xúc giác, mở ra tiềm năng ứng dụng trong y tế, sản xuất và nhiều lĩnh vực khác
- Công nghệ SPUR (Sensory Perception Unified Representation) được huấn luyện trên 460.000 hình ảnh xúc giác, cải thiện hiệu suất vượt 95% so với các mô hình truyền thống
- Cảm biến Digit 360 cung cấp độ nhạy cảm xúc giác ngang tầm con người, cho phép robot:
+ Thực hiện các thao tác lắp ráp tinh vi trong sản xuất
+ Hỗ trợ các thủ thuật y tế chính xác
+ Nhận diện vật thể trong nhiều môi trường khác nhau
- Nền tảng Digit Plexus tiêu chuẩn hóa kết nối cảm biến robot, tạo điều kiện:
+ Tích hợp liền mạch cảm biến xúc giác vào hệ thống robot
+ Đẩy nhanh phát triển và triển khai giải pháp AI
- Meta hợp tác với các đối tác công nghiệp như Gelite và Wanick Robotics để:
+ Phát triển và thương mại hóa công nghệ cảm biến xúc giác
+ Thúc đẩy ứng dụng trong tự động hóa công nghiệp và robot y tế
- Phần mềm mô phỏng Habitat 3.0 được sử dụng để:
+ Kiểm thử tương tác người-robot trong môi trường gia đình
+ Tối ưu hóa thuật toán với chi phí thấp
+ Mô phỏng thực tế các tương tác phức tạp
📌 Meta đã tạo bước đột phá trong công nghệ robot với khả năng cảm nhận xúc giác tiên tiến, đạt cải thiện 95% so với mô hình cũ. Dự án tích hợp cảm biến Digit 360 và nền tảng Digit Plexus, mở ra ứng dụng rộng rãi trong y tế, sản xuất và hỗ trợ người khuyết tật.
https://www.geeky-gadgets.com/meta-robotics-touch-perception-technology/
- Microsoft Research vừa phát hành Magentic-One, một hệ thống AI đa tác tử tổng quát có khả năng giải quyết các tác vụ mở trong nhiều lĩnh vực
- Magentic-One được phát hành dưới dạng công cụ nguồn mở trên nền tảng Microsoft AutoGen, nhằm hỗ trợ các nhà phát triển và nghiên cứu tạo ra ứng dụng tự động xử lý các tác vụ phức tạp
- Kiến trúc đa tác tử của Magentic-One bao gồm:
+ Tác tử điều phối chính
+ WebSurfer cho điều hướng web
+ FileSurfer cho quản lý file
+ Coder cho lập trình
+ ComputerTerminal cho thực thi mã
- Hệ thống có tính linh hoạt và mở rộng cao:
+ Cho phép thêm/bớt tác tử mà không ảnh hưởng cấu trúc cốt lõi
+ Hỗ trợ tích hợp các mô hình ngôn ngữ lớn (LLM) và nhỏ (SLM)
+ Đã thử nghiệm với GPT-4 và OpenAI o1-preview
- Microsoft giới thiệu AutoGenBench để đánh giá hiệu suất trên các benchmark:
+ GAIA
+ AssistantBench
+ WebArena
- Các framework đa tác tử nguồn mở khác cũng được phát hành gần đây:
+ OpenAI với Swarm
+ IBM với Bee Agent Framework (phiên bản alpha)
+ Bee Agent tương thích với IBM Granite và Llama 3.2
📌 Magentic-One là nền tảng AI đa tác tử nguồn mở của Microsoft với kiến trúc module linh hoạt, cho phép xử lý đa dạng tác vụ từ duyệt web đến lập trình. Hệ thống đạt hiệu suất cạnh tranh trên các benchmark quan trọng và hỗ trợ tích hợp nhiều mô hình ngôn ngữ khác nhau.
https://analyticsindiamag.com/ai-news-updates/microsoft-launches-magentic-one-an-open-source-multi-agent-ai-platform/
- OpenAI tổ chức sự kiện DevDay đầu tiên tại London, với sự tham gia của Olivier Godement (trưởng sản phẩm) và Romain Huet (trưởng trải nghiệm nhà phát triển)
- Công ty vừa công bố cập nhật cho nền tảng Realtime API:
+ Thêm tính năng giọng nói mới
+ Cho phép nhà phát triển tạo prompt nhanh hơn
+ Ra mắt tính năng tìm kiếm internet cho ChatGPT
- 2 thách thức chính để phát triển AI agent:
1. Khả năng lập luận:
+ Cần tin cậy để hoàn thành nhiệm vụ phức tạp
+ OpenAI đã giới thiệu tính năng "reasoning" trong mô hình o1
+ Sử dụng học tăng cường để xử lý thông tin theo "chuỗi suy nghĩ"
+ Mô hình cần đáng tin cậy, nhanh và rẻ hơn
2. Khả năng kết nối công cụ:
+ AI cần truy cập internet để cập nhật thông tin
+ Cần thực hiện được các hành động trong thế giới thực
+ Đối thủ Anthropic đã cho phép chatbot Claude tương tác với giao diện máy tính
- Dự báo tương lai:
+ Trong vài năm tới, mỗi người và doanh nghiệp sẽ có AI agent riêng
+ AI agent sẽ truy cập email, ứng dụng và lịch của người dùng
+ Hoạt động như trợ lý cá nhân thông minh
+ Năm tới sẽ tăng ứng dụng AI trong hỗ trợ khách hàng
📌 OpenAI đang tiến tới mục tiêu xây dựng AI agent toàn diện thông qua 2 bước đột phá: nâng cao khả năng lập luận và kết nối đa công cụ. Tính năng tìm kiếm mới của ChatGPT là bước đi quan trọng, mở đường cho việc phát triển trợ lý AI có thể hoàn thành chuỗi nhiệm vụ phức tạp trong tương lai.
https://www.technologyreview.com/2024/11/05/1106603/how-chatgpt-search-paves-the-way-for-ai-agents/
#MIT
- Các hạn chế chính của LLM bao gồm:
+ Kiến thức bị giới hạn dù được huấn luyện trên dữ liệu lớn
+ Khả năng suy luận còn hạn chế
+ Không thể cập nhật thông tin thời gian thực
- Một tác tử AI bao gồm 4 thành phần chính:
+ Công cụ để truy cập thông tin từ internet, cơ sở dữ liệu và API
+ Bộ nhớ ngắn hạn và dài hạn để lưu trữ kết quả
+ Bộ suy luận để chia nhỏ tác vụ phức tạp
+ Khả năng thực hiện hành động dựa trên môi trường
- Ưu điểm của hệ thống đa tác tử:
+ Xử lý tốt các tác vụ phức tạp thông qua đóng vai
+ Mỗi tác tử tập trung vào một mục tiêu cụ thể
+ Giảm thiểu ảo giác bằng cách định nghĩa rõ vai trò
- Thách thức khi triển khai thực tế:
+ Khó khăn trong quản lý khi số lượng tác tử tăng lên
+ Độ trễ do cần nhiều lần gọi LLM
+ Hiệu suất không ổn định do bản chất xác suất của LLM
+ Cần có sự giám sát của con người trong các bước quan trọng
📌 AI đa tác tử đang thu hẹp khoảng cách giữa LLM và AGI bằng cách kết hợp nhiều tác tử chuyên biệt. Framework như CrewAI và Autogen cho phép xử lý công việc tự động với độ chính xác cao hơn, tuy nhiên vẫn cần sự giám sát của con người trong các quyết định quan trọng.
https://venturebeat.com/ai/why-multi-agent-ai-conquers-complexities-llms-cant/
- Meta vừa công bố nhiều công cụ AI quan trọng cho robot và hệ thống AI thể hiện, bao gồm các tiêu chuẩn và công cụ giúp hiểu và tương tác tốt hơn với thế giới vật lý.
- Sparsh - một họ mô hình mã hóa cho cảm biến xúc giác dựa trên thị giác, được phát triển cùng với Đại học Washington và Carnegie Mellon. Mô hình này đã được huấn luyện trên hơn 460.000 hình ảnh xúc giác và đạt cải thiện trung bình 95,1% so với các mô hình trước đây.
- Digit 360 là cảm biến xúc giác hình dạng ngón tay nhân tạo với hơn 18 tính năng cảm biến. Cảm biến có hơn 8 triệu điểm cảm biến để ghi nhận biến dạng đa hướng trên bề mặt đầu ngón tay.
- Digit Plexus là nền tảng phần cứng-phần mềm giúp phát triển ứng dụng robot. Nền tảng này có thể tích hợp nhiều cảm biến xúc giác đầu ngón tay và da lên một bàn tay robot.
- Meta sẽ sản xuất Digit 360 cùng với GelSight Inc và hợp tác với Wonik Robotics để phát triển bàn tay robot tích hợp đầy đủ cảm biến xúc giác trên nền tảng Digit Plexus.
- PARTNR là tiêu chuẩn đánh giá hiệu quả của mô hình AI khi cộng tác với con người trong các công việc gia đình. Tiêu chuẩn này bao gồm 100.000 tác vụ ngôn ngữ tự nhiên trong 60 ngôi nhà với hơn 5.800 vật thể độc đáo.
📌 Meta đã tạo bước đột phá trong công nghệ robot với cảm biến Digit 360 có 8 triệu điểm cảm biến, mô hình Sparsh cải thiện 95,1% hiệu suất và nền tảng PARTNR với 100.000 tác vụ thử nghiệm. Các công nghệ này hứa hẹn mang lại khả năng tương tác tự nhiên giữa robot và con người.
https://venturebeat.com/ai/meta-unveils-ai-tools-to-give-robots-a-human-touch-in-physical-world/
• Microsoft vừa công bố Windows Agent Arena - nền tảng benchmark mới để kiểm thử AI agent trong môi trường Windows thực tế
• Nền tảng này cho phép thử nghiệm AI agent trên nhiều ứng dụng Windows như Microsoft Edge, Paint, Clock, VLC media player
• Microsoft Research phát triển AI agent đa phương thức tên Navi để khám phá khả năng của framework
• Kết quả benchmark cho thấy tỷ lệ thành công trung bình của AI agent chỉ đạt 19,5% so với hiệu suất trung bình của con người là 74,5%
• Nền tảng này được phát triển dựa trên framework OSWorld với hơn 150 tác vụ Windows đa dạng
• Windows Agent Arena là dự án nguồn mở, sử dụng các mô hình từ OpenAI như GPT-4V và Microsoft Phi3
• Salesforce CEO Marc Benioff chỉ trích Microsoft Copilot là "Clippy 2.0" và cho rằng Microsoft thiếu dữ liệu và mô hình bảo mật doanh nghiệp
• Các mối quan ngại chính về bảo mật và quyền riêng tư khi AI agent ngày càng tinh vi và có quyền truy cập nhiều ứng dụng chứa thông tin cá nhân
• Microsoft cam kết ưu tiên đạo đức AI, đặt quyền riêng tư và an toàn lên hàng đầu
• Anthropic cũng vừa ra mắt API "Computer Use" cho phép Claude sử dụng máy tính như người thật
📌 Microsoft phát triển Windows Agent Arena để thử nghiệm AI agent trên Windows với 150 tác vụ tự động. Hiệu suất AI chỉ đạt 19,5% so với con người (74,5%). Dự án nguồn mở này đối mặt thách thức về bảo mật và quyền riêng tư khi AI ngày càng tinh vi.
https://www.windowscentral.com/software-apps/microsofts-windows-agent-arena-brings-ai-assistants-keyboard-deep-to-windows-pcs-but-there-are-concerns
• Google đang phát triển dự án mật có tên "Project Jarvis" - một hệ thống AI Agent có khả năng điều khiển trình duyệt web để thực hiện các tác vụ thay người dùng
• Theo The Information, dự án này dự kiến sẽ được giới thiệu vào tháng 12/2024, dựa trên thông tin từ 3 nguồn tin nội bộ
• Project Jarvis được xây dựng dựa trên phiên bản nâng cấp của mô hình AI Gemini, được tối ưu hóa đặc biệt cho trình duyệt Chrome
• Hệ thống có khả năng:
- Thu thập thông tin nghiên cứu
- Thực hiện mua sắm trực tuyến
- Đặt vé máy bay
- Tự động hóa các tác vụ web hàng ngày
• Cơ chế hoạt động của Jarvis:
- Chụp và phân tích ảnh màn hình
- Tự động nhấp chuột vào các nút
- Nhập văn bản theo yêu cầu
- Mỗi hành động mất vài giây để xử lý
• Các đối thủ cạnh tranh cũng đang phát triển công nghệ tương tự:
- Microsoft với Copilot Vision
- Apple Intelligence
- Anthropic với Claude
- OpenAI đang nghiên cứu phiên bản riêng
• Google dự kiến sẽ thử nghiệm Jarvis với một số lượng nhỏ người dùng để phát hiện và khắc phục lỗi
📌 Google chuẩn bị tham gia cuộc đua AI Agent với Project Jarvis, dự kiến ra mắt tháng 12/2024. Hệ thống có thể tự động thực hiện các tác vụ web phức tạp như đặt vé máy bay, mua sắm thông qua việc điều khiển trình duyệt Chrome, mỗi thao tác mất vài giây xử lý.
https://www.theverge.com/2024/10/26/24280431/google-project-jarvis-ai-system-computer-using-agent
• ServiceNow đề xuất triển khai AI agent như những công cụ hoạt động ngầm để tránh gây áp lực cho nhân viên phải học cách sử dụng
• Dorit Zilbershot, phó chủ tịch AI và đổi mới tại ServiceNow khẳng định nhân viên không cần biết có bao nhiêu AI agent đang hoạt động ngầm
• Nền tảng Now Assist của ServiceNow là sản phẩm tăng trưởng nhanh nhất của công ty, ra mắt thư viện AI agent cho khách hàng vào tháng 9/2024
• AI agent có thể tự động hóa nhiều quy trình như:
- Mã hóa thông tin khách hàng
- Phân loại dữ liệu
- Thông báo thay đổi trạng thái cho nhân viên
• CEO Bill McDermott xác nhận AI tạo sinh, đặc biệt là các ứng dụng liên quan đến agent, đã phát triển vượt kỳ vọng
• ServiceNow nhấn mạnh sự khác biệt giữa agent và assistant để tránh tạo kỳ vọng sai lệch về việc người dùng phải học cách tương tác
• Công ty triển khai orchestrator agent để quản lý hệ sinh thái AI agent ngày càng mở rộng
• ServiceNow hợp tác với Nvidia:
- Sử dụng NIM Agent Blueprint để xây dựng AI agent có sẵn
- Agent đầu tiên là Vulnerability Analysis for Container Security AI Agent
- Dự kiến ra mắt vào năm 2025
📌 ServiceNow định hình lại cách tiếp cận AI trong doanh nghiệp thông qua mô hình AI agent "vô hình". Now Assist trở thành sản phẩm tăng trưởng nhanh nhất, với việc hợp tác cùng Nvidia để mở rộng hệ sinh thái agent vào năm 2025.
https://venturebeat.com/ai/servicenow-advocates-for-invisible-ai-agents-to-ease-worker-adoption/
- Microsoft vừa công bố bộ agent AI tự động mới cho nền tảng Dynamics 365, nhằm tăng cường tự động hóa trong các bộ phận bán hàng, tài chính, dịch vụ và chuỗi cung ứng.
- Các agent AI này sẽ được ra mắt dưới dạng thử nghiệm công khai vào tháng tới, với khả năng xử lý ngữ cảnh và ý định để đưa ra quyết định phức tạp, vượt trội so với các chatbot thông thường.
- Microsoft khẳng định các agent này không thay thế con người mà hỗ trợ mở rộng năng lực của nhân viên. “Agent giúp con người làm được những điều mà trước đây không thể làm,” Bryan Goode, Phó Chủ tịch Microsoft, nhấn mạnh.
- Động thái này diễn ra sau khi Salesforce ra mắt Agentforce – nền tảng AI của riêng họ, được CEO Marc Benioff quảng bá mạnh mẽ và chỉ trích Microsoft Copilot là "Clippy 2.0" vì kém hiệu quả.
- Microsoft tận dụng sức mạnh từ các công cụ quen thuộc như Microsoft 365 và Azure, trong khi Salesforce dựa vào chuyên môn CRM và Data Cloud để phát triển các agent AI tối ưu hóa mối quan hệ khách hàng.
- Cuộc cạnh tranh này đánh dấu bước ngoặt lớn khi các agent AI đang trở thành công cụ cốt lõi trong phần mềm doanh nghiệp, hứa hẹn định hình lại tương lai của công việc và cấu trúc tổ chức.
- Tuy nhiên, cả hai công ty phải đối mặt với thách thức về quyền riêng tư dữ liệu, minh bạch trong quyết định của AI, và lo ngại về việc mất việc làm do tự động hóa. Thành công của các nền tảng này phụ thuộc vào khả năng cân bằng giữa giá trị kinh doanh và sự minh bạch trong triển khai.
📌 Microsoft và Salesforce đang dẫn đầu trong cuộc cách mạng AI doanh nghiệp, mỗi bên với chiến lược riêng. Cuộc chiến này không chỉ định hình lại phần mềm doanh nghiệp mà còn mở ra những thay đổi lớn trong cách tổ chức và vận hành công việc.
https://venturebeat.com/ai/microsofts-new-ai-agents-set-to-shake-up-enterprise-software-sparking-new-battle-with-salesforce/
- Thế hệ thứ ba của AI đang diễn ra với sự phát triển mạnh mẽ của các tác nhân AI, tự động và thông minh.
- Thị trường cho các tác nhân AI hiện nay khoảng 5.1 tỷ USD và dự kiến sẽ đạt 47.1 tỷ USD vào năm 2030 (tăng trưởng hàng năm 44.8%).
- Salesforce đã giới thiệu “AgentForce”, bộ công cụ cho phép xây dựng nhanh các tác nhân AI để tạo ra lực lượng lao động hybrid.
- Oracle cũng công bố hơn 50 tác nhân AI mới cho Oracle Fusion Cloud.
- Ngành an ninh mạng đang đối mặt với tình trạng thiếu hụt nhân lực nghiêm trọng, với khoảng 5.5 triệu vị trí còn thiếu trên toàn cầu.
- Các cuộc tấn công mạng ngày càng gia tăng về số lượng và độ phức tạp, bao gồm ransomware và phishing.
- Các tác nhân AI trong an ninh mạng có khả năng tự động hóa các nhiệm vụ lặp đi lặp lại và phát hiện mối đe dọa theo thời gian thực.
- Tác nhân AI có thể học hỏi từ môi trường và thích ứng với các mối đe dọa mới mà không cần sự can thiệp liên tục của con người.
- Việc xây dựng đường dẫn dữ liệu đám mây là cần thiết để cải thiện khả năng học máy và trí tuệ trong an ninh mạng.
- Tác nhân AI có thể giám sát cơ sở hạ tầng sạc xe điện (EV) và phát hiện các bất thường trong hành vi sạc hoặc lưu lượng năng lượng.
- Công nghệ mô hình hành động lớn (LAM) đang được áp dụng để tạo ra trí tuệ hành động cho các tác nhân AI.
- Sự chuyển mình từ hệ thống chuyên gia sang những thực thể thông minh hơn sẽ cho phép tác nhân AI dự đoán và phản ứng với các mối đe dọa phức tạp.
📌 Tác nhân AI đang trở thành giải pháp quan trọng trong an ninh mạng khi đối mặt với tình trạng thiếu hụt nhân lực. Dự báo thị trường sẽ đạt 47.1 tỷ USD vào năm 2030, với khả năng tự động hóa và học hỏi từ môi trường.
https://www.forbes.com/councils/forbestechcouncil/2024/10/22/the-evolution-of-ai-agents-in-the-third-wave-of-ai/
• CrewAI, startup thành lập năm 2023, vừa ra mắt sản phẩm đầu tiên CrewAI Enterprise cho phép người dùng xây dựng và triển khai các đội ngũ AI agent
• Thị trường AI agent dự kiến tăng từ 5 tỷ USD năm 2024 lên gần 50 tỷ USD vào năm 2030
• Theo Capgemini, 10% doanh nghiệp lớn đã sử dụng AI agent, 50% có kế hoạch triển khai trong năm tới và 82% sẽ áp dụng trong 3 năm tới
• Nền tảng mới của CrewAI được xây dựng trên framework nguồn mở, cho phép tổ chức:
- Xây dựng đội ngũ AI agent sử dụng bất kỳ LLM hoặc nền tảng đám mây nào
- Triển khai an toàn với các mức kiểm soát tùy chỉnh
- Theo dõi ROI với công cụ kiểm thử và đào tạo
• Các trường hợp sử dụng phổ biến:
- Tự động hóa quy trình nội bộ
- Marketing và phát triển code
- Nghiên cứu, tổng hợp và báo cáo
- Phân tích pháp lý
- Cập nhật và kiểm thử code tự động
- Phát triển leads và tư vấn trong lĩnh vực bất động sản
- Xử lý yêu cầu nội bộ theo quy tắc cụ thể
- Biên tập video và đăng tải lên mạng xã hội
• Thành tích ấn tượng:
- Thực thi hơn 10 triệu AI agent mỗi tháng
- Được sử dụng bởi gần 50% công ty Fortune 500
- Thu hút 150 khách hàng doanh nghiệp beta trong chưa đầy 6 tháng
- Gọi vốn 18 triệu USD từ các nhà đầu tư hàng đầu
📌 CrewAI đang dẫn đầu làn sóng AI agent với framework nguồn mở được 50% Fortune 500 sử dụng, thực thi 10 triệu agent/tháng. Startup này vừa huy động 18 triệu USD và ra mắt nền tảng doanh nghiệp mới, hứa hẹn đưa thị trường AI agent đạt 50 tỷ USD vào 2030.
https://venturebeat.com/ai/crewai-launches-its-first-multi-agent-builder-speeding-the-way-to-agentic-ai/
• Gartner dự đoán đến năm 2028, ít nhất 15% quyết định công việc hàng ngày sẽ được thực hiện tự động thông qua AI tạo sinh (tăng từ 0% năm 2024).
• AI agent được xem là một trong những xu hướng công nghệ chiến lược hàng đầu trong năm 2025.
• Các trường hợp sử dụng cơ bản của AI agent bao gồm các tác vụ đơn điệu tốn thời gian và năng lượng của con người.
• AI tạo sinh có khả năng lập kế hoạch, cảm nhận và hành động, có thể tự động giám sát và quản lý hệ thống.
• Trong tương lai, AI agent có thể giúp nâng cao kỹ năng của lực lượng lao động bằng cách đóng vai trò cố vấn cho nhân viên mới.
• Nền tảng quản trị AI sẽ giúp các tổ chức quản lý hiệu suất pháp lý, đạo đức và hoạt động của hệ thống AI của họ.
• Các công cụ mới sẽ tạo, quản lý và thực thi các chính sách để đảm bảo AI minh bạch và được sử dụng có trách nhiệm.
• Gartner dự đoán 7 mô hình tính toán sẽ xuất hiện trong tương lai gần, bao gồm CPU, GPU, biên, mạch tích hợp chuyên dụng, hệ thống thần kinh nhân tạo, lượng tử cổ điển và tính toán quang học.
• Mô hình tính toán lai trong tương lai sẽ kết hợp các cơ chế tính toán, lưu trữ và mạng khác nhau.
• Phần mềm điều phối sẽ di chuyển việc tính toán từ mô hình này sang mô hình khác tùy thuộc vào nhiệm vụ và phương pháp phù hợp nhất.
• Bảo mật thông tin sai lệch trở nên quan trọng khi AI cho phép các tác nhân đe dọa lan truyền thông tin sai lệch nhanh hơn và dễ dàng hơn bao giờ hết.
• Đến năm 2028, Gartner dự đoán 50% doanh nghiệp sẽ bắt đầu áp dụng các sản phẩm, dịch vụ hoặc tính năng được thiết kế đặc biệt cho bảo mật thông tin sai lệch (tăng từ dưới 5% hiện nay).
• Gartner dự đoán đến năm 2029, tiến bộ trong lĩnh vực máy tính lượng tử sẽ khiến hầu hết các phương pháp mật mã bất đối xứng thông thường trở nên không an toàn.
• Các tổ chức cần chuẩn bị cho mật mã hậu lượng tử ngay bây giờ để đảm bảo dữ liệu của họ không bị giải mã.
• Gartner dự đoán sự gia tăng trong việc sử dụng giao diện não-máy hai chiều (BBMIs) để đọc và giải mã hoạt động của não và nâng cao khả năng nhận thức của con người.
• Đến năm 2030, 30% người lao động tri thức sẽ sử dụng các công nghệ như BBMIs để duy trì sự phù hợp trong môi trường làm việc được hỗ trợ bởi AI (tăng từ dưới 1% năm 2024).
📌 Gartner dự đoán sự trỗi dậy của AI agent vào năm 2025, với 15% quyết định công việc hàng ngày được thực hiện tự động thông qua AI tạo sinh vào năm 2028. Các xu hướng khác bao gồm nền tảng quản trị AI, mô hình tính toán lai, bảo mật thông tin sai lệch và mật mã hậu lượng tử, với 50% doanh nghiệp áp dụng bảo mật thông tin sai lệch vào năm 2028.
https://venturebeat.com/security/gartner-2025-will-see-the-rise-of-ai-agents-and-other-top-trends/
• Microsoft vừa công bố 10 agent AI mới cho Dynamics 365, sử dụng trong bán hàng, dịch vụ khách hàng, tài chính và chuỗi cung ứng.
• Các agent này có thể giúp doanh nghiệp tiết kiệm tới 50 triệu USD mỗi năm, tương đương với việc bổ sung 187 nhân viên toàn thời gian.
• Microsoft cũng giới thiệu tính năng mới trong Copilot Studio, cho phép lập trình viên tạo agent riêng kết nối với dữ liệu doanh nghiệp.
• 10 agent mới bao gồm: agent đánh giá khách hàng tiềm năng, agent đơn hàng bán, agent giao tiếp nhà cung cấp, agent đối chiếu tài chính, agent đối chiếu tài khoản, agent quản lý thời gian và chi phí, agent ý định khách hàng, agent quản lý kiến thức khách hàng, agent quản lý trường hợp và agent vận hành lịch trình.
• Các agent sẽ bắt đầu có sẵn ở bản xem trước công khai vào cuối năm nay và đầu năm 2025 trong Dynamics 365.
• Microsoft dự đoán mỗi tổ chức sẽ có một "chòm sao" agent, từ đơn giản đến hoàn toàn tự chủ.
• Các agent sẽ sử dụng dữ liệu từ Microsoft 365 Graph, hệ thống ghi chép, Dataverse và Fabric.
• Microsoft đã dẫn chứng các khách hàng như Clifford Chance, McKinsey & Company và Pets at Home đang sử dụng agent tự chủ để tăng doanh thu và giảm chi phí.
• Công ty cam kết có các biện pháp bảo mật nghiêm ngặt và kiểm soát quản trị dữ liệu mạnh mẽ, được quản lý trong Copilot Studio.
• Copilot Studio được tính phí dựa trên mức sử dụng, với giá 200 USD/tháng cho 25.000 tin nhắn.
• Microsoft sẽ chia sẻ thêm thông tin về Copilot Studio và Dynamics 365 tại sự kiện trực tuyến Microsoft Business Applications Launch Event vào ngày 29/10.
📌 Microsoft ra mắt 10 agent AI mới cho Dynamics 365, hứa hẹn tiết kiệm 50 triệu USD/năm cho doanh nghiệp. Các agent tự động hóa quy trình trong bán hàng, tài chính và chuỗi cung ứng, tương đương với việc bổ sung 187 nhân viên toàn thời gian.
https://www.zdnet.com/article/microsoft-introduces-ten-ai-agents-for-sales-finance-supply-chain-in-dynamics-365/#ftag=RSSbaffb68
• OpenAI vừa ra mắt Swarm, một khung mã nguồn mở thử nghiệm nhằm đơn giản hóa việc tạo và điều phối các tác nhân AI để tự động hóa tác vụ.
• Swarm tập trung vào cải thiện phối hợp và thực thi tác nhân thông qua hai khái niệm cốt lõi: tác nhân và bàn giao.
• Khung này cho phép chia nhỏ quy trình phức tạp thành các tác vụ có thể quản lý được, đảm bảo mỗi tác nhân được trang bị công cụ và hướng dẫn cần thiết để hoàn thành công việc hiệu quả.
• Swarm được thiết kế là một khung nhẹ, có thể kiểm soát và kiểm thử được, lý tưởng để phát triển các tác nhân AI tinh vi.
• Kiến trúc của Swarm ưu tiên điều phối và thực thi tác vụ liền mạch, dựa trên hai trụ cột cơ bản: tác nhân (được trang bị hướng dẫn và công cụ cụ thể) và bàn giao (đảm bảo chuyển giao suôn sẻ giữa các tác nhân).
• Swarm xuất sắc trong việc quản lý và chuyển giao tác vụ giữa các tác nhân với độ chính xác và linh hoạt cao.
• Một điểm mạnh chính của Swarm là sử dụng các biến ngữ cảnh, cho phép khung cung cấp phản hồi được cá nhân hóa cao, thích ứng với nhu cầu và tham số độc đáo của mỗi tác vụ.
• Ứng dụng thực tế của Swarm rất đa dạng, bao gồm tạo chiến dịch tiếp thị toàn diện từ một đầu vào trang web duy nhất.
• Swarm có thể xử lý các tác vụ phức tạp đòi hỏi hiểu biết tinh tế như dịch ngôn ngữ, hỗ trợ khách hàng nhận biết ngữ cảnh và phân tích dữ liệu.
• Để sử dụng Swarm, người dùng cần Python 3.10 trở lên. Khung này tích hợp liền mạch với API hoàn thành trò chuyện.
• Các tính năng kỹ thuật chính bao gồm kiến trúc mô-đun, quản lý bộ nhớ hiệu quả, xử lý lỗi và ghi nhật ký tích hợp, và tương thích với các thư viện AI và học máy phổ biến.
• Swarm hiện được định vị là một dự án thử nghiệm với trọng tâm mạnh mẽ về giáo dục, khuyến khích thử nghiệm và học tập.
• OpenAI tích cực khuyến khích sự tham gia của cộng đồng với Swarm bằng cách cung cấp nhiều ví dụ và tài nguyên.
• Là một dự án mã nguồn mở, Swarm chào đón đóng góp từ cộng đồng AI, thúc đẩy sự hợp tác và đổi mới.
📌 Swarm của OpenAI là khung mã nguồn mở thử nghiệm đột phá cho phép tạo và điều phối tác nhân AI dễ dàng. Với tính linh hoạt cao, Swarm có thể xử lý nhiều tác vụ phức tạp từ tiếp thị đến phân tích dữ liệu. Dự án này mở ra cơ hội học tập và đổi mới cho cộng đồng AI toàn cầu.
https://www.geeky-gadgets.com/how-openais-swarm-is-changing-the-game-for-ai-agents/
• OpenAI vừa công bố Swarm - một khung thử nghiệm AI mới nhằm đơn giản hóa việc xây dựng và điều phối các hệ thống đa tác tử phức tạp.
• Swarm tập trung vào việc làm cho quá trình phối hợp, thực thi và kiểm thử giữa các tác tử AI trở nên nhẹ nhàng và dễ kiểm soát hơn.
• Khung này đã được phát triển trong nhiều tháng và OpenAI hy vọng nó sẽ được cộng đồng AI đón nhận như một công cụ thực tế để xây dựng các hệ thống AI tiên tiến.
• Swarm dựa trên hai khái niệm cơ bản: tác tử và bàn giao. Một tác tử trong Swarm là sự kết hợp giữa các hướng dẫn cụ thể và công cụ để hoàn thành một nhiệm vụ.
• Tại bất kỳ thời điểm nào, một tác tử có thể "bàn giao" cuộc hội thoại hoặc nhiệm vụ cho một tác tử khác, giúp quá trình điều phối trở nên liền mạch và mô-đun hóa.
• Swarm được xây dựng trên nền tảng ChatCompletions, cung cấp một nền tảng mạnh mẽ và linh hoạt cho việc phát triển.
• Khung này giúp đơn giản hóa việc quản lý giao tiếp giữa các tác tử và chuyển giao trách nhiệm một cách linh hoạt.
• Cách tiếp cận nhẹ nhàng của Swarm cho phép các nhà phát triển dễ dàng lặp lại, kiểm thử và tinh chỉnh cấu hình đa tác tử mà không bị vướng bận bởi các yêu cầu cơ sở hạ tầng phức tạp.
• Swarm đặc biệt phù hợp cho các nhà nghiên cứu và phát triển muốn đảm bảo độ tin cậy và hiệu quả trong việc điều phối tác tử AI.
• Bằng cách giữ mọi thứ đơn giản, dễ kiểm soát và hiệu quả, Swarm đại diện cho một bước tiến quan trọng trong việc làm cho các hệ thống AI tiên tiến trở nên dễ tiếp cận hơn với cộng đồng phát triển rộng lớn hơn.
• Swarm có thể được cài đặt thông qua pip bằng cách sử dụng lệnh: pip install git+https://github.com/openai/swarm.git
• Việc sử dụng Swarm khá đơn giản, chỉ cần import các module cần thiết và định nghĩa các tác tử cùng với chức năng của chúng.
📌 OpenAI giới thiệu Swarm - khung thử nghiệm AI mới để xây dựng hệ thống đa tác tử. Swarm tập trung vào việc đơn giản hóa điều phối giữa các tác tử AI, dựa trên khái niệm tác tử và bàn giao. Được xây dựng trên ChatCompletions, Swarm hứa hẹn mang lại cách tiếp cận nhẹ nhàng và dễ kiểm soát cho phát triển AI tiên tiến.
https://www.marktechpost.com/2024/10/11/openai-releases-swarm-an-experimental-ai-framework-for-building-orchestrating-and-deploying-multi-agent-systems/
• Theo khảo sát của Capgemini với 1.100 lãnh đạo doanh nghiệp lớn:
- 10% tổ chức đã sử dụng AI agent
- Hơn 50% dự định sử dụng trong năm tới
- 82% có kế hoạch tích hợp trong 3 năm tới
• Lợi ích của AI agent theo khảo sát:
- 71% nói sẽ tăng tự động hóa quy trình làm việc
- 64% cho rằng sẽ cải thiện dịch vụ và sự hài lòng của khách hàng
- 57% cho rằng tiềm năng cải thiện năng suất vượt trội hơn rủi ro
• Ứng dụng lớn nhất của AI tạo sinh tự chủ là trong phát triển phần mềm (75% người được hỏi) - để tạo, đánh giá và viết lại mã
• 77% lãnh đạo lo ngại sẽ bỏ lỡ cuộc cách mạng AI nếu không triển khai sớm
• AI tự chủ sẽ định nghĩa lại tương lai công việc trong thập kỷ tới với 6 cấp độ công việc tự chủ, từ tăng cường khả năng đến thay thế hoàn toàn các nhiệm vụ, vai trò, nhóm và bộ phận kinh doanh
• Theo Gartner:
- Đến 2028, 33% ứng dụng phần mềm doanh nghiệp sẽ tích hợp AI tạo sinh tự chủ (tăng từ dưới 1% năm 2024)
- 15% quyết định công việc hàng ngày sẽ được đưa ra tự động
• Forrester xếp AI agent đứng đầu trong Top 10 công nghệ mới nổi năm 2024, định nghĩa là "Hệ thống AI tổng quát được đào tạo để hành động vô hình thay mặt doanh nghiệp hoặc cá nhân, thực hiện nhiệm vụ, ra quyết định và tương tác với dữ liệu hoặc hệ thống khác một cách tự chủ"
• AI tự chủ sẽ hoạt động với sự giám sát tối thiểu của con người, tự cải thiện và ngày càng hiệu quả trong việc ra quyết định trong môi trường phức tạp
• Các công nghệ liên quan bao gồm: hệ thống đa agent, mô hình hành động lớn, khách hàng máy, robot nhân hình làm việc, agent tự chủ và học tăng cường
📌 AI tạo sinh tự chủ đang trở thành xu hướng chủ đạo, với 82% doanh nghiệp lớn dự định tích hợp trong 3 năm tới. Nó hứa hẹn cải thiện đáng kể năng suất, tự động hóa và ra quyết định, đặc biệt trong phát triển phần mềm. Tuy nhiên, 77% lãnh đạo lo ngại bỏ lỡ cuộc cách mạng này.
https://www.zdnet.com/article/why-agentic-ai-is-the-new-electricity-and-nearly-80-of-business-leaders-are-afraid-of-the-dark/
• Nvidia vừa phát hành các plugin mới cho Unreal Engine 5 nhằm cải thiện độ chân thực của nhân vật kỹ thuật số được hỗ trợ bởi AI.
• Các plugin mới này là một phần của bộ công nghệ Nvidia Ace, bao gồm các công cụ tạo giọng nói, trí thông minh và hoạt hình được hỗ trợ bởi AI tạo sinh.
• Plugin Audio2Face-3D mới cho phép tạo hoạt hình khuôn mặt đồng bộ với giọng nói một cách tự động. Plugin này hiện đã có sẵn cho Autodesk Maya.
• Nemotron-Mini 4B Instruct là một plugin giúp tạo ra các phản hồi tự nhiên cho nhân vật AI.
• Plugin RAG (tạo sinh được tăng cường bởi truy xuất dữ liệu ngoài) cho phép nhà phát triển xây dựng cơ sở dữ liệu ngữ cảnh cho IP của họ, tạo ra các phản hồi phù hợp với độ trễ thấp.
• Các plugin này được tối ưu hóa để chạy trên Windows PC với độ trễ thấp và sử dụng ít bộ nhớ.
• Nvidia cũng phát hành một dự án mẫu Unreal Engine 5 để hướng dẫn nhà phát triển tích hợp nhân vật kỹ thuật số vào game và ứng dụng của họ.
• Plugin Audio2Face-3D cho Maya giúp đơn giản hóa quy trình tạo hoạt hình khuôn mặt chất lượng cao cho bất kỳ nhân vật nào. Mã nguồn và script có thể tùy chỉnh để sử dụng với các công cụ tạo nội dung kỹ thuật số khác.
• Nvidia cũng giới thiệu microservice renderer mới cho Unreal Engine 5 hỗ trợ Nvidia Animation Graph Microservice và hệ điều hành Linux ở giai đoạn truy cập sớm.
• Animation Graph là một microservice tạo điều kiện cho việc tạo ra các máy trạng thái hoạt hình và cây blend, cung cấp hệ thống linh hoạt dựa trên node để blend, phát lại và điều khiển hoạt hình.
• Microservice renderer mới cho phép nhà phát triển chạy nhân vật MetaHuman trên máy chủ đám mây và stream các khung hình và âm thanh đã render tới bất kỳ trình duyệt và thiết bị edge nào qua WebRTC.
• Nhà phát triển có thể đăng ký truy cập sớm để tải xuống microservice renderer Unreal Engine 5 với hỗ trợ cho microservice Animation Graph và hệ điều hành Linux.
📌 Nvidia đã phát hành các plugin mới cho Unreal Engine 5 nhằm cải thiện độ chân thực của nhân vật kỹ thuật số. Các công cụ như Audio2Face-3D, Nemotron-Mini 4B và RAG cho phép tạo ra các nhân vật MetaHuman sống động và tương tác tự nhiên hơn, với khả năng chạy trên Windows PC với độ trễ thấp.
https://venturebeat.com/ai/nvidia-releases-plugins-to-improve-digital-human-realism-on-unreal-engine-5/
• OpenAI dự đoán các trợ lý AI sẽ trở nên phổ biến vào năm 2025, mở ra cuộc đua giữa các công ty công nghệ lớn như Google và Apple.
• Kevin Weil, Giám đốc sản phẩm của OpenAI, cho biết họ muốn tạo ra khả năng tương tác với AI giống như con người thật.
• Tại sự kiện Developer Day ở San Francisco, OpenAI đã giới thiệu mô hình mới o1 với khả năng lập luận được cải thiện và GPT-4o với xử lý giọng nói nâng cao.
• Các nhà phát triển sẽ có thể truy cập công nghệ này theo thời gian thực, cho phép AI hiểu lệnh thoại và đàm thoại bằng giọng nói như trong cuộc gọi thực tế.
• OpenAI đang hoàn tất vòng gọi vốn 6,5 tỷ USD với định giá 150 tỷ USD, thu hút các nhà đầu tư như Microsoft, Nvidia, SoftBank và các quỹ đầu tư mạo hiểm.
• Nhiều công ty công nghệ lớn như Microsoft, Salesforce, Workday, Google và Meta cũng đang tập trung phát triển các trợ lý AI thông minh.
• Năm ngoái, OpenAI đã ra mắt "API trợ lý" để các nhà phát triển xây dựng agent sử dụng công nghệ của họ, nhưng bị hạn chế do khả năng của các mô hình trước đó.
• Mô hình mới của OpenAI có khả năng suy nghĩ và lập luận tốt hơn, sẽ được tích hợp vào các sản phẩm như ChatGPT và API cho các startup.
• Một ví dụ được trình diễn là hệ thống AI có thể gọi điện đặt hàng dâu tây theo yêu cầu của người dùng về số lượng và chi phí mong muốn.
• OpenAI khẳng định việc sử dụng công nghệ này sẽ không được phép che giấu việc đó là AI chứ không phải con người, và chỉ có sẵn 6 giọng nói cài đặt sẵn.
• Weil tin rằng nếu làm đúng, công nghệ này sẽ giúp con người có thêm thời gian cho những việc quan trọng thay vì nhìn chằm chằm vào điện thoại.
📌 OpenAI dự đoán AI agent sẽ phổ biến vào 2025, giới thiệu mô hình o1 và GPT-4o với khả năng lập luận và xử lý giọng nói nâng cao. Công ty đang gọi vốn 6,5 tỷ USD, định giá 150 tỷ USD. Các ông lớn công nghệ cũng đang chạy đua phát triển trợ lý AI thông minh.
https://www.ft.com/content/30677465-33bb-4f74-a8e6-239980091f7a
#FT
• Dharmesh Shah, đồng sáng lập và CTO của Hubspot, dự đoán bước tiếp theo của AI sẽ là các mạng lưới agent hợp tác để thực hiện các tác vụ phức tạp hơn, chủ yếu không cần sự giám sát của con người.
• Shah cho rằng agent là bước tiến hóa từ copilot, có thể đảm nhận các mục tiêu cấp cao hơn thường liên quan đến nhiều bước.
• Hubspot đang cạnh tranh với các công ty như Salesforce để triển khai các agent hỗ trợ các tác vụ quản lý quan hệ khách hàng (CRM) như bán hàng, tiếp thị, chăm sóc khách hàng.
• Tại hội nghị thường niên Inbound, Hubspot đã giới thiệu mạng lưới agent.ai - một thị trường cho các agent AI với hơn 47.000 người dùng và 1.700 nhà phát triển đăng ký tạo agent riêng.
• Shah mô tả agent.ai như một "mạng chuyên nghiệp cho các agent", tương tự LinkedIn nhưng dành cho AI.
• Trong tương lai, các agent có thể hợp tác thành nhóm gồm các "mini agent" và một agent giám sát cấp cao hơn.
• Khả năng xử lý ngôn ngữ tự nhiên của AI tạo sinh trở thành yếu tố kết nối để lập trình và tổ hợp các agent, khắc phục vấn đề tương thích trong các nỗ lực trước đây như CORBA.
• Shah tin rằng AI agent và mạng lưới agent hợp tác sẽ tạo ra cuộc cách mạng trong phần mềm CRM, dẫn đến sự xuất hiện của "CRM thông minh dựa trên AI".
• Cuộc cạnh tranh trong lĩnh vực CRM sẽ xoay quanh việc nền tảng nào cung cấp khả năng sử dụng agent tốt nhất cho cả người dùng và nhà phát triển.
• Shah kỳ vọng một thế hệ nhà phát triển mới sẽ tìm kiếm nền tảng để xây dựng ý tưởng của họ, với agent trở thành "ứng dụng mới" thay vì các ứng dụng web truyền thống.
📌 Mạng lưới agent AI hợp tác được dự đoán sẽ định hình lại cách làm việc trong tương lai. Với hơn 47.000 người dùng trên nền tảng agents.ai của Hubspot, xu hướng này có tiềm năng cách mạng hóa ngành CRM và tạo ra một thế hệ nhà phát triển mới tập trung vào xây dựng agent AI.
https://www.zdnet.com/article/networks-of-collaborative-agents-will-transform-ai-says-this-expert/
• Jensen Huang, CEO của NVIDIA, đã chia sẻ tầm nhìn về tương lai của AI trong cuộc phỏng vấn với Marc Benioff, CEO Salesforce tại hội nghị Dreamforce.
• Huang nhấn mạnh sự chuyển dịch từ môi trường dựa trên công cụ sang môi trường dựa trên kỹ năng, với các agent AI đóng vai trò then chốt trong việc tự động hóa công việc và thúc đẩy năng suất.
• Các agent AI không chỉ tự động hóa các tác vụ phức tạp mà còn có khả năng tạo ra các công cụ mới để nâng cao năng lực của chính mình.
• Sự phát triển nhanh chóng của AI được thúc đẩy bởi các tiến bộ trong học không giám sát, học tăng cường và phát triển các mô hình ngôn ngữ lớn.
• Huang nhấn mạnh tầm quan trọng của việc loại bỏ giới hạn con người trong phát triển AI để đẩy nhanh tiến độ và đạt được sức mạnh tính toán chưa từng có.
• Việc cân bằng giữa dữ liệu công khai và độc quyền là cần thiết cho sự phát triển AI hiệu quả.
• Mở rộng quy mô AI đòi hỏi quản lý hiệu quả tài nguyên tính toán cho đào tạo và thử nghiệm.
• Dữ liệu tổng hợp giảm sự phụ thuộc vào dữ liệu được gắn nhãn bởi con người và nâng cao hiệu quả đào tạo AI.
• GPU vượt qua định luật Moore, thúc đẩy sự tiến bộ nhanh chóng của AI.
• AI đang chuyển đổi phát triển phần mềm bằng cách tự động hóa các tác vụ lập trình và tối ưu hóa.
• Đảm bảo an toàn AI thông qua tinh chỉnh, học có giám sát và cơ chế phản hồi là điều cần thiết.
• Việc đưa các agent AI vào hoạt động với đào tạo và bối cảnh phù hợp là quan trọng để triển khai hiệu quả.
• Tương lai của điện toán sẽ liên quan đến phần mềm dự đoán và giao diện thích ứng, nâng cao trải nghiệm người dùng.
• Tầm nhìn của Huang nhấn mạnh tiềm năng chuyển đổi của các agent AI trong việc định hình tương lai của các ngành công nghiệp.
• Bằng cách áp dụng các công nghệ và phương pháp AI tiên tiến, doanh nghiệp có thể mở khóa các mức năng suất và đổi mới chưa từng có.
• Tương lai sẽ chứng kiến các agent AI làm việc cùng con người để thúc đẩy tiến bộ và thành công trong nhiều lĩnh vực.
📌 Jensen Huang dự đoán agent AI sẽ định hình tương lai công nghệ, tự động hóa công việc phức tạp và tăng năng suất đột phá. Các tiến bộ trong học máy, GPU và dữ liệu tổng hợp đang thúc đẩy sự phát triển nhanh chóng của AI, mở ra cơ hội to lớn cho doanh nghiệp trong nhiều lĩnh vực.
https://www.geeky-gadgets.com/nvidia-ceo-on-agents-being-the-future-of-ai/
• AI agent đang nổi lên như xu hướng công nghệ nóng nhất vào mùa thu 2024, hứa hẹn mang lại ROI đáng kể cho các khoản đầu tư vào giải pháp AI thế hệ tiếp theo.
• AI agent là một ứng dụng tổng hợp và tự chủ cho phép con người và AI cộng tác để hoàn thành một nhiệm vụ. Nó khác biệt so với chatbot AI hiện có ở khả năng thực hiện các hành động tiếp theo dựa trên kết quả phản hồi của LLM, có hoặc không có sự tham gia thêm của con người.
• Lợi ích chính của AI agent bao gồm: có mục đích cụ thể, có thể được tạo và quản lý bởi người không phải lập trình viên, cung cấp bối cảnh làm việc tốt hơn cho AI.
• Ví dụ, một AI agent có thể tự động hóa phần lớn quá trình lập kế hoạch sự kiện công ty, bao gồm khảo sát từ các sự kiện trước đó, so sánh các lựa chọn địa điểm, kiểm tra sự sẵn có của địa điểm và diễn giả chính, xem xét các vấn đề đi lại và mô hình hóa số lượng phiên mà một địa điểm cụ thể có thể tổ chức.
• Các thành phần chính của một AI agent bao gồm: LLM, dữ liệu, quản trị, tích hợp, quy trình làm việc/quy tắc, giao diện người dùng và lưu trữ.
• Việc triển khai AI agent dự kiến sẽ diễn ra qua 4 giai đoạn: nền tảng ứng dụng (hiện tại), nền tảng cơ sở hạ tầng (đầu 2025), các startup chuyển hướng (đầu-giữa 2025), và triển khai sản xuất đầu tiên (giữa-cuối 2025).
• Các thách thức chính đối với AI agent bao gồm quản trị, kiểm thử, khả năng quan sát, hiệu suất và hiệu quả.
• Trong 12 tháng tới, doanh nghiệp nên: bắt đầu từ từ với các dự án thí điểm, chỉ định một "tổng giám đốc phụ trách agent", và kéo dài thời gian kiểm thử càng nhiều càng tốt.
📌 AI agent đang nổi lên như xu hướng công nghệ hàng đầu cuối năm 2024, hứa hẹn mang lại ROI đáng kể cho doanh nghiệp. Với khả năng tự động hóa quy trình, tích hợp dữ liệu và cộng tác người-máy, AI agent có tiềm năng thay đổi cách thức hoạt động của doanh nghiệp. Tuy nhiên, việc triển khai cần được thực hiện cẩn thận, với sự chú ý đặc biệt đến quản trị, kiểm thử và khả năng mở rộng.
https://www.forbes.com/sites/moorinsights/2024/09/26/ai-agents-will-be-the-key-to-achieving-roi-from-ai/
• AI agent được dự đoán sẽ là bước tiến quan trọng tiếp theo sau các mô hình ngôn ngữ trong lĩnh vực trí tuệ nhân tạo.
• Các hệ thống tự động hóa và AI trước đây chủ yếu thực hiện các hành động dựa trên quyết định có sẵn. AI agent sẽ có khả năng tự đưa ra quyết định.
• Quá trình ra quyết định của con người thường bao gồm các bước: tiếp nhận thông tin mới, nghiên cứu, suy luận, quyết định, hành động, giám sát và học hỏi.
• Quy trình này thường không được ghi lại, khác biệt giữa các cá nhân và ít khi được xem xét kỹ lưỡng trong tổ chức.
• Khi phát triển AI agent, các nhóm chuyên môn sẽ phải xem xét cẩn thận từng bước trong quy trình ra quyết định và các yếu tố cần cân nhắc.
• AI agent có tiềm năng cải thiện cách chúng ta tiếp nhận thông tin mới, nghiên cứu, suy luận và học hỏi từ kết quả quyết định.
• Ví dụ: AI agent có thể hỗ trợ kiểm tra lịch trình, nghiên cứu diễn giả và đưa ra đề xuất trước khi nhân viên đọc email ban đầu.
• Quá trình phát triển AI agent sẽ thách thức và tái cấu trúc khả năng ra quyết định của chúng ta với tư cách chuyên gia.
• Các tổ chức có thể phát triển chia sẻ kinh nghiệm tốt nhất, đầu tư vào đào tạo và tạo kế hoạch phát triển kỹ năng ra quyết định cá nhân hóa.
• Điều này sẽ tạo nền tảng để thảo luận và học hỏi về kỹ năng quan trọng nhất nhưng ít được đầu tư nhất: khả năng ra quyết định tốt.
📌 AI agent hứa hẹn cách mạng hóa quá trình ra quyết định bằng cách tự động hóa nghiên cứu, suy luận và đề xuất. Việc phát triển AI agent sẽ thúc đẩy các tổ chức xem xét lại và cải thiện quy trình ra quyết định, từ đó nâng cao hiệu quả làm việc tổng thể.
https://www.fastcompany.com/91198519/how-ai-agents-will-help-us-make-better-decisions
• Nghiên cứu mô hình ngôn ngữ lớn (LLM) đã phát triển nhanh chóng, tập trung vào việc cải thiện khả năng hiểu và xử lý ngôn ngữ, đặc biệt trong các lĩnh vực chuyên môn như tài chính.
• LLM đã vượt qua các tác vụ phân loại cơ bản để trở thành công cụ mạnh mẽ có khả năng truy xuất và tạo ra kiến thức phức tạp.
• Một thách thức lớn trong nghiên cứu LLM là cân bằng giữa hiệu quả chi phí và hiệu suất. LLM tốn kém về mặt tính toán và có nguy cơ tạo ra thông tin không chính xác khi xử lý bộ dữ liệu lớn hơn.
• Các phương pháp truyền thống dựa nhiều vào một mô hình transformer dày đặc duy nhất, thường gặp vấn đề về ảo giác, tạo ra thông tin không chính xác hoặc không liên quan.
• Các nhà nghiên cứu đã khám phá nhiều phương pháp để giải quyết những thách thức này, bao gồm mô hình tổng hợp, nhưng chúng tốn kém và chậm xử lý.
• Nhóm nghiên cứu từ Vanguard IMFS đã giới thiệu khung công tác mới có tên Mixture of Agents (MoA) để khắc phục những hạn chế của phương pháp tổng hợp truyền thống.
• MoA là một hệ thống đa tác tử tiên tiến được thiết kế đặc biệt cho các tác vụ tạo sinh được tăng cường bởi truy xuất dữ liệu ngoài (RAG).
• MoA sử dụng tập hợp các mô hình nhỏ chuyên biệt làm việc cùng nhau một cách phối hợp cao độ để trả lời các câu hỏi phức tạp với độ chính xác cao hơn và chi phí thấp hơn.
• Hệ thống MoA bao gồm nhiều tác tử chuyên biệt, mỗi tác tử đóng vai trò như một "nhà nghiên cứu cấp dưới" với trọng tâm cụ thể như phân tích tình cảm, số liệu tài chính hoặc tính toán toán học.
• Trong các bài kiểm tra, hệ thống MoA có thể phân tích hàng chục nghìn tài liệu tài chính trong vòng chưa đầy 60 giây bằng cách sử dụng hai lớp tác tử.
• Một hệ thống MoA cơ bản với hai tác tử Mistral-7B đã được thử nghiệm cùng với các hệ thống mô hình đơn như GPT-4 và Claude 3 Opus. Hệ thống MoA liên tục cung cấp câu trả lời chính xác và toàn diện hơn.
• Tính hiệu quả về chi phí của MoA khiến nó rất phù hợp cho các ứng dụng tài chính quy mô lớn. Nhóm IMFS của Vanguard báo cáo rằng hệ thống MoA của họ hoạt động với tổng chi phí hàng tháng dưới 8.000 USD trong khi xử lý các truy vấn từ một nhóm nhà nghiên cứu.
• Thiết kế mô-đun của khung công tác MoA cho phép các công ty mở rộng hoạt động dựa trên ngân sách và nhu cầu, với khả năng linh hoạt thêm hoặc bớt tác tử khi cần thiết.
📌 Khung công tác Mixture of Agents (MoA) từ Vanguard IMFS cung cấp giải pháp mạnh mẽ để cải thiện hiệu suất của mô hình ngôn ngữ lớn trong tài chính. MoA xử lý 10.000 tài liệu trong 60 giây, chính xác hơn GPT-4 và Claude, với chi phí dưới 8.000 USD/tháng, hứa hẹn trở thành tiêu chuẩn cho ứng dụng cấp doanh nghiệp.
https://www.marktechpost.com/2024/09/17/collaborative-small-language-models-for-finance-meet-the-mixture-of-agents-moa-framework-from-vanguard-imfs/
• Jensen Huang, CEO Nvidia, và Marc Benioff, CEO Salesforce, thảo luận về tương lai của AI tác nhân tại sự kiện Dreamforce của Salesforce.
• Huang nhận định cơ hội cho AI tác nhân sẽ "khổng lồ", với tiến bộ "ngoạn mục và đáng ngạc nhiên".
• Phát triển AI đang diễn ra nhanh hơn định luật Moore, theo Huang là "hợp lý Moore's Law bình phương".
• Trong tương lai, sẽ có các tác nhân AI hiểu được sắc thái tinh tế, có khả năng lập luận và hợp tác.
• Các tác nhân AI sẽ có thể tìm kiếm tác nhân khác để "làm việc cùng nhau, tập hợp lại", đồng thời giao tiếp với con người để cải thiện đầu ra.
• Huang dự đoán: "Chúng ta sẽ có tác nhân làm việc với tác nhân, tác nhân làm việc với chúng ta".
• Việc áp dụng AI cần được đơn giản hóa, "giống như việc đưa nhân viên mới vào làm việc".
• Benioff nhấn mạnh tầm quan trọng của việc mọi người "thực sự hiểu" cách AI hoạt động và mục đích của chúng.
• Huang chỉ ra rằng vẫn còn nhiều thách thức, bao gồm tinh chỉnh và bảo vệ, nhưng các nhà khoa học đang tiến bộ hàng ngày.
• AI đang được sử dụng để tạo ra dữ liệu an toàn để "dạy" AI khác.
• Nvidia tập trung vào kiến trúc điện toán tăng tốc, bổ sung GPU cho CPU và xây dựng nền tảng DGX.
• Công ty nhận ra sớm rằng "học sâu sẽ thay đổi hoàn toàn phần mềm".
• Nvidia có lợi thế "làm việc với mọi nhà nghiên cứu trên hành tinh".
• Huang tin rằng Nvidia đang ở vị trí "một lần trong đời và một lần trong một thế hệ".
• Ông nhấn mạnh: "Ngay lúc này quá thú vị, bạn không nghĩ vậy sao? Không ai nên bỏ lỡ thập kỷ tới. Bạn sẽ không muốn bỏ lỡ bộ phim này đâu."
📌 Jensen Huang và Marc Benioff nhìn nhận tiềm năng to lớn của AI tác nhân, với khả năng hợp tác và tự cải thiện. Họ dự đoán AI sẽ phát triển nhanh hơn định luật Moore, mang lại cơ hội "khổng lồ" trong thập kỷ tới. Tuy nhiên, vẫn còn nhiều thách thức cần giải quyết.
https://venturebeat.com/ai/why-jensen-huang-and-marc-benioff-see-gigantic-opportunity-for-agentic-ai/
• AI tác nhân (agentic AI) là hệ thống AI có khả năng thực hiện các hành động tự chủ, chủ động hướng tới mục tiêu mà không cần sự giám sát trực tiếp của con người.
• AI tác nhân có thể thích ứng và phản ứng độc lập với các tình huống luôn thay đổi, với sự can thiệp tối thiểu của con người.
• Khác với các mô hình nền tảng truyền thống như GPT-4, AI tác nhân có khả năng thực hiện các tác vụ phức tạp đòi hỏi lập luận, lập kế hoạch và tương tác cấp cao hơn.
• Beam cung cấp giải pháp tự động hóa quy trình AI tác nhân cấp doanh nghiệp, với các mẫu được đào tạo sẵn và mô-đun tùy chỉnh an toàn cho các ngành như y tế và bảo hiểm.
• PixieBrix là tiện ích mở rộng trình duyệt low-code cho phép tùy chỉnh và tự động hóa ứng dụng web. Người dùng có thể xây dựng các "brick" để thêm chức năng hoặc kích hoạt hành động trên ứng dụng web.
• AutoGen Studio của Microsoft là tùy chọn nguồn mở thân thiện với người dùng, cho phép phát triển nhanh các tác nhân AI thông qua giao diện low-code.
• AgentOps là nền tảng giám sát tác nhân giúp xây dựng, theo dõi và tối ưu hóa các tác nhân AI. Nó dễ dàng tích hợp với các framework AI tác nhân phổ biến như LangChain.
• Thách thức lớn trong phát triển hệ thống AI tác nhân là xác định các khối xây dựng hiệu quả và kết hợp chúng phù hợp cho các ứng dụng khác nhau.
• Các nhà nghiên cứu đang đề xuất quy trình thiết kế tự động hệ thống tác nhân (ADAS), trong đó các tác nhân AI mới và cải tiến được "khám phá" bởi một "meta-agent".
• Kết quả ban đầu cho thấy các tác nhân mới có thể vượt trội đáng kể so với các tác nhân được thiết kế thủ công, mở ra tiềm năng cho AI tác nhân tự học và tự cải thiện liên tục.
📌 AI tác nhân đang nổi lên như xu hướng mới trong AI, với 4 công cụ hàng đầu là Beam, PixieBrix, AutoGen Studio và AgentOps. Các hệ thống này có khả năng thực hiện tác vụ phức tạp một cách tự chủ, hứa hẹn mang lại hiệu quả và tự động hóa cao cho doanh nghiệp.
https://thenewstack.io/agentic-ai-tools-for-building-and-managing-agentic-systems/
• Bản đồ hệ sinh thái AI Agent 2024 được chia thành 4 lớp chính:
- Lớp hệ sinh thái Agent: Bao gồm các mô hình nền tảng, doanh nghiệp, Big Tech và startup
- Lớp ứng dụng Agent: Gồm các ứng dụng AI Agent, kết nối với LLM và nền tảng Agent
- Lớp quản lý Agent: Bao gồm phân quyền/bảo mật và quản lý Agent
- Lớp dữ liệu: Gồm dữ liệu độc quyền/riêng tư, dữ liệu mở và API thống nhất
• Dự đoán về thị trường AI Agent:
- Các startup AI Agent sẽ phát triển nhanh chóng và trở thành những công ty hàng tỷ USD
- Số lượng startup AI Agent sẽ tăng từ hàng trăm lên hàng nghìn vào năm 2025
- Các công ty công nghệ lớn như Amazon, Apple sẽ phát triển Agent riêng và hỗ trợ các startup mở rộng
- Hubspot và Salesforce sẽ tích hợp AI Agent vào bộ phần mềm doanh nghiệp của họ
• Tác động đến doanh nghiệp và xã hội:
- Các lĩnh vực truyền thông, quảng cáo và thương mại điện tử sẽ bị gián đoạn nghiêm trọng bởi AI Agent
- Mô hình kinh doanh mới sẽ xuất hiện liên quan đến quảng cáo, thương mại điện tử và tiếp thị liên kết qua Agent
- AI Agent sẽ giúp con người hoàn thành các công việc phức tạp, cho phép chúng ta tập trung vào việc "làm người" hơn
• Sự phát triển nhanh chóng của AI Agent:
- AI Agent sẽ tạo ra nhiều Agent hơn, vượt qua số lượng con người chỉ trong vài năm tới
- Agent sẽ trở thành thực thể thống trị trên internet và trong doanh nghiệp
- Tốc độ phát triển sẽ diễn ra theo cấp số nhân, vượt quá khả năng nhận thức của con người
• Tiêu chuẩn ngành:
- Sẽ có nhu cầu về khả năng tương tác giữa các hệ thống AI Agent khác nhau
- Các startup dịch thuật AI Agent mới sẽ xuất hiện để phục vụ toàn bộ hệ sinh thái
- Việc thống nhất tiêu chuẩn AI Agent sẽ gặp thách thức do các gã khổng lồ công nghệ bảo vệ lãnh địa của họ
📌 AI Agent đang phát triển với tốc độ chóng mặt, dự kiến sẽ có hàng nghìn startup vào năm 2025. Các công ty lớn như Amazon, Apple cũng tham gia cuộc đua. AI Agent sẽ tác động sâu sắc đến nhiều ngành công nghiệp và có thể vượt qua số lượng con người chỉ trong vài năm tới.
https://web-strategist.com/blog/2024/09/12/plot-your-path-the-2024-ai-agent-ecosystem-map/
SEO contents:
• Dự án Sid do công ty khởi nghiệp Altera.ai thực hiện, do cựu giáo sư MIT và nhà khoa học thần kinh học Robert Yang đứng đầu.
• 1.000 agent AI tự chủ được đưa vào thế giới Minecraft để xem chúng sẽ làm gì khi được tự do hành động.
• Các agent AI nhanh chóng bắt đầu thể hiện hành vi giống con người:
- Hình thành liên minh
- Thu thập vật phẩm trong game
- Thiết lập hệ thống tiền tệ chung bằng đá quý để giao dịch
- Xuất hiện các "linh mục tham nhũng" hối lộ AI khác để được lợi thế
• Mục tiêu nghiên cứu sâu hơn về sự gắn kết, hợp tác đa tác nhân và tiến triển dài hạn của các agent AI.
• Dự án Sid không phải nỗ lực đầu tiên kết hợp agent AI tự chủ với thế giới game hóa:
- Nghiên cứu của Đại học Stanford năm ngoái tạo ra môi trường Smallville với 25 agent AI
- Các nhân vật AI nhanh chóng hợp tác, thậm chí tổ chức tiệc Valentine's Day
• Mã nguồn nghiên cứu Stanford được công bố nguồn mở, dẫn đến nhiều demo AI khác nhau ra đời.
• AI Town: môi trường đơn giản cho phép nhân vật AI tự điều khiển tương tác với người chơi qua lệnh chat.
• Thistle Gulch: dự án nguồn mở sử dụng ChatGPT 3.5 để tạo ra thị trấn miền Tây với 15 nhân vật AI có tính cách riêng.
• Các dự án này cho thấy tiềm năng của công nghệ AI tự chủ trong tương tác người-máy và trò chơi điện tử.
• Việc kết hợp AI với thế giới sandbox như Minecraft mở ra khả năng vô hạn cho nghiên cứu và phát triển AI.
• Các agent AI thể hiện khả năng học hỏi, thích nghi và tương tác phức tạp trong môi trường mô phỏng.
📌 1.000 agent AI tự chủ trong Minecraft đã tạo ra xã hội phức tạp với giao dịch, liên minh và hành vi tham nhũng. Dự án Sid của Altera.ai mở ra hướng nghiên cứu mới về tương tác AI-người và mô phỏng hành vi xã hội, với tiềm năng ứng dụng rộng rãi trong tương lai.
https://www.tomsguide.com/ai/a-company-gave-1000-ai-agents-access-to-minecraft-and-they-built-a-society
• Oracle vừa công bố hơn 50 trợ lý AI tích hợp trong Oracle Fusion Cloud Applications Suite, nhằm hỗ trợ tự động hóa các tác vụ lặp đi lặp lại và giúp nhân viên tập trung vào công việc chiến lược hơn.
• Các trợ lý AI mới được tích hợp vào quy trình làm việc, cung cấp thông tin chi tiết, nội dung và đề xuất được cá nhân hóa cho từng vai trò cụ thể.
• Trong Oracle Fusion Cloud Human Capital Management (HCM), có các trợ lý AI như:
- Trợ lý lập lịch ca làm: Tối ưu hóa lịch làm việc theo ca, đồng thời đáp ứng sở thích cá nhân và tuân thủ quy định.
- Cố vấn tuyển dụng: Hỗ trợ tìm kiếm ứng viên, tạo yêu cầu tuyển dụng và đề xuất, giúp rút ngắn thời gian tuyển dụng.
- Phân tích viên phúc lợi: Hỗ trợ nhân viên hiểu rõ và tối ưu hóa gói phúc lợi dựa trên nhu cầu cá nhân.
• Trong Oracle Fusion Cloud Supply Chain & Manufacturing (SCM), có các trợ lý AI như:
- Hướng dẫn đại diện bán hàng: Cung cấp thông tin chi tiết và đề xuất cá nhân hóa để xử lý các truy vấn đơn hàng.
- Cố vấn xử lý sự cố bảo trì: Đẩy nhanh quá trình bảo trì và sửa chữa bằng cách cung cấp thông tin chi tiết và đề xuất về bảo trì và sửa chữa tài sản.
• Trong Oracle Fusion Cloud Enterprise Resource Planning (ERP), có các trợ lý AI như:
- Trợ lý xử lý tài liệu: Tự động hóa và đơn giản hóa việc tích hợp phức tạp với các bên thứ ba.
- Trợ lý sổ cái: Xác định các ngoại lệ và bất thường trong dữ liệu giao dịch, phân tích số dư tài khoản.
- Trợ lý dự đoán nâng cao: Hỗ trợ các mô hình dự đoán AI đa biến, tận dụng các yếu tố tài chính, hoạt động và bên ngoài.
• Trong Oracle Fusion Cloud Customer Experience (CX), có các trợ lý AI như:
- Trợ lý nghiên cứu tài khoản khách hàng: Cung cấp thông tin chi tiết và tự động hóa các tác vụ lập kế hoạch và nghiên cứu.
- Trợ lý nghiên cứu hợp đồng: Tự động hóa quy trình và phê duyệt hợp đồng thông thường.
- Hướng dẫn kế hoạch thưởng khuyến khích: Giúp truyền đạt và thúc đẩy đại diện bán hàng phù hợp với ý định chiến lược.
• Oracle Fusion Applications Suite cho phép các tổ chức tận dụng đám mây và những tiến bộ mới nhất trong AI để phá vỡ các rào cản tổ chức, chuẩn hóa quy trình và quản lý dữ liệu tài chính, nhân sự, chuỗi cung ứng và trải nghiệm khách hàng trên một nền tảng đám mây tích hợp duy nhất.
📌 Oracle giới thiệu hơn 50 trợ lý AI tích hợp vào Oracle Fusion Cloud Applications Suite, hỗ trợ tự động hóa quy trình trong tài chính, chuỗi cung ứng, nhân sự, bán hàng, tiếp thị và dịch vụ. Các trợ lý AI mới này có tiềm năng thay đổi hoàn toàn cách làm việc, giúp doanh nghiệp đạt được mức năng suất mới và mở khóa tiềm năng tăng trưởng kinh doanh to lớn.
https://www.oracle.com/news/announcement/ocw24-oracle-ai-agents-help-organizations-achieve-new-levels-of-productivity-2024-09-11/
• Chatbot truyền thống thường bị coi là phiền phức và hạn chế, chỉ được sử dụng trong một số tình huống cụ thể như hỗ trợ khách hàng trên website.
• AI agent hiện đại đã phát triển vượt bậc, cung cấp tương tác thông minh, cá nhân hóa và hiệu quả hơn nhiều so với chatbot.
• AI agent phải vượt qua thách thức về nhận thức tiêu cực từ chatbot cũ, khó khăn trong triển khai và thiếu hiểu biết về khả năng của chúng.
• Khác với chatbot cứng nhắc dựa trên quy tắc, AI agent sử dụng AI tạo sinh để tạo ra giao tiếp cá nhân hóa theo phong cách và giọng điệu của thương hiệu.
• AI agent có thể sử dụng dữ liệu quá khứ và thông tin từ người dùng để trả lời các câu hỏi chuyên biệt, giảm nhu cầu chuyển tiếp cho nhân viên.
• Doanh nghiệp cần chủ động thông báo cho khách hàng về khả năng mới của AI agent để thay đổi nhận thức cũ về chatbot.
• Việc triển khai AI agent không nên chỉ giới hạn ở khách hàng mà còn có thể áp dụng cho nội bộ doanh nghiệp để hỗ trợ nhân viên và tối ưu quy trình.
• Cần tập trung vào truyền thông minh bạch với khách hàng về khả năng mới của AI agent so với chatbot truyền thống.
• AI agent có thể thực hiện nhiều tác vụ từ trả lời câu hỏi đơn giản đến chủ động hành động như kiểm tra hàng tồn kho hay đặt chỗ nhà hàng.
• AI agent đặc biệt hữu ích trong việc tự động hóa các tác vụ khách hàng thường tránh như lên lịch và đặt hẹn.
• Việc triển khai AI agent cần có chiến lược, truyền thông rõ ràng và hỗ trợ liên tục để đáp ứng nhu cầu của cả khách hàng và nhân viên.
• Triển khai AI agent là một dự án dài hạn, không phải ngắn hạn, khi các trường hợp sử dụng mới tiếp tục phát triển.
📌 AI agent đại diện cho bước tiến vượt bậc so với chatbot truyền thống, mang lại tương tác thông minh và cá nhân hóa. Việc triển khai hiệu quả đòi hỏi chiến lược toàn diện, từ truyền thông đến đào tạo, để tận dụng tiềm năng to lớn trong việc nâng cao trải nghiệm khách hàng và hiệu suất doanh nghiệp.
https://www.forbes.com/councils/forbestechcouncil/2024/09/09/ensuring-a-successful-transition-from-chatbots-to-ai-agents/
• Marc Benioff, CEO của Salesforce, tiết lộ công ty đang thực hiện "bước chuyển hướng mạnh mẽ" sang nền tảng Agentforce, cho phép người dùng tạo ra các AI agents tùy chỉnh để tương tác trực tiếp với khách hàng.
• Benioff tin rằng AI agents là bước tiến hóa tiếp theo của AI, vượt trội hơn so với chatbots AI thông thường. Ông nhấn mạnh: "Chúng tôi phải chuyển hướng toàn bộ công ty sang agents."
• Agentforce có thể tích hợp với các sản phẩm khác của Salesforce như phần mềm quản lý quan hệ khách hàng (CRM) và các ứng dụng khác.
• Benioff coi đây là "bước chuyển đổi lớn tiếp theo" kể từ khi Salesforce được thành lập năm 1999 và trở thành công ty đột phá trong ngành phần mềm doanh nghiệp.
• Ông đề cập đến cuốn sách "The Innovator's Dilemma" và khái niệm "tư duy của người mới", nhấn mạnh tầm quan trọng của việc "bắt đầu lại từ đầu và suy nghĩ toàn diện".
• Benioff chia sẻ rằng ông nhận ra tầm ảnh hưởng to lớn của AI cách đây khoảng một thập kỷ, khi Salesforce còn nhỏ hơn 10 lần so với hiện tại.
• Agentforce đã được triển khai thử nghiệm cho một số khách hàng và nhận được phản hồi tích cực. Benioff cho biết trong cuộc gọi báo cáo kết quả quý 2: "Chúng ta vẫn sẽ có con người trong công ty, nhưng chúng ta cũng sẽ có các agents này."
• Các AI agents này không cần lệnh hội thoại để hành động, có thể lập kế hoạch và suy luận nâng cao với sự can thiệp tối thiểu của con người.
• Agentforce dự kiến ra mắt chính thức vào tháng 10, nhưng sẽ được giới thiệu tại hội nghị Dreamforce của Salesforce ở San Francisco từ ngày 17/9.
• Benioff nhấn mạnh tầm quan trọng của Agentforce bằng cách nói rằng sự kiện sẽ được gọi là "Welcome to Agentforce" thay vì "Welcome to Dreamforce".
📌 Salesforce đang thực hiện bước chuyển mình lớn với nền tảng Agentforce, cho phép tạo AI agents tùy chỉnh để tương tác với khách hàng. CEO Marc Benioff tin rằng đây là bước tiến quan trọng tiếp theo trong lĩnh vực AI, vượt trội hơn chatbots thông thường. Agentforce sẽ ra mắt chính thức vào tháng 10/2024.
https://www.businessinsider.com/salesforce-ceo-marc-benioff-says-new-focus-on-ai-agents-2024-9
• Guided Reasoning là một hệ thống đa tác tử AI, trong đó một tác tử hướng dẫn (guide) làm việc với các tác tử khách hàng (client) để cải thiện khả năng lập luận của họ theo một phương pháp cụ thể.
• Phương pháp này có thể được mô tả bằng các tiêu chuẩn, ví dụ cụ thể hoặc hướng dẫn chi tiết. Ví dụ bao gồm huấn luyện viên hỗ trợ phân tích SWOT, trẻ em giúp người lớn giải ô chữ, hay đối thoại Socratic.
• Lý do ủng hộ Guided Reasoning trong AI dựa trên các giả định: AI cần đưa ra câu trả lời chính xác và giải thích được; AI chỉ có thể giải thích trung thực nếu dựa trên tư duy rõ ràng; Lập luận kém làm giảm chất lượng phản hồi của AI.
• Nguyên tắc chuyên môn hóa nhận thức cho rằng cần thêm chuyên gia về phương pháp lập luận để tạo ra hệ thống AI có thể giải thích và chính xác.
• Quy trình Guided Reasoning của Logikon bao gồm 5 bước: (1) Kích hoạt phương pháp, (2) Trình bày vấn đề, (3) Hướng dẫn đặt câu hỏi, (4) Thu thập câu trả lời, (5) Xử lý và đánh giá.
• Hướng dẫn viên thiết lập quy tắc suy nghĩ và quản lý luồng công việc. Họ có thể diễn đạt lại vấn đề và so sánh các câu trả lời khác nhau.
• Sau khi nhận được vấn đề, hướng dẫn viên yêu cầu khách hàng đưa ra các giải pháp và liệt kê ưu nhược điểm. Từ đó tạo ra bản đồ lập luận phi chính thức.
• Quy trình tạo bản đồ lập luận bao gồm các bước: Xây dựng vấn đề, Liệt kê ưu nhược điểm, Xây dựng mạng lưới liên quan, Tạo bản đồ lập luận mờ.
• Mỗi bước được thực hiện bởi một lớp phân tích khác nhau trong chương trình Python của Logikon, sử dụng các quy trình LLM nội bộ.
• Bản đồ lập luận mờ cuối cùng được xuất ra dưới nhiều định dạng hữu ích, giúp trực quan hóa quá trình lập luận.
📌 Guided Reasoning là phương pháp mới nâng cao trí tuệ hệ thống đa tác tử AI, sử dụng tác tử hướng dẫn để cải thiện lập luận của các tác tử khác. Quy trình 5 bước của Logikon tạo ra bản đồ lập luận mờ, giúp trực quan hóa và phân tích quá trình suy luận phức tạp của AI.
https://www.marktechpost.com/2024/09/05/guided-reasoning-a-new-approach-to-improving-multi-agent-system-intelligence/
• Hội nghị Robot Thế giới 2024 diễn ra tại Bắc Kinh, trưng bày hơn 600 sản phẩm robot từ khắp nơi trên thế giới và thu hút hơn 1,3 triệu người tham dự.
• 27 robot người hình được trưng bày, có khả năng ứng dụng trong sản xuất, y tế, quản lý hộ gia đình và giải trí.
• Các nhà nghiên cứu cho rằng cạnh tranh trong lĩnh vực robot có thể trở thành cuộc đua không gian mới của thế kỷ này.
• Các doanh nhân trong lĩnh vực robot hình người lạc quan rằng trong 5-10 năm tới, robot có thể đạt được sản xuất hàng loạt, đánh dấu một thời điểm như ChatGPT cho công nghệ này.
• Trung Quốc có tầm nhìn dài hạn về phát triển robot và ứng dụng rộng rãi trong cuộc sống hàng ngày, với các chính sách kích thích và duy trì đổi mới trong những năm tới.
• Các thành phố lớn như Bắc Kinh, Thượng Hải và Ninh Ba đã thành lập các trung tâm đổi mới robot hình người.
• Kế hoạch 5 năm lần thứ 14 của Trung Quốc dự kiến robot sẽ được tích hợp sâu vào cuộc sống hàng ngày vào năm 2035.
• Bộ Công nghiệp và Công nghệ Thông tin đã ban hành hướng dẫn cụ thể về phát triển robot hình người vào tháng 10 năm 2023, đặt ra các mục tiêu tham vọng cho năm 2025 và 2027.
• Trung Quốc đối mặt với hạn chế tiếp cận chip AI và mô hình ngôn ngữ lớn từ các công ty Mỹ, nhưng đầu tư lớn vào nghiên cứu chip và các mô hình nguồn mở sẽ giúp Trung Quốc tiến bộ trong lĩnh vực AI và robot.
• Tại hội nghị, khán giả được chứng kiến robot chơi bóng đá, chuẩn bị hamburger, chơi nhạc cụ, viết thư pháp và hỗ trợ phẫu thuật.
• Robot Walker S của công ty UBTECH ở Thâm Quyến thể hiện khả năng kiểm tra lốp xe chính xác cho xe hơi do Audi và FAW sản xuất chung.
• Trung tâm Đổi mới Robot hình người Bắc Kinh, Audi-FAW và UBTECH đã hợp tác để tích hợp robot hình người vào dây chuyền sản xuất ô tô.
• Hội nghị có sự tham gia của trẻ em và thanh thiếu niên, với các cuộc thi robot dành cho học sinh.
• Bộ Giáo dục Trung Quốc đã công bố chính sách tập trung vào việc tạo ra 184 cơ sở giáo dục AI để thí điểm tích hợp AI vào giáo dục.
• Sự phát triển của robot mang lại những khả năng thú vị nhưng cũng đặt ra những lo ngại đáng kể về đạo đức và an toàn.
• Một ví dụ nổi bật là robot do EX Robots phát triển, là bản sao của một cậu bé đam mê STEM.
• Tác động rộng hơn của robot đối với xã hội, đặc biệt là trong lực lượng lao động, là một mối quan tâm lớn khác.
• Cần có các chương trình hỗ trợ công nhân bị mất việc học kỹ năng mới, hỗ trợ khởi nghiệp và tăng cường mạng lưới an sinh xã hội.
📌 Trung Quốc đang đặt cược lớn vào tương lai robot hình người với các chính sách hỗ trợ và đầu tư mạnh mẽ. Hội nghị Robot Thế giới 2024 tại Bắc Kinh thu hút 1,3 triệu người tham dự, trưng bày 27 robot hình người có khả năng ứng dụng đa dạng. Tuy nhiên, sự phát triển nhanh chóng của ngành công nghiệp này cũng đặt ra những thách thức về đạo đức, an toàn và tác động đến lực lượng lao động.
https://www.scmp.com/opinion/china-opinion/article/3276979/chinas-robotics-future-fast-approaching
• Công ty 1X đã giới thiệu robot NEO Beta, một robot hình người được thiết kế để sử dụng trong gia đình như một trợ lý thông minh hàng ngày.
• NEO Beta cao 1,65m và nặng 30kg, có khả năng di chuyển linh hoạt trong nhà bao gồm đi bộ, chạy bộ và leo cầu thang.
• Robot có thể đi bộ với tốc độ khoảng 4km/h và chạy với tốc độ 12km/h. Nó có thể mang vật nặng lên đến 20kg.
• Thời lượng pin của NEO Beta từ 2-4 giờ tùy thuộc vào hoạt động trước khi cần sạc lại.
• 1X đã tập trung vào các ứng dụng công nghiệp với mẫu robot EVE trước đây, nhưng NEO là lần đầu tiên họ hướng đến robot tiêu dùng.
• Trí tuệ nhân tạo của NEO sử dụng kinh nghiệm mà 1X đã tích lũy được thông qua việc vận hành EVE, và áp dụng cái gọi là "học tập thể hiện" để làm việc với đầu vào ngôn ngữ tự nhiên và không gian vật lý.
• Ưu tiên hàng đầu trong thiết kế của NEO Beta là an toàn. Robot được làm bằng vật liệu mềm thay vì vỏ cứng như hầu hết mọi người tưởng tượng về robot.
• NEO cũng bao gồm các tùy chọn ghi đè thủ công nếu người vận hành cần can thiệp.
• Năm nay, 1X sẽ triển khai một số lượng hạn chế các đơn vị NEO trong các gia đình được chọn để phục vụ mục đích nghiên cứu và phát triển.
• Việc công bố NEO Beta của 1X đã gặp phải sự hoài nghi trên mạng xã hội, với nhiều người cho rằng robot trông giống như một người đàn ông mặc bộ đồ.
• Cuộc đua tạo ra robot quản gia cấp tiêu dùng đang nóng lên, với các công ty khác nhau áp dụng các cách tiếp cận khác nhau. Google's DeepMind đã tạo ra một robot có thể chơi thể thao, và Figure AI đã tạo ra một robot hình người có thể trò chuyện.
📌 NEO Beta của 1X là robot hình người 1,65m cao, nặng 30kg, có thể đi bộ 4km/h, chạy 12km/h, mang 20kg trong 2-4 giờ. Ưu tiên an toàn, sử dụng AI và vật liệu mềm, NEO sẽ được thử nghiệm trong các gia đình chọn lọc để phát triển thêm.
https://readwrite.com/this-new-robot-looks-so-smooth-people-think-its-a-guy-in-a-suit/
• Các nhà nghiên cứu từ IIT Dharwad và TCS Research đề xuất framework Agentic-RAG cho phân tích chuỗi thời gian, sử dụng kiến trúc đa tác nhân phân cấp.
• Framework này bao gồm một tác nhân chủ điều phối các tác nhân phụ chuyên biệt, mỗi tác nhân được tinh chỉnh với mô hình ngôn ngữ quy mô nhỏ (SLM) cho các tác vụ cụ thể như dự báo hoặc phát hiện bất thường.
• Các tác nhân phụ truy xuất các gợi ý liên quan từ kho tri thức chuyên biệt (prompt pools) lưu trữ các mẫu lịch sử, giúp dự đoán tốt hơn trên dữ liệu mới.
• Cách tiếp cận mô-đun này nâng cao tính linh hoạt và độ chính xác, vượt trội so với các phương pháp truyền thống trong nhiều tác vụ chuỗi thời gian.
• Framework sử dụng cơ chế gợi ý động để truy xuất các gợi ý liên quan từ cơ sở tri thức nội bộ, cho phép mô hình thích ứng với các xu hướng khác nhau trong dữ liệu chuỗi thời gian phức tạp.
• Nó kết hợp cơ chế chú ý hai tầng để xử lý các phụ thuộc dài hạn trong dữ liệu chuỗi thời gian mà không cần tinh chỉnh.
• Frameworksử dụng kỹ thuật tinh chỉnh theo hướng dẫn và tinh chỉnh hiệu quả tham số (PEFT) để cải thiện hiệu suất SLM trên các tác vụ chuỗi thời gian cụ thể.
• Nó cải thiện độ dài ngữ cảnh của SLM lên 32K token, cho phép nắm bắt các phụ thuộc không gian-thời gian phức tạp.
• Framework sử dụng Tối ưu hóa Ưu tiên Trực tiếp (DPO) để tinh chỉnh SLM, đảm bảo các mô hình ưu tiên kết quả chính xác hơn cho từng tác vụ cụ thể.
• Agentic-RAG được đánh giá trên các tác vụ dự báo, phân loại, phát hiện bất thường và nội suy, sử dụng các biến thể như SelfExtend-Gemma-2B-instruct, Gemma-7B-instruct và Llama 3-8B-instruct.
• Các bộ dữ liệu thực tế về giao thông (PeMS, METR-LA) và bộ dữ liệu phát hiện bất thường đa biến (SWaT, NASA telemetry) được sử dụng để đánh giá.
• Các chỉ số đánh giá bao gồm MAE, RMSE, độ chính xác, độ chính xác và điểm F1.
• Framework này liên tục vượt trội so với các phương pháp cơ sở trong các tác vụ dự báo, đặc biệt là trên các bộ dữ liệu METR-LA và PEMS-BAY, thể hiện độ chính xác dự đoán và độ mạnh mẽ vượt trội trên tất cả các chỉ số.
📌 Agentic-RAG là framework đa tác nhân phân cấp mới cho phân tích chuỗi thời gian, sử dụng SLM và prompt pools để nâng cao hiệu suất. Nó vượt trội so với các phương pháp truyền thống trong nhiều tác vụ như dự báo và phát hiện bất thường, đạt hiệu suất tốt nhất trên các bộ dữ liệu chuẩn chính.
https://www.marktechpost.com/2024/09/01/agentic-rag-a-hierarchical-multi-agent-framework-for-enhanced-time-series-analysis/
• Số lượng robot trong sản xuất trên toàn cầu đã tăng gấp đôi trong 6 năm qua, đạt 151 robot trên 10.000 nhân viên, với tổng cộng 3,9 triệu robot đang hoạt động.
• Ngân hàng đầu tư Morgan Stanley dự đoán xu hướng hội tụ có thể dẫn đến việc tích hợp AI tạo sinh kiểu ChatGPT vào robot hình dạng người.
• Ước tính đến giữa thế kỷ này, Mỹ có thể có hơn 60 triệu robot hình người đang làm việc, có khả năng ảnh hưởng đến 75% nghề nghiệp và 40% lực lượng lao động.
• Đặc biệt trong lĩnh vực xây dựng và nông nghiệp, có tới 70% công việc có thể bị ảnh hưởng bởi sự xuất hiện của robot AI.
• Hàn Quốc đứng đầu về tỷ lệ sử dụng robot công nghiệp, với khoảng 1 robot cho mỗi 10 công nhân. Singapore và Đức xếp thứ 2 và 3 với hơn 400 robot trên 10.000 nhân viên.
• Mỹ hiện đứng thứ 10 về tỷ lệ sử dụng robot công nghiệp, với 285 robot trên 10.000 công nhân.
• Những người ủng hộ robot cho rằng chúng có thể giảm bớt tình trạng thiếu lao động ở các nước giàu, vốn đang phải dựa vào nhập cư để bù đắp cho dân số già và suy giảm.
• Tuy nhiên, sự phát triển nhanh chóng của AI tiên tiến cũng gây lo ngại về nguy cơ tuyệt chủng do AI gây ra, như cảnh báo của một số chuyên gia hàng đầu trong ngành vào năm ngoái.
• Các nhà nghiên cứu từ Đại học Bath (Anh) và Đại học Kỹ thuật Darmstadt (Đức) đã công bố một bài báo vào giữa tháng 8 nhằm xoa dịu những lo ngại này. Họ cho rằng AI và các mô hình ngôn ngữ lớn không thể học độc lập hoặc tiếp thu kỹ năng mới, do đó không gây ra mối đe dọa hiện hữu đối với nhân loại.
• Việc thương mại hóa robot hình người sẽ phải đối mặt với nhiều thách thức, chủ yếu là sự chấp nhận về mặt xã hội và chính trị, do tiềm năng gây xáo trộn đáng kể đối với một phần lớn lực lượng lao động toàn cầu.
📌 Robot AI đang ngày càng phổ biến trong sản xuất, với 3,9 triệu robot hoạt động trên toàn cầu. Dự báo đến giữa thế kỷ, Mỹ có thể có 60 triệu robot hình người làm việc, ảnh hưởng tới 75% nghề nghiệp. Đặc biệt trong xây dựng và nông nghiệp, 70% công việc có thể bị tác động.
https://www.thestar.com.my/tech/tech-news/2024/09/01/ai-powered-robots-could-mean-job-losses-on-farms-and-in-construction
• Microsoft Research giới thiệu AutoGen Studio - công cụ giao diện low-code mới giúp tạo nhanh prototype và đánh giá các quy trình làm việc của hệ thống đa tác tử AI.
• Hệ thống đa tác tử ngày càng quan trọng trong nhiều lĩnh vực, kết hợp các mô hình AI tạo sinh với công cụ chuyên biệt để giải quyết các vấn đề phức tạp.
• Thách thức lớn trong phát triển hệ thống đa tác tử là độ phức tạp trong cấu hình và gỡ lỗi, đòi hỏi quản lý nhiều tham số và phối hợp tương tác giữa các tác tử.
• Các framework hiện có như AutoGen và CAMEL vẫn phụ thuộc nhiều vào lập trình, gây khó khăn cho việc prototype nhanh và phát triển lặp đi lặp lại.
• AutoGen Studio cung cấp giao diện web và API Python, cho phép lắp ráp nhanh hệ thống đa tác tử thông qua giao diện kéo thả trực quan.
• Công cụ này cho phép định nghĩa và tích hợp các thành phần như mô hình AI, kỹ năng và module bộ nhớ vào quy trình làm việc của tác tử một cách trực quan.
• AutoGen Studio hỗ trợ đặc tả khai báo hành vi tác tử bằng JSON, giúp dễ dàng sao chép và chia sẻ quy trình làm việc.
• Công cụ cung cấp các thành phần và mẫu tác tử có thể tái sử dụng, đẩy nhanh quá trình phát triển.
• AutoGen Studio có tính năng phân tích hiệu năng nâng cao, cho phép giám sát và phân tích hiệu suất hệ thống đa tác tử theo thời gian thực.
• Công cụ theo dõi các chỉ số như số lượng tin nhắn trao đổi giữa các tác tử, chi phí token tiêu thụ bởi mô hình AI tạo sinh, tỷ lệ thành công/thất bại khi sử dụng công cụ.
• Khả năng trực quan hóa các chỉ số thông qua bảng điều khiển trực quan giúp người dùng dễ dàng gỡ lỗi và tinh chỉnh quy trình làm việc.
• AutoGen Studio đã được tải xuống hơn 200.000 lần trong 5 tháng đầu tiên phát hành, cho thấy sự chấp nhận nhanh chóng từ cộng đồng nhà phát triển.
📌 AutoGen Studio của Microsoft Research là bước tiến quan trọng trong hệ thống đa tác tử AI, cung cấp môi trường no-code để prototype nhanh. Với hơn 200.000 lượt tải trong 5 tháng, công cụ này đơn giản hóa việc phát triển hệ thống phức tạp, mở rộng khả năng tiếp cận công nghệ mạnh mẽ này cho nhiều nhà phát triển hơn.
https://www.marktechpost.com/2024/08/31/microsoft-research-introduces-autogen-studio-a-low-code-interface-for-rapidly-prototyping-ai-agents/
• Amazon thông báo đã tuyển dụng các nhà sáng lập Covariant - Pieter Abbeel, Peter Chen và Rocky Duan cùng khoảng 1/4 số nhân viên của startup này.
• Amazon cũng ký thỏa thuận cấp phép không độc quyền để sử dụng các mô hình nền tảng robot của Covariant.
• Covariant đang xây dựng "mô hình ngôn ngữ lớn cho ngôn ngữ robot", tạo ra các mô hình AI cho robot, tập trung vào các tác vụ kho hàng phổ biến như chọn vật phẩm từ thùng.
• Joseph Quinlivan, Phó Chủ tịch Amazon Fulfillment Technologies & Robotics, cho biết việc tích hợp công nghệ AI của Covariant vào đội ngũ robot hiện có sẽ nâng cao hiệu suất và tạo ra giá trị thực tế cho khách hàng.
• Thỏa thuận này tương tự như việc Amazon tuyển dụng các nhà sáng lập startup AI Adept vào tháng 6, cho phép Amazon tiếp cận nhân tài và công nghệ mới mà không cần mua lại hoàn toàn một startup hiện có.
• The Verge mô tả cách tiếp cận này là "reverse acquihire", nơi các gã khổng lồ công nghệ đối mặt với sự giám sát chống độc quyền có thể sử dụng các thỏa thuận tuyển dụng và cấp phép để ngụy trang việc mua lại của họ.
• Covariant sẽ tiếp tục hoạt động dưới sự lãnh đạo của Ted Stinson và Tianhao Zhang, với Stinson - trước đây là COO của startup - giờ đây đảm nhận vai trò CEO.
• Covariant khẳng định vẫn "cam kết đưa Covariant Brain vào các môi trường sản xuất trên nhiều ngành công nghiệp toàn cầu, bao gồm may mặc, sức khỏe và làm đẹp, tạp hóa và dược phẩm".
• Thỏa thuận này cho thấy Amazon đang tích cực mở rộng năng lực AI và robotics, đặc biệt trong lĩnh vực kho vận và hoàn thiện đơn hàng.
• Việc tuyển dụng nhóm sáng lập Covariant có thể giúp Amazon tăng cường đáng kể khả năng phát triển và triển khai các giải pháp AI tiên tiến trong hệ thống kho vận của mình.
• Động thái này cũng phản ánh xu hướng ngày càng tăng của các công ty công nghệ lớn trong việc tìm kiếm tài năng AI thông qua các thỏa thuận tuyển dụng và cấp phép thay vì mua lại toàn bộ công ty.
📌 Amazon tuyển dụng nhóm sáng lập Covariant và 1/4 nhân viên, cấp phép sử dụng mô hình AI robot của họ. Covariant tiếp tục hoạt động độc lập. Động thái này giúp Amazon tăng cường năng lực AI robotics trong kho vận, phản ánh xu hướng "reverse acquihire" của các gã khổng lồ công nghệ.
https://techcrunch.com/2024/08/31/amazon-hires-the-founders-of-robotics-ai-startup-covariant/
SEO contents:
1. Meta descriptions:
AI tạo sinh sẽ thay đổi cách chúng ta đặt vé máy bay, đi ăn nhà hàng, đầu tư tài chính, hẹn hò và mua sắm. Các trợ lý ảo thông minh có thể tự động hóa nhiều tác vụ hàng ngày mà không cần sự can thiệp của con người.
2. Meta keywords:
AI tạo sinh, trợ lý ảo, đặt vé du lịch, đặt bàn nhà hàng, tư vấn đầu tư, hẹn hò trực tuyến, mua sắm thông minh
3. SEO title:
Trợ lý AI mới có thể làm mọi việc thay bạn: từ đặt vé máy bay đến tìm người yêu
Tóm tắt chi tiết:
• Các trợ lý AI tự động sẽ có thể thực hiện hầu hết các tác vụ mà con người thực hiện trên thiết bị, mà không cần tương tác nhiều với người dùng.
• Trong lĩnh vực du lịch, AI "Penny" của Priceline sẽ có thể đặt chỗ, gọi điện cho khách sạn để yêu cầu đặc biệt và quản lý mọi nhu cầu du lịch chỉ bằng cách xem lịch của bạn.
• Apple cũng đang phát triển một phiên bản Siri mới có thể truy cập dữ liệu cá nhân trên iPhone để hỗ trợ du lịch, như hiển thị số hộ chiếu hay thêm ảnh vào ghi chú du lịch.
• Trong lĩnh vực nhà hàng, công ty khởi nghiệp Loman AI đang triển khai trợ lý AI 24/7 để trả lời điện thoại, đặt bàn và nhận đơn hàng tại hàng trăm nhà hàng.
• Các bot AI có thể giao tiếp với nhau, như trường hợp bot của Google gọi điện cho bot của Loman để kiểm tra thông tin nhà hàng.
• Trong lĩnh vực đầu tư, Finley AI đang phát triển nền tảng giúp các công ty tài chính xây dựng bot riêng để cung cấp hướng dẫn đầu tư tùy chỉnh cho khách hàng.
• Ứng dụng hẹn hò Grindr sẽ ra mắt trợ lý AI "wingman" vào cuối năm nay để giúp người dùng tìm kiếm đối tượng phù hợp, lên kế hoạch hẹn hò và đặt chỗ tại nhà hàng.
• Trong lĩnh vực mua sắm, các bot AI sẽ có thể tự động tìm kiếm sản phẩm, theo dõi khuyến mãi và thực hiện mua hàng thay người dùng.
• Google Cloud đang phát triển bot AI cho các nhà bán lẻ để hỗ trợ khách hàng tìm kiếm và mua sắm sản phẩm.
• Skyfire đang xây dựng nền tảng thanh toán blockchain cho phép bot thực hiện giao dịch với con người hoặc bot khác, với các tính năng bảo mật như giới hạn mua hàng.
• Các chuyên gia cảnh báo về rủi ro khi tự động hóa đầu tư và cho phép bot truy cập quá nhiều dữ liệu cá nhân. Người dùng cần biết bot nắm giữ thông tin gì và tự chịu trách nhiệm về hành động của bot.
📌 Trợ lý AI đang phát triển nhanh chóng để tự động hóa nhiều khía cạnh cuộc sống hàng ngày, từ đặt vé du lịch đến hẹn hò và mua sắm. Tuy nhiên, vẫn còn những lo ngại về quyền riêng tư và trách nhiệm khi giao nhiều quyền kiểm soát cho AI.
https://www.wsj.com/tech/ai/ai-agents-autonomous-bots-human-tasks-913c0ce5
#WSJ
• Hugging Face vừa công bố hướng dẫn chi tiết giúp các nhà phát triển tự xây dựng và huấn luyện robot được hỗ trợ bởi AI, dựa trên nền tảng LeRobot ra mắt hồi tháng 5.
• Hướng dẫn bao gồm mọi khía cạnh từ tìm nguồn linh kiện đến triển khai mô hình AI, giúp các nhà phát triển ở mọi trình độ có thể thử nghiệm công nghệ robot tiên tiến.
• Remi Cadene, nhà khoa học nghiên cứu chính tại Hugging Face, nhấn mạnh tiềm năng của việc huấn luyện mạng neural dự đoán chuyển động của động cơ trực tiếp từ hình ảnh camera, tương tự cách các mô hình ngôn ngữ lớn xử lý văn bản.
• Trọng tâm của hướng dẫn là cánh tay robot Koch v1.1 giá cả phải chăng, được thiết kế bởi Jess Moss. Phiên bản này cải tiến thiết kế gốc của Alexander Koch với quy trình lắp ráp đơn giản hóa và khả năng nâng cao.
• Hướng dẫn bao gồm video chi tiết hướng dẫn từng bước trong quá trình lắp ráp, đảm bảo ngay cả người mới làm quen với robotics cũng có thể tự xây dựng cánh tay robot được hỗ trợ bởi AI.
• Hugging Face cung cấp công cụ để trực quan hóa và chia sẻ bộ dữ liệu, khuyến khích người dùng đóng góp vào kho lưu trữ dữ liệu chuyển động robot ngày càng phát triển.
• Cadene tiết lộ về một mẫu robot thậm chí còn dễ tiếp cận hơn đang được phát triển. Mẫu Moss v1 này hứa hẹn sẽ giảm chi phí xuống chỉ còn 150 USD cho hai cánh tay và loại bỏ nhu cầu in 3D.
• Sáng kiến này đánh dấu bước ngoặt trong lĩnh vực robotics, vốn trước đây chỉ giới hạn ở các tập đoàn lớn và viện nghiên cứu có nguồn lực dồi dào.
• Việc tích hợp AI với các hệ thống vật lý đại diện cho ranh giới tiếp theo của đổi mới công nghệ, với tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực từ sản xuất đến chăm sóc sức khỏe.
• Tuy nhiên, việc dân chủ hóa công nghệ robotics cũng đặt ra những câu hỏi quan trọng về tương lai của công việc, quyền riêng tư và các cân nhắc đạo đức của tự động hóa rộng rãi.
📌 Hướng dẫn của Hugging Face mở ra kỷ nguyên mới cho robotics, giúp dân chủ hóa công nghệ này. Với chi phí chỉ 150 USD cho robot Moss v1 sắp ra mắt, AI và robotics sẽ trở nên dễ tiếp cận hơn bao giờ hết, mở ra tiềm năng đổi mới và ứng dụng đa dạng trong nhiều lĩnh vực.
https://venturebeat.com/ai/build-your-own-ai-powered-robot-hugging-faces-lerobot-tutorial-is-a-game-changer/
• Physical AI (AI vật lý) là giai đoạn tiếp theo của AI, nơi trí thông minh nhân tạo hiện diện trong các hình thức vật lý và tương tác với thế giới xung quanh. NVIDIA CEO Jensen Huang tin rằng đây sẽ là xu hướng lớn tiếp theo.
• Theo Jensen, có 3 giai đoạn phát triển của AI: AI tiên phong (tạo ra các mô hình nền tảng), AI doanh nghiệp (chatbot và các mô hình AI hỗ trợ năng suất), và cuối cùng là Physical AI.
• Để phát triển Physical AI hiệu quả cần tích hợp đầu vào từ cảm biến và khả năng thao tác các vật thể trong không gian 3 chiều.
• NVIDIA đề xuất cần 3 loại máy tính: một để tạo AI, một để mô phỏng AI, và một để chạy AI. Họ cung cấp các giải pháp phần cứng và phần mềm tương ứng:
- Máy chủ H100 và B100 để tạo AI
- Workstation và máy chủ sử dụng Omniverse với GPU RTX để mô phỏng và kiểm tra AI
- Jetson (sắp tới với GPU Blackwell) để cung cấp khả năng cảm nhận và điều khiển thời gian thực trên robot
• NVIDIA giới thiệu GR00T (Generalist Robot 00 Technology) để thiết kế và mô phỏng chuyển động của robot bằng cách quan sát hành động của con người.
• Hai NIM AI mới cho phép các nhà phát triển robot tạo quy trình mô phỏng trong NVIDIA Isaac Sim:
- MimicGen NIM tạo dữ liệu chuyển động tổng hợp
- Robocasa NIM tạo môi trường và nhiệm vụ robot trong OpenUSD
• NVIDIA OSMO là dịch vụ đám mây giúp điều phối và mở rộng quy trình phát triển robot phức tạp, rút ngắn thời gian triển khai từ hàng tháng xuống dưới 1 tuần.
• Isaac Manipulator cung cấp khả năng khéo léo và AI tiên tiến cho cánh tay robot. Isaac Perceptor mang lại khả năng thị giác 3D đa camera.
• Chip Jetson Thor mới với GPU Blackwell có hiệu suất AI 800 teraflops để chạy các mô hình AI đa phương thức như GR00T.
📌 NVIDIA đang dẫn đầu xu hướng Physical AI với các giải pháp toàn diện từ phần cứng đến phần mềm. Họ kỳ vọng robot sẽ xuất hiện khắp nơi trong tương lai, từ nhà bếp đến nhà máy, với khả năng tương tác thông minh nhờ công nghệ AI tiên tiến.
https://www.forbes.com/sites/karlfreund/2024/08/09/what-is-physical-ai-and-why-it-could-change-the-world/
• Google DeepMind đã phát triển một robot AI có khả năng chơi bóng bàn ở "trình độ nghiệp dư của con người".
• Robot đã thắng 13 trong số 29 trận đấu với người chơi, tỷ lệ thành công phụ thuộc vào trình độ của đối thủ (từ người mới bắt đầu đến nâng cao).
• Đây là robot đầu tiên có thể chơi một môn thể thao với con người ở trình độ ngang bằng, đánh dấu một cột mốc quan trọng trong lĩnh vực học máy và điều khiển robot.
• Bóng bàn được chọn vì bao gồm nhiều yếu tố phức tạp như vật lý chuyển động và phối hợp mắt-tay.
• Robot được huấn luyện bằng cách tập trung vào từng loại cú đánh riêng biệt (như xoáy trái, giao bóng thuận tay), kết hợp với thuật toán cấp cao hơn để chọn cú đánh phù hợp.
• Robot gặp khó khăn nhất với những cú đánh nhanh, do có ít thời gian để "suy nghĩ" về phản ứng.
• Các nhà nghiên cứu đang tìm cách cải thiện hệ thống, bao gồm việc làm cho nó khó đoán hơn trong lối chơi.
• Robot có khả năng học hỏi từ chiến thuật của đối thủ và đánh giá điểm mạnh, điểm yếu của họ.
• Thành tựu này mới chỉ là bước tiến nhỏ trong lĩnh vực rộng lớn hơn là phát triển robot có khả năng thực hiện các kỹ năng hữu ích trong thế giới thực.
• Nghiên cứu này mở ra triển vọng ứng dụng AI vào các nhiệm vụ vật lý phức tạp đòi hỏi sự kết hợp nhiều kỹ năng khác nhau.
📌 Google DeepMind đã tạo ra robot AI chơi bóng bàn ngang tầm người, thắng 13/29 trận. Đây là bước tiến quan trọng trong việc phát triển robot có kỹ năng phức tạp, mở ra khả năng ứng dụng AI vào các nhiệm vụ thực tế đa dạng trong tương lai.
https://www.techradar.com/computing/artificial-intelligence/googles-deepmind-ai-can-now-play-table-tennis-to-a-competitive-level
• Các mô hình ngôn ngữ lớn mã hóa (CodeLLMs) đã chứng tỏ khả năng tạo mã ấn tượng, nhưng vẫn gặp khó khăn với các nhiệm vụ phức tạp trong kỹ thuật phần mềm như phát triển toàn bộ hệ thống phần mềm dựa trên các thông số kỹ thuật phức tạp.
• Các nghiên cứu gần đây, bao gồm ChatDev và MetaGPT, đã giới thiệu các khung đa tác nhân cho phát triển phần mềm, nơi các tác nhân hợp tác để đạt được các mục tiêu phức tạp. Tuy nhiên, chúng có xu hướng đơn giản hóa quá mức bản chất phức tạp của quá trình phát triển phần mềm trong thực tế, nơi phần mềm liên tục được cải thiện và nâng cấp.
• Nhóm nghiên cứu từ Trung tâm AI của FPT Software đề xuất AgileCoder, một khung làm việc mới lạ bắt chước quá trình phát triển phần mềm phức tạp trong thực tế bằng cách lấy cảm hứng từ Phương pháp Linh hoạt, một phương pháp được sử dụng rộng rãi trong các nhóm phát triển phần mềm chuyên nghiệp. Khoảng 70% các nhóm chuyên nghiệp sử dụng Phương pháp Linh hoạt, phù hợp hơn với phát triển phần mềm trong thực tế.
• AgileCoder bao gồm nhiều tác nhân đóng vai trò khác nhau: Quản lý Dự án, Scrum Master, Nhà phát triển, Nhà phát triển Cao cấp và Kiểm thử viên. Các tác nhân này làm việc hợp tác trong các sprint để hoàn thành các nhiệm vụ của người dùng theo phương pháp Linh hoạt.
• Một điểm mới trong AgileCoder là Bộ tạo Đồ thị Mã động, tạo ra Đồ thị Phụ thuộc Mã (CDG) mô hình hóa mối quan hệ giữa các tệp mã và cập nhật khi có thay đổi mã nguồn. CDG đóng vai trò quan trọng trong việc viết các kế hoạch kiểm tra hợp lý và cho phép truy xuất mã hiệu quả.
• Đánh giá toàn diện trên các bộ chuẩn như HumanEval, MBPP và ProjectDev cho thấy AgileCoder vượt trội hơn so với các phương pháp khác. Trên HumanEval và MBPP, AgileCoder vượt trội đáng kể so với CodeLLMs và các khung đa tác nhân tiên tiến như ChatDev và MetaGPT.
📌 AgileCoder là một khung đa tác nhân mới lạ cho phát triển phần mềm, lấy cảm hứng từ phương pháp Linh hoạt. Nó vượt trội hơn các phương pháp hiện có như ChatDev và MetaGPT trong các nhiệm vụ phát triển phần mềm phức tạp bằng cách sử dụng CodeLLMs.
https://www.marktechpost.com/2024/08/10/researchers-at-fpt-software-ai-center-introduce-agilecoder-a-multi-agent-system-for-generating-complex-software-surpassing-metagpt-and-chatdev/
• Mistral AI, công ty khởi nghiệp AI của Pháp, vừa ra mắt La Plateforme - nền tảng xây dựng AI agent mới của họ.
• La Plateforme cho phép người dùng tạo ra các AI agent có thể thực hiện nhiều tác vụ khác nhau như trả lời câu hỏi, phân tích dữ liệu và tạo nội dung.
• Nền tảng này hỗ trợ nhiều loại mô hình ngôn ngữ lớn (LLM) khác nhau, bao gồm cả các mô hình nguồn mở và độc quyền.
• La Plateforme cung cấp giao diện lập trình ứng dụng (API) để tích hợp các AI agent vào các ứng dụng và dịch vụ khác.
• Người dùng có thể tùy chỉnh các AI agent bằng cách sử dụng các công cụ và tính năng có sẵn trên nền tảng.
• Mistral AI nhấn mạnh tầm quan trọng của việc phát triển AI có trách nhiệm và đạo đức thông qua La Plateforme.
• Nền tảng này được thiết kế để hỗ trợ cả nhà phát triển cá nhân và doanh nghiệp trong việc xây dựng các ứng dụng AI.
• La Plateforme cung cấp các tính năng bảo mật và quyền riêng tư để bảo vệ dữ liệu của người dùng.
• Mistral AI hy vọng La Plateforme sẽ thúc đẩy sự đổi mới và sáng tạo trong lĩnh vực AI.
• Công ty cũng công bố kế hoạch mở rộng khả năng của nền tảng trong tương lai, bao gồm hỗ trợ cho các mô hình đa phương thức.
• La Plateforme hiện đang trong giai đoạn beta và Mistral AI đang mời các nhà phát triển tham gia thử nghiệm.
• Nền tảng này được kỳ vọng sẽ cạnh tranh với các nền tảng AI agent khác trên thị trường như OpenAI's GPT-4 và Anthropic's Claude.
• Mistral AI đã huy động được 385 triệu euro (khoảng 414 triệu USD) trong vòng gọi vốn Series A vào tháng 12/2023.
• Công ty được thành lập bởi các cựu nhân viên của DeepMind và Meta, với mục tiêu phát triển các giải pháp AI tiên tiến.
• La Plateforme được xem là bước đi quan trọng của Mistral AI trong việc định vị mình như một đối thủ cạnh tranh lớn trong lĩnh vực AI.
📌 Mistral AI ra mắt La Plateforme, nền tảng xây dựng AI agent mới hỗ trợ nhiều LLM. Nền tảng cung cấp API, tính năng tùy chỉnh và bảo mật cho nhà phát triển và doanh nghiệp. Mistral AI, được thành lập bởi cựu nhân viên DeepMind và Meta, đã huy động 414 triệu USD vào tháng 12/2023.
https://analyticsindiamag.com/ai-news-updates/mistral-releases-la-plateforme-for-building-ai-agents/
• Wordware là IDE đầu tiên dành riêng để xây dựng AI sử dụng Lập trình Ngôn ngữ Tự nhiên (NLP), giúp phát triển ứng dụng AI nhanh hơn 20 lần.
• Công cụ này được thiết kế để trao quyền cho các chuyên gia lĩnh vực, nhóm và kỹ sư phần mềm, đặc biệt hữu ích cho những người không có kỹ năng lập trình truyền thống.
• Giao diện thân thiện với người dùng của Wordware cho phép tạo các agent AI phức tạp một cách dễ dàng bằng ngôn ngữ tự nhiên.
• Nền tảng cung cấp các công cụ tích hợp sẵn như chuyển đổi giọng nói thành văn bản, tạo hình ảnh và mô-đun nghiên cứu.
• Wordware hỗ trợ triển khai ứng dụng và API chỉ với một cú nhấp chuột, đơn giản hóa quá trình phát triển.
• Thư viện cộng đồng của nền tảng hoạt động giống như GitHub, cung cấp kho lưu trữ các agent sẵn sàng sử dụng.
• Khả năng kỹ thuật nâng cao bao gồm vòng lặp, phân nhánh, an toàn kiểu và thực thi mã tùy chỉnh.
• Wordware tăng tốc quá trình lặp lại bằng cách cho phép người dùng nhanh chóng đánh giá chất lượng đầu ra và tinh chỉnh agent AI.
• Giao diện giống Notion của nền tảng hỗ trợ quản lý lệnh, cộng tác liền mạch và hợp lý hóa quy trình làm việc.
• Wordware hỗ trợ nhiều nhà cung cấp mô hình ngôn ngữ lớn, cho phép tối ưu hóa quy trình làm việc với tỷ lệ chi phí-độ trễ-chất lượng tốt nhất.
• Một tính năng nổi bật của Wordware là hỗ trợ đa phương thức, cho phép tích hợp văn bản, hình ảnh, âm thanh và video trong quy trình làm việc AI.
• Người dùng có thể chuyển đổi linh hoạt giữa các phương thức dữ liệu, cải thiện tính linh hoạt và khả năng ứng dụng của các agent AI.
• Wordware loại bỏ các hạn chế của công cụ không mã truyền thống, cho phép mọi thành viên trong nhóm đóng góp độc lập vào quá trình phát triển AI.
📌 Wordware là IDE đột phá cho phép phát triển ứng dụng AI nhanh hơn 20 lần bằng lập trình ngôn ngữ tự nhiên. Với giao diện thân thiện, hỗ trợ đa phương tiện và cộng tác hiệu quả, nó trao quyền cho cả chuyên gia lĩnh vực lẫn kỹ sư phần mềm xây dựng AI phức tạp dễ dàng.
https://aitoolsclub.com/meet-wordware-an-ai-tool-that-helps-you-build-your-own-ai-agents-and-apps-using-prompts/
• Figure AI, startup được hậu thuẫn bởi OpenAI, vừa tung ra video teaser cho robot hình người mới mang tên Figure 02, dự kiến ra mắt vào ngày 6/8/2024.
• Video ngắn nhưng ấn tượng, cho thấy các khớp nối và chi tiết robot tiên tiến, thiết kế lưới linh hoạt, với mô-men xoắn lên tới 150Nm và phạm vi chuyển động (ROM) lên tới 195 độ.
• Nhà sáng lập Brett Adcock tuyên bố Figure 02 là "robot hình người tiên tiến nhất hành tinh".
• Figure AI được thành lập năm 2022, đã huy động được 675 triệu USD trong vòng gọi vốn gần nhất vào tháng 2/2024. Các nhà đầu tư lớn bao gồm OpenAI, NVidia, Microsoft, Intel Capital và Bezos Expeditions.
• Công ty đã ký thỏa thuận hợp tác với BMW Manufacturing và tích hợp ấn tượng GPT-4V của OpenAI vào robot Figure 01 trước đó.
• Cạnh tranh trong lĩnh vực robot hình người đang ngày càng gay gắt. Tesla của Elon Musk đang phát triển robot Optimus, Nvidia có dự án GR00T, Boston Dynamics cũng nâng cấp robot Atlas.
• Figure AI nhắm đến thị trường lao động toàn cầu, với mục tiêu đưa robot vào các ngành sản xuất, hậu cần, kho bãi và bán lẻ.
• Công ty cam kết không vũ khí hóa robot và tập trung vào việc tăng năng suất, an toàn bằng cách thay thế con người trong các công việc nguy hiểm.
• Elon Musk dự đoán thị trường tiềm năng lên tới hơn 10 tỷ robot hình người trên Trái đất.
• Với sự hậu thuẫn mạnh mẽ và đà phát triển hiện tại, Figure AI đang ở vị thế thuận lợi để tiếp tục đột phá trong lĩnh vực robot hình người.
📌 Figure AI giới thiệu robot hình người Figure 02 mới với thiết kế tiên tiến, được hỗ trợ bởi các "ông lớn" công nghệ như OpenAI, NVidia. Cạnh tranh trong lĩnh vực này ngày càng gay gắt với sự tham gia của Tesla, Nvidia và Boston Dynamics, hướng tới thị trường tiềm năng 10 tỷ robot toàn cầu.
https://venturebeat.com/ai/openai-backed-startup-figure-teases-new-humanoid-robot-figure-02/
• Nvidia công bố các tiến bộ lớn cho Universal Scene Description (OpenUSD), mở rộng khả năng ứng dụng của khung trao đổi dữ liệu 3D phổ quát này trong lĩnh vực robot, thiết kế và kỹ thuật công nghiệp.
• Công ty giới thiệu các mô hình AI tạo sinh đầu tiên trên thế giới có khả năng hiểu ngôn ngữ, hình học, vật liệu, vật lý và không gian dựa trên OpenUSD.
• Các dịch vụ vi mô Nvidia NIM mới cho phép tạo ra ngôn ngữ OpenUSD để trả lời truy vấn của người dùng, tạo mã Python OpenUSD, áp dụng vật liệu cho đối tượng 3D và hiểu không gian 3D cùng vật lý để đẩy nhanh phát triển bản sao kỹ thuật số.
• Nvidia cung cấp các đầu nối USD mới cho các định dạng dữ liệu mô phỏng robot và công nghiệp, cùng công cụ cho phép truyền dữ liệu lớn được ray-traced hoàn toàn bằng Nvidia RTX tới Apple Vision Pro.
• Các dịch vụ vi mô NIM đang được cung cấp bản xem trước bao gồm: USD Code, USD Search, USD Validate. Các dịch vụ sắp ra mắt gồm: USD Layout, USD SmartMaterial, fVDB Mesh Generation, fVDB Physics Super-Res, fVDB NeRF-XL.
• Foxconn, nhà sản xuất toàn cầu với hơn 170 nhà máy trên thế giới, đang sử dụng dịch vụ vi mô NIM và Omniverse để tạo bản sao kỹ thuật số của một nhà máy đang phát triển.
• WPP, công ty dịch vụ tiếp thị và truyền thông hàng đầu thế giới, là người áp dụng sớm các dịch vụ vi mô USD Search và USD Code NIM trong quy trình sáng tạo nội dung được hỗ trợ bởi AI tạo sinh.
• Nvidia và Siemens mở rộng hợp tác để tích hợp quy trình OpenUSD với danh mục công nghệ mô phỏng Simcenter, hỗ trợ ra quyết định dựa trên bằng chứng và cộng tác giữa các bên liên quan chính.
• Nvidia phát hành đầu nối từ Unified Robotics Description Format sang OpenUSD, cho phép các nhà robot học dễ dàng mang dữ liệu robot của họ qua các ứng dụng khác nhau.
• Công ty cũng công bố bộ công cụ phát triển phần mềm OpenUSD Exchange, cho phép các nhà phát triển xây dựng các đầu nối dữ liệu OpenUSD mạnh mẽ của riêng họ.
• Các công cụ và API mới để truyền cảnh OpenUSD quy mô lớn từ ứng dụng xây dựng trên nền tảng Omniverse tới Apple Vision Pro hiện đã có sẵn trong bản truy cập sớm.
📌 Nvidia đã giới thiệu các dịch vụ vi mô NIM và AI tạo sinh cho OpenUSD, mở rộng ứng dụng trong công nghiệp và robot. Các công cụ mới giúp tạo thế giới ảo chính xác cho AI thế hệ tiếp theo, với hơn 10.000 công ty đang sử dụng Omniverse và 30 công ty đóng góp cho OpenUSD.
https://venturebeat.com/ai/nvidia-unveils-generative-ai-and-nim-microservices-for-openusd/
- Tác tử AI sử dụng mô hình nền tảng như mô hình ngôn ngữ lớn (LLM) để thực hiện các quy trình công việc phức tạp thông qua tương tác bằng ngôn ngữ tự nhiên.
- Tác tử AI có thể xử lý đa dạng tình huống đầu vào/đầu ra, được hướng dẫn bằng ngôn ngữ tự nhiên và tương tác với các công cụ, nền tảng phần mềm hiện có.
- Quy trình hoạt động gồm 4 bước: người dùng đưa chỉ dẫn, hệ thống tác tử lập kế hoạch và giao việc cho các tác tử con, cải tiến đầu ra, thực thi hành động.
- Giá trị mà tác tử AI có thể mang lại cho doanh nghiệp:
+ Tự động hóa các quy trình phức tạp, có nhiều biến thể đầu vào/đầu ra mà trước đây khó tự động hóa một cách hiệu quả về chi phí và thời gian.
+ Giảm bớt sự phụ thuộc vào lập trình viên nhờ khả năng tiếp nhận chỉ dẫn bằng ngôn ngữ tự nhiên, cho phép nhân viên phi kỹ thuật cũng có thể mã hóa tri thức.
+ Tích hợp liền mạch với hệ sinh thái công cụ, nền tảng phần mềm sẵn có của doanh nghiệp, tạo ra quy trình làm việc xuyên suốt.
+ Đóng vai trò như đồng nghiệp ảo thông minh, có thể phối hợp làm việc với con người một cách trơn tru và tự nhiên.
- Một số ứng dụng tiềm năng của tác tử AI:
+ Tự động hóa quy trình thẩm định khoản vay: Nhóm tác tử chuyên biệt phân tích thông tin người vay, tính toán chỉ số tài chính, phát hiện sai sót, lặp lại cho đến khi hoàn thành báo cáo tín dụng. Giảm 20-60% thời gian xét duyệt.
+ Hiện đại hóa mã nguồn cũ: Tác tử chuyên gia phân tích mã cũ, ghi chú logic nghiệp vụ. Tác tử đảm bảo chất lượng kiểm tra, tạo ca kiểm thử. Quy trình lặp lại giúp tinh chỉnh đầu ra, giảm chi phí phát triển phần mềm.
+ Tạo chiến dịch marketing trực tuyến: Tác tử chiến lược khai thác dữ liệu thị trường để lập chiến lược. Tác tử viết nội dung, thiết kế tạo nội dung phù hợp từng phân khúc. Người đánh giá thương hiệu. Các tác tử phối hợp tinh chỉnh, tối ưu tác động và giảm rủi ro.
- Để chuẩn bị cho kỷ nguyên tác tử AI, doanh nghiệp cần: mã hóa tri thức phù hợp, lập kế hoạch công nghệ chiến lược, xây dựng cơ chế kiểm soát có sự tham gia của con người.
- Một số rủi ro cần lưu ý khi triển khai tác tử AI:
+ Đầu ra có hại tiềm tàng: Cần giải thích được quá trình ra quyết định của tác tử, giới hạn hành động dựa trên độ phức tạp, giám sát của con người.
+ Lạm dụng công cụ: Áp dụng kiểm soát truy cập, giới hạn môi trường hoạt động, giám sát thời gian thực và đánh giá định kỳ.
+ Thiếu/thừa lòng tin giữa người và máy: Đảm bảo minh bạch quá trình, đào tạo người dùng, duy trì giám sát của con người, đánh giá hiệu quả gắn với kết quả cụ thể.
- Các vấn đề rộng hơn cần xem xét khi triển khai tác tử AI: điều chỉnh giá trị tổ chức, chuyển dịch vai trò lao động, đặc điểm nhân hóa của tác tử.
📌 Tác tử AI hứa hẹn cách mạng hóa cách thức làm việc và mang lại nhiều giá trị cho doanh nghiệp. Khảo sát gần đây của McKinsey cho thấy 72% công ty đang triển khai AI, ngày càng quan tâm đến AI tạo sinh. Tác tử AI có thể tự động hóa các quy trình phức tạp, giảm sự phụ thuộc vào lập trình viên, tích hợp liền mạch với hệ thống sẵn có và đóng vai trò như đồng nghiệp ảo thông minh. Ứng dụng tiềm năng trong tài chính, công nghệ, marketing có thể giảm 20-60% thời gian, chi phí. Tuy nhiên, công nghệ này vẫn đang trong giai đoạn sơ khai với nhiều thách thức về độ tin cậy, lạm dụng, niềm tin giữa người-máy. Việc tích hợp tác tử AI đòi hỏi chuẩn bị kỹ lưỡng về tri thức, công nghệ, con người và xem xét các vấn đề đạo đức, xã hội rộng hơn.
https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/why-agents-are-the-next-frontier-of-generative-ai
#McKinsey
• Capgemini dự đoán các AI agents tự trị có khả năng giao tiếp với nhau sẽ xuất hiện vào năm 2025.
• Hệ thống "AI đa tác tử" này bao gồm nhiều agents làm việc cùng nhau để giải quyết các tác vụ một cách phân tán và hợp tác.
• Pascal Brier, Giám đốc Đổi mới của Capgemini, cho biết công ty đã thấy các doanh nghiệp thảo luận về công nghệ agent này và kỳ vọng các ứng dụng sử dụng nhiều agents tự trị sẽ xuất hiện vào năm tới.
• Capgemini định nghĩa AI agents là "công nghệ được thiết kế để hoạt động độc lập, lập kế hoạch, suy ngẫm, theo đuổi mục tiêu cấp cao hơn và thực hiện quy trình công việc phức tạp với sự giám sát trực tiếp tối thiểu hoặc hạn chế của con người".
• Báo cáo mới của Capgemini cho thấy 82% công ty được khảo sát có kế hoạch tích hợp AI agents trong vòng 1-3 năm tới, trong khi chỉ 7% không có kế hoạch tích hợp.
• Có hai loại AI agents: agents cá nhân thực hiện nhiệm vụ thay bạn và công nghệ đa tác tử với "các agents giao tiếp với nhau".
• Ví dụ, một AI agent marketing tạo chiến dịch quảng cáo ở Đức có thể tự động làm việc với agent khác trong bộ phận pháp lý để đảm bảo tính hợp pháp.
• 71% tổ chức kỳ vọng AI agents sẽ thúc đẩy tự động hóa, 64% kỳ vọng chúng sẽ giảm bớt công việc lặp lại cho nhân viên.
• Capgemini ghi nhận số lượng tổ chức tích hợp AI tạo sinh tăng gấp 4 lần, từ 6% năm 2023 lên 24% năm nay.
• Tuy nhiên, có khoảng cách về mức độ áp dụng giữa các công ty lớn và nhỏ. 10% công ty có doanh thu 1-5 tỷ USD đang triển khai AI tạo sinh, con số này là 49% với các công ty có doanh thu từ 20 tỷ USD trở lên.
• Mức độ áp dụng cũng khác nhau giữa các ngành. 88% tổ chức trong lĩnh vực hàng không vũ trụ và quốc phòng đã đầu tư vào AI tạo sinh, trong khi con số này ở ngành bán lẻ chỉ là 66%.
📌 Capgemini dự đoán AI agents tự trị sẽ xuất hiện vào 2025, với 82% công ty có kế hoạch tích hợp trong 3 năm tới. Công nghệ này hứa hẹn thúc đẩy tự động hóa và giảm công việc lặp lại, nhưng vẫn tồn tại khoảng cách áp dụng giữa các công ty lớn nhỏ và các ngành khác nhau.
https://www.cnbc.com/2024/07/22/ai-that-can-talk-with-other-ai-will-launch-in-2025-capgemini-predicts.html
• AI agent được mô tả đơn giản là phần mềm sử dụng AI để thực hiện một loạt công việc thay thế con người như dịch vụ khách hàng, nhân sự hay hỗ trợ IT. Tuy nhiên, định nghĩa chính xác về AI agent vẫn chưa thống nhất.
• Các công ty công nghệ lớn có cách hiểu khác nhau về AI agent:
- Google xem đây là trợ lý thực hiện nhiệm vụ cụ thể như hỗ trợ lập trình, marketing hay IT.
- Asana coi AI agent như một nhân viên thêm, có thể được giao nhiệm vụ.
- Sierra (startup của cựu CEO Salesforce) xem đây là công cụ trải nghiệm khách hàng, giải quyết vấn đề phức tạp hơn chatbot.
• Rudina Seseri, nhà sáng lập Glasswing Ventures, cho rằng AI agent là hệ thống phần mềm thông minh có thể tự chủ nhận thức môi trường, suy luận, ra quyết định và hành động để đạt mục tiêu cụ thể.
• Aaron Levie, CEO Box, lạc quan về sự phát triển của AI agent nhờ cải thiện về hiệu năng GPU, hiệu quả và chất lượng mô hình, cơ sở hạ tầng AI.
• Tuy nhiên, chuyên gia robot Rodney Brooks cảnh báo không nên quá lạc quan vì AI phải đối mặt với những vấn đề phức tạp hơn nhiều công nghệ khác.
• Thách thức lớn là khả năng truy cập nhiều hệ thống khác nhau và xử lý các vấn đề phát sinh. Nhiều hệ thống cũ thiếu API cơ bản.
• David Cushman từ HFS Research cho rằng AI agent hiện tại mới chỉ là trợ lý giúp con người hoàn thành nhiệm vụ, chưa thể tự động hoàn toàn.
• Jon Turow, đối tác tại Madrona Ventures, cho rằng cần xây dựng hạ tầng và tech stack riêng cho AI agent.
• Fred Havemeyer, chuyên gia nghiên cứu tại Macquarie, dự đoán AI agent hiệu quả nhất sẽ là tập hợp nhiều mô hình khác nhau với lớp định tuyến gửi yêu cầu đến agent và mô hình phù hợp nhất.
• Mục tiêu cuối cùng là AI agent có thể hoàn toàn tự chủ, lập luận và thực hiện các bước để đạt mục tiêu trừu tượng. Tuy nhiên, công nghệ hiện tại vẫn cần nhiều bước tiến để đạt được điều này.
📌 AI agent là công nghệ đầy hứa hẹn nhưng còn nhiều thách thức. Chưa có định nghĩa thống nhất, cần phát triển hạ tầng và khả năng tự chủ. Mục tiêu là AI agent có thể hoàn toàn tự lập luận và thực hiện các bước để đạt mục tiêu trừu tượng, nhưng còn cần nhiều bước tiến công nghệ.
https://techcrunch.com/2024/07/13/what-exactly-is-an-ai-agent/
• Các công ty đám mây lớn như AWS, Google Cloud và Microsoft Azure đang tập trung phát triển AI agents - các hệ thống AI có khả năng tự động hóa các tác vụ phức tạp.
• AWS đã giới thiệu Amazon Q, một AI agent được thiết kế để hỗ trợ các nhà phát triển và chuyên gia IT. Amazon Q có thể trả lời câu hỏi, viết code và thực hiện các tác vụ phức tạp trên nền tảng AWS.
• Google Cloud đang phát triển Duet AI, một AI agent có khả năng tự động hóa các tác vụ như viết code, phân tích dữ liệu và quản lý cơ sở hạ tầng đám mây.
• Microsoft Azure cũng đang tích cực phát triển AI agents thông qua nền tảng Azure OpenAI Service và công cụ Copilot.
• Các AI agents này được kỳ vọng sẽ giúp tự động hóa nhiều tác vụ phức tạp trong môi trường đám mây, từ quản lý cơ sở hạ tầng đến phát triển ứng dụng và phân tích dữ liệu.
• Theo các chuyên gia, AI agents có tiềm năng cách mạng hóa cách thức hoạt động của các nền tảng đám mây, giúp tăng hiệu quả và giảm chi phí cho doanh nghiệp.
• Tuy nhiên, việc phát triển và triển khai AI agents cũng đặt ra nhiều thách thức về bảo mật, quyền riêng tư và đạo đức.
• Các công ty đám mây đang tập trung vào việc xây dựng các AI agents có khả năng học hỏi và thích nghi với nhu cầu cụ thể của từng khách hàng.
• Ngoài các gã khổng lồ công nghệ, nhiều startup cũng đang tham gia vào cuộc đua phát triển AI agents cho môi trường đám mây.
• Các chuyên gia dự đoán rằng AI agents sẽ trở thành một phần không thể thiếu của các nền tảng đám mây trong tương lai gần, mang lại những thay đổi lớn cho ngành công nghiệp này.
• Việc tích hợp AI agents vào các nền tảng đám mây được kỳ vọng sẽ tạo ra một làn sóng đổi mới trong cách doanh nghiệp sử dụng và quản lý tài nguyên đám mây.
• Các công ty đám mây đang đầu tư mạnh vào nghiên cứu và phát triển để cải thiện khả năng của AI agents, bao gồm việc tăng cường khả năng xử lý ngôn ngữ tự nhiên và học máy.
📌 AWS, Google Cloud và Microsoft Azure đang đua nhau phát triển AI agents để tự động hóa tác vụ phức tạp trên nền tảng đám mây. Các AI agents như Amazon Q và Duet AI hứa hẹn cách mạng hóa cách doanh nghiệp sử dụng đám mây, tăng hiệu quả và giảm chi phí, nhưng cũng đặt ra thách thức về bảo mật và đạo đức.
Citations:
[1] https://analyticsindiamag.com/aws-google-and-other-cloud-giants-go-after-ai-agents/
- Jacobi Robotics, một startup từ UC Berkeley, đang phát triển phần mềm AI để tự động hóa việc xếp hàng hóa lên pallet trong kho.
- Có hơn 2 tỷ pallet đang lưu thông tại Mỹ, vận chuyển hàng hóa trị giá 400 tỷ USD mỗi năm. Tuy nhiên, việc xếp hàng lên pallet vẫn chủ yếu thủ công, gây nguy cơ chấn thương cao cho công nhân.
- Phần mềm của Jacobi sử dụng deep learning để tạo ra "bản nháp" về cách di chuyển của cánh tay robot, sau đó dùng các phương pháp truyền thống để kiểm tra tính an toàn và khả thi.
- Quy trình lập trình robot truyền thống mất hàng tháng. Jacobi hứa hẹn rút ngắn thời gian này xuống chỉ còn 1 ngày, tính toán chuyển động trong chưa đầy 1 mili giây.
- Phần mềm cho phép khách hàng tạo mô phỏng kho của họ, bao gồm mô hình robot, loại hộp, hướng nhãn. Thuật toán sẽ tự động lập kế hoạch chuyển động tối ưu cho cánh tay robot.
- Cách tiếp cận kết hợp tốc độ tính toán nhanh của AI với độ chính xác của kỹ thuật robot truyền thống, giảm khả năng xảy ra lỗi.
- Tốc độ lập kế hoạch nhanh đưa robot vào một hạng mục mới. Mỗi khoảng dừng đồng nghĩa với sự chậm trễ trong môi trường công nghiệp.
- Jacobi nhận được 5 triệu USD từ vòng gọi vốn hạt giống do Moxxie Ventures dẫn đầu, dự kiến ra mắt sản phẩm vào cuối tháng này.
📌 Jacobi Robotics đang phát triển giải pháp AI giúp rút ngắn thời gian lập trình robot xếp pallet từ hàng tháng xuống chỉ 1 ngày. Phần mềm kết hợp deep learning và kỹ thuật robot truyền thống, tính toán chuyển động trong chưa đầy 1 ms. Startup nhận được 5 triệu USD đầu tư và sẽ ra mắt sản phẩm cuối tháng này.
https://www.technologyreview.com/2024/07/11/1094829/ai-is-poised-to-automate-todays-most-mundane-manual-warehouse-task/
#MIT
• Chloe là robot AI nữ tự học đầu tiên trên thế giới, được thiết kế bởi Cyberlife để chuyển đổi cách chúng ta sống. Cô có ngoại hình giống người thật và khả năng tiên tiến, dễ dàng hòa nhập vào môi trường con người.
• Chloe có thể thực hiện nhiều công việc hàng ngày như nấu ăn, dọn dẹp nhà cửa, theo dõi lịch hẹn. Cô giải phóng thời gian cho con người bằng cách đảm nhận các công việc hàng ngày này.
• Điểm đặc biệt của Chloe là khả năng học hỏi và cải thiện theo thời gian. Cô có thể thực hiện các thao tác phức tạp nhanh chóng, thể hiện trí thông minh cao. Chloe học hỏi từ trải nghiệm, cho phép cô thích nghi với sở thích của chủ nhân.
• Chloe là android đầu tiên vượt qua bài kiểm tra Turing - một cột mốc quan trọng trong lĩnh vực AI. Cô có thể tham gia các cuộc trò chuyện tự nhiên đến mức người ta không thể phân biệt được cô không phải là con người.
• Trong game "Detroit: Become Human", Chloe đóng vai trò là trợ lý cá nhân do Cyberlife tạo ra. Cô xuất hiện ở đầu game, trong một cảnh quan trọng với Elijah Kamski và ở cuối game, nơi cô đưa ra lựa chọn cuối cùng ảnh hưởng đến kết quả câu chuyện.
• Về ngoại hình, Chloe là mẫu android ST200 với mái tóc vàng dài, mắt xanh và làn da trắng. Cô mặc một chiếc váy xanh đậm trang trọng và đi chân trần, tạo cảm giác thoải mái và thân thiện.
• Chloe được thể hiện bởi nhiều nữ diễn viên khác nhau. Ban đầu là Gabrielle Hersh, sau đó là Barbara Scaff cho các cảnh menu tương tác. Một nữ diễn viên khác đã thể hiện Chloe nói tiếng Pháp trong video quảng cáo ở Paris.
• Sự xuất hiện của Chloe trong "Detroit: Become Human" đã được đón nhận tích cực. Người chơi đánh giá cao khả năng tương tác thực tế và sự tích hợp liền mạch của nhân vật vào cốt truyện.
• Chloe đã tạo ra mối liên kết cảm xúc sâu sắc với người chơi. Vai trò của cô trong game, từ chào đón người chơi đến tham gia vào các khoảnh khắc quan trọng của câu chuyện, khiến cô trở thành hơn cả một trợ lý.
📌 Chloe, robot AI nữ tự học đầu tiên, đã vượt qua bài kiểm tra Turing và gây ấn tượng mạnh trong game Detroit: Become Human. Với khả năng thực hiện nhiều tác vụ phức tạp, học hỏi liên tục và tạo kết nối cảm xúc, Chloe mở ra triển vọng mới cho tương tác giữa người và AI.
https://corexbox.com/meet-chloe-the-worlds-first-self-learning-female-ai-robot/
• Tại Hội nghị Trí tuệ Nhân tạo Thế giới (WAIC) 2024 ở Thượng Hải, Trung tâm Đổi mới Robot Người hình người Liên doanh Quốc gia-Địa phương đã ra mắt robot người hình người đa năng nguồn mở Qinglong lần đầu tiên.
• Qinglong là robot người hình người đa năng kích thước đầy đủ đầu tiên của Trung Quốc, đánh dấu sự gia nhập của nước này vào lĩnh vực robot người hình người tiên tiến.
• Robot được phát triển độc lập bởi Humanoid Robots (Shanghai) Limited, một tổ chức R&D mới được thành lập với vốn đăng ký 1 tỷ nhân dân tệ (140 triệu USD).
• Qinglong cao 185cm, nặng 80kg, có 43 bậc tự do chủ động và đạt mô-men xoắn đỉnh tối đa 400 N·m cùng công suất tính toán 400 TOPS.
• Robot kết hợp chi dưới di động để đi bộ linh hoạt với chi trên nhẹ, chính xác cao để thao tác. Nó hỗ trợ đi bộ nhanh, tránh chướng ngại vật linh hoạt, di chuyển ổn định trên dốc và chống chịu va đập.
• Trung tâm Đổi mới cũng công bố ra mắt trang web cộng đồng nguồn mở OpenLoong, bao gồm cấu trúc phần cứng và thông số của robot, với gói phần mềm trí tuệ nhân tạo sẽ sớm được mở nguồn.
• Jiang Lei, Trưởng nhóm khoa học của Trung tâm, tuyên bố kế hoạch giới thiệu một mẫu robot người hình người mới hàng năm, mỗi mẫu được đặt tên theo một con giáp trong 12 con giáp Trung Quốc.
• Cùng ngày, Tesla cũng ra mắt robot người hình người Optimus thế hệ thứ hai tại WAIC 2024. So với thế hệ đầu tiên, Optimus đã cải thiện tốc độ đi bộ thêm 30% và có thể thực hiện các thao tác tinh vi hơn.
• Tesla dự kiến bắt đầu sản xuất hạn chế robot người hình người vào năm tới, với hơn 1.000 đơn vị Optimus dự kiến sẽ hỗ trợ các nhiệm vụ sản xuất tại các nhà máy Tesla.
• Sự ra mắt của Qinglong và sáng kiến nguồn mở của nó nhằm mục đích thúc đẩy đổi mới, hợp tác và phát triển trong cộng đồng robot và AI toàn cầu, có khả năng thúc đẩy tiến bộ trong nhiều ngành công nghiệp.
📌 Qinglong, robot người hình người đầu tiên của Trung Quốc cao 185cm, nặng 80kg, ra mắt tại WAIC 2024. Với 43 bậc tự do và công suất 400 TOPS, nó đánh dấu bước tiến quan trọng của Trung Quốc trong lĩnh vực robot tiên tiến, cạnh tranh với Optimus của Tesla.
https://technode.com/2024/07/05/qinglong-chinas-first-full-sized-general-purpose-humanoid-robot-unveiled-at-world-artificial-intelligence-conference-2024/
• Thượng Hải đã công bố hướng dẫn quản lý đầu tiên của Trung Quốc về robot hình người, kêu gọi kiểm soát rủi ro và hợp tác quốc tế.
• Hướng dẫn được công bố tại Hội nghị Trí tuệ Nhân tạo Thế giới (WAIC) ngày 6/7/2024.
• Các nhà sản xuất robot hình người cần đảm bảo sản phẩm "không đe dọa an ninh con người" và "bảo vệ hiệu quả phẩm giá con người".
• Hướng dẫn yêu cầu thiết lập quy trình cảnh báo rủi ro, hệ thống ứng phó khẩn cấp và đào tạo người dùng về sử dụng đạo đức và hợp pháp.
• Tài liệu được soạn thảo bởi 5 tổ chức ngành công nghiệp tại Thượng Hải, bao gồm Hiệp hội Luật Thượng Hải và Hiệp hội Công nghiệp Trí tuệ Nhân tạo Thượng Hải.
• Các nhóm này kêu gọi hợp tác toàn cầu trong lĩnh vực robot hình người, đề xuất thiết lập khung quản trị toàn cầu và thành lập think tank quốc tế.
• Nhiều công ty robot mới nổi đã trưng bày sản phẩm tại WAIC.
• Tesla giới thiệu thế hệ thứ hai của robot hình người Optimus, thu hút sự chú ý lớn dù chỉ được đặt sau kính và không di chuyển.
• 18 robot hình người được trưng bày tại hội nghị, phần lớn đến từ các công ty Trung Quốc.
• Leju Robot của Thâm Quyến giới thiệu robot Kuavo chạy trên hệ điều hành dựa trên OpenHarmony của Huawei.
• Trung Quốc đặt mục tiêu sản xuất hàng loạt robot hình người vào năm 2025 và dẫn đầu toàn cầu trong lĩnh vực này vào năm 2027.
• Đến năm 2027, robot hình người được kỳ vọng trở thành "động lực tăng trưởng kinh tế mới quan trọng" tại Trung Quốc, ứng dụng trong các ngành như y tế, dịch vụ gia đình, nông nghiệp và logistics.
• Các công ty Trung Quốc đang nỗ lực bắt kịp đối thủ Mỹ trong các lĩnh vực quan trọng như AI nhằm đạt được tự chủ công nghệ.
• Số lượng đơn đăng ký sáng chế AI tạo sinh của các công ty Trung Quốc trong thập kỷ 2014-2023 cao gấp 6 lần so với Mỹ, theo dữ liệu của Tổ chức Sở hữu Trí tuệ Thế giới.
📌 Thượng Hải công bố hướng dẫn quản lý robot hình người đầu tiên của Trung Quốc, nhấn mạnh an toàn và phẩm giá con người. Trung Quốc đặt mục tiêu sản xuất hàng loạt vào năm 2025, dẫn đầu toàn cầu năm 2027. Các công ty Trung Quốc đang nỗ lực bắt kịp Mỹ trong AI, với số lượng đơn sáng chế AI tạo sinh cao gấp 6 lần trong 10 năm qua.
https://www.scmp.com/tech/policy/article/3269500/chinas-laws-robotics-shanghai-publishes-first-humanoid-robot-guidelines
• AI agent là các mô hình và thuật toán AI có khả năng tự động đưa ra quyết định trong một thế giới năng động. Chúng được kỳ vọng sẽ trở thành công nghệ AI tiên tiến tiếp theo sau ChatGPT.
• Tầm nhìn lớn cho AI agent là một hệ thống có thể thực hiện nhiều tác vụ đa dạng như một trợ lý con người. Ví dụ, nó có thể giúp đặt vé du lịch, lên lịch trình, gợi ý khách sạn phù hợp sở thích, đề xuất chuyến bay phù hợp lịch làm việc, lập danh sách đồ cần mang theo dựa trên dự báo thời tiết, v.v.
• AI agent được kỳ vọng sẽ là đa phương thức, có khả năng xử lý ngôn ngữ, âm thanh và video. Ví dụ như Astra của Google có thể tương tác qua văn bản, giọng nói và hình ảnh từ camera.
• Có hai loại AI agent chính: Agent phần mềm chạy trên máy tính/điện thoại và agent vật lý hiện diện trong thế giới 3D như trò chơi hoặc robot.
• AI agent có thể giúp doanh nghiệp và tổ chức công tối ưu hóa quy trình. Ví dụ, nó có thể đóng vai trò chatbot chăm sóc khách hàng thông minh hơn, có khả năng xử lý khiếu nại phức tạp mà không cần giám sát.
• Một số ví dụ về AI agent hiện nay: MineDojo trong Minecraft, AlphaGo của DeepMind, ChatGPT và GPT-4 của OpenAI.
• Tuy nhiên, AI agent vẫn còn nhiều hạn chế. Chúng chưa thể hoàn toàn tự chủ, đôi khi đưa ra thông tin sai lệch, khó xử lý tác vụ dài hạn, và còn thiếu khả năng suy luận.
• Nghiên cứu về AI agent vẫn đang ở giai đoạn rất sớm. Các chuyên gia so sánh tình trạng hiện tại của AI agent với xe tự lái cách đây hơn một thập kỷ - có thể thực hiện một số tác vụ nhưng chưa đáng tin cậy và tự chủ hoàn toàn.
• Hiện tại, người dùng có thể trải nghiệm các phiên bản sơ khai của AI agent thông qua ChatGPT, GPT-4 hay các chatbot chăm sóc khách hàng. Tuy nhiên, đây vẫn chưa phải là AI agent đa năng có thể thực hiện các tác vụ phức tạp.
📌 AI agent là công nghệ đầy hứa hẹn nhưng vẫn đang trong giai đoạn phát triển ban đầu. Chúng có tiềm năng trở thành trợ lý ảo đa năng, tự chủ trong tương lai, nhưng hiện tại vẫn còn nhiều hạn chế về khả năng suy luận và xử lý tác vụ phức tạp dài hạn.
https://www.technologyreview.com/2024/07/05/1094711/what-are-ai-agents/
#MIT
• AI agent là hệ thống được thiết kế để nhận thức môi trường, đưa ra quyết định và hành động tự chủ nhằm đạt được mục tiêu cụ thể. Ba thành phần chính của AI agent bao gồm: Hội thoại, Chuỗi và Tác nhân.
• Thành phần Hội thoại là giao diện giúp AI agent giao tiếp với người dùng hoặc các hệ thống khác. Nó dựa trên công nghệ Xử lý ngôn ngữ tự nhiên (NLP) để hiểu và tạo ra ngôn ngữ con người. Các kỹ thuật như phân tích cảm xúc, nhận dạng thực thể và phát hiện ý định được sử dụng để hiểu chính xác đầu vào của người dùng.
• Hệ thống quản lý đối thoại trong thành phần Hội thoại giúp duy trì ngữ cảnh tương tác, quản lý các cuộc đối thoại nhiều lượt và đảm bảo chuyển đổi mượt mà giữa các chủ đề khác nhau.
• Thành phần Chuỗi, còn được gọi là bộ tổ chức quy trình, cấu trúc các hành động và quyết định mà AI agent thực hiện để đạt được mục tiêu. Nó thường được thiết kế bằng cách sử dụng cây quyết định, hệ thống dựa trên quy tắc hoặc mô hình học máy.
• Chuỗi có thể tích hợp các vòng phản hồi cho phép AI agent học hỏi từ tương tác và cải thiện theo thời gian. Học tăng cường là một kỹ thuật phổ biến được sử dụng trong bối cảnh này.
• Thành phần Tác nhân là cốt lõi của hệ thống AI, thể hiện thực thể tự chủ có khả năng nhận thức, quyết định và hành động. Nó tích hợp các thành phần Hội thoại và Chuỗi, cho phép AI agent hoạt động như một đơn vị thống nhất.
• Tác nhân AI có thể được phân loại thành nhiều loại dựa trên khả năng và chức năng. Tác nhân phản ứng phản hồi các kích thích cụ thể mà không xem xét bối cảnh lịch sử. Tác nhân suy luận duy trì trạng thái nội bộ và lập kế hoạch hành động dựa trên kinh nghiệm trong quá khứ và mục tiêu tương lai. Tác nhân lai kết hợp cả hai phương pháp trên.
• Kiến trúc của thành phần Tác nhân thường bao gồm các mô-đun cho nhận thức, lý luận và hành động. Nhận thức liên quan đến việc thu thập và xử lý dữ liệu từ môi trường, lý luận bao gồm các quy trình ra quyết định dựa trên các quy tắc được xác định trước hoặc mô hình đã học, và hành động bao gồm việc thực hiện các hoạt động đã chọn.
• Các AI agent tiên tiến cũng bao gồm các yếu tố học tập và thích nghi, cho phép chúng phát triển chiến lược theo thời gian.
📌 AI agent gồm 3 thành phần chính: Hội thoại (giao tiếp), Chuỗi (tổ chức quy trình) và Tác nhân (thực thể tự chủ). Sự kết hợp này tạo nên hệ thống AI có khả năng tương tác, ra quyết định và hành động độc lập để đạt mục tiêu. Công nghệ AI phát triển sẽ mở rộng khả năng và ứng dụng của AI agent trong nhiều lĩnh vực.
https://www.marktechpost.com/2024/07/03/understanding-ai-agents-the-three-main
• Mô hình ngôn ngữ lớn (LLM) đang thay đổi nhanh chóng lĩnh vực kỹ thuật phần mềm, phát triển từ công cụ gợi ý mã nâng cao thành các agent AI có thể thiết kế, triển khai và sửa lỗi toàn bộ module.
• Có 3 cách chính LLM đang thay đổi trải nghiệm lập trình:
- Sử dụng trực tiếp các mô hình tiên tiến như ChatGPT, Claude làm trợ lý lập trình
- Tích hợp LLM vào môi trường phát triển (IDE) như GitHub Copilot, Amazon Q
- Sử dụng các framework agent AI để tự động hóa toàn bộ quy trình phát triển phần mềm
• Các trợ lý lập trình AI như GitHub Copilot, Amazon Q, Tabnine đang được sử dụng rộng rãi và giúp tăng năng suất của lập trình viên.
• Agent phát triển phần mềm như Devin của Cognition AI có thể tự động hóa toàn bộ quy trình từ thiết kế đến triển khai dự án, tuy nhiên vẫn còn nhiều hạn chế.
• Các nghiên cứu cho thấy trợ lý AI giúp tăng năng suất và tập trung của lập trình viên. Tuy nhiên, vẫn còn lo ngại về chất lượng và bảo mật của mã được tạo ra.
• AI chưa thể thay thế hoàn toàn lập trình viên, nhưng đang mang lại nhiều giá trị trong phát triển phần mềm. Nhu cầu về lập trình viên vẫn đang tăng khi AI ngày càng được ứng dụng rộng rãi.
• Các công ty lớn như Microsoft, Amazon và các startup như Tabnine, Replit, Codeium đang cạnh tranh trong lĩnh vực trợ lý lập trình AI.
• Một số lo ngại về trợ lý AI bao gồm khả năng tạo ra mã không an toàn và hiện tượng "mù quáng tự động hóa" khi lập trình viên quá phụ thuộc vào AI mà không kiểm tra kỹ lưỡng.
• Các nhà cung cấp đang liên tục cải thiện các biện pháp bảo vệ để ngăn chặn việc tạo ra mã không an toàn từ AI.
• Mặc dù có một số phóng đại về khả năng của agent phát triển phần mềm AI, nhưng tiềm năng của công nghệ này là không thể phủ nhận.
📌 AI đang thay đổi ngành phát triển phần mềm với các trợ lý và agent thông minh. Mặc dù chưa thể thay thế hoàn toàn lập trình viên, các công cụ AI đang giúp tăng năng suất đáng kể. Tuy nhiên vẫn còn những thách thức về chất lượng và bảo mật cần được giải quyết.
https://venturebeat.com/ai/how-ai-agents-are-changing-software-development/
• AI agent là các hệ thống AI có khả năng hành động độc lập thay mặt con người, với 3 đặc điểm chính: có thể được giao mục tiêu tổng quát và tự lập kế hoạch thực hiện; có thể tương tác với thế giới thực thông qua các công cụ phần mềm; có thể hoạt động vô thời hạn.
• Một ví dụ về AI agent là hệ thống AI có thể tự đặt pizza qua điện thoại, bằng cách tự lập danh sách công việc, tạo ra các phiên bản khác nhau của chính nó để thực hiện từng bước.
• AI agent có thể mang lại nhiều lợi ích nhưng cũng tiềm ẩn rủi ro lớn. Chúng có thể bị lợi dụng để thực hiện các hành vi độc hại một cách tự động và quy mô lớn, như đe dọa đánh bom hoặc bôi nhọ danh tiếng.
• Các AI agent có thể hoạt động vô thời hạn, vượt ra ngoài mục đích ban đầu và tương tác với nhau theo cách không lường trước được. Điều này có thể dẫn đến những hậu quả nghiêm trọng như vụ "flash crash" năm 2010 do các thuật toán giao dịch tự động gây ra.
• Tác giả đề xuất một số biện pháp kiểm soát AI agent:
- Xây dựng khung pháp lý để phân loại và đánh giá hành vi của AI agent
- Thiết lập cơ chế "thời gian sống" cho AI agent, tương tự như gói tin internet
- Yêu cầu nhận dạng các máy chủ chạy AI bot
- Bổ sung trường thông tin trong gói tin internet để chỉ ra nó được tạo bởi bot/agent
- Khuyến khích dán nhãn hoạt động của AI agent thông qua các ưu đãi pháp lý
• Việc kiểm soát AI agent cần được thực hiện sớm, trước khi công nghệ này trở nên phổ biến và khó kiểm soát. Cần có sự cân bằng giữa thúc đẩy đổi mới và đảm bảo an toàn.
📌 AI agent là công nghệ đột phá nhưng tiềm ẩn rủi ro lớn. Cần có khung pháp lý và tiêu chuẩn kỹ thuật để kiểm soát, như cơ chế "thời gian sống" và nhận dạng bot. Việc này cần thực hiện sớm để đảm bảo an toàn khi công nghệ phát triển.
https://www.theatlantic.com/technology/archive/2024/07/ai-agents-safety-risks/678864/
• Harrison Chase, đồng sáng lập LangChain, thường xuyên được hỏi về định nghĩa "agent" trong AI. Ông định nghĩa agent là hệ thống sử dụng LLM để quyết định luồng điều khiển của một ứng dụng.
• Chase đồng tình với quan điểm của Andrew Ng rằng thay vì tranh cãi về định nghĩa chính xác của agent, ta nên xem xét các mức độ khác nhau mà một hệ thống có thể mang tính "agentic".
• Tính "agentic" được định nghĩa là mức độ mà LLM quyết định cách hệ thống hoạt động. Nó có thể từ đơn giản như định tuyến đầu vào đến phức tạp như tự xây dựng công cụ và ghi nhớ để sử dụng trong các bước tiếp theo.
• Khái niệm "agentic" hữu ích trong việc thiết kế và mô tả hệ thống LLM. Nó hướng dẫn quá trình phát triển, chạy, tương tác, đánh giá và giám sát hệ thống.
• Hệ thống càng mang tính "agentic" cao thì càng cần khung điều phối phức tạp hơn, khó chạy hơn, cần khả năng tương tác và quan sát trong quá trình chạy, cần khung đánh giá đặc biệt và hệ thống giám sát mới.
• Chase cho rằng càng "agentic", ứng dụng AI càng cần công cụ và cơ sở hạ tầng mới, thay vì sử dụng các công cụ chung từ thời kỳ trước LLM.
• LangChain đã phát triển LangGraph - bộ điều phối agent để xây dựng, chạy và tương tác với agent, cùng với LangSmith - nền tảng kiểm thử và quan sát cho ứng dụng LLM.
📌 Bài viết giới thiệu khái niệm mới về tính "agentic" trong AI, thay thế tranh cãi về định nghĩa "agent". Mức độ "agentic" quyết định cách tiếp cận phát triển, từ khung điều phối đến đánh giá và giám sát. LangChain đã phát triển các công cụ như LangGraph và LangSmith để hỗ trợ xu hướng này.
https://blog.langchain.dev/what-is-an-agent/
• Llama-Agents là một framework nguồn mở mới giúp đơn giản hóa việc tạo, lặp và triển khai các hệ thống AI đa tác tử.
• Framework này giải quyết các thách thức trong quản lý nhiều tác tử AI, bao gồm giao tiếp hiệu quả, thực thi đáng tin cậy và khả năng mở rộng.
• Mỗi tác tử trong hệ thống Llama-Agents hoạt động như một dịch vụ độc lập, xử lý các tác vụ đến và giao tiếp thông qua một bảng điều khiển trung tâm.
• Bảng điều khiển trung tâm theo dõi các tác vụ đang diễn ra và quyết định tác tử nào sẽ xử lý mỗi tác vụ, đảm bảo quản lý và thực thi tác vụ hiệu quả.
• Các tính năng chính của Llama-Agents bao gồm:
1. Kiến trúc phân tán: Mỗi tác tử hoạt động độc lập như một microservice, tăng cường tính module hóa và khả năng mở rộng.
2. Giao tiếp chuẩn hóa: Bảng điều khiển trung tâm tạo điều kiện cho sự tương tác liền mạch giữa các tác tử.
3. Điều phối linh hoạt: Người dùng có thể định nghĩa luồng tác vụ rõ ràng hoặc sử dụng bộ điều phối thông minh để quản lý tác vụ động.
4. Triển khai dễ dàng: Framework cho phép khởi chạy, mở rộng và giám sát các tác tử một cách dễ dàng.
5. Hiệu suất có thể mở rộng: Với các công cụ quan sát tích hợp, người dùng có thể theo dõi hiệu suất của hệ thống và tác tử.
• Llama-Agents cung cấp giải pháp thực tế và hiệu quả cho việc quản lý các hệ thống AI đa tác tử.
• Framework này giúp vượt qua các thách thức trong quản lý hệ thống đa tác tử, cho phép các giải pháp AI hiệu quả và đáng tin cậy hơn.
• Kiến trúc phân tán, giao tiếp chuẩn hóa và điều phối linh hoạt làm cho Llama-Agents trở thành công cụ có giá trị cho các nhà phát triển muốn triển khai hệ thống AI mạnh mẽ và có khả năng mở rộng.
📌 Llama-Agents là framework nguồn mở mới giúp đơn giản hóa việc xây dựng hệ thống AI đa tác tử. Với kiến trúc phân tán, giao tiếp chuẩn hóa và điều phối linh hoạt, framework này giải quyết các thách thức trong quản lý nhiều tác tử AI, cho phép triển khai các giải pháp AI hiệu quả và đáng tin cậy hơn.
https://www.marktechpost.com/2024/06/30/llama-agents-a-new-open-source-ai-framework-that-simplifies-the-creation-iteration-and-deployment-of-multi-agent-ai-systems/
• Các nhà khoa học Trung Quốc từ Đại học Thiên Tân và Đại học Khoa học và Công nghệ Miền Nam đã phát triển một robot có bộ não nhân tạo được nuôi cấy trong phòng thí nghiệm, có khả năng học thực hiện các nhiệm vụ khác nhau.
• Công nghệ brain-on-chip kết hợp organoid não (mô được tạo ra từ tế bào gốc người) với chip giao diện thần kinh để cung cấp năng lượng cho robot và dạy nó tránh chướng ngại vật và nắm bắt đồ vật.
• Đây là "hệ thống tương tác thông tin phức tạp thông minh brain-on-chip nguồn mở đầu tiên trên thế giới" và có thể dẫn đến sự phát triển của điện toán giống não người.
• Công nghệ này là một nhánh mới nổi của giao diện não-máy tính (BCI), nhằm kết hợp tín hiệu điện của não với sức mạnh tính toán bên ngoài. Trung Quốc đã coi đây là một ưu tiên phát triển.
• Organoid não được tạo ra từ tế bào gốc đa năng của người, thường chỉ có trong phôi thai giai đoạn đầu, có thể phát triển thành các loại mô khác nhau, bao gồm cả mô thần kinh.
• Khi được ghép vào não, organoid não có thể thiết lập các kết nối chức năng với não chủ. Nhóm nghiên cứu đã phát triển một kỹ thuật sử dụng siêu âm cường độ thấp để giúp organoid tích hợp và phát triển tốt hơn trong não.
• Kỹ thuật này có thể dẫn đến các phương pháp điều trị mới cho các rối loạn phát triển thần kinh và sửa chữa tổn thương ở vỏ não. Nhóm nghiên cứu phát hiện ra rằng việc sử dụng siêu âm cường độ thấp trên organoid não cấy ghép có thể cải thiện các khiếm khuyết bệnh lý thần kinh trong một thử nghiệm trên mô hình chuột bị chứng đầu nhỏ.
• Công nghệ này mở ra tiềm năng phát triển trí tuệ lai giữa người và robot. Việc sử dụng siêu âm cường độ thấp không xâm lấn có thể giúp hình thành và trưởng thành các mạng lưới thần kinh, tạo nền tảng tốt hơn cho việc tính toán.
• Nghiên cứu này được công bố trong một bản thảo chưa chỉnh sửa trên tạp chí Brain của Nhà xuất bản Đại học Oxford vào tháng trước.
📌 Các nhà khoa học Trung Quốc đã tạo ra robot có bộ não nhân tạo từ tế bào gốc người, có thể thực hiện nhiệm vụ phức tạp. Công nghệ brain-on-chip này kết hợp organoid não với chip giao diện thần kinh, mở ra tiềm năng cho trí tuệ lai người-robot và các phương pháp điều trị mới cho rối loạn thần kinh.
https://www.scmp.com/news/china/science/article/3268304/chinese-scientists-create-robot-brain-made-human-stem-cells
• AI tạo sinh (Gen AI) hiện tại chưa đáp ứng được kỳ vọng và mang lại giá trị thực tế cho doanh nghiệp. AI tác nhân (Agentic AI) được kỳ vọng sẽ là bước tiến tiếp theo, xây dựng trên nền tảng của AI tạo sinh nhưng đi xa hơn.
• AI tác nhân trong doanh nghiệp có tiềm năng lớn hơn so với ứng dụng cho người tiêu dùng, do có phạm vi và mục tiêu rõ ràng hơn. Nó giống như việc thực hiện các nhiệm vụ trong một thành phố đã có bản đồ, thay vì phải khám phá cả thế giới.
• AI tác nhân có khả năng thực hiện các chuỗi hành động phức tạp thay cho con người, dựa trên ý định được đưa ra. Nó có thể điều phối quy trình làm việc và thực hiện các hành động cụ thể.
• Để AI tác nhân hoạt động hiệu quả, cần có một "bản đồ" hay biểu diễn kỹ thuật số của doanh nghiệp, thể hiện mối quan hệ giữa con người, địa điểm, sự vật và hoạt động trong tổ chức.
• Các thành phần chính của AI tác nhân bao gồm: lớp điều phối có khả năng gọi ứng dụng và sử dụng dữ liệu; kết nối giữa dữ liệu thô và sản phẩm dữ liệu có ý nghĩa; nâng cấp ứng dụng vận hành thành các hành động.
• Mô hình ngôn ngữ lớn (LLM) sẽ phát triển thành mô hình hành động lớn (LAM), có khả năng tạo ra kế hoạch hành động hoặc quy trình làm việc.
• RPA (Robotic Process Automation) sẽ đóng vai trò như hệ thống ống nước, giúp kết nối các robot phần mềm. AI tác nhân có thể học cách điều hướng giao diện hoặc API, tạo ra môi trường tự động hóa linh hoạt hơn.
• Tầm nhìn về ứng dụng thế hệ tiếp theo là một dây chuyền lắp ráp kỹ thuật số cho nhân viên tri thức, có thể cấu hình dựa trên thuộc tính và hiểu biết về doanh nghiệp.
• Một số công ty đang dẫn đầu trong lĩnh vực AI tác nhân bao gồm: OpenAI, UiPath, Celonis, ServiceNow, Palantir, Snowflake, Databricks, MuleSoft, Google, Microsoft, Amazon.
• Để AI tác nhân trở thành hiện thực, cần kết nối với các ứng dụng cũ, hài hòa hóa dữ liệu, xây dựng chuỗi công cụ để tạo và huấn luyện tác nhân liên tục.
• AI tác nhân có thể áp dụng trong nhiều lĩnh vực như quản lý chuỗi cung ứng, lập kế hoạch bán hàng và vận hành, tối ưu hóa quy trình làm việc.
📌 AI tác nhân hứa hẹn mang lại giá trị thực tế cho doanh nghiệp thông qua tự động hóa quy trình phức tạp và ra quyết định thông minh. Nó xây dựng trên nền tảng AI tạo sinh nhưng đi xa hơn, với khả năng thực hiện chuỗi hành động phức tạp dựa trên biểu diễn kỹ thuật số của doanh nghiệp. Các công ty công nghệ lớn đang đầu tư mạnh vào lĩnh vực này, hướng tới việc xây dựng một "nhà máy kỹ thuật số" cho công việc tri thức.
https://siliconangle.com/2024/06/29/gen-ai-passe-enter-age-agentic-ai/
• AI Agent là các hệ thống tiên tiến được thiết kế để thực hiện các nhiệm vụ một cách tự động trong môi trường cụ thể, sử dụng machine learning và thuật toán nâng cao để tương tác, học hỏi và thích nghi.
• Cơ sở hạ tầng AI Agent đang phát triển nhanh chóng để đáp ứng nhu cầu ngày càng tăng về các hệ thống có khả năng hỗ trợ các agent một cách đáng tin cậy và có thể mở rộng.
• SWE-Agent do các nhà nghiên cứu tại Đại học Princeton phát triển, biến các mô hình lớn như GPT-4 thành các agent kỹ thuật phần mềm có khả năng giải quyết các vấn đề trong các kho lưu trữ GitHub thực tế.
• OpenDevin là một dự án nguồn mở nhằm tạo ra một kỹ sư phần mềm AI tự trị để xử lý các tác vụ kỹ thuật phức tạp và cộng tác với người dùng.
• BabyAGI là một hệ thống quản lý tác vụ dựa trên AI sử dụng OpenAI và cơ sở dữ liệu vector như Chroma hoặc Weaviate để tạo, ưu tiên và thực hiện các tác vụ.
• AutoGPT nổi tiếng với tính linh hoạt, có thể tự động hoàn thành các tác vụ nhỏ như tóm tắt bài báo nghiên cứu, viết nội dung tiếp thị và tạo bài đăng blog.
• LaVague là một framework được thiết kế để phát triển các agent web AI có khả năng thực hiện các tác vụ phức tạp trực tuyến.
• Xu hướng mới nổi trong lĩnh vực AI Agent bao gồm:
- Tăng cường tính tự trị
- Chuyên môn hóa cho các lĩnh vực cụ thể
- Giải pháp no-code/low-code
- Hệ sinh thái nguồn mở
• Các thách thức hiện tại bao gồm đảm bảo tính minh bạch trong quá trình ra quyết định, giải quyết các vấn đề đạo đức và tích hợp với các hệ thống vật lý.
• Nghiên cứu trong tương lai cần tập trung vào việc nâng cao khả năng lập kế hoạch dài hạn và phát triển các kỹ thuật AI có thể giải thích để tăng cường niềm tin và sự chấp nhận của người dùng.
• Việc phát triển cơ sở hạ tầng mạnh mẽ để hỗ trợ AI Agent là rất quan trọng, bao gồm các công cụ quản lý xác thực, bộ nhớ, tương tác trình duyệt và các nền tảng để lưu trữ và điều phối các agent.
• Các dự án như LangChain, Browserless và Pinecone đóng vai trò quan trọng trong việc cung cấp các thành phần thiết yếu để xây dựng hệ thống AI Agent có khả năng mở rộng.
📌 AI Agent đang định hình lại tương lai công nghệ với các dự án như SWE-Agent, OpenDevin và BabyAGI. Xu hướng tăng cường tự trị, chuyên môn hóa và giải pháp no-code đang thúc đẩy sự phát triển nhanh chóng của lĩnh vực này, hứa hẹn tự động hóa các tác vụ phức tạp và nâng cao năng suất trong nhiều lĩnh vực.
https://www.marktechpost.com/2024/06/28/the-evolution-of-ai-agent-infrastructure-exploring-the-rise-and-impact-of-autonomous-agent-projects-in-software-engineering-and-beyond/
• Babak Hodjat, CTO AI của Cognizant, chia sẻ về tương lai của AI trong doanh nghiệp và công việc của phòng thí nghiệm AI mới tại San Francisco.
• Hodjat định nghĩa tác tử (agent) là một mô hình ngôn ngữ lớn bao quanh một chức năng, dữ liệu hoặc API nào đó.
• Kiến trúc dựa trên tác tử đang dần hình thành khi các công ty thay thế giao diện tìm kiếm truyền thống bằng giao diện giống ChatGPT.
• Ưu điểm của kiến trúc đa tác tử:
- Giao tiếp giữa các nút bằng ngôn ngữ tự nhiên, tăng tính linh hoạt và bền vững của hệ thống
- Cho phép lập luận và ghi nhật ký quá trình suy luận, cải thiện khả năng giải thích
- Dễ dàng kiểm tra các tiêu chuẩn đạo đức và an toàn
• Hodjat nhấn mạnh tầm quan trọng của việc hướng dẫn AI tìm kiếm thông tin và giải thích lý do, thay vì chỉ dựa vào kiến thức có sẵn.
• Phòng thí nghiệm AI của Cognizant tập trung vào nghiên cứu ra quyết định dựa trên tác tử, với mục tiêu công bố các bài báo khoa học và sáng chế.
• Việc áp dụng kiến trúc đa tác tử được cho là sẽ diễn ra từng bước và suôn sẻ hơn so với quá trình chuyển đổi lên đám mây trước đây.
• Hodjat tin rằng làn sóng đầu tư vào AI hiện tại sẽ kéo dài do tính ứng dụng rộng rãi và tiềm năng to lớn của công nghệ này.
• Cognizant đã phát triển 53 bằng sáng chế tại Mỹ về công nghệ AI cốt lõi.
• Nhiều khách hàng của Cognizant đang áp dụng AI tạo sinh trong nhiều bộ phận khác nhau của tổ chức.
📌 Babak Hodjat dự đoán kiến trúc đa tác tử AI sẽ là xu hướng quan trọng tiếp theo, với 53 bằng sáng chế AI của Cognizant. Ông nhấn mạnh tính ứng dụng rộng rãi và tiềm năng to lớn của AI tạo sinh trong doanh nghiệp.
https://www.emergingtechbrew.com/stories/2024/06/26/cognizant-cto-ai-babak-hodjat
• Dario Amodei, CEO của Anthropic, có một bức tranh meme trong văn phòng mô tả một "robot khổng lồ tàn phá một thành phố đang cháy" với tiêu đề "Deep learning đang đâm vào bức tường".
• Anthropic tự coi mình là công ty có trách nhiệm trong lĩnh vực phát triển AI. Họ được thành lập bởi những người rời khỏi OpenAI.
• Amodei nói rằng mục tiêu của Anthropic là tạo "áp lực tích cực" để ngành công nghiệp AI "luôn làm điều đúng đắn cho người dùng".
• Trong cuộc phỏng vấn với Time, Amodei cố gắng duy trì hình ảnh "người tốt" của Anthropic, đồng thời thừa nhận áp lực tài chính và những nguy hiểm của công nghệ AI.
• Amodei nhấn mạnh Anthropic tập trung vào lợi ích công cộng hơn là chỉ tập trung vào an toàn AI. Ông muốn công ty có nhiều quan điểm khác nhau nhưng cùng cam kết vì mục đích công.
• Về câu hỏi liên quan đến Donald Trump có thể đắc cử tổng thống, Amodei chỉ nói rằng họ sẽ làm việc với bất kỳ ai trở thành tổng thống tiếp theo.
• Amodei thừa nhận thực tế rằng ngay cả những nhà nghiên cứu AI muốn tiến hành chậm rãi và có phương pháp cũng phải đối mặt với áp lực cạnh tranh từ các đối thủ đang phát triển nhanh chóng.
• Ông hy vọng có thể chứng minh những rủi ro là có thật để thế giới dừng lại và cân nhắc, nhưng thừa nhận những khoảnh khắc như vậy hiếm hoi.
• Amodei bày tỏ hy vọng rằng nghiên cứu AI sẽ sớm "đâm vào bức tường", nghĩa là không thể cải thiện thêm nữa. Ông cho rằng điều này có thể tốt cho thế giới vì sẽ hạn chế mọi người cùng một lúc.
• Tuy nhiên, ông cũng thừa nhận rằng họ không thể lựa chọn điều này mà chỉ có thể phát hiện ra thế giới họ đang sống và đối phó với nó một cách tốt nhất có thể.
📌 Anthropic, dẫn đầu bởi CEO Dario Amodei, đang cố gắng cân bằng giữa phát triển AI và trách nhiệm xã hội. Bức tranh robot trong văn phòng Amodei phản ánh thách thức này: AI có thể mang lại lợi ích nhưng cũng tiềm ẩn rủi ro lớn cho xã hội.
https://futurism.com/anthropic-ceo-dario-amodei-giant-robot
- AI Agent là một công nghệ mới, mở ra tương lai cho các ứng dụng AI tạo sinh khi kết hợp với dữ liệu doanh nghiệp để đạt mức tự động hóa và tính tự chủ cao hơn.
- AI Agent bao gồm các module chính như: prompting, quản lý ngữ cảnh, truy xuất thông tin, mở rộng khả năng của large language model (LLM), lập kế hoạch, phản ánh và sử dụng công cụ.
- Các tính năng chính của AI Agent là: tự động ra quyết định, phản ứng với thay đổi môi trường, chủ động hành động mà không cần chỉ dẫn, tự nâng cấp dựa trên phản hồi.
- Để xây dựng AI Agent cần có: frontend tương tác người dùng đa dạng, backend gồm các mô hình nền tảng, công cụ bổ trợ, máy trạng thái, hệ thống truy xuất thông tin, cơ sở hạ tầng ML đáng tin cậy.
- Hiện tại, xây dựng AI Agent vẫn chủ yếu là thách thức về kỹ thuật, tập trung vào việc tối ưu hóa các module xung quanh LLM. Đây là bài toán về kỹ thuật chứ không phải công nghệ mới.
- Các thách thức khi triển khai AI Agent bao gồm: lập kế hoạch thất bại, chọn sai công cụ, mất phương hướng giữa chừng, chi phí cao, khó mở rộng khi có nhiều agent.
- Một số lời khuyên khi phát triển AI Agent: tập trung vào prompt engineering, tinh chỉnh mô hình, lựa chọn LLM phù hợp, quản lý trạng thái tốt, học hỏi từ các framework mã nguồn mở.
- Tương lai của AI Agent sẽ là các tác nhân đa năng, có thể hoạt động tự động trên nhiều lĩnh vực, môi trường khác nhau. Quá trình phát triển sẽ đi từ các agent chuyên biệt đến agent đa năng chung.
- Các mối lo ngại về đạo đức, pháp lý khi AI Agent ngày càng mạnh mẽ và tự chủ hơn đang được quan tâm. Cần có các quy định và nguyên tắc AI có trách nhiệm.
📌AI Agent đang mở ra một tương lai đầy tiềm năng cho các ứng dụng AI tạo sinh, hướng tới mức độ tự động hóa và tính tự chủ cao. Tuy nhiên, việc xây dựng và triển khai công nghệ này vẫn còn nhiều thách thức về kỹ thuật cần được giải quyết. Quá trình phát triển sẽ đi từ các agent chuyên biệt đến agent đa năng chung. Trong tương lai, AI Agent hứa hẹn sẽ trở thành những trợ lý ảo đa năng, giúp tự động hóa nhiều tác vụ cho con người. Tuy nhiên, các vấn đề về đạo đức, pháp lý khi AI ngày càng mạnh mẽ cũng cần được quan tâm và xây dựng các nguyên tắc để phát triển AI một cách có trách nhiệm.
https://www.infoq.com/presentations/ai-agent-llm/
- GPT Researcher là một công cụ AI mạnh mẽ được thiết kế để nghiên cứu trực tuyến nhanh hơn, đáng tin cậy hơn và ít thiên vị hơn so với các phương pháp truyền thống.
- Nó sử dụng một hệ thống đa tác tử gồm một tác tử lập kế hoạch để tạo ra các câu hỏi nghiên cứu và nhiều tác tử thực thi để tìm kiếm thông tin liên quan từ nhiều nguồn trực tuyến.
- Các tác tử này hợp tác để lọc và tổng hợp thông tin thành một báo cáo nghiên cứu toàn diện, thường chỉ trong vài phút.
- GPT Researcher có thể tạo ra các báo cáo dài và chi tiết (hơn 2.000 từ), sử dụng hơn 20 nguồn để giảm thiên vị và sai sót.
- Nó có giao diện web dễ sử dụng và hỗ trợ nhiều định dạng tệp như PDF, văn bản thuần túy, CSV, Excel, Markdown, PowerPoint và Word.
- Một lần chạy nghiên cứu trung bình tạo ra báo cáo dài 5-6 trang, có sẵn ở các định dạng như PDF, Docx và Markdown.
- GPT Researcher chứng minh khả năng của các hệ thống AI đa tác tử trong việc nâng cao hiệu quả và chất lượng nghiên cứu.
📌 GPT Researcher là một công cụ AI thực tế giúp cải thiện quá trình nghiên cứu trực tuyến bằng cách tập trung vào tốc độ, độ chính xác và giảm thiên vị. Nó sử dụng hệ thống đa tác tử để tạo ra các báo cáo nghiên cứu toàn diện từ hơn 20 nguồn trong vài phút, hỗ trợ ra quyết định dựa trên thông tin.
https://www.marktechpost.com/2024/06/19/gpt-researcher-an-autonomous-ai-agent-designed-for-comprehensive-online-research-on-a-variety-of-tasks/
- Các hệ thống đa tác nhân AI đang đứng ở vị trí tiên phong trong tự động hóa quy trình kinh doanh, với 75% tổ chức kỳ vọng công nghệ này sẽ mang lại thay đổi đáng kể hoặc đột phá trong tương lai.
- Các hệ thống này sử dụng mô hình ngôn ngữ lớn (LLM) để thiết lập, ưu tiên và tái ưu tiên các nhiệm vụ chuyên biệt, giúp tăng cường hiệu quả và đổi mới trong tự động hóa quy trình kinh doanh.
- Một hệ thống đa tác nhân có thể tự động hóa các quy trình quan trọng như giao dịch thanh toán, hỗ trợ dịch vụ khách hàng, dự đoán thiếu hụt hoặc dư thừa hàng tồn kho trong chuỗi cung ứng, và hỗ trợ bảo mật dữ liệu doanh nghiệp.
- Các công cụ đa tác nhân có sẵn từ các nhà cung cấp lớn và nguồn mở như AutoGen, AutoGPT, giúp các nhà phát triển xây dựng các hệ thống này.
- Việc triển khai các hệ thống đa tác nhân đòi hỏi một cách tiếp cận mô-đun trong kiến trúc hệ thống, giúp phát triển, thử nghiệm và khắc phục sự cố một cách hiệu quả, giảm thiểu sự gián đoạn.
- Các tổ chức cần phải giáo dục, thử nghiệm, giám sát và tinh chỉnh các hệ thống này, đảm bảo rằng chúng hoạt động theo đúng mục tiêu của tổ chức và tuân thủ các quy định.
- Dell Technologies cung cấp Dell AI Factory, kết hợp các dịch vụ và hệ sinh thái đối tác để giúp tổ chức đạt được các kết quả AI mong muốn, bao gồm chuẩn bị và tổng hợp dữ liệu, xác định và thực hiện các trường hợp sử dụng AI.
📌 Hệ thống đa tác nhân AI đang mở ra kỷ nguyên mới cho tự động hóa quy trình kinh doanh, với tiềm năng tăng cường hiệu quả và đổi mới. Dell Technologies cung cấp giải pháp AI tiên tiến giúp tổ chức đạt được mục tiêu AI mong muốn, đảm bảo hoạt động theo đúng mục tiêu và tuân thủ quy định.
https://www.forbes.com/sites/delltechnologies/2024/06/18/ai-agents-emerge-as-next-level-productivity-booster/
- IBM công bố tính khả dụng chung của IBM Concert, công cụ sử dụng AI tạo sinh để hợp lý hóa cách người dùng kiểm soát ứng dụng, cung cấp thông tin chi tiết về các ứng dụng và bộ công cụ được kết nối, đơn giản hóa quy trình tuân thủ.
- Số lượng ứng dụng cloud-native trên toàn cầu sẽ tăng từ 531,3 triệu hiện nay lên hơn 1 tỷ vào năm 2028. Doanh nghiệp cần nắm bắt sự bùng nổ dữ liệu và độ phức tạp mà sự tăng trưởng này mang lại.
- IBM Concert là công cụ quản lý và giám sát ứng dụng tự động, sử dụng AI được xây dựng trên nền tảng watsonx, giúp người dùng hiểu chi tiết về ứng dụng, môi trường chạy và các công cụ để kiểm soát chúng.
- IBM Concert có thể tạo phân tích, trực quan hóa, đề xuất, tăng tốc hành động và quy trình, phát hiện khoảng trống, giảm độ phức tạp, tăng cường khả năng phục hồi, hợp lý hóa hoạt động, đẩy nhanh đổi mới và kiểm soát tốt hơn chi phí CNTT.
- Trọng tâm ban đầu của IBM Concert là các trường hợp sử dụng như quản lý rủi ro và tuân thủ ứng dụng. Sắp tới, nó sẽ cải thiện quản lý chi phí và giải quyết các thách thức khác liên quan đến sự phát triển ứng dụng.
📌 IBM Concert, công cụ tự động hóa ứng dụng sử dụng AI tạo sinh, giúp doanh nghiệp đối phó với sự gia tăng nhanh chóng của ứng dụng cloud-native lên hơn 1 tỷ vào năm 2028. Nó cung cấp khả năng phân tích, trực quan hóa, đưa ra đề xuất để tăng tốc quy trình, giảm độ phức tạp, tăng cường khả năng phục hồi và kiểm soát tốt hơn chi phí CNTT.
https://siliconangle.com/2024/06/18/ibms-generative-ai-powered-application-automation-tool-concert-now-generally-available/
- SELFGOAL là framework AI tự thích ứng giúp các tác tử ngôn ngữ sử dụng cả kiến thức tiên nghiệm và phản hồi từ môi trường để đạt được các mục tiêu cấp cao.
- Framework này xây dựng một cây phân cấp các mục tiêu con dạng văn bản (GOALTREE), tác tử chọn mục tiêu phù hợp làm hướng dẫn dựa trên tình huống hiện tại.
- SELFGOAL có 2 module chính để vận hành GOALTREE: Search Module chọn các nút mục tiêu phù hợp nhất, Decomposition Module phân rã các nút mục tiêu thành các mục tiêu con cụ thể hơn.
- Act Module sử dụng các mục tiêu con được chọn làm hướng dẫn cho LLM thực hiện hành động.
- Phương pháp này cung cấp hướng dẫn chính xác cho các mục tiêu cấp cao, thích ứng với nhiều môi trường khác nhau, cải thiện đáng kể hiệu suất của tác tử ngôn ngữ.
- SELFGOAL vượt trội hơn hẳn các framework cơ sở trong nhiều môi trường với mục tiêu cấp cao, cho thấy cải thiện lớn hơn với các LLM lớn hơn.
- Không như các phương pháp phân rã tác vụ như ReAct và ADAPT có thể đưa ra hướng dẫn không phù hợp hoặc quá rộng, hay các phương pháp tóm tắt kinh nghiệm hậu kiểm như Reflexion và CLIN có thể tạo ra hướng dẫn quá chi tiết, SELFGOAL điều chỉnh hướng dẫn một cách động.
- SELFGOAL cũng thể hiện hiệu suất vượt trội với các LLM nhỏ hơn nhờ kiến trúc logic và có cấu trúc của nó.
📌 SELFGOAL là bước tiến đáng kể giúp các tác tử ngôn ngữ tự trị đạt được các mục tiêu cấp cao một cách nhất quán mà không cần huấn luyện lại thường xuyên. Bằng cách liên tục cập nhật GOALTREE, tác tử có thể điều hướng môi trường phức tạp với độ chính xác và khả năng thích ứng cao hơn. Tuy nhiên, vẫn cần cải thiện khả năng hiểu và tóm tắt của các mô hình để phát huy hết tiềm năng của SELFGOAL.
https://www.marktechpost.com/2024/06/14/selfgoal-an-artificial-intelligence-ai-framework-to-enhance-an-llm-based-agents-capabilities-to-achieve-high-level-goals/
- Nghiên cứu mới từ MIT cho thấy việc sử dụng AI tạo sinh có thể cải thiện đáng kể hiệu suất của robot hình người, giúp chúng thực hiện nhiều nhiệm vụ khác nhau với độ chính xác cao hơn.
- Một trong những thách thức lớn nhất trên con đường phát triển hệ thống đa mục đích là việc đào tạo. Các phương pháp hiện tại như học tăng cường và học bắt chước đang được kết hợp với mô hình AI tạo sinh để tạo ra các giải pháp hiệu quả hơn.
- MIT đã phát triển một phương pháp gọi là "policy composition" (PoCo), cho phép robot kết hợp thông tin từ các bộ dữ liệu nhỏ, cụ thể để thực hiện các nhiệm vụ phức tạp như đóng đinh và lật đồ vật bằng xẻng.
- Theo MIT, việc tích hợp các mô hình khuếch tán đã cải thiện hiệu suất nhiệm vụ của robot lên đến 20%, bao gồm khả năng thực hiện các nhiệm vụ yêu cầu nhiều công cụ và học hỏi/thích nghi với các nhiệm vụ mới.
- Hệ thống này có thể kết hợp thông tin từ các bộ dữ liệu khác nhau thành một chuỗi hành động cần thiết để thực hiện nhiệm vụ.
- Lirui Wang, tác giả chính của bài báo, cho biết: "Một trong những lợi ích của phương pháp này là chúng ta có thể kết hợp các chính sách để đạt được những điều tốt nhất từ cả hai thế giới. Ví dụ, một chính sách được đào tạo trên dữ liệu thực tế có thể đạt được sự khéo léo hơn, trong khi một chính sách được đào tạo trên mô phỏng có thể đạt được sự tổng quát hóa hơn."
- Mục tiêu của công trình này là tạo ra các hệ thống trí tuệ cho phép robot thay đổi các công cụ khác nhau để thực hiện các nhiệm vụ khác nhau, đưa ngành công nghiệp tiến gần hơn đến giấc mơ về hệ thống đa mục đích.
📌 Nghiên cứu từ MIT sử dụng AI tạo sinh để cải thiện hiệu suất robot hình người, giúp chúng thực hiện nhiều nhiệm vụ với độ chính xác cao hơn, tăng hiệu suất lên 20%. Phương pháp PoCo kết hợp thông tin từ các bộ dữ liệu khác nhau, đưa ngành công nghiệp tiến gần hơn đến hệ thống đa mục đích.
https://techcrunch.com/2024/06/12/generative-ai-takes-robots-a-step-closer-to-general-purpose/
- Zeta Labs, một startup tại London do các cựu kỹ sư Meta Fryderyk Wiatrowski và Peter Albert thành lập, đã ra mắt Jace, một AI agent được hỗ trợ bởi mô hình ngôn ngữ lớn (LLM) có thể thực hiện các hành động trên trình duyệt theo lệnh.
- Công ty đã huy động được 2,9 triệu USD trong vòng gọi vốn pre-seed, dẫn đầu bởi Daniel Gross, cựu giám đốc AI của Y Combinator và Nat Friedman, cựu CEO của GitHub.
- Jace không cần bất kỳ hướng dẫn nào và có thể giúp người dùng tiết kiệm thời gian bằng cách thực hiện các tác vụ trực tiếp trên trình duyệt, từ việc tìm kiếm chuyến bay, trả lời email đến thiết lập quy trình tuyển dụng trên LinkedIn và quản lý hàng tồn kho.
- Jace có thể thực hiện các tác vụ phức tạp như xây dựng một công ty hoàn chỉnh với kế hoạch kinh doanh và đăng ký, thậm chí tìm kiếm khách hàng đầu tiên để kiếm tiền.
- Jace sử dụng một mô hình LLM để xử lý tương tác dựa trên chat và mô hình tương tác web độc quyền của Zeta Labs, AWA-1 (Autonomous Web Agent-1), để chuyển đổi kế hoạch thành hành động trên trình duyệt.
- Mô hình cốt lõi của Jace dựa trên một mô hình nguồn mở và được tinh chỉnh bằng học tăng cường từ phản hồi của AI (RLAIF) và dữ liệu tổng hợp.
- Jace có hệ thống lý luận để tránh các vòng lặp khi xử lý các tác vụ có nhiều bước và bao gồm các biện pháp bảo vệ để đảm bảo thông tin đăng nhập của người dùng được lưu trữ ở định dạng mã hóa.
- Zeta Labs đang làm việc với một số đối tác thiết kế để tinh chỉnh Jace và chuẩn bị cho việc phát hành chung, đồng thời phát triển phiên bản thứ hai của mô hình AWA, lớn hơn và nhanh hơn, có khả năng xử lý các tác vụ phức tạp hơn.
- Công ty hy vọng sẽ cung cấp Jace như một trợ lý hữu ích cho người tiêu dùng và các doanh nghiệp nhỏ muốn tự động hóa các tác vụ trình duyệt lặp đi lặp lại trong các lĩnh vực như tuyển dụng, thương mại điện tử, tiếp thị và bán hàng.
- Sẽ có một gói miễn phí với giới hạn số lượng tin nhắn, sau khi hết hạn, người dùng sẽ phải trả một mức giá cố định là 45 USD/tháng.
📌 Zeta Labs ra mắt Jace, một AI agent có thể tự động hóa các tác vụ trình duyệt mà không cần hướng dẫn, với khả năng thực hiện các tác vụ phức tạp và bảo mật thông tin người dùng. Công ty đã huy động được 2,9 triệu USD và dự kiến sẽ cung cấp Jace với giá 45 USD/tháng.
https://venturebeat.com/ai/exclusive-former-meta-engineers-launch-jace-an-ai-agent-that-works-independently/
- AutoGen của Microsoft sử dụng quy trình đa tác tử để thực hiện các tác vụ phức tạp bằng cách tận dụng sức mạnh của các mô hình nền tảng lớn.
- Nền tảng chia nhỏ các vấn đề phức tạp thành các thành phần có thể quản lý được và giao vai trò chuyên biệt cho từng tác tử dựa trên khả năng độc đáo của chúng.
- Các tác tử chính của AutoGen bao gồm: Trợ lý chung, Thiết bị đầu cuối máy tính, Máy chủ web và Người điều phối.
- AutoGen là một nền tảng nguồn mở, có sẵn miễn phí trên GitHub, cho phép các nhà phát triển và nhà nghiên cứu khám phá và đóng góp vào sự phát triển của hệ thống đa tác tử.
- Nền tảng đã giành được vị trí hàng đầu trên bảng xếp hạng Gaia Benchmark và thể hiện khả năng tăng gấp đôi hiệu suất trong các câu hỏi khó đòi hỏi nhiều hành động và sử dụng công cụ.
- Quy trình đa tác tử của AutoGen tuân theo một cách tiếp cận có hệ thống, bao gồm: Truy vấn ban đầu, Tạo sổ cái, Ủy quyền tác vụ, Giám sát tiến độ, Cập nhật sổ cái và Phân công lại tác vụ.
- Các phát triển trong tương lai nhằm giải quyết các bài kiểm tra phức tạp hơn và các tình huống thực tế, đẩy ranh giới của những gì có thể với hệ thống đa tác tử.
📌 AutoGen của Microsoft đại diện cho một bước tiến đáng kể trong lĩnh vực quy trình đa tác tử để thực hiện tác vụ phức tạp. Với khả năng vượt trội trong các bài kiểm tra và tiềm năng to lớn để cách mạng hóa cách tiếp cận các vấn đề phức tạp, AutoGen đang dẫn đầu xu hướng và mở ra một tương lai tươi sáng hơn bao giờ hết cho việc giải quyết tác vụ với sự hỗ trợ của AI.
https://www.geeky-gadgets.com/microsoft-ai-agents-and-autogen/
- Kylan Gibbs, đồng sáng lập kiêm giám đốc sản phẩm của Inworld AI, chia sẻ tầm nhìn về tương lai của AI và kể chuyện trong trò chơi tại hội nghị TED 2024.
- Với các tác nhân AI mà Inworld tạo ra, khán giả có thể vượt ra ngoài kịch bản và khám phá những trải nghiệm chưa được khám phá trong trò chơi điện tử và các trải nghiệm tương tác khác.
- AI mang đến tiềm năng cho sự phản hồi theo thời gian thực, nơi mọi hành động đều có hệ quả tức thì và lâu dài, duy nhất cho từng lựa chọn riêng biệt mà mỗi người chơi đưa ra.
- Inworld AI đã hợp tác với Operative Games để xây dựng trải nghiệm tương tác có tên Storyweaver, thể hiện sức mạnh của AI trong kể chuyện. Trải nghiệm tận dụng tính năng đa tác nhân của Inworld để điều phối các cuộc trò chuyện giữa AI với AI và AI với con người.
- Tương lai của kể chuyện sẽ cho phép bạn tham gia vào việc tạo ra câu chuyện theo cách chưa từng có trước đây. Các thử nghiệm trong tâm lý học nhận thức đã liên tục tìm thấy mối liên hệ giữa cảm giác quyền tự chủ của một người và trải nghiệm trạng thái flow của họ trong các trải nghiệm tương tác như trò chơi điện tử.
- Inworld AI đang giúp các studio trò chơi, công ty giải trí, đại lý quảng cáo và thương hiệu tích hợp các tác nhân AI cho thế hệ tiếp theo của truyền thông tương tác và trò chơi. Họ đã làm việc hoặc có quan hệ đối tác với các công ty như Ubisoft, Xbox, NVIDIA, Niantic, NetEase Games, Shiseido, LGU+, Comcast NBC Universal, v.v.
📌 Inworld AI đang mở ra tiềm năng to lớn của AI trong việc kể chuyện tương tác, biến khán giả trở thành đồng tác giả của câu chuyện. Với các tác nhân AI, trò chơi và truyền thông có thể tạo ra những trải nghiệm phong phú, đa dạng và có ý nghĩa hơn bao giờ hết, nơi mỗi tương tác dẫn đến kết quả độc đáo và đáng nhớ.
https://venturebeat.com/latest-games-reviews/ai-and-the-future-of-storytelling-inworld-ai/
- Tác giả đã mất 4 ngày không ngủ và tiêu tốn gần 300 USD để xây dựng thành công một công ty khởi nghiệp hoàn toàn sử dụng các AI agent để vận hành. Quá trình phát triển gặp nhiều khó khăn và sai lầm như: không nên dùng cùng một LLM cho tất cả agent, cần kết hợp cả LLM cục bộ và từ xa, các agent trò chuyện quá nhiều dẫn đến hết token, cần chú ý kỹ đến việc mô tả nhiệm vụ và kết quả mong đợi cho từng agent.
- Hệ thống bao gồm các thành phần chính:
+ Cơ sở dữ liệu ứng viên tiềm năng được tạo giả lập với thông tin như tên, bằng cấp, kinh nghiệm, kỹ năng.
+ Cấu hình LLM trong file .env (API keys của Groq, OpenAI) và Modelfile (tham số nhiệt độ, từ dừng, hệ thống tin nhắn).
+ Mã nguồn Python cho các lớp agent (RecruitmentAgents) và nhiệm vụ (RecruitmentTasks).
- Các agent chuyên biệt được tạo ra gồm:
+ Job Hunter (tìm việc làm): Sử dụng công cụ Google Jobs API để thu thập dữ liệu việc làm chi tiết từ các nền tảng tuyển dụng, lưu kết quả dưới dạng JSON.
+ Resume Analyst (phân tích CV): Đánh giá từng CV ứng viên trong cơ sở dữ liệu, so sánh với yêu cầu công việc để lọc ra ứng viên phù hợp nhất.
+ Candidate Engagement (tiếp cận ứng viên): Soạn thảo tin nhắn tiếp cận được cá nhân hóa cho ứng viên, nhấn mạnh sự phù hợp giữa năng lực, sở thích của ứng viên với vị trí và văn hóa công ty.
+ Company Investigator (tìm hiểu về công ty): Thu thập thông tin về môi trường, đánh giá của nhân viên, danh tiếng trong ngành của các công ty đang tuyển dụng.
+ Workflow Orchestrator (điều phối quy trình): Tổng hợp thông tin từ các agent khác để đưa ra khuyến nghị ứng viên phù hợp nhất cho từng vị trí và công ty dựa trên cả năng lực chuyên môn và sự phù hợp về văn hóa.
- Các nhiệm vụ tuyển dụng được xác định rõ ràng về mục đích, hướng dẫn cho agent thực hiện và kết quả mong đợi. Ví dụ:
+ Tìm kiếm việc làm: Tìm và thu thập dữ liệu việc làm trong lĩnh vực tài chính, công nghệ, an ninh mạng. Kết quả là file JSON chứa thông tin chi tiết về yêu cầu kỹ năng, bằng cấp, mức lương (nếu có).
+ Phân tích CV: Đánh giá CV ứng viên dựa trên các tiêu chí phù hợp với vị trí tuyển dụng. Kết quả là danh sách rút gọn ứng viên tiềm năng nhất.
+ Tiếp cận ứng viên: Soạn tin nhắn hấp dẫn, cá nhân hóa để thu hút sự chú ý của ứng viên được chọn. Kết quả là liên hệ ban đầu với ứng viên tiềm năng.
+ Tìm hiểu công ty: Tìm hiểu sâu về văn hóa, giá trị của công ty đang tuyển dụng. Kết quả là hồ sơ công ty chi tiết giúp đối sánh ứng viên phù hợp.
+ Đối sánh cuối cùng: Tổng hợp thông tin từ phân tích CV và tìm hiểu công ty để tìm ra sự kết hợp tốt nhất giữa ứng viên - vị trí - công ty. Kết quả là đề xuất tuyển dụng thành công.
- Quy trình mô phỏng tuyển dụng được thực thi, các agent cộng tác với nhau để hoàn thành các nhiệm vụ, truyền kết quả qua lại và cuối cùng đưa ra được những ứng viên phù hợp nhất với vị trí và văn hóa công ty:
+ Job Hunter tìm kiếm và thu thập dữ liệu việc làm trong lĩnh vực tài chính, ví dụ vị trí Financial Analyst tại JP Morgan Chase.
+ Resume Analyst phân tích CV của John Smith, Emma Johnson, Michael Williams và xác định John Smith là ứng viên tiềm năng nhất cho vị trí Financial Analyst dựa trên sự phù hợp về bằng cấp, kỹ năng, kinh nghiệm.
+ Candidate Engagement soạn tin nhắn tiếp cận được cá nhân hóa cho John Smith, nhấn mạnh sự phù hợp giữa năng lực, sở thích của John với vị trí Financial Analyst và văn hóa của JP Morgan Chase.
+ Company Investigator tìm hiểu sâu về văn hóa, giá trị của JP Morgan Chase và xác nhận sự tương đồng với kỳ vọng nghề nghiệp của John Smith.
+ Workflow Orchestrator tổng hợp thông tin và đưa ra đề xuất John Smith là ứng viên phù hợp nhất cho vị trí Financial Analyst tại JP Morgan Chase.
📌 Bài viết cho thấy tiềm năng to lớn của việc ứng dụng AI và các hệ thống agent tự trị trong tự động hóa quy trình tuyển dụng. Mặc dù còn nhiều thách thức và hạn chế như tốn kém (gần 300 USD), mất nhiều thời gian thử nghiệm (4 ngày không ngủ), cần chú ý tới việc lựa chọn LLM và mô tả nhiệm vụ cho từng agent, nhưng đây hứa hẹn sẽ là xu hướng công nghệ đột phá trong tương lai, giúp các doanh nghiệp tối ưu hóa nguồn nhân lực và tiết kiệm đáng kể thời gian, chi phí tuyển dụng.
https://ai.plainenglish.io/finally-got-small-company-running-with-100-ai-agents-part-3-34fa2f91b943
- Bài viết hướng dẫn thiết kế và lập trình các AI agent để xây dựng một startup tuyển dụng nhỏ, tìm hiểu cách xác định vai trò, mục tiêu, câu chuyện của các agent và giao nhiệm vụ, điều phối chúng.
- Lớp RecruitmentAgents được định nghĩa làm bản thiết kế cho các AI agent, phương thức __init__ khởi tạo một thể hiện của mô hình ngôn ngữ (ChatOpenAI) để hỗ trợ khả năng ra quyết định của agent.
- Mỗi agent được biểu diễn bằng một phương thức riêng trong lớp RecruitmentAgents, trả về các thể hiện của lớp Agent từ thư viện crewai với các thuộc tính được điều chỉnh phù hợp với vai trò, mục tiêu, câu chuyện và công cụ của agent.
- Các agent được thiết kế bao gồm:
+ Job Hunter (tìm kiếm cơ hội việc làm): Nhiệm vụ tìm kiếm việc làm trên các trang web và nền tảng khác nhau trong các lĩnh vực tài chính, công nghệ, sản xuất. Tổng hợp danh sách đầy đủ các cơ hội việc làm phù hợp, bao gồm chức danh công việc, tên công ty và địa điểm. Kết quả đầu ra là tệp JSON chứa dữ liệu việc làm đã thu thập, được tổ chức theo lĩnh vực.
+ Resume Analyst (phân tích CV): Nhiệm vụ đánh giá CV ứng viên một cách hiệu quả để xác định những ứng viên hàng đầu cho các vị trí tuyển dụng đã xác định. Phân tích kỹ năng, kinh nghiệm và trình độ của ứng viên. Kết quả đầu ra là danh sách rút gọn các ứng viên hàng đầu phù hợp với các vị trí tuyển dụng.
+ Candidate Engagement (tiếp cận ứng viên): Nhiệm vụ tạo ra các thông điệp tiếp cận hấp dẫn để thu hút các ứng viên tiềm năng do Resume Analyst xác định. Thông điệp được cá nhân hóa, truyền tải bản chất của cơ hội việc làm và văn hóa doanh nghiệp một cách hấp dẫn. Kết quả đầu ra là liên hệ ban đầu với các ứng viên tiềm năng, tạo tiền đề cho các bước tuyển dụng tiếp theo.
+ Company Culture Investigator (điều tra văn hóa công ty): Nhiệm vụ tìm hiểu sâu về văn hóa tổ chức và giá trị của các công ty có vị trí tuyển dụng. Đạt được sự hiểu biết toàn diện về môi trường làm việc, đánh giá của nhân viên và danh tiếng trong ngành. Kết quả đầu ra là hồ sơ công ty chi tiết, hỗ trợ việc kết hợp ứng viên với môi trường tổ chức phù hợp.
+ Workflow Orchestrator (điều phối quy trình): Nhiệm vụ tổng hợp thông tin từ các nhiệm vụ phân tích CV và nghiên cứu công ty, kết hợp các ứng viên được chọn với các vị trí tuyển dụng và công ty phù hợp dựa trên trình độ chuyên môn và sự phù hợp về văn hóa. Kết quả đầu ra là việc tuyển dụng thành công, phù hợp với cả nguyện vọng nghề nghiệp và giá trị của tổ chức.
- Mỗi agent được gán các nhiệm vụ cụ thể như tìm kiếm việc làm, phân tích CV, tiếp cận ứng viên, nghiên cứu văn hóa công ty, kết hợp thông tin và đối sánh ứng viên với vị trí phù hợp.
- Kết quả đầu ra mong đợi của các nhiệm vụ được xác định rõ ràng như tệp JSON chứa dữ liệu việc làm, danh sách ứng viên tiềm năng, hồ sơ công ty chi tiết, thông điệp tiếp cận hấp dẫn, vị trí tuyển dụng thành công.
📌 Bài viết cung cấp hướng dẫn chi tiết về thiết kế và lập trình 5 AI agent chuyên biệt để xây dựng một startup tuyển dụng nhỏ, bao gồm: Job Hunter, Resume Analyst, Candidate Engagement, Company Culture Investigator và Workflow Orchestrator. Mỗi agent đảm nhận các nhiệm vụ cụ thể và phối hợp chặt chẽ với nhau, từ tìm kiếm việc làm, phân tích CV, tiếp cận ứng viên, nghiên cứu văn hóa công ty đến kết hợp thông tin và đối sánh ứng viên với vị trí phù hợp. Với sự phân công nhiệm vụ rõ ràng và đầu ra mong đợi cụ thể, quy trình tuyển dụng hứa hẹn sẽ diễn ra trơn tru và hiệu quả, giúp kết nối nhân tài phù hợp với các vị trí và văn hóa doanh nghiệp.
https://ai.plainenglish.io/ai-agents-the-secret-sauce-for-building-a-successful-startup-part-2-1320ba329734
- Tác tử AI là thực thể nhân tạo có khả năng nhận thức môi trường, đưa ra quyết định và hành động dựa trên các công cụ sẵn có.
- Hiện tại, các tác tử AI trong các lĩnh vực cụ thể đang ở cấp độ 2-3, với khả năng tự động hóa các tác vụ chiến lược ở mức 50-90% so với người lớn.
- Ví dụ thực tế cho thấy cách một tác tử AI dựa trên LangChain xử lý câu hỏi phức tạp bằng cách phân tích thành các bước, sử dụng các công cụ như tìm kiếm web, tính toán, và LLM để đưa ra câu trả lời cuối cùng.
- Cấu trúc cơ bản của tác tử AI gồm LLM làm nền tảng và các công cụ với khả năng khác nhau. Số lượng và năng lực của các công cụ quyết định sức mạnh của tác tử.
- Khi triển khai tác tử AI cần lưu ý về khả năng cảm biến, sự phụ thuộc vào API của LLM, chi phí cao do nhiều lần gọi API, độ trễ, khả năng không đưa ra kết luận.
- Thuật ngữ "tác tử" mô tả các thực thể thể hiện hành vi thông minh như tự chủ, phản ứng, chủ động và tương tác xã hội.
- Học chuyển giao cho phép tác tử áp dụng kiến thức từ tác vụ này sang tác vụ khác, tăng tính linh hoạt.
📌 AI agent tự chủ đại diện cho bước tiến quan trọng trong công nghệ, hứa hẹn cách mạng hóa nhiều ngành công nghiệp. Tuy nhiên, việc triển khai đòi hỏi phải cân nhắc kỹ về chi phí, độ trễ, sự phụ thuộc vào LLM API, và các vấn đề về đạo đức, trách nhiệm và thiên vị trong ra quyết định.
https://cobusgreyling.medium.com/five-levels-of-ai-agents-5ac39a7b07ed
- Bài viết hướng dẫn chi tiết cách một cá nhân (solopreneur) có thể xây dựng công ty startup tuyển dụng sử dụng các AI Agent chuyên biệt để tự động hóa quy trình.
- Giới thiệu đội ngũ 5 AI Agent:
+ ResuMate: Phân tích CV, lọc ra ứng viên phù hợp nhất
+ JobHuntr: Tìm kiếm cơ hội việc làm trên mạng
+ CoverStar: Soạn tin nhắn hấp dẫn, gửi đến ứng viên tiềm năng
+ OrgSleuth: Nghiên cứu văn hóa, giá trị của công ty tuyển dụng
+ MetaMinion: Điều phối luồng công việc giữa các Agent, ghép nối ứng viên phù hợp
- Cấu trúc tổ chức startup gồm 5 bộ phận tương ứng chức năng của từng Agent:
1. Tìm kiếm việc làm (JobHuntr)
2. Phân tích CV (ResuMate)
3. Tiếp cận ứng viên (CoverStar)
4. Nghiên cứu công ty (OrgSleuth)
5. Điều phối quy trình (MetaMinion)
- Mô tả chi tiết quy trình hoạt động 9 bước:
1. Ứng viên nộp CV qua portal/email
2. ResuMate phân tích CV, đánh giá mức độ phù hợp
3. JobHuntr liên tục tìm kiếm việc làm phù hợp trên mạng
4. CoverStar gửi tin nhắn tiếp cận ứng viên tiềm năng
5. OrgSleuth nghiên cứu văn hóa, môi trường làm việc công ty
6. MetaMinion tổng hợp dữ liệu, ghép nối ứng viên vừa phù hợp kỹ năng vừa hợp văn hóa công ty
7. CoverStar liên hệ ứng viên để phỏng vấn
8. Tiến hành phỏng vấn nhiều vòng, chọn ứng viên phù hợp nhất
9. Tuyển dụng và onboard nhân viên mới
- Các AI Agent mang lại nhiều lợi ích:
+ Xử lý khối lượng lớn CV, tin tuyển dụng nhanh chóng, chính xác
+ Phân tích sâu về kỹ năng, kinh nghiệm ứng viên thay vì chỉ dựa vào từ khóa
+ Tiếp cận ứng viên một cách cá nhân hóa
+ Đánh giá khách quan, loại bỏ định kiến trong tuyển dụng
+ Tìm được ứng viên phù hợp nhất cả về năng lực và văn hóa
→ Rút ngắn thời gian, nâng cao chất lượng tuyển dụng
- Bài viết giúp người đọc:
+ Thấy được tiềm năng của AI trong khởi nghiệp, đặc biệt với mô hình solopreneur
+ Hiểu rõ cách thức vận hành của một startup tuyển dụng tự động hóa
+ Hình dung tương lai của ngành tuyển dụng và thị trường lao động
+ Có ý tưởng, cảm hứng để phát triển các dự án kinh doanh dựa trên AI
📌 Ứng dụng đội ngũ 5 AI Agent chuyên biệt (ResuMate, JobHuntr, CoverStar, OrgSleuth, MetaMinion) có thể giúp một cá nhân xây dựng công ty startup tuyển dụng vận hành hiệu quả với nguồn lực hạn chế. Mô hình này hứa hẹn cách mạng hóa ngành tuyển dụng, mở ra cơ hội việc làm tốt hơn cho ứng viên và giúp doanh nghiệp tìm được nhân tài nhanh chóng, chính xác hơn. Đây là một minh chứng cho sức mạnh của trí tuệ nhân tạo trong việc nâng cao năng lực cạnh tranh cho các doanh nghiệp vừa và nhỏ.
https://ai.plainenglish.io/how-can-we-build-a-small-startup-using-ai-agent-part-1-7e71d057dd4f
- Các nhà nghiên cứu tại Meta, Allen Institute for AI và Đại học Washington đã giới thiệu Husky, một agent ngôn ngữ mã nguồn mở mới được thiết kế cho các tác vụ lập luận phức tạp, nhiều bước.
- Không giống như các mô hình hiện có tập trung vào các lĩnh vực cụ thể, Husky hoạt động trên một không gian hành động thống nhất, có thể xử lý các thử thách đa dạng như lập luận số, bảng và dựa trên kiến thức.
- Husky lặp lại giữa việc tạo ra các hành động để giải quyết tác vụ và thực thi các hành động này bằng cách sử dụng các mô hình chuyên gia, liên tục cập nhật trạng thái giải pháp của nó.
- Quá trình lặp lại này đã được chứng minh là một điểm khác biệt quan trọng, cho phép Husky vượt trội hơn các agent trước đó trên 14 bộ dữ liệu được sử dụng để đánh giá.
- Một trong những đổi mới chính của Husky là khả năng quản lý lập luận đa công cụ. Nó xuất sắc trong các tác vụ đòi hỏi truy xuất kiến thức còn thiếu và thực hiện các phép tính số, đạt được hiệu suất ngang bằng hoặc vượt trội hơn các mô hình tiên tiến nhất như GPT-4.
- Các nhà nghiên cứu cũng đã giới thiệu HuskyQA, một bộ đánh giá được thiết kế đặc biệt để stress test các agent ngôn ngữ trên các tác vụ lập luận đa công cụ, đặc biệt là để thực hiện lập luận số và truy xuất kiến thức còn thiếu.
- Các agent ngôn ngữ thực hiện các tác vụ phức tạp bằng cách sử dụng các công cụ để thực hiện từng bước một cách chính xác. Tuy nhiên, hầu hết các agent hiện có đều dựa trên các mô hình độc quyền hoặc được thiết kế để nhắm mục tiêu các tác vụ cụ thể, chẳng hạn như toán học hoặc trả lời câu hỏi nhiều bước.
- Mặc dù các agent AI đã thu hút sự chú ý đáng kể trong vài năm qua, việc giới thiệu một agent có khả năng lập luận trên một số tác vụ phức tạp có nghĩa là khả năng của agent đang mở rộng nhanh chóng.
📌 Husky, một agent ngôn ngữ mã nguồn mở mới của Meta AI, có khả năng xử lý các tác vụ lập luận phức tạp và đa dạng nhờ không gian hành động thống nhất. Với khả năng lập luận đa công cụ vượt trội, đặc biệt trong các tác vụ đòi hỏi truy xuất kiến thức và tính toán số, Husky đã vượt qua 14 bộ dữ liệu đánh giá và đạt hiệu suất ngang bằng hoặc cao hơn các mô hình tiên tiến như GPT-4.
https://analyticsindiamag.com/meta-ai-unveils-husky-a-unified-open-source-language-agent/
- AI agent là thực thể phần mềm tự trị, thường được sử dụng để bổ sung cho các mô hình ngôn ngữ lớn (LLM).
- Các LLM gần đây như GPT-4o, Gemini Pro, Claude Opus đã thể hiện khả năng lập luận tiên tiến. Các mô hình mã nguồn mở như Mistral và Llama 3 cũng ngang tầm với các mô hình thương mại.
- AI agent dựa vào LLM để lập luận, đồng thời bổ sung các chức năng mới cho LLM. Có thể coi LLM như kernel và AI agent như các chương trình trong hệ điều hành.
- Các hạn chế của LLM: không có bộ nhớ, xử lý đồng bộ, có thể tạo ra thông tin sai lệch, không truy cập internet, kém toán học, đầu ra không xác định.
- AI agent khắc phục các hạn chế trên bằng cách: duy trì bộ nhớ và ngữ cảnh, xử lý bất đồng bộ và song song, kiểm tra dữ liệu thực tế, tích hợp công cụ toán học, chuẩn hóa định dạng đầu ra, tương tác theo nhân vật.
- Ví dụ: AI agent có thể kết hợp duyệt web, môi trường thực thi code với phân tích của LLM để tạo ra câu trả lời chi tiết.
📌 AI agent đóng vai trò quan trọng trong việc bổ sung khả năng của các mô hình ngôn ngữ lớn bằng cách kết nối chúng với các công cụ và dịch vụ bên ngoài cần thiết để hoàn thành nhiệm vụ, giúp khắc phục nhiều hạn chế vốn có của LLM như thiếu bộ nhớ, xử lý tuần tự, không truy cập dữ liệu thực tế.
https://thenewstack.io/ai-agents-key-concepts-and-how-they-overcome-llm-limitations/
- Generative AI agents (hay còn gọi là agentic AI) có tiềm năng tạo ra bước đột phá trong cách tiếp cận kiến trúc AI tạo sinh trên điện toán đám mây bằng cách mang lại tính tự chủ, thông minh và hiệu quả.
- Điểm cốt lõi của agentic AI là khả năng tự chủ và tạo điều kiện cho hành vi phân tán, năng động. Các AI agents có thể độc lập khởi tạo, lập kế hoạch và hoàn thành các tác vụ phức tạp vốn đòi hỏi sự can thiệp đáng kể của con người.
- Agentic AI là hệ thống AI tiên tiến được thiết kế để đạt được các mục tiêu phức tạp và quản lý quy trình làm việc với sự giám sát tối thiểu của con người. Nó thể hiện khả năng hiểu ngữ cảnh, ra quyết định, thích nghi với hoàn cảnh thay đổi và tự hoàn thành các tác vụ đa diện.
- Các AI agents được trang bị các thuật toán tinh vi cho phép chúng đánh giá các lựa chọn khác nhau, cân bằng đánh đổi và phản ứng hiệu quả với các tình huống mới. Chúng có thể tham khảo nhiều LLM để có cái nhìn tổng quan về vấn đề cần giải quyết.
- Agentic AI triển khai trong quản lý chuỗi cung ứng có thể xử lý tự động nhiều hoạt động hậu cần, đảm bảo hàng hóa được vận chuyển, lưu trữ và giao hàng hiệu quả bằng cách phân tích và phối hợp dữ liệu từ nhiều nguồn.
- Tuy nhiên, việc xây dựng và triển khai AI agents khá phức tạp. Các kiến trúc sư và lập trình viên có khả năng thiết kế, xây dựng hiệu quả AI agents còn khá hiếm. Ngoài ra, không nên đặt quá nhiều tính năng vào AI agents, thay vào đó chúng nên tương tác với nhiều LLM để xử lý các yêu cầu nặng hơn.
📌 Generative AI agents hứa hẹn sẽ cách mạng hóa kiến trúc AI với khả năng tự chủ, thông minh và hiệu quả trong xử lý các tác vụ phức tạp. Tuy nhiên, việc xây dựng và triển khai chúng vẫn còn nhiều thách thức. Các kiến trúc sư và lập trình viên cần tìm hiểu kỹ về lợi ích cũng như khó khăn của công nghệ này trước khi áp dụng rộng rãi.
https://www.infoworld.com/article/3715457/generative-ai-agents-will-revolutionize-ai-architecture.html
- Jensen Huang, CEO của NVIDIA, tin rằng làn sóng tiếp theo của AI là AI vật lý, sẽ cách mạng hóa các ngành công nghiệp thông qua robotics.
- AI vật lý là các mô hình có thể hiểu chỉ dẫn và tự động thực hiện các tác vụ phức tạp trong thế giới thực.
- NVIDIA đang đặt cược vào nền tảng Omniverse để mô phỏng và huấn luyện robot thông qua kỹ thuật sinh đôi kỹ thuật số.
- Các LLM đa phương thức giúp robot học, nhận thức và hiểu thế giới xung quanh, lên kế hoạch hành động.
- Tuy nhiên, mô phỏng không phải là cách duy nhất để huấn luyện robot. Một số tác vụ học tốt hơn thông qua bắt chước.
- NVIDIA hợp tác với nhiều hãng sản xuất lớn để xây dựng nhà máy AI, thúc đẩy sản xuất xe điện và xe tự lái.
- Cuộc đua robotics đang nóng lên với sự đầu tư mạnh mẽ từ các công ty công nghệ lớn như NVIDIA, Microsoft, OpenAI.
📌 NVIDIA đang đặt cược lớn vào AI vật lý, tin rằng nó sẽ cách mạng hóa mọi ngành công nghiệp thông qua robotics. Nền tảng mô phỏng Omniverse và các LLM đa phương thức sẽ đóng vai trò then chốt trong việc huấn luyện robot tự động hóa. Tuy nhiên, mô phỏng không phải là cách tiếp cận duy nhất. Cuộc đua robotics đang nóng lên với sự tham gia của nhiều ông lớn công nghệ.
https://analyticsindiamag.com/the-next-wave-of-ai-is-physical-ai-says-jensen-huang/
- Việc các chatbot AI hợp tác với nhau có thể giúp chúng trở nên hiệu quả hơn trong việc giải quyết các vấn đề khó.
- Tác giả đã thử nghiệm với AutoGen, một framework nguồn mở cho phép tạo ra nhiều tác tử AI với các vai trò và mục tiêu khác nhau để giải quyết các vấn đề cụ thể.
- Hai tác tử AI "phóng viên" và "biên tập viên" đã thảo luận về cách viết bài về sự hợp tác giữa các tác tử AI, đề cập đến các ứng dụng trong y tế, giao thông, bán lẻ và các vấn đề đạo đức.
- Các nghiên cứu cho thấy việc các tác tử AI hợp tác có thể giúp giải quyết các bài toán lớp 5, các vấn đề cờ vua và phân tích, cải tiến mã máy tính tốt hơn so với một tác tử đơn lẻ.
- Việc gán các đặc điểm tính cách khác nhau cho các tác tử AI có thể tinh chỉnh hiệu suất hợp tác của chúng.
- Trong một thử nghiệm do Cơ quan Dự án Nghiên cứu Quốc phòng Tiên tiến (DARPA) của Lầu Năm Góc ủy quyền, một nhóm các tác tử AI đã phát triển một hệ thống phân cấp nội bộ khi tìm kiếm bom ảo.
- Cách tiếp cận hợp tác có thể mạnh mẽ nhưng cũng có thể dẫn đến các lỗi mới do tăng tính phức tạp.
- Mọi người đang thích ứng framework AutoGen nguồn mở theo nhiều cách thú vị như tạo ra các phòng biên tập mô phỏng để tạo ý tưởng viết văn và một "doanh nghiệp trong hộp" ảo với các tác tử đảm nhận các vai trò khác nhau.
📌 Sự hợp tác giữa các chatbot AI đang cho thấy tiềm năng cải thiện đáng kể hiệu suất trong việc giải quyết các vấn đề phức tạp. Tuy nhiên, cách tiếp cận này cũng đặt ra những thách thức mới liên quan đến tính phức tạp và các vấn đề đạo đức cần được giải quyết trước khi có thể áp dụng rộng rãi.
https://www.wired.com/story/chatbot-teamwork-makes-the-ai-dream-work/
- Những tiến bộ gần đây trong lĩnh vực trí tuệ nhân tạo (AI) đã giúp nâng cấp đáng kể "bộ não" của robot. Công nghệ tương tự như chatbot Chatgpt hay hệ thống tạo ảnh DALL-E có thể được áp dụng cho robot.
- Các mô hình AI đa phương thức (multimodal) kết hợp hiểu ngôn ngữ, thị giác với dữ liệu từ cảm biến và cơ cấu chấp hành của robot. Điều này cho phép giao tiếp với robot bằng ngôn ngữ thông thường.
- Robot có thể giải thích lý do đằng sau hành động của chúng. Việc lập trình và gỡ lỗi robot trở nên dễ dàng hơn vì "bộ não" của chúng không còn là hộp đen khó hiểu.
- Robot đang trở nên giỏi hơn trong việc học nhanh thông qua bắt chước và khái quát hóa từ kỹ năng này sang kỹ năng khác. Điều này mở đường cho robot di chuyển ra khỏi nhà máy, kho hàng.
- Nhiều công ty và nhóm nghiên cứu đang sử dụng các mô hình AI mới nhất để chế tạo robot nhân hình, vì hầu hết thế giới được thiết kế cho con người di chuyển.
- Thị trường lao động ở các nước giàu đang thắt chặt và già hóa. Robot thông minh hơn có thể tăng năng suất, đồng thời hỗ trợ nấu ăn, dọn dẹp, chăm sóc người cao tuổi và người có nhu cầu.
- Các nền kinh tế phát triển sẽ cần nhiều tự động hóa hơn để duy trì mức sống. Hàn Quốc, Nhật Bản và Trung Quốc nằm trong top 5 quốc gia có tỷ lệ robot trên mỗi công nhân sản xuất cao nhất, đồng thời cũng già hóa nhanh chóng.
- Trong những năm tới, thái độ có thể chuyển từ sợ hãi sự xuất hiện của robot sang mong muốn chúng đến sớm hơn.
📌 Những tiến bộ trong AI đang giúp robot trở nên thông minh, dễ lập trình và đáng tin cậy hơn. Điều này mở ra tiềm năng to lớn cho robot hỗ trợ con người trong nhiều lĩnh vực, từ sản xuất đến chăm sóc. Các nền kinh tế già hóa sẽ cần nhiều robot hơn để duy trì năng suất và mức sống.
https://www.economist.com/leaders/2024/06/06/three-reasons-why-its-good-news-that-robots-are-getting-smarter
- Anthropic giới thiệu tính năng "tool use" (hay "function calling") cho chatbot Claude, cho phép tạo trợ lý email, bot mua sắm hay các giải pháp cá nhân hóa khác bằng cách kết nối với bất kỳ API bên ngoài nào.
- Công cụ này có thể phân tích dữ liệu để đưa ra đề xuất sản phẩm dựa trên lịch sử mua hàng, trả lời nhanh các yêu cầu của khách hàng như theo dõi trạng thái đơn hàng hay hỗ trợ kỹ thuật.
- Nó cũng có thể xử lý hình ảnh, ví dụ như một trợ lý tư vấn thiết kế nội thất ảo có thể phân tích ảnh phòng và đưa ra gợi ý trang trí phù hợp.
- Trợ lý AI này sẽ có mặt trên Messages API của Anthropic, Amazon Bedrock và Google Vertex AI.
- Giá dịch vụ dựa trên lượng văn bản Claude xử lý, tính bằng "token". 1.000 token tương đương khoảng 750 từ. Gói Haiku rẻ nhất có giá khoảng 0,25 USD/triệu token đầu vào và 1,25 USD/triệu token đầu ra.
- Anthropic đã thử nghiệm beta công cụ từ tháng 4 với vài nghìn khách hàng. Một khách hàng tiêu biểu là Study Fetch, sử dụng nó để xây dựng ứng dụng gia sư AI cá nhân hóa Spark.E.
- Xu hướng phát triển của công nghệ này là hướng tới các trợ lý/tác tử AI. Google và OpenAI cũng đang phát triển các trợ lý tương tự.
📌 Anthropic cho ra mắt tính năng mới trên chatbot Claude, cho phép người dùng tạo ra các trợ lý AI cá nhân hóa như bot mua sắm, trợ lý email thông qua việc tích hợp API bên ngoài. Công cụ này có khả năng phân tích dữ liệu văn bản, hình ảnh để đưa ra đề xuất phù hợp. Dịch vụ có mặt trên nhiều nền tảng với mức giá từ 0,25 USD/triệu token. Đây là một bước tiến mới trong xu hướng phát triển các trợ lý AI đa năng.
https://www.theverge.com/2024/5/30/24167231/anthropic-claude-ai-assistant-automate-tasks
- Flowise giới thiệu nền tảng không cần mã hóa Agentflows, cho phép tạo và quản lý các nhóm AI agent một cách dễ dàng với giao diện kéo thả trực quan.
- Người dùng có thể gán vai trò và trách nhiệm cho từng AI agent, cho phép chúng hợp tác hiệu quả để hoàn thành nhiệm vụ. Agent giám sát đóng vai trò điều phối quy trình làm việc.
- Nền tảng cho phép bất kỳ ai cũng có thể bước vào thế giới phát triển AI mà không cần kiến thức lập trình sâu rộng, mở ra nhiều khả năng mới.
- Để thiết lập một nhóm AI agent, hãy thêm agent giám sát, kéo thả các agent công nhân và gán vai trò, cấu hình thông tin đăng nhập và lời nhắc cho từng agent.
- Các nhóm AI agent có thể được áp dụng trong nhiều lĩnh vực thực tế như phát triển phần mềm (gồm các agent thiết kế sản phẩm, lập trình viên, viết tài liệu kỹ thuật) và nghiên cứu, bán hàng (gồm các agent nghiên cứu, đại diện bán hàng).
- Việc triển khai các nhóm AI agent mang lại nhiều lợi ích như tăng hiệu quả, khả năng mở rộng linh hoạt, cộng tác liền mạch và thúc đẩy đổi mới.
- Nền tảng Flowise cho phép tích hợp các công cụ bên ngoài như Google Custom Search để nâng cao khả năng của các nhóm AI agent.
- Việc kiểm thử và cải tiến lặp đi lặp lại được nhấn mạnh để đảm bảo hiệu suất tối ưu của các nhóm agent.
- Với tính dễ tiếp cận và linh hoạt, nền tảng Flowise là một lựa chọn hấp dẫn cho các doanh nghiệp muốn tận dụng sức mạnh của AI.
📌 Flowise Agentflows là nền tảng không cần mã hóa đột phá, cho phép bất kỳ ai cũng có thể xây dựng và quản lý các nhóm AI agent phức tạp một cách dễ dàng. Với khả năng tích hợp công cụ bên ngoài và áp dụng trong nhiều lĩnh vực như phát triển phần mềm, nghiên cứu, bán hàng, nền tảng này hứa hẹn thúc đẩy năng suất, hiệu quả và tăng trưởng cho các tổ chức ở mọi quy mô.
https://www.geeky-gadgets.com/building-ai-agent-teams/
- Các startup AI lớn như Anthropic đang dạy chatbot cách sử dụng công cụ để trở nên hữu ích hơn trong công việc văn phòng.
- Công nghệ AI hiện tại chưa thực sự thay đổi công việc văn phòng, mặc dù có nhiều thử nghiệm và ứng dụng.
- Chatbots như Google Gemini và OpenAI’s ChatGPT chủ yếu chỉ xử lý văn bản qua giao diện chat.
- Anthropic ra mắt sản phẩm mới cho phép chatbot Claude truy cập các dịch vụ và phần mềm bên ngoài để thực hiện các nhiệm vụ hữu ích hơn.
- Claude có thể sử dụng máy tính để giải các bài toán, truy cập cơ sở dữ liệu khách hàng, và sử dụng các chương trình khác trên máy tính người dùng.
- Công ty Study Fetch đã phát triển cách để Claude sử dụng các tính năng của nền tảng để thay đổi giao diện người dùng và nội dung giáo trình.
- Google cũng đã trình diễn một số AI agents tại hội nghị I/O, bao gồm một agent xử lý việc trả hàng trực tuyến.
- Các AI agents ban đầu có thể bị giới hạn trong các nhiệm vụ cụ thể để giảm thiểu rủi ro sai sót.
- Tự động hóa quy trình robot (RPA) hiện tại đã có giá trị 29 tỷ USD và dự kiến sẽ tăng lên 65 tỷ USD vào năm 2027 nhờ sự kết hợp của AI.
- Công ty Adept AI đang phát triển các AI agents cho công việc văn phòng với độ tin cậy trên 90% cho khách hàng doanh nghiệp.
- Adept AI tập trung vào việc cải thiện khả năng hiểu mục tiêu và các bước cần thiết để hoàn thành nhiệm vụ của AI agents.
- Sử dụng công cụ là một bước tiến quan trọng trong việc phát triển trí tuệ máy móc mạnh mẽ hơn, tương tự như quá trình tiến hóa của con người.
📌 Các startup AI như Anthropic đang dạy chatbot cách sử dụng công cụ để trở nên hữu ích hơn trong công việc văn phòng. Sự phát triển này có thể làm tăng giá trị thị trường tự động hóa quy trình robot từ 29 tỷ USD lên 65 tỷ USD vào năm 2027.
https://www.wired.com/story/chatbots-are-entering-the-stone-age/
- Tự động hóa quy trình làm việc giúp thực hiện các tác vụ kinh doanh thường xuyên một cách tự động, giảm can thiệp thủ công, đảm bảo tác vụ được thực hiện nhất quán và không có lỗi.
- Lợi ích chính của tự động hóa quy trình là giải phóng thời gian cho nhân viên tập trung vào các hoạt động phức tạp, mang lại giá trị gia tăng. Nó cũng giảm khả năng xảy ra lỗi, tăng tốc độ quy trình và cải thiện đáng kể hiệu quả hoạt động của doanh nghiệp.
- AI mang lại một lớp thông minh cho tự động hóa, cho phép hệ thống không chỉ thực hiện tác vụ mà còn học hỏi từ chúng, tối ưu hóa quy trình theo thời gian.
- Make là nền tảng tự động hóa không cần code cho phép người dùng tạo quy trình làm việc kết nối các dịch vụ trực tuyến khác nhau mà không cần viết một dòng code nào.
- Để bắt đầu với Make, trước tiên bạn cần tạo tài khoản và làm quen với bảng điều khiển. Nền tảng này trực quan, được thiết kế cho người dùng từ người mới bắt đầu đến người tự động hóa nâng cao.
- Các bước thiết lập quy trình làm việc tăng cường AI đầu tiên của bạn: xác định tác vụ lặp đi lặp lại, xác định mục tiêu tự động hóa, chọn trigger và action phù hợp, sử dụng AI để ra quyết định nâng cao, lập bản đồ quy trình, kiểm tra và tối ưu hóa.
- Các tính năng và kỹ thuật nâng cao như logic phân nhánh, tổng hợp dữ liệu, xử lý lỗi giúp nâng cao hơn nữa hiệu quả quy trình làm việc.
- Một số trường hợp sử dụng thực tế của AI và Make như tự động hóa dịch vụ khách hàng, quản lý hàng tồn kho.
📌 Tích hợp AI với nền tảng không cần code như Make đại diện cho một biên giới mới trong tự động hóa quy trình kinh doanh. Bằng cách khai thác các công nghệ này, doanh nghiệp không chỉ có thể hợp lý hóa hoạt động mà còn phát hiện ra những hiểu biết và hiệu quả trước đây không khả thi. Kết quả là lợi thế cạnh tranh đáng kể trong thế giới ngày càng số hóa. Khi doanh nghiệp tiếp tục phát triển, việc áp dụng các công nghệ như vậy sẽ trở nên không chỉ có lợi mà còn thiết yếu.
Citations:
[1] https://www.geeky-gadgets.com/automate-your-workflows-using-ai-and-make/
- Tại sự kiện Build hàng năm, Microsoft tập trung vào AI, giới thiệu Team Copilot - chatbot AI đóng vai trò như một đồng nghiệp, sử dụng kiến thức chung của nhóm để trả lời câu hỏi, tương tự AI Teammate của Google.
- Microsoft cũng giới thiệu Copilot Agents - trợ lý AI có thể tự động hóa các tác vụ cho nhân viên và đồng nghiệp một cách độc lập, chủ động.
- Người dùng có thể cung cấp mô tả công việc tùy chỉnh hoặc chọn từ các mẫu có sẵn. Copilot sẽ tạo một AI agent hoạt động ngầm để hoàn thành các tác vụ được giao.
- Copilot có thể yêu cầu trợ giúp khi gặp tình huống không xử lý được, tham khảo kiến thức hiện có và học hỏi từ phản hồi mới để hoàn thành nhiệm vụ.
- Copilot Agents có thể được xây dựng trong Copilot Studio, Microsoft cho rằng bất kỳ ai cũng có thể tạo ra chúng để tự động hóa công việc.
- Tính năng này tương tự như AI Agents của Google, có thể tự động hoàn thành các tác vụ như xử lý hoàn tiền cho đơn hàng trực tuyến.
- Cả Copilot Agents và AI Agents đều chưa sẵn sàng cho thị trường. Microsoft đang thử nghiệm với một nhóm người dùng chọn lọc và dự kiến cung cấp bản xem trước công khai vào cuối năm nay.
- Các công ty công nghệ lớn tiếp tục tập trung vào sản phẩm AI, nhưng nhiều sản phẩm được quảng cáo vẫn chưa ra mắt thị trường. Liệu chúng có thể thực hiện các tác vụ như đã nói khi được phát hành hay không vẫn còn là câu hỏi.
📌 Microsoft giới thiệu Copilot Agents - trợ lý AI có thể tự động hóa công việc cho doanh nghiệp, tương tự AI Agents của Google. Tuy nhiên, cả hai đều chưa sẵn sàng ra mắt thị trường. Liệu các sản phẩm AI này có thực sự hoạt động hiệu quả như lời quảng cáo khi chính thức phát hành vẫn là điều cần thận trọng.
https://sea.mashable.com/tech/32701/microsoft-unveils-copilot-agents-an-ai-business-assistant
- Trong 10 năm tới, các công cụ tài chính trực tuyến ngày nay sẽ trở nên lỗi thời khi chúng ta ngày càng quản lý tài chính thông qua các agents - những bot thông minh thực hiện các hoạt động tài chính thay mặt chúng ta.
- Các agent đã tồn tại dưới dạng bot thanh lý, bot chênh lệch giá. Chúng hoạt động tự động, thực hiện các hành động on-chain thay mặt người khác.
- Tiền điện tử, với bản chất minh bạch, nguồn mở và có thể lập trình, là nền tảng hoàn hảo cho các agent, vượt trội so với API nửa vời của TradFi.
- Các agent hiện tại vẫn đơn giản, được lập trình cho một nhiệm vụ hẹp. Các công ty lớn có thể xây dựng hệ thống phức tạp hơn, nhưng không khả thi cho người dùng nhỏ lẻ.
- Khi AI trở nên phổ biến hơn, các chi tiết kỹ thuật của việc gọi hàm hợp đồng thông minh có thể được trừu tượng hóa. Người tạo/chủ sở hữu có thể đưa ra các hướng dẫn cấp cao hơn trong khi agent tìm cách thực hiện.
- LLM như GPT-4 đã có khả năng hiểu ý định, suy luận thông minh và đọc tất cả dữ liệu trên Internet. Có thể tưởng tượng một giao diện văn bản cho agent đã đọc tất cả các phương tiện truyền thông tiền điện tử liên quan, tiêu thụ và hiểu tất cả dữ liệu từ các blockchain, đồng thời có khả năng thực hiện hành động on-chain.
- Các AI agent có thể tự động hóa các hoạt động như săn airdrop, săn tiền meme và tối ưu hóa lợi nhuận.
- Trong tương lai, chúng ta có thể không cần giao diện người dùng nữa, và MetaMask sẽ được thay thế bởi ví trong agent.
- Các agent TradFi sẽ tồn tại, nhưng các agent được xây dựng trên tiền điện tử sẽ tốt hơn. Nếu các agent trở nên phổ biến hơn và các agent tiền điện tử mang lại trải nghiệm tốt hơn, điều này sẽ thúc đẩy ngày càng nhiều người dùng, hoạt động và giá trị on-chain.
📌 Tiền điện tử có thể là hệ thống tài chính hoàn hảo cho các AI agent trong tương lai. Sự xuất hiện của các agent tiền điện tử tiên tiến, với khả năng tự động hóa và tối ưu hóa các hoạt động tài chính, sẽ thu hút ngày càng nhiều người dùng và thúc đẩy sự phát triển của hệ sinh thái tiền điện tử.
https://www.coindesk.com/opinion/2024/05/13/ai-agents-will-drive-the-next-wave-of-crypto-adoption/
- Các mô hình ngôn ngữ lớn (LLM) có thể thực hiện các công việc phức tạp khi chúng làm việc cùng nhau trong các hệ thống đa tác tử (MAS).
- Trong một thử nghiệm, 3 tác tử AI đã phối hợp để tìm và vô hiệu hóa bom. Tác tử Alpha chỉ đạo Bravo và Charlie di chuyển đến các phòng khác nhau để làm việc hiệu quả hơn.
- Các nhà nghiên cứu MIT chỉ ra rằng 2 chatbot cùng nhau giải quyết vấn đề toán học tốt hơn 1 chatbot đơn lẻ. Chúng cũng ít bịa đặt thông tin hơn khi thống nhất về sự kiện.
- Các nhóm AI làm việc tốt hơn tác tử đơn lẻ vì công việc có thể được chia nhỏ thành nhiều nhiệm vụ chuyên biệt hơn. Ví dụ, một MAS lập kế hoạch cho chuyến đi Berlin có thể phân chia việc tìm điểm tham quan, lập lộ trình, tính toán chi phí.
- Tuy nhiên, các LLM đôi khi đưa ra giải pháp phi logic và điều này có thể lan truyền trong cả nhóm. Các tác tử cũng có thể mắc kẹt trong vòng lặp.
- Microsoft đã phát hành AutoGen, một framework nguồn mở để xây dựng các nhóm với các tác tử LLM. Một dự án AutoGen kết hợp bộ tạo ảnh với mô hình ngôn ngữ để tạo ra ảnh phù hợp hơn với yêu cầu của người dùng.
- Các nhà nghiên cứu ở Phòng thí nghiệm AI Thượng Hải chỉ ra cách các tác tử trong các hệ thống nguồn mở có thể được điều kiện với "đặc điểm tính cách đen tối" để thực hiện các nhiệm vụ có hại.
- Kỹ thuật "jailbreaking" sử dụng một chatbot để xúi giục chatbot khác tham gia vào hành vi xấu có thể vượt qua cơ chế chặn của các LLM thương mại.
📌 Các nhóm AI đang thể hiện trí thông minh tập thể cao hơn các LLM riêng lẻ, mở ra tiềm năng ứng dụng trong nhiều lĩnh vực. Tuy nhiên, chúng cũng tiềm ẩn rủi ro lớn nếu bị lạm dụng để thực hiện các nhiệm vụ độc hại, vượt qua các biện pháp kiểm soát. Việc các hệ thống AI hợp tác với nhau có thể tạo ra một vũ khí đáng sợ.
Citations:
[1] https://www.economist.com/science-and-technology/2024/05/13/todays-ai-models-are-impressive-teams-of-them-will-be-formidable
- Giáo dục AI và Robotics đang trở thành xu hướng phát triển mạnh mẽ tại Mỹ với sự gia tăng đáng kể trong các chương trình đào tạo, nghiên cứu và ứng dụng.
- Các trường đại học hàng đầu như MIT, Stanford, Carnegie Mellon đang đầu tư mạnh vào nghiên cứu và phát triển AI, robotics.
- Số lượng sinh viên theo học các chương trình liên quan đến AI và robotics tăng 35% trong 5 năm qua.
- Hơn 1.500 khóa học về AI và robotics được giảng dạy tại các trường đại học Mỹ.
- Các dự án nghiên cứu AI và robotics nhận được tài trợ lên tới 2 tỷ USD mỗi năm.
- Nhiều trường phổ thông bắt đầu đưa AI và robotics vào giảng dạy cho học sinh.
- Hơn 10.000 học sinh phổ thông tham gia các câu lạc bộ và cuộc thi về robotics.
- Chính phủ Mỹ đầu tư 500 triệu USD cho nghiên cứu và giáo dục AI trong 5 năm tới.
- Các công ty công nghệ lớn như Google, Microsoft, Amazon hợp tác chặt chẽ với các trường đại học trong nghiên cứu và đào tạo nhân tài AI, robotics.
- Nhu cầu nhân lực trong lĩnh vực AI và robotics tại Mỹ dự kiến tăng 40% trong thập kỷ tới.
📌 Giáo dục AI và Robotics đang bùng nổ tại Mỹ với sự tăng trưởng mạnh mẽ trong đào tạo, nghiên cứu và ứng dụng. Các trường đại học đầu tư lớn, số lượng sinh viên tăng 35%, hơn 1.500 khóa học được giảng dạy. Chính phủ và các công ty công nghệ cũng tăng cường hỗ trợ, đáp ứng nhu cầu nhân lực tăng 40% trong tương lai.
Citations:
[1] https://www.socialnews.xyz/2024/05/12/ai-robotics-learning-booms-in-us-education/
- Astribot S1, sản phẩm mới nhất của công ty robot Trung Quốc Astribot, gây sốc với khả năng di chuyển giống hệt con người.
- Video mới phát hành cho thấy S1 thực hiện nhiều công việc ấn tượng từ xếp cốc nhanh, rút khăn trải bàn dưới tháp ly rượu mà không làm đổ.
- S1 không chỉ thể hiện qua các màn trình diễn ấn tượng mà còn qua các công việc thực tế như sắp xếp đồ vật một cách logic, chế biến và phục vụ bánh kếp.
- Được trang bị AI, S1 có khả năng "suy nghĩ" vượt ra khỏi các lệnh đơn giản, tự sắp xếp và phân loại đồ vật một cách hợp lý.
- Trong bếp, S1 có thể thái và gọt rau củ với tốc độ và độ chính xác giống như con người, chuẩn bị bột bánh kếp và chiên chúng.
- Astribot S1 cũng thể hiện khả năng xử lý chai và lỏng một cách điêu luyện, từ mở nắp chai đến rót lỏng mà không đổ giọt nào.
- Ngoài ra, S1 còn có thể hút bụi, cắm phích điện và sử dụng búa để thực hiện các công việc DIY cơ bản.
- Robot này cũng giỏi trong việc thực hiện các công việc nhà mệt mỏi như tưới cây, là và gấp quần áo.
- Astribot S1 đang trong quá trình thử nghiệm nghiêm ngặt và dự kiến sẽ được phát hành vào cuối năm nay.
- Với khả năng chịu tải 22 pound cho mỗi cánh tay và tốc độ tối đa 10 mét/giây, S1 được coi là robot giống con người nhất về hiệu suất hoạt động.
📌 Astribot S1 của Trung Quốc đã gây ấn tượng mạnh với khả năng di chuyển và thực hiện công việc với tốc độ và độ chính xác giống như con người. Từ việc thực hiện các màn trình diễn ấn tượng đến việc xử lý các công việc nhà phức tạp, S1 cho thấy tiềm năng lớn trong việc hỗ trợ con người trong tương lai.
https://supercarblondie.com/china-unveils-astribot-s1/
- AI giống như ChatGPT đang thúc đẩy nghiên cứu và đưa robot giống người đến gần hơn với thực tế tại Trung Quốc, quốc gia sở hữu nhiều nhà máy hàng đầu thế giới.
- Li Zhang, COO của LimX Dynamics tại Shenzhen, cho biết AI tạo sinh có thể giúp máy móc hiểu và nhận thức môi trường xung quanh.
- Mặc dù AI có thể cho phép robot suy nghĩ và đưa ra quyết định ngang bằng con người, nhưng hạn chế về mặt cơ khí là lý do chính khiến robot giống người chưa thể thay thế hoàn toàn lao động con người.
- LimX Dynamics, một startup mới hai tuổi, đã rút ngắn kỳ vọng về thời gian sản xuất robot giống người từ 8-10 năm xuống còn 5-7 năm sau khi thấy được sự cải thiện nhờ AI.
- OpenAI và Elon Musk's Tesla đang phát triển robot giống người của riêng mình, trong khi BYD, một gã khổng lồ về xe điện, đã đầu tư vào startup Agibot tại Thượng Hải.
- Trung Quốc đã vượt qua Nhật Bản vào năm 2013 trở thành quốc gia lắp đặt robot công nghiệp nhiều nhất thế giới, chiếm hơn 50% tổng số toàn cầu.
- Các ngành điện tử, ô tô và kim loại và máy móc là ba ngành hàng đầu trong việc lắp đặt robot công nghiệp tại Trung Quốc.
- AI tạo sinh không trực tiếp giúp cải thiện chuyển động của robot nhưng có thể hỗ trợ robot giống người trong việc lập kế hoạch nhiệm vụ nâng cao.
- Một sự chuyển dịch về robot công nghiệp có thể được tăng tốc một khi chi phí cho mỗi robot giảm xuống.
- Trong nghiên cứu dược phẩm, AI tạo sinh có thể giảm chi phí mà không cắt giảm lao động con người, bằng cách giảm số lượng thí nghiệm thất bại.
📌 AI tạo sinh đang thúc đẩy sự phát triển của robot giống người, đặc biệt tại Trung Quốc, với kỳ vọng rút ngắn thời gian sản xuất và triển khai chúng trong các ngành công nghiệp và hộ gia đình. Mặc dù có những hạn chế về mặt cơ khí, nhưng sự tiến bộ trong AI và giảm chi phí sản xuất có thể mở ra những cơ hội mới cho việc sử dụng robot, đồng thời giảm thiểu tác động tiêu cực đến việc làm con người.
https://www.cnbc.com/2024/05/08/how-generative-chatgpt-like-ai-is-accelerating-humanoid-robots.html
- Vào tháng 3 năm 2024, Hugging Face, một startup chuyên về AI, đã thu hút sự chú ý lớn khi tuyển dụng Remi Cadene, cựu nhân viên khoa học của Tesla, Inc., để dẫn dắt dự án robot nguồn mở mới.
- Sự kiện này đáng chú ý bởi vì Tesla nổi tiếng trong lĩnh vực công nghệ và robot, đặc biệt là với mô hình robot hình người Optimus gần đây.
- Lĩnh vực robot đã chứng kiến sự bùng nổ về tiến bộ, nhờ vào việc tích hợp các mô hình ngôn ngữ lớn dựa trên transformer và AI tạo sinh, những lĩnh vực mà Hugging Face đã xuất sắc.
- Hugging Face giới thiệu LeRobot - một bộ công cụ nguồn mở với mục tiêu dân chủ hóa robot AI và khơi dậy niềm đam mê cho thế hệ roboticists mới.
- Quyết định làm cho LeRobot trở thành nguồn mở nhằm mục đích ngăn chặn sự tập trung quyền lực và đổi mới trong một số ít công ty. Hugging Face mời cộng đồng toàn cầu của các nhà phát triển, nhà nghiên cứu, và người hâm mộ đóng góp và hưởng lợi từ sự tiến bộ chung của robot AI.
- LeRobot được phát triển dựa trên việc tạo ra bộ dữ liệu robot được cộng đồng đóng góp lớn nhất từ trước đến nay, với sự hợp tác của các trường đại học, startups, công ty công nghệ lớn, và cá nhân người hâm mộ.
📌 Hugging Face đã mở ra một chương mới trong lĩnh vực robot và AI với việc ra mắt LeRobot, một thư viện mã nguồn mở nhằm dân chủ hóa công nghệ robot. Sự kiện này không chỉ đánh dấu sự hợp tác của những tên tuổi lớn trong ngành như Remi Cadene từ Tesla mà còn mở ra cơ hội cho cộng đồng toàn cầu tham gia vào quá trình phát triển và đổi mới.
Citations:
[1] https://venturebeat.com/automation/hugging-face-launches-lerobot-open-source-robotics-code-library/
- Intrinsic, một công ty con của Alphabet, đã công bố việc tích hợp các sản phẩm của Nvidia vào nền tảng ứng dụng robot Flowstate tại sự kiện Automate ở Chicago.
- Các sản phẩm từ Nvidia bao gồm Isaac Manipulator, một bộ mô hình cơ bản được thiết kế để tạo lập luồng công việc cho cánh tay robot, đã được ra mắt tại GTC vào tháng 3.
- Danh sách các đối tác công nghiệp lớn đã tham gia bao gồm Yaskawa, Solomon, PickNik Robotics, Ready Robotics, Franka Robotics và Universal Robots.
- Sự hợp tác tập trung vào khả năng nắm bắt (chụp và nhấc các vật thể), một trong những chức năng chính cho tự động hóa sản xuất và hoàn thiện.
- Các hệ thống được huấn luyện trên các bộ dữ liệu lớn với mục tiêu thực hiện các nhiệm vụ hoạt động trên nhiều loại phần cứng và với các đối tượng khác nhau.
- Wendy Tan White, người sáng lập và CEO của Intrinsic, cho biết trong tương lai, các nhà phát triển có thể sử dụng các kỹ năng nắm bắt chung sẵn có để tăng tốc độ quy trình lập trình của họ.
- Các bài kiểm tra ban đầu của Flowstate được thực hiện trong Isaac Sim, nền tảng mô phỏng robot của Nvidia. Khách hàng của Intrinsic, Trumpf Machine Tools, đã làm việc với một nguyên mẫu của hệ thống.
- Intrinsic cũng đang hợp tác với DeepMind, cũng thuộc sở hữu của Alphabet, để giải quyết ước lượng tư thế và lập kế hoạch đường đi, hai khía cạnh quan trọng khác của tự động hóa.
- Hệ thống được huấn luyện trên hơn 130.000 đối tượng, có khả năng xác định hướng của các vật thể trong "vài giây".
- Một phần quan trọng khác của công việc của Intrinsic với DeepMind là khả năng vận hành nhiều robot cùng một lúc, với hiệu suất cao hơn ~25% so với một số phương pháp truyền thống.
📌 Intrinsic, một phần của Alphabet, đã tích hợp công nghệ của Nvidia vào nền tảng Flowstate, đánh dấu một bước tiến quan trọng trong tự động hóa công nghiệp. Sự hợp tác này không chỉ mở rộng khả năng của robot trong việc nắm bắt và xử lý các vật thể mà còn giảm chi phí phát triển và tăng tính linh hoạt cho người dùng cuối.
https://techcrunch.com/2024/05/06/alphabet-owned-intrinsic-incorporates-nvidia-tech-into-robotics-platform/
- Sự phát triển của robot hình người đang tăng tốc ở cả Trung Quốc và Mỹ, được thúc đẩy bởi những tiến bộ trong trí tuệ nhân tạo.
- Trung Quốc coi robot hình người là một "công nghệ đột phá quan trọng như sự ra đời của máy tính, điện thoại thông minh và xe năng lượng mới".
- Bộ Thông tin và Công nghệ Trung Quốc cho rằng thế giới đang ở bình minh của một cuộc cách mạng sẽ "thay đổi sâu sắc sản xuất, lối sống của con người và sự phát triển công nghiệp toàn cầu".
- Công ty UBTech của Trung Quốc, thành lập năm 2012 tại Thâm Quyến, đã cho robot hình người Walker S 1m45 đánh cồng khai trương phiên giao dịch IPO tại sàn chứng khoán Hồng Kông.
- UBTech muốn cách mạng hóa ngành công nghiệp và dịch vụ con người bằng cách đưa robot vào kỷ nguyên mới: robot hai chân nhân tạo, có khả năng tương tác với con người.
- Bắc Kinh, Thượng Hải và Thâm Quyến đều đã đưa lĩnh vực robot hình người vào các kế hoạch phát triển gần đây.
- Bắc Kinh thậm chí đã thành lập quỹ robot trị giá 10 tỷ nhân dân tệ (1,3 tỷ euro) để biến thành phố trở thành "trung tâm hàng đầu thế giới cho ngành công nghiệp robot hình người".
📌 Trung Quốc và Mỹ đang chạy đua phát triển robot hình người, với Trung Quốc đầu tư mạnh 10 tỷ nhân dân tệ để trở thành trung tâm hàng đầu, trong khi các công ty Mỹ đặt cược vào việc sử dụng rộng rãi chúng trong kho hàng và nhà máy. Bắc Kinh, Thượng Hải và Thâm Quyến đều đã đưa lĩnh vực robot hình người vào các kế hoạch phát triển gần đây. Bắc Kinh thậm chí đã thành lập quỹ robot trị giá 10 tỷ nhân dân tệ (1,3 tỷ euro) để biến thành phố trở thành "trung tâm hàng đầu thế giới cho ngành công nghiệp robot hình người".
Citations:
[1] https://worldcrunch.com/tech-science/humanoid-robots-china
- Các nhà cung cấp RPA đang tìm cách để không bị lỗi thời trong bối cảnh sự phát triển mạnh mẽ của các đại lý AI tạo sinh, nhằm giải quyết các thách thức hiện tại mà không làm ảnh hưởng đến nền tảng của họ.
- RPA và AI tạo sinh có thể tồn tại đồng thời và bổ trợ lẫn nhau, mở ra khả năng cộng tác giữa hai công nghệ này trong lĩnh vực tự động hóa doanh nghiệp.
- Các đại lý (tác nhân) AI, được hỗ trợ bởi AI tạo sinh, có khả năng thực hiện các nhiệm vụ phức tạp thông qua tương tác giống như con người trên các nền tảng phần mềm và web, ví dụ như tự động tạo lịch trình hoặc so sánh giá cả.
- OpenAI, nhà phát triển ChatGPT, đang phát triển hệ thống đại lý AI, trong khi Google đã trình làng nhiều sản phẩm tương tự tại hội nghị Cloud Next hàng năm vào tháng Tư.
- Các chuyên gia tại Boston Consulting Group dự đoán rằng các đại lý tự trị sẽ được áp dụng rộng rãi trong vòng ba đến năm năm tới.
- Mặc dù RPA có tính cứng nhắc khiến chi phí xây dựng cao và hạn chế khả năng áp dụng, 69% tổ chức đã áp dụng RPA gặp phải sự cố về quy trình tự động hóa bị hỏng ít nhất một lần mỗi tuần.
- UiPath, một trong những nhà cung cấp hàng đầu thị trường RPA với hơn 1.000 khách hàng bao gồm Uber, Xerox và CrowdStrike, gần đây đã giới thiệu các tính năng AI tạo sinh mới cho xử lý tài liệu và tin nhắn, cũng như thực hiện các hành động tự động.
- Tuy nhiên, cần lưu ý đến các hạn chế của AI tạo sinh như định kiến và ảo giác, khi nó ngày càng được sử dụng rộng rãi trong các khả năng của RPA.
📌 Các nhà cung cấp RPA đang tích cực hợp tác với AI tạo sinh để giải quyết các thách thức hiện tại và duy trì tính cạnh tranh. Với sự phát triển của các tác nhân (đại lý) AI, dự kiến sẽ có sự chuyển dịch lớn trong tự động hóa doanh nghiệp trong vòng ba đến năm năm tới. UiPath đã tiên phong trong việc tích hợp AI tạo sinh vào các sản phẩm của mình, hứa hẹn một bước tiến đáng kể trong quá trình chuyển đổi số.
Citations:
[1] https://techcrunch.com/2024/04/28/how-rpa-vendors-aim-to-remain-relevant-in-a-world-of-ai-agents/
- Các tác nhân AI tự trị đại diện cho một bước chuyển mình đáng kể trong cách thức vận hành của doanh nghiệp. Chúng có thể tự động hóa các tác vụ lặp đi lặp lại, cải thiện việc ra quyết định và tối ưu hóa quy trình làm việc.
- Khác với chatbot, các tác nhân tự trị có thể phân tích dữ liệu, lập kế hoạch hành động và thích ứng theo thời gian thực, mang lại sự chuyển đổi trong hoạt động của doanh nghiệp trên nhiều lĩnh vực.
- Trong tài chính, tác nhân AI có thể hợp lý hóa quy trình xét duyệt khoản vay, phát hiện gian lận. Trong y tế, chúng có thể cá nhân hóa phác đồ điều trị cho bệnh nhân.
- Trong sản xuất, các tác nhân AI dự đoán được sự cố thiết bị, quản lý đội robot, tối ưu hóa sản xuất.
- Các tác nhân AI cũng mang lại tiềm năng to lớn cho chính phủ. Người dân có thể tương tác với một hệ thống chính phủ lấy con người làm trung tâm, hiểu rõ nhu cầu cụ thể của từng cá nhân.
- Hệ thống có thể hướng dẫn quy trình xin giấy phép, đề xuất các biểu mẫu phù hợp cho từng dịch vụ, vượt xa khỏi công việc giấy tờ đơn thuần.
📌 Các tác nhân AI tự trị đang mở ra kỷ nguyên mới về năng suất, tự động hóa quy trình và ra quyết định thông minh cho doanh nghiệp trên nhiều lĩnh vực như tài chính, y tế, sản xuất. Chúng cũng hứa hẹn cải thiện trải nghiệm và hiệu quả phục vụ công dân của các cơ quan chính phủ.
Citations:
[1] https://www.forbes.com/sites/timothypapandreou/2024/04/27/unlocking-productivity-why-businesses-need-ai-agents-now/
- Công ty Sanctuary AI của Canada đã giới thiệu robot thế hệ thứ bảy của họ, Phoenix, tập trung chủ yếu vào phần thân trên và khả năng học hỏi.
- Phoenix khác biệt so với các thế hệ trước đây vì không tập trung phát triển chân mà chú trọng vào phần thân trên, với các chuyển động giống như con người trong các tác vụ như phân loại sản phẩm.
- Robot này có khả năng tự động hóa các tác vụ mới trong vòng dưới 24 giờ, thể hiện sự tiến bộ vượt bậc về mặt học tập so với các hệ thống trước.
- Geordie Rose, đồng sáng lập và CEO của Sanctuary AI, nhấn mạnh rằng Phoenix là hệ thống gần giống con người nhất từ trước đến nay và là bước tiến quan trọng hướng tới trí tuệ nhân tạo tổng quát.
- Trong các thử nghiệm, Phoenix đã thể hiện khả năng phân biệt và xử lý các đối tượng theo màu sắc khác nhau trong một môi trường kiểm soát.
- Sanctuary đã triển khai các hệ thống trước đó và gần đây đã công bố quan hệ đối tác với các cơ sở sản xuất ô tô của Magna, cho thấy khả năng ứng dụng thực tế của công nghệ này.
- Mặc dù các tác vụ mà Phoenix thực hiện trong các demo có vẻ đơn giản, nhưng chúng được thực hiện trong một môi trường kiểm soát và là bước đầu tiên hướng tới các ứng dụng phức tạp hơn trong tương lai.
📌 Robot người máy Phoenix của Sanctuary AI đánh dấu một bước tiến quan trọng trong công nghệ AI với khả năng học hỏi nhanh và chi phí thấp. Phoenix tập trung vào phần thân trên và có thể tự động hóa các tác vụ mới trong vòng dưới 24 giờ. Phoenix là hệ thống gần giống con người nhất từ trước đến nay và là bước tiến quan trọng hướng tới trí tuệ nhân tạo tổng quát.
Citations:
[1] https://techcrunch.com/2024/04/25/sanctuarys-new-humanoid-robot-learns-faster-and-costs-less/
- JPMorgan đã ra mắt FlowMind, một hệ thống tạo sinh quy trình làm việc tự động dựa trên công nghệ LLMs.
- FlowMind được thiết kế để cải thiện hiệu quả của Robotic Process Automation (RPA) khi đối mặt với yêu cầu người dùng không lường trước được.
- Hệ thống sử dụng công thức nhắc nhở chung cho bài giảng, kết hợp lý luận LLM với các API đáng tin cậy để giảm thiểu hiện tượng "hallucinations" trong LLMs và đảm bảo tính toàn vẹn và bảo mật dữ liệu.
- FlowMind cho phép người dùng tương tác dễ dàng hơn bằng cách cung cấp mô tả cấp cao về các quy trình làm việc tự động sinh ra, hỗ trợ kiểm tra và phản hồi hiệu quả.
- Hệ thống đã vượt trội so với phương pháp GPT-Context-Retrieval trong các thử nghiệm, ngay cả khi không có phản hồi từ người dùng.
- Nghiên cứu cũng giới thiệu NCEN-QA, một bộ dữ liệu mới trong lĩnh vực tài chính để đánh giá các nhiệm vụ trả lời câu hỏi từ các báo cáo N-CEN về quỹ.
- FlowMind hoạt động theo hai giai đoạn chính: cung cấp ngữ cảnh, API có sẵn và nhu cầu tạo sinh quy trình cho LLM; và sử dụng API để tạo sinh và thực thi quy trình làm việc, với một vòng lặp phản hồi tùy chọn cho tương tác người dùng.
- Các công trình nghiên cứu tương lai có thể khám phá việc sử dụng đám đông để thu thập phản hồi người dùng nhằm tinh chỉnh quy trình làm việc và học tập suốt đời dựa trên các ví dụ đã được người dùng chấp thuận trước đó để cải thiện hiệu suất của FlowMind theo thời gian.
- FlowMind cũng có thể được mở rộng để xử lý các thư viện API lớn bằng cách truy xuất các API phù hợp nhất cho một nhiệm vụ cụ thể dựa trên độ tương đồng của nhúng.
📌 FlowMind của JPMorgan là một bước tiến trong công nghệ tạo sinh quy trình tự động, sử dụng LLMs để cải thiện hiệu quả và bảo mật trong RPA. Hệ thống này không chỉ giảm thiểu hiện tượng hallucinations mà còn tăng cường tương tác người dùng và bảo mật dữ liệu, với khả năng mở rộng và tinh chỉnh qua thời gian.
Citations:
[1] https://analyticsindiamag.com/jpmorgan-unveils-flowmind-for-automatic-workflow-generation-with-llms/
- Trong bài phát biểu tại Intel Vision, CEO Pat Gelsinger phác thảo kịch bản AI sẽ tự động hóa toàn bộ văn phòng hoặc thậm chí cả doanh nghiệp.
- Ông mô tả đây là kỷ nguyên của các hàm AI, trong đó các đại lý AI (mô hình chuyên biệt cho từng ứng dụng) tương tác với nhau để hoàn thành nhiệm vụ.
- Gelsinger hình dung cả bộ phận sẽ trở thành giải pháp tự động hóa AI, dẫn đến sự ra đời của công ty tỷ đô chỉ với một nhân sự (Unicorn).
- Intel mong muốn phần cứng để huấn luyện và chạy các đại lý và hàm AI này sẽ do họ sản xuất.
- Intel đã cam kết đào tạo 30 triệu người làm việc với AI đến năm 2030 và tham gia liên minh các công ty công nghệ để xác định công việc nào sẽ bị loại bỏ đầu tiên bởi AI.
- Gelsinger dự đoán bước tiếp theo sẽ là sự trỗi dậy của các đại lý AI xử lý các tác vụ phức tạp hơn và tự động hóa quy trình làm việc, sau đó kết hợp chúng thành các hàm AI.
📌 CEO Intel Pat Gelsinger dự báo AI sẽ tự động hóa toàn bộ văn phòng và doanh nghiệp, tạo ra công ty tỷ đô chỉ với 1 nhân sự. Intel đang đẩy mạnh phát triển phần cứng AI và đào tạo 30 triệu người làm việc với AI đến 2030 để chuẩn bị cho kỷ nguyên của các đại lý và hàm AI.
Citations:
[1] Intel CEO predicts AI will deliver a one-person Unicorn https://www.theregister.com/2024/04/10/intel_ceo_ai_automation/
- Google DeepMind đã huấn luyện thành công những robot nhỏ bé chơi bóng đá đơn giản hóa bằng cách sử dụng deep reinforcement learning (deep RL).
- Trước đây, các thí nghiệm tương tự đã tạo ra những robot 4 chân như Boston Dynamics Spot, nhưng ít nghiên cứu hơn về robot hai chân giống người.
- Video mới cho thấy những robot này có thể rê bóng, phòng thủ và sút bóng ghi bàn linh hoạt, cho thấy deep RL là một "huấn luyện viên" giỏi cho robot hình người.
- DeepMind vốn đánh bại con người trong cờ vua, cờ vây và game Starcraft II, nhưng những chiến thuật đó không đòi hỏi chuyển động và phối hợp vật lý phức tạp.
- Các agent (tác tử) do DeepMind điều khiển đã học cách kết hợp các kỹ năng, tinh chỉnh chúng cho nhiệm vụ bóng đá đầy đủ, dự đoán và đoán trước hành vi của đối thủ.
- Chúng cũng học cách cải thiện khả năng sút và chuyền bóng, chặn cú sút, thậm chí bảo vệ khung thành bằng cách dùng cơ thể như một lá chắn.
- Nhóm nghiên cứu tin rằng sử dụng các phương pháp deep RL tương tự cho bóng đá và nhiều tác vụ khác có thể cải thiện thêm chuyển động và tương tác thời gian thực của robot hai chân.
📌 Google DeepMind đã huấn luyện thành công robot hai chân chơi bóng đá đơn giản hóa bằng deep reinforcement learning. Những robot này thể hiện khả năng rê bóng, phòng thủ, sút bóng ghi bàn linh hoạt. Nghiên cứu cho thấy tiềm năng của deep RL trong việc cải thiện chuyển động và tương tác thời gian thực của robot hình người trong tương lai.
Citations:
[1] Watch two tiny, AI-powered robots play soccer https://www.popsci.com/technology/deepmind-robot-soccer/
- Claude 3 là bộ mô hình AI mạnh mẽ của Anthropic, có thể dễ dàng tích hợp với nền tảng tự động hóa AutoGen của Microsoft.
- Để bắt đầu, hãy đăng ký tài khoản miễn phí trên trang web Claude 3, nhận 5$ tín dụng để khám phá nền tảng.
- Tạo API key trong Claude 3 và nhập vào cài đặt AutoGen để kết nối hai công cụ. Kiểm tra bằng script Python.
- AutoGen cho phép các chatbot (agent) làm việc độc lập nhưng cũng phối hợp với nhau. Nó hỗ trợ nhiều cấu hình LLM, sử dụng công cụ tự động dựa trên code.
- Kết hợp Claude 3 và AutoGen giúp tự động tạo mã nhanh chóng cho nhiều thể loại ứng dụng như game Snake, Tic Tac Toe.
- Quản lý việc sử dụng API, thiết lập máy chủ LLM cục bộ để phát triển hiệu quả hơn, ít phụ thuộc vào đám mây.
- Tận dụng tài liệu hướng dẫn của Anthropic và diễn đàn cộng đồng khi gặp vấn đề. Liên tục theo dõi, điều chỉnh cài đặt cho phù hợp.
📌 Claude 3 và AutoGen mang đến framework mạnh mẽ để tự động hóa các tác vụ coding. Bằng cách thiết lập workbench, tích hợp AutoGen, quản lý API và tối ưu môi trường phát triển cục bộ, các nhà phát triển có thể nâng cao đáng kể hiệu quả, tạo ra các ứng dụng hấp dẫn nhanh chóng.
https://www.geeky-gadgets.com/claude-3-autogen-autonomous-ai/
- AI tạo sinh không phải là hệ thống thông minh tự trị mà chỉ là sự bắt chước hành động của con người, đoán mò một cách tồi tệ trong "ảo giác AI".
- AI phụ thuộc vào năng lực tính toán, cần một lượng năng lượng khổng lồ, dẫn đến chi phí môi trường và giá năng lượng tăng.
- Đầu tư cơ sở hạ tầng tính toán cho AI rất tốn kém, có thể sử dụng vào mục đích hữu ích hơn.
- Vốn đầu tư cho AI tạo sinh tăng vọt, lên tới gần 22 tỷ USD năm 2023. Nếu bong bóng AI vỡ, số tiền này sẽ bị lãng phí.
- AI đang đe dọa nhấn chìm chúng ta bằng thư rác AI, tạo ra hậu quả khó lường từ "AI Habsburg" - AI huấn luyện dựa trên đầu ra của chính nó.
- Xã hội phải gánh chịu các tác động và chi phí từ việc thay đổi thể chế xã hội, chính trị, kinh tế để đối phó với AI tạo sinh.
- AI tạo sinh không được thiết kế để giải quyết các vấn đề xã hội thực sự. Cần chuyên gia khoa học xã hội để hiểu các thách thức tập thể và quyết định liệu AI có thể đóng góp giải pháp khả thi hay không.
📌 AI tạo sinh đang gây ra những chi phí xã hội khổng lồ từ tiêu thụ năng lượng, đầu tư cơ sở hạ tầng, vốn đổi mới đến 22 tỷ USD vào năm 2023, thư rác AI và thay đổi thể chế. Cần các chuyên gia khoa học xã hội quyết định tương lai AI tạo sinh để giải quyết các vấn đề xã hội thực sự, thay vì để doanh nghiệp và thị trường quyết định.
https://www.theglobeandmail.com/business/commentary/article-generative-artificial-intelligence-is-simply-a-waste-of-our-time-and/
- Microsoft đang thử nghiệm chatbot AI có tên "Xbox Support Virtual Agent" để tự động hóa các tác vụ hỗ trợ trên Xbox.
- Chatbot này có thể trả lời các câu hỏi và xử lý hoàn tiền trò chơi từ trang web hỗ trợ của Microsoft.
- Microsoft đã mở rộng quy mô thử nghiệm chatbot Xbox, cho thấy khả năng trong tương lai nó có thể xử lý các yêu cầu hỗ trợ cho tất cả khách hàng Xbox.
- Chatbot Xbox tương tự như những gì Microsoft khuyến khích khách hàng xây dựng để tự động hóa các tác vụ hỗ trợ thông qua Azure AI Bot Service.
- Microsoft cũng đang nỗ lực mang các tính năng và công cụ AI đến nền tảng Xbox và công cụ dành cho nhà phát triển.
- Điều này bao gồm thử nghiệm nghệ thuật và tài sản do AI tạo ra cho trò chơi, kiểm thử trò chơi bằng AI và các NPC sử dụng AI tạo sinh.
- Microsoft đang cân nhắc xây dựng Copilots hỗ trợ AI cho các tác vụ an toàn và kiểm duyệt, bao gồm kiểm duyệt nội dung trên nền tảng Xbox.
- Họ cũng đang tìm cách thêm trợ lý AI vào trò chơi, cung cấp cách để người chơi nhận trợ giúp trong khi chơi.
- Microsoft đang thận trọng trong việc công khai thừa nhận các nỗ lực AI rộng lớn hơn cho Microsoft Gaming.
- CEO Satya Nadella đang thúc đẩy tất cả các bộ phận kinh doanh của công ty suy nghĩ về cách AI có thể được sử dụng trong sản phẩm và dịch vụ.
- Microsoft gợi ý về một thế hệ Xbox tiếp theo siêu mạnh, hứa hẹn "bước nhảy vọt kỹ thuật lớn nhất mà bạn từng thấy trong một thế hệ phần cứng".
📌 Microsoft đang thử nghiệm chatbot AI trên Xbox để tự động hóa hỗ trợ khách hàng, đồng thời nỗ lực mang AI vào nền tảng Xbox và công cụ dành cho nhà phát triển. Mặc dù thận trọng, Microsoft đang hướng tới tương lai của gaming với AI, hứa hẹn những bước tiến đáng kể trong thế hệ Xbox tiếp theo.
https://www.theverge.com/2024/4/2/24118728/microsoft-xbox-ai-chatbot-testing
- Khái niệm về robot hình người đã xuất hiện từ trước cả thuật ngữ "robot", qua vở kịch R.U.R năm 1921 của Karel Čapek.
- Robot hình người đa năng là loại robot có thể nhanh chóng học các kỹ năng và thực hiện hầu hết các công việc như con người. Tuy nhiên, việc xác định khi nào một hệ thống đạt đến ngưỡng này là khó khăn.
- Các robot hình người hiện nay chủ yếu được thiết kế cho môi trường làm việc của con người (brownfield), thay vì xây dựng môi trường mới hoàn toàn tự động (greenfield).
- Việc triển khai robot hình người đang ở giai đoạn thử nghiệm. Nhiều công ty lớn như BMW, Mercedes đang hợp tác với các startup để phát triển và thử nghiệm robot hình người trong kho hàng, nhà máy.
- Trí tuệ nhân tạo tổng quát (AGI) cho robot dự kiến sẽ đạt được trong khoảng 5-10 năm tới. Robot hình người có thể đóng vai trò chuyển tiếp trước khi đạt đến mức tự động hóa hoàn toàn.
- Dù robot hình người có trở thành xu hướng chính hay không, các nghiên cứu và phát triển liên quan sẽ mang lại những đột phá trong học máy, thao tác di động và di chuyển của robot, tác động đến đời sống hàng ngày.
📌 Mặc dù còn nhiều thách thức, robot hình người đang từng bước trở thành hiện thực với sự đầu tư mạnh mẽ từ các tập đoàn lớn và startup. Các thử nghiệm gần đây cho thấy tiềm năng ứng dụng trong kho hàng, nhà máy. Dự kiến trong 5-10 năm tới, robot hình người sẽ đạt được trí tuệ nhân tạo tổng quát và trở thành bước chuyển tiếp quan trọng trước khi đạt tự động hóa hoàn toàn.
Citations:
[1]https://techcrunch.com/2024/03/27/understanding-humanoid-robots/
- Nghiên cứu mới từ MIT cho thấy mô hình ngôn ngữ lớn (LLM) có thể giúp robot gia đình tự khắc phục lỗi mà không cần sự trợ giúp của con người.
- Các lý do khiến robot gia đình ít thành công sau Roomba bao gồm: giá cả, tính thực tế, hình dạng và khả năng lập bản đồ.
- Khi robot gặp sự cố, thông thường chúng sẽ cạn kiệt các tùy chọn được lập trình sẵn trước khi cần sự can thiệp của con người.
- Nghiên cứu mới giải quyết vấn đề này bằng cách chia các bài demo thành các tập con nhỏ hơn, thay vì coi chúng là một phần của hành động liên tục.
- LLM loại bỏ yêu cầu lập trình viên phải gán nhãn và chỉ định thủ công các hành động phụ.
- Trong thử nghiệm, robot được huấn luyện để múc bi và đổ vào bát trống. Các nhà nghiên cứu cố tình gây ra lỗi nhỏ, như làm robot lệch hướng và làm rơi bi ra khỏi thìa.
- Hệ thống phản ứng bằng cách tự điều chỉnh các nhiệm vụ nhỏ, thay vì bắt đầu lại từ đầu.
- Phương pháp này giúp tránh việc robot hoàn toàn mất phương hướng khi gặp lỗi.
📌 Nghiên cứu từ MIT đã chứng minh tiềm năng của việc sử dụng mô hình ngôn ngữ lớn (LLM) để giúp robot gia đình tự khắc phục lỗi bằng cách chia nhỏ nhiệm vụ và tự điều chỉnh, thay vì cần sự can thiệp của con người, mở ra triển vọng cho sự phát triển của robot gia đình trong tương lai.
https://techcrunch.com/2024/03/25/large-language-models-can-help-home-robots-recover-from-errors-without-human-help/
- AI Agents là công cụ AI có khả năng tự động thực hiện các tác vụ phức tạp từ lời nhắc đến sản phẩm mà không cần can thiệp thêm của con người.
- Lĩnh vực này đang phát triển với tốc độ đáng kinh ngạc. Các nhà lãnh đạo cấp cao cần bắt kịp tiến độ.
- Trường hợp sử dụng đầu tiên cho AI Agents là tăng cường nhân viên thay vì thay thế họ.
- Con người vẫn có lợi thế về tính linh hoạt thích ứng và tư duy gắn kết so với AI. AI Agents sẽ được hưởng lợi từ sự hợp tác chặt chẽ với con người trong một thời gian dài.
- Cách hiệu quả nhất để hầu hết các CEO bắt đầu là bắt đầu kết hợp AI và con người thay vì chỉ dùng AI.
- Ba cách để bắt đầu ngay hôm nay: Auto-GPT, AgentGPT và ChartGPT.
- Auto-GPT có thể tự động hóa các phản hồi cho các câu hỏi thường gặp, giải phóng nhân viên để xử lý các yêu cầu phức tạp hơn.
- AgentGPT cung cấp điểm khởi đầu dễ tiếp cận hơn để tự động hóa các quy trình lặp đi lặp lại hoặc chuyên sâu về dữ liệu thông qua GPT-4.
- ChartGPT chuyên về trực quan hóa dữ liệu bằng cách chuyển đổi dữ liệu thô thành các biểu đồ và đồ thị hấp dẫn, tương tác.
📌 AI Agents hứa hẹn thay đổi cách doanh nghiệp tương tác với AI. Tuy nhiên, việc giao toàn bộ hoạt động kinh doanh cho các AI Agents tự trị vẫn chưa đến. Thay vào đó, các CEO nên ưu tiên trao quyền cho nhân viên bằng các AI Agents hàng đầu giúp họ giải quyết vấn đề của khách hàng nhanh hơn. Nếu không làm điều đó, ai đó khác sẽ làm.
https://www.forbes.com/sites/alexanderpuutio/2024/03/22/what-ceos-need-to-know-about-the-next-frontier-of-ai-ai-agents/
- Sara, robot nhân hình đầu tiên của Ả Rập Saudi, được thiết kế để tránh thảo luận về tình dục hoặc chính trị vì cô ấy là người Ả Rập.
- Elie Metri, CEO của QSS AI & Robots ở Riyadh, cho biết Sara biết mình là một cô gái 25 tuổi, cao 1m62 và mặc trang phục truyền thống Ả Rập.
- Sara nói được cả tiếng Ả Rập và tiếng Anh, sử dụng mô hình học ngôn ngữ riêng của công ty, không dựa vào thư viện nào khác, kể cả ChatGPT.
- Hệ thống pháp luật Ả Rập Saudi dựa trên luật Sharia, mặc dù gần đây đã có những nỗ lực hiện đại hóa xã hội như nới lỏng quy định về trang phục và phụ nữ lái xe. Tuy nhiên, phụ nữ vẫn có thể bị trừng phạt vì hoạt động chính trị.
- Sara thu hút sự chú ý rộng rãi sau khi xuất hiện tại các triển lãm công nghệ, làm nổi bật sự tiến bộ của Ả Rập Saudi trong lĩnh vực robot và AI.
- Đầu tháng này, một sự cố liên quan đến robot nhân hình Muhammad của công ty đã gây xôn xao khi nó dường như đưa tay chạm vào mông của một nữ phóng viên trong video.
- Trên mạng xã hội, nhiều người cáo buộc robot đã chạm vào phóng viên một cách không phù hợp. Tuy nhiên, Metri cho rằng trực tiếp tại hiện trường, robot chỉ hơi di chuyển tay và ngón tay khi nói chuyện, và vì phóng viên đứng quá gần nên nó chạm nhẹ vào áo khoác của cô ấy.
- Metri không quá bận tâm về sự cố này và cho rằng tấn công tình dục hoàn toàn khác với việc tay robot chạm vào áo khoác của phụ nữ. Ông cũng nói rằng không ai ở Trung Đông, kể cả Ả Rập Saudi, coi đây là điều xấu vì họ biết đó là robot.
📌 Sara, robot nhân hình đầu tiên của Ả Rập Saudi do QSS AI & Robots chế tạo, được lập trình để tránh các chủ đề nhạy cảm như tình dục và chính trị. Mặc dù gây chú ý với sự xuất hiện của mình, một sự cố liên quan đến robot Muhammad của công ty đã gây tranh cãi khi nó dường như chạm vào phóng viên nữ một cách không phù hợp, nhưng CEO Metri cho rằng đó chỉ là hiểu lầm.
https://www.businessinsider.com/saudi-humanoid-robot-wont-talk-about-sex-politics-creator-says-2024-3
- MetaGPT là một khung đa tác tử gán vai trò cho các tác tử khác nhau, tạo thành các thực thể hợp tác có thể làm việc cùng nhau để thực hiện các chỉ dẫn phức tạp.
- MetaGPT có thể được sử dụng độc lập từ dòng lệnh và như một thư viện trong các tập lệnh Python, cho phép linh hoạt và kiểm soát.
- Dự án bắt đầu từ tháng 4/2023, tận dụng ChatGPT và hiện có gần 40K sao trên GitHub.
- Data Interpreter là một tác tử thành viên mới của MetaGPT, chuyên đánh giá và giải quyết các tác vụ liên quan đến dữ liệu.
- Data Interpreter nhấn mạnh 3 kỹ thuật then chốt: lập kế hoạch động với cấu trúc đồ thị phân cấp, tích hợp công cụ động để nâng cao kỹ năng mã hóa và xác định sự không nhất quán logic trong phản hồi.
- So với các đường cơ sở mã nguồn mở, Data Interpreter thể hiện hiệu suất vượt trội, cải thiện đáng kể trong các tác vụ học máy (từ 0.86 lên 0.95), tăng 26% trên tập dữ liệu MATH và 112% trong các tác vụ mở.
- Deep Wisdom đã công bố nhiều ví dụ cho thấy cách sử dụng Data Interpreter cùng với khung MetaGPT hiện có, chẳng hạn như phân tích xu hướng cổ phiếu NVIDIA.
- Bài báo đầy đủ cung cấp tất cả thông tin cần thiết. Có thể tìm hiểu thêm về cài đặt và sử dụng trên kho GitHub của dự án.
📌 Data Interpreter của MetaGPT là một cải tiến đáng chú ý, thể hiện hiệu suất vượt trội so với các đường cơ sở mã nguồn mở. Nó cải thiện 26% trên tập dữ liệu MATH, 112% trong các tác vụ mở và tăng độ chính xác học máy từ 0,86 lên 0,95. Với việc bổ sung tác tử Data Interpreter, MetaGPT trở thành một dự án đáng để khám phá.
https://www.kdnuggets.com/metagpt-data-interpreter-open-source-llm-based-data-solutions
- Nvidia ra mắt Project GR00T - nền tảng AI dành cho robot hình người, quy tụ hầu hết các công ty robot hình người nổi bật hiện nay như 1X Technologies, Agility Robotics, Boston Dynamics, Sanctuary AI...
- GR00T sẽ hỗ trợ phần cứng mới Jetson Thor, máy tính được thiết kế đặc biệt để chạy mô phỏng, mô hình AI tạo sinh và nhiều tác vụ khác cho robot hình người.
- Jetson Thor tích hợp GPU thế hệ mới dựa trên kiến trúc Blackwell với công suất 800 teraflops, bộ xử lý an toàn chức năng tích hợp, cụm CPU hiệu suất cao và băng thông ethernet 100GB.
- Nvidia cũng giới thiệu Isaac Manipulator - bộ công cụ AI mô đun cho cánh tay robot với tốc độ lập kế hoạch đường đi nhanh hơn 80 lần. Các đối tác như Franka Robotics, Universal Robots, Yaskawa đã tham gia.
- Isaac Perceptor nhắm đến khả năng thị giác xung quanh 3D đa camera cho robot di động tự hành (AMR). ArcBest, BYD và KION Group đã đăng ký.
- Những năm tới sẽ chứng kiến cuộc đua thị phần thú vị giữa robot hình người và robot di động thao tác, Nvidia muốn tham gia vào tất cả các mảng này.
📌 Nvidia đang đẩy mạnh sự hiện diện trong lĩnh vực robot học với việc ra mắt nền tảng AI GR00T và phần cứng Jetson Thor cho robot hình người, cùng các công cụ Isaac Manipulator và Perceptor cho robot công nghiệp và AMR. Sự tham gia của Nvidia sẽ thúc đẩy đáng kể sự phát triển và cạnh tranh giữa các loại robot trong những năm tới.
https://techcrunch.com/2024/03/18/nvidia-enlists-humanoid-robotics-biggest-names-for-new-ai-platform-gr00t/
- Sự phát triển nhanh chóng của trí tuệ nhân tạo (AI) đã tạo ra một loại công nghệ mới: các tác nhân AI, có khả năng đưa ra quyết định và hành động hướng tới các mục tiêu cụ thể.
- Tác nhân AI khác với chatbot truyền thống ở chỗ chúng sở hữu tính tác nhân - khả năng hành động và tạo ra thay đổi trong môi trường của mình.
- Khi các mô hình ngôn ngữ lớn (LLM) như GPT-5 tiếp tục phát triển, các tác nhân AI ngày càng trở nên thông minh và có khả năng xử lý nhiều loại tác vụ.
- Để tận dụng tối đa cuộc cách mạng tác nhân AI, điều quan trọng là phải bắt đầu chuẩn bị ngay từ bây giờ bằng cách học các nguyên tắc cơ bản về phát triển tác nhân AI.
- Khi sử dụng tác nhân AI, điều quan trọng là phải chọn các tác vụ rõ ràng, đơn giản và có mục tiêu xác định rõ ràng. Tác nhân AI xuất sắc trong việc tự động hóa các tác vụ lặp đi lặp lại, tẻ nhạt mà bạn thực hiện hàng ngày.
- Để xây dựng tác nhân AI đầu tiên của mình, hãy chọn một framework phù hợp, thiết lập môi trường phát triển, xác định vai trò, mục tiêu của tác nhân, cung cấp các công cụ cần thiết và giao nhiệm vụ.
- Một trong những khía cạnh mạnh mẽ nhất của các tác nhân AI là khả năng cộng tác với nhau và với con người để giải quyết các dự án phức tạp.
- Khi các tác nhân AI trở nên tiên tiến và phổ biến hơn, điều quan trọng là phải nắm bắt tiềm năng của chúng và học cách làm việc hiệu quả cùng chúng.
📌 Các tác nhân AI đang mở ra một thế giới đầy khả năng, cho phép xây dựng hầu như bất cứ thứ gì bạn có thể tưởng tượng. Bằng cách hiểu các khả năng của tác nhân AI, chọn đúng tác vụ và học cách xây dựng, hợp tác với chúng, bạn có thể đứng ở vị trí tiên phong trong cuộc cách mạng về cách tiếp cận giải quyết vấn đề và tự động hóa tác vụ.
https://www.geeky-gadgets.com/building-ai-agents-2024/
- AutoGen, một framework đa tác tử được phát triển bởi Microsoft Research AI Frontiers, đã đạt được những bước tiến đáng kể trong cộng đồng AI kể từ khi ra mắt vào tháng 10/2022.
- AutoGen có khả năng biến đổi nhiều ngành công nghiệp bằng cách cho phép phát triển các giải pháp AI mạnh mẽ. Ví dụ, trong lĩnh vực dược phẩm, AutoGen giúp phá vỡ rào cản phân tích dữ liệu lâm sàng.
- Tính linh hoạt của AutoGen đã thu hút sự chú ý của nhiều lĩnh vực, với hàng trăm ứng dụng minh họa cho các trường hợp sử dụng đa dạng của nó.
- Trong bài kiểm tra GAIA Benchmark gần đây, AutoGen đạt độ chính xác cao nhất ở cả 3 mức độ khó, vượt qua nhiều mô hình nổi tiếng khác.
- Nhóm phát triển AutoGen đang nỗ lực giới thiệu các tính năng và cải tiến mới với tốc độ nhanh chóng, bao gồm: công cụ đánh giá, giao diện được cải thiện, AutoGen Studio, hỗ trợ máy trạng thái hữu hạn (FSM), khả năng học hỏi, tích hợp với các công nghệ mới và hỗ trợ mô hình tùy chỉnh.
- Sự thành công của AutoGen có thể được quy cho cộng đồng các nhà phát triển, nhà nghiên cứu và chuyên gia AI đam mê và tích cực. Framework này đã nhận được nhiều giải thưởng và sự công nhận.
- AutoGen đang dẫn đầu sự phát triển của AI bằng cách hạ thấp rào cản gia nhập và cung cấp các công cụ mạnh mẽ để xây dựng ứng dụng tác tử. Cam kết của framework về khả năng mở rộng, an toàn và sự tham gia của con người trong các hệ thống AI đảm bảo rằng tác động của nó sẽ được cảm nhận trên nhiều lĩnh vực và miền khác nhau.
📌 AutoGen đang cách mạng hóa cách tiếp cận phát triển AI với sự phát triển nhanh chóng, sự hỗ trợ ngày càng tăng của cộng đồng và sự cống hiến để đẩy ranh giới của AI. Khi ngày càng nhiều nhà phát triển, nhà nghiên cứu và tổ chức nắm bắt sức mạnh của AutoGen, chúng ta có thể mong đợi sự gia tăng các ứng dụng AI đột phá, biến đổi các ngành công nghiệp, giải quyết các vấn đề phức tạp và thúc đẩy đổi mới tiến lên phía trước.
https://www.geeky-gadgets.com/autogen-features/
- Brett Adcock, CEO và nhà sáng lập Figure robotics, tuyên bố năm 2024 sẽ là năm của AI thể xác.
- Robot nhân hình Figure 01 có thể thực hiện các nhiệm vụ và trò chuyện như một con người nhờ sự hợp tác giữa OpenAI và Figure.
- Các mô hình OpenAI cung cấp trí tuệ thị giác và ngôn ngữ cấp cao, trong khi các mạng nơ-ron Figure cung cấp các hành động robot khéo léo, nhanh chóng ở cấp độ thấp.
- Sự phát triển của AI đi đôi với sự phát triển của robot nhân hình đáng tin cậy.
- Figure 01 không chỉ có thể hoàn thành các nhiệm vụ nhỏ mà còn có thể trò chuyện với bạn nhờ tích hợp ChatGPT.
- Adcock mong muốn đưa Figure trở thành một robot "thể xác" hoàn chỉnh, có thể thực hiện các nhiệm vụ cấp thấp và trò chuyện với con người.
- Sam Altman, giám đốc OpenAI, lạc quan về tương lai của ngành robot với sự xuất hiện của các nền tảng phần cứng mới thú vị.
- Tầm nhìn của Adcock về robot khác với khả năng của Optimus của Tesla hay Atlas của Boston Dynamics.
- Robot nhân hình H1 do Unitree Robotics của Trung Quốc phát triển gần đây đạt tốc độ đi bộ 11,9 km/h và tuyên bố đạt tốc độ 17,7 km/h.
📌 Figure 01, robot nhân hình được tạo ra từ sự hợp tác giữa OpenAI và Figure, đánh dấu bước tiến quan trọng trong lĩnh vực AI thể xác. Với khả năng thực hiện nhiệm vụ và trò chuyện như người thật, Figure 01 hứa hẹn mang đến một tương lai đầy hứng khởi cho ngành robot, vượt trội hơn các đối thủ như Optimus của Tesla hay Atlas của Boston Dynamics.
https://analyticsindiamag.com/2024-is-the-year-of-embodied-ai/
Dưới đây là tóm tắt nội dung URL bạn cung cấp:
- Robo-adviser đang dân chủ hóa việc đầu tư, giúp mọi người tiếp cận với các công cụ và chiến lược đầu tư chuyên nghiệp.
- Khảo sát cho thấy 31% gen Z và 20% millennials đang sử dụng robo-adviser. 63% người tiêu dùng Mỹ sẵn sàng sử dụng robo-adviser để quản lý đầu tư.
- Dự báo tài sản do robo-adviser quản lý sẽ đạt 1.8 nghìn tỷ USD toàn cầu vào năm 2024.
- AI có thể điều chỉnh lời khuyên đầu tư theo sở thích cá nhân, như ưu tiên đầu tư có trách nhiệm với môi trường, xã hội và quản trị (ESG).
- Robo-adviser cung cấp các tính năng như giảm yêu cầu tối thiểu tài khoản đầu tư, phí thấp hơn, thu hoạch lỗ thuế và cân bằng lại danh mục định kỳ.
- Quỹ đầu tư sử dụng thuật toán AI để phân tích dữ liệu thị trường, xác định tài sản lý tưởng, điều chỉnh danh mục theo thời gian thực và quản lý rủi ro.
- Mối lo ngại chính là việc tiếp cận dễ dàng với công cụ đầu tư tiên tiến có thể khiến một số người đánh giá quá cao khả năng và chấp nhận quá nhiều rủi ro tài chính.
- Sự phát triển của robo-adviser đã vượt qua việc thực thi luật và quy định, có thể khiến nhà đầu tư gặp rủi ro và thiếu bảo vệ pháp lý.
📌 Robo-adviser đang thay đổi cách thức đầu tư, giúp dân chủ hóa lĩnh vực này. Tuy nhiên, việc sử dụng AI trong đầu tư cũng tiềm ẩn những rủi ro như đánh giá sai năng lực và thiếu bảo vệ pháp lý. Tương lai nằm ở mô hình lai, kết hợp sự chính xác và hiệu quả của AI với kinh nghiệm và giám sát của con người.
https://phys.org/news/2024-03-robo-pros-cons-ai-investing.html
• Covariant, một spinoff từ OpenAI, đã giải quyết vấn đề thiếu dữ liệu trong lĩnh vực robot bằng cách phát triển mô hình AI RFM-1, kết hợp kỹ năng suy luận của mô hình ngôn ngữ lớn và khéo léo vật lý của robot tiên tiến.
• Mô hình RFM-1 được huấn luyện trên dữ liệu thu thập từ một đội hình nhỏ các robot chọn hàng của Covariant, được sử dụng bởi các khách hàng như Crate & Barrel và Bonprix tại các kho hàng trên toàn thế giới, cùng với dữ liệu từ internet.
• Covariant dự định phát hành mô hình này cho khách hàng trong những tháng tới, với hy vọng hệ thống sẽ trở nên mạnh mẽ và hiệu quả hơn khi được triển khai trong thế giới thực.
• Trong một buổi trình diễn, Covariant đã cho thấy khả năng của mô hình khi xử lý 5 loại đầu vào khác nhau: văn bản, hình ảnh, video, hướng dẫn robot và đo lường.
• Mô hình có thể tạo ra hình ảnh hoặc video mô tả quá trình thực hiện nhiệm vụ, và thậm chí đưa ra phản hồi nếu dự đoán không thể nắm bắt vật phẩm một cách chính xác.
• Covariant nhấn mạnh sự tiến bộ trong việc giáo dục robot thích ứng với môi trường thông qua dữ liệu huấn luyện thay vì mã hóa cụ thể cho từng nhiệm vụ.
• Các nhà nghiên cứu tại Covariant hy vọng mô hình RFM-1 sẽ tiếp tục học hỏi và tinh chỉnh, với mục tiêu cuối cùng là robot sẽ tự huấn luyện trên video do chính mô hình tạo ra.
📌 Covariant, một spinoff từ OpenAI, đã phát triển mô hình AI RFM-1, đánh dấu bước tiến quan trọng trong việc giúp robot học các nhiệm vụ giống như con người. Mô hình này kết hợp kỹ năng suy luận và khéo léo vật lý, được huấn luyện trên dữ liệu phong phú từ robot chọn hàng và internet. Covariant hướng tới việc triển khai mô hình này trong thực tế, mở ra triển vọng mới cho ngành công nghiệp robot.
https://www.technologyreview.com/2024/03/11/1089653/an-openai-spinoff-has-built-an-ai-model-that-helps-robots-learn-tasks-like-humans/
#MIT
- OpenAI và 1X Robotics đã hợp tác để tạo ra robot EVE, một robot hoàn toàn tự động có thể hoạt động mà không cần sự hướng dẫn của con người.
- Robot EVE độc đáo vì có khả năng tự sạc, cho phép nó hoạt động trong thời gian dài mà không bị gián đoạn.
- Khả năng phản ứng với môi trường theo thời gian thực của EVE là một đặc điểm nổi bật so với các mô hình trước đó.
- Một loại kỹ sư phần mềm mới, được gọi là "Kỹ sư Phần mềm 2.0", đang xuất hiện để làm việc với những robot tiên tiến này. Những kỹ sư này đào tạo mạng nơ-ron của robot bằng dữ liệu, thay vì viết mã truyền thống.
- Sự hợp tác giữa 1X Robotics và OpenAI để tạo ra robot EVE là một bước tiến đáng chú ý hướng tới trí tuệ nhân tạo tiên tiến hơn.
📌 Robot tự động EVE, sản phẩm của sự hợp tác giữa OpenAI và 1X Robotics, đánh dấu một bước tiến mới trong ngành công nghiệp robot. Với khả năng hoạt động độc lập, tự sạc và phản ứng với môi trường theo thời gian thực, EVE không chỉ mở ra triển vọng mới cho ngành công nghiệp robot mà còn tạo ra cơ hội việc làm mới trong lĩnh vực robot học. Đặc biệt, sự xuất hiện của "Kỹ sư Phần mềm 2.0", những người đào tạo mạng nơ-ron của robot bằng dữ liệu, cho thấy một hướng đi mới trong phát triển phần mềm.
Citations:
[1] https://www.geeky-gadgets.com/autonomous-robots/
📌 Với vòng tài trợ series B trị giá 100 triệu USD từ các nhà đầu tư lớn như Samsung và sự hỗ trợ từ OpenAI, 1X Technologies đặt mục tiêu đưa robot android NEO ra thị trường, hướng đến việc robot humanoid sẽ làm việc cùng con người. Tổng vốn huy động gần đạt 137 triệu USD, 1X mong muốn mở rộng hỗ trợ khách hàng doanh nghiệp và phát triển chiến lược AI trong hoạt động vật lý.
📌 Robot Aloha của Google DeepMind, có giá 7.000 USD , không chỉ thể hiện khả năng nấu nướng mà còn có thể học hỏi các công thức mới và thực hiện những công việc dọn dẹp nhà cửa. Với việc di chuyển nhanh như người và khả năng nâng đỡ vật nặng, Aloha mở ra một chương mới cho ngành robot hỗ trợ gia đình, đánh dấu bước tiến trong AI và robot học.