- Microsoft Research vừa phát hành Magentic-One, một hệ thống AI đa tác tử tổng quát có khả năng giải quyết các tác vụ mở trong nhiều lĩnh vực
- Magentic-One được phát hành dưới dạng công cụ nguồn mở trên nền tảng Microsoft AutoGen, nhằm hỗ trợ các nhà phát triển và nghiên cứu tạo ra ứng dụng tự động xử lý các tác vụ phức tạp
- Kiến trúc đa tác tử của Magentic-One bao gồm:
+ Tác tử điều phối chính
+ WebSurfer cho điều hướng web
+ FileSurfer cho quản lý file
+ Coder cho lập trình
+ ComputerTerminal cho thực thi mã
- Hệ thống có tính linh hoạt và mở rộng cao:
+ Cho phép thêm/bớt tác tử mà không ảnh hưởng cấu trúc cốt lõi
+ Hỗ trợ tích hợp các mô hình ngôn ngữ lớn (LLM) và nhỏ (SLM)
+ Đã thử nghiệm với GPT-4 và OpenAI o1-preview
- Microsoft giới thiệu AutoGenBench để đánh giá hiệu suất trên các benchmark:
+ GAIA
+ AssistantBench
+ WebArena
- Các framework đa tác tử nguồn mở khác cũng được phát hành gần đây:
+ OpenAI với Swarm
+ IBM với Bee Agent Framework (phiên bản alpha)
+ Bee Agent tương thích với IBM Granite và Llama 3.2
📌 Magentic-One là nền tảng AI đa tác tử nguồn mở của Microsoft với kiến trúc module linh hoạt, cho phép xử lý đa dạng tác vụ từ duyệt web đến lập trình. Hệ thống đạt hiệu suất cạnh tranh trên các benchmark quan trọng và hỗ trợ tích hợp nhiều mô hình ngôn ngữ khác nhau.
https://analyticsindiamag.com/ai-news-updates/microsoft-launches-magentic-one-an-open-source-multi-agent-ai-platform/
- OpenAI tổ chức sự kiện DevDay đầu tiên tại London, với sự tham gia của Olivier Godement (trưởng sản phẩm) và Romain Huet (trưởng trải nghiệm nhà phát triển)
- Công ty vừa công bố cập nhật cho nền tảng Realtime API:
+ Thêm tính năng giọng nói mới
+ Cho phép nhà phát triển tạo prompt nhanh hơn
+ Ra mắt tính năng tìm kiếm internet cho ChatGPT
- 2 thách thức chính để phát triển AI agent:
1. Khả năng lập luận:
+ Cần tin cậy để hoàn thành nhiệm vụ phức tạp
+ OpenAI đã giới thiệu tính năng "reasoning" trong mô hình o1
+ Sử dụng học tăng cường để xử lý thông tin theo "chuỗi suy nghĩ"
+ Mô hình cần đáng tin cậy, nhanh và rẻ hơn
2. Khả năng kết nối công cụ:
+ AI cần truy cập internet để cập nhật thông tin
+ Cần thực hiện được các hành động trong thế giới thực
+ Đối thủ Anthropic đã cho phép chatbot Claude tương tác với giao diện máy tính
- Dự báo tương lai:
+ Trong vài năm tới, mỗi người và doanh nghiệp sẽ có AI agent riêng
+ AI agent sẽ truy cập email, ứng dụng và lịch của người dùng
+ Hoạt động như trợ lý cá nhân thông minh
+ Năm tới sẽ tăng ứng dụng AI trong hỗ trợ khách hàng
📌 OpenAI đang tiến tới mục tiêu xây dựng AI agent toàn diện thông qua 2 bước đột phá: nâng cao khả năng lập luận và kết nối đa công cụ. Tính năng tìm kiếm mới của ChatGPT là bước đi quan trọng, mở đường cho việc phát triển trợ lý AI có thể hoàn thành chuỗi nhiệm vụ phức tạp trong tương lai.
https://www.technologyreview.com/2024/11/05/1106603/how-chatgpt-search-paves-the-way-for-ai-agents/
#MIT
- Các hạn chế chính của LLM bao gồm:
+ Kiến thức bị giới hạn dù được huấn luyện trên dữ liệu lớn
+ Khả năng suy luận còn hạn chế
+ Không thể cập nhật thông tin thời gian thực
- Một tác tử AI bao gồm 4 thành phần chính:
+ Công cụ để truy cập thông tin từ internet, cơ sở dữ liệu và API
+ Bộ nhớ ngắn hạn và dài hạn để lưu trữ kết quả
+ Bộ suy luận để chia nhỏ tác vụ phức tạp
+ Khả năng thực hiện hành động dựa trên môi trường
- Ưu điểm của hệ thống đa tác tử:
+ Xử lý tốt các tác vụ phức tạp thông qua đóng vai
+ Mỗi tác tử tập trung vào một mục tiêu cụ thể
+ Giảm thiểu ảo giác bằng cách định nghĩa rõ vai trò
- Thách thức khi triển khai thực tế:
+ Khó khăn trong quản lý khi số lượng tác tử tăng lên
+ Độ trễ do cần nhiều lần gọi LLM
+ Hiệu suất không ổn định do bản chất xác suất của LLM
+ Cần có sự giám sát của con người trong các bước quan trọng
📌 AI đa tác tử đang thu hẹp khoảng cách giữa LLM và AGI bằng cách kết hợp nhiều tác tử chuyên biệt. Framework như CrewAI và Autogen cho phép xử lý công việc tự động với độ chính xác cao hơn, tuy nhiên vẫn cần sự giám sát của con người trong các quyết định quan trọng.
https://venturebeat.com/ai/why-multi-agent-ai-conquers-complexities-llms-cant/
- Meta vừa công bố nhiều công cụ AI quan trọng cho robot và hệ thống AI thể hiện, bao gồm các tiêu chuẩn và công cụ giúp hiểu và tương tác tốt hơn với thế giới vật lý.
- Sparsh - một họ mô hình mã hóa cho cảm biến xúc giác dựa trên thị giác, được phát triển cùng với Đại học Washington và Carnegie Mellon. Mô hình này đã được huấn luyện trên hơn 460.000 hình ảnh xúc giác và đạt cải thiện trung bình 95,1% so với các mô hình trước đây.
- Digit 360 là cảm biến xúc giác hình dạng ngón tay nhân tạo với hơn 18 tính năng cảm biến. Cảm biến có hơn 8 triệu điểm cảm biến để ghi nhận biến dạng đa hướng trên bề mặt đầu ngón tay.
- Digit Plexus là nền tảng phần cứng-phần mềm giúp phát triển ứng dụng robot. Nền tảng này có thể tích hợp nhiều cảm biến xúc giác đầu ngón tay và da lên một bàn tay robot.
- Meta sẽ sản xuất Digit 360 cùng với GelSight Inc và hợp tác với Wonik Robotics để phát triển bàn tay robot tích hợp đầy đủ cảm biến xúc giác trên nền tảng Digit Plexus.
- PARTNR là tiêu chuẩn đánh giá hiệu quả của mô hình AI khi cộng tác với con người trong các công việc gia đình. Tiêu chuẩn này bao gồm 100.000 tác vụ ngôn ngữ tự nhiên trong 60 ngôi nhà với hơn 5.800 vật thể độc đáo.
📌 Meta đã tạo bước đột phá trong công nghệ robot với cảm biến Digit 360 có 8 triệu điểm cảm biến, mô hình Sparsh cải thiện 95,1% hiệu suất và nền tảng PARTNR với 100.000 tác vụ thử nghiệm. Các công nghệ này hứa hẹn mang lại khả năng tương tác tự nhiên giữa robot và con người.
https://venturebeat.com/ai/meta-unveils-ai-tools-to-give-robots-a-human-touch-in-physical-world/
• Microsoft vừa công bố Windows Agent Arena - nền tảng benchmark mới để kiểm thử AI agent trong môi trường Windows thực tế
• Nền tảng này cho phép thử nghiệm AI agent trên nhiều ứng dụng Windows như Microsoft Edge, Paint, Clock, VLC media player
• Microsoft Research phát triển AI agent đa phương thức tên Navi để khám phá khả năng của framework
• Kết quả benchmark cho thấy tỷ lệ thành công trung bình của AI agent chỉ đạt 19,5% so với hiệu suất trung bình của con người là 74,5%
• Nền tảng này được phát triển dựa trên framework OSWorld với hơn 150 tác vụ Windows đa dạng
• Windows Agent Arena là dự án nguồn mở, sử dụng các mô hình từ OpenAI như GPT-4V và Microsoft Phi3
• Salesforce CEO Marc Benioff chỉ trích Microsoft Copilot là "Clippy 2.0" và cho rằng Microsoft thiếu dữ liệu và mô hình bảo mật doanh nghiệp
• Các mối quan ngại chính về bảo mật và quyền riêng tư khi AI agent ngày càng tinh vi và có quyền truy cập nhiều ứng dụng chứa thông tin cá nhân
• Microsoft cam kết ưu tiên đạo đức AI, đặt quyền riêng tư và an toàn lên hàng đầu
• Anthropic cũng vừa ra mắt API "Computer Use" cho phép Claude sử dụng máy tính như người thật
📌 Microsoft phát triển Windows Agent Arena để thử nghiệm AI agent trên Windows với 150 tác vụ tự động. Hiệu suất AI chỉ đạt 19,5% so với con người (74,5%). Dự án nguồn mở này đối mặt thách thức về bảo mật và quyền riêng tư khi AI ngày càng tinh vi.
https://www.windowscentral.com/software-apps/microsofts-windows-agent-arena-brings-ai-assistants-keyboard-deep-to-windows-pcs-but-there-are-concerns
• Google đang phát triển dự án mật có tên "Project Jarvis" - một hệ thống AI Agent có khả năng điều khiển trình duyệt web để thực hiện các tác vụ thay người dùng
• Theo The Information, dự án này dự kiến sẽ được giới thiệu vào tháng 12/2024, dựa trên thông tin từ 3 nguồn tin nội bộ
• Project Jarvis được xây dựng dựa trên phiên bản nâng cấp của mô hình AI Gemini, được tối ưu hóa đặc biệt cho trình duyệt Chrome
• Hệ thống có khả năng:
- Thu thập thông tin nghiên cứu
- Thực hiện mua sắm trực tuyến
- Đặt vé máy bay
- Tự động hóa các tác vụ web hàng ngày
• Cơ chế hoạt động của Jarvis:
- Chụp và phân tích ảnh màn hình
- Tự động nhấp chuột vào các nút
- Nhập văn bản theo yêu cầu
- Mỗi hành động mất vài giây để xử lý
• Các đối thủ cạnh tranh cũng đang phát triển công nghệ tương tự:
- Microsoft với Copilot Vision
- Apple Intelligence
- Anthropic với Claude
- OpenAI đang nghiên cứu phiên bản riêng
• Google dự kiến sẽ thử nghiệm Jarvis với một số lượng nhỏ người dùng để phát hiện và khắc phục lỗi
📌 Google chuẩn bị tham gia cuộc đua AI Agent với Project Jarvis, dự kiến ra mắt tháng 12/2024. Hệ thống có thể tự động thực hiện các tác vụ web phức tạp như đặt vé máy bay, mua sắm thông qua việc điều khiển trình duyệt Chrome, mỗi thao tác mất vài giây xử lý.
https://www.theverge.com/2024/10/26/24280431/google-project-jarvis-ai-system-computer-using-agent
• ServiceNow đề xuất triển khai AI agent như những công cụ hoạt động ngầm để tránh gây áp lực cho nhân viên phải học cách sử dụng
• Dorit Zilbershot, phó chủ tịch AI và đổi mới tại ServiceNow khẳng định nhân viên không cần biết có bao nhiêu AI agent đang hoạt động ngầm
• Nền tảng Now Assist của ServiceNow là sản phẩm tăng trưởng nhanh nhất của công ty, ra mắt thư viện AI agent cho khách hàng vào tháng 9/2024
• AI agent có thể tự động hóa nhiều quy trình như:
- Mã hóa thông tin khách hàng
- Phân loại dữ liệu
- Thông báo thay đổi trạng thái cho nhân viên
• CEO Bill McDermott xác nhận AI tạo sinh, đặc biệt là các ứng dụng liên quan đến agent, đã phát triển vượt kỳ vọng
• ServiceNow nhấn mạnh sự khác biệt giữa agent và assistant để tránh tạo kỳ vọng sai lệch về việc người dùng phải học cách tương tác
• Công ty triển khai orchestrator agent để quản lý hệ sinh thái AI agent ngày càng mở rộng
• ServiceNow hợp tác với Nvidia:
- Sử dụng NIM Agent Blueprint để xây dựng AI agent có sẵn
- Agent đầu tiên là Vulnerability Analysis for Container Security AI Agent
- Dự kiến ra mắt vào năm 2025
📌 ServiceNow định hình lại cách tiếp cận AI trong doanh nghiệp thông qua mô hình AI agent "vô hình". Now Assist trở thành sản phẩm tăng trưởng nhanh nhất, với việc hợp tác cùng Nvidia để mở rộng hệ sinh thái agent vào năm 2025.
https://venturebeat.com/ai/servicenow-advocates-for-invisible-ai-agents-to-ease-worker-adoption/
- Microsoft vừa công bố bộ agent AI tự động mới cho nền tảng Dynamics 365, nhằm tăng cường tự động hóa trong các bộ phận bán hàng, tài chính, dịch vụ và chuỗi cung ứng.
- Các agent AI này sẽ được ra mắt dưới dạng thử nghiệm công khai vào tháng tới, với khả năng xử lý ngữ cảnh và ý định để đưa ra quyết định phức tạp, vượt trội so với các chatbot thông thường.
- Microsoft khẳng định các agent này không thay thế con người mà hỗ trợ mở rộng năng lực của nhân viên. “Agent giúp con người làm được những điều mà trước đây không thể làm,” Bryan Goode, Phó Chủ tịch Microsoft, nhấn mạnh.
- Động thái này diễn ra sau khi Salesforce ra mắt Agentforce – nền tảng AI của riêng họ, được CEO Marc Benioff quảng bá mạnh mẽ và chỉ trích Microsoft Copilot là "Clippy 2.0" vì kém hiệu quả.
- Microsoft tận dụng sức mạnh từ các công cụ quen thuộc như Microsoft 365 và Azure, trong khi Salesforce dựa vào chuyên môn CRM và Data Cloud để phát triển các agent AI tối ưu hóa mối quan hệ khách hàng.
- Cuộc cạnh tranh này đánh dấu bước ngoặt lớn khi các agent AI đang trở thành công cụ cốt lõi trong phần mềm doanh nghiệp, hứa hẹn định hình lại tương lai của công việc và cấu trúc tổ chức.
- Tuy nhiên, cả hai công ty phải đối mặt với thách thức về quyền riêng tư dữ liệu, minh bạch trong quyết định của AI, và lo ngại về việc mất việc làm do tự động hóa. Thành công của các nền tảng này phụ thuộc vào khả năng cân bằng giữa giá trị kinh doanh và sự minh bạch trong triển khai.
📌 Microsoft và Salesforce đang dẫn đầu trong cuộc cách mạng AI doanh nghiệp, mỗi bên với chiến lược riêng. Cuộc chiến này không chỉ định hình lại phần mềm doanh nghiệp mà còn mở ra những thay đổi lớn trong cách tổ chức và vận hành công việc.
https://venturebeat.com/ai/microsofts-new-ai-agents-set-to-shake-up-enterprise-software-sparking-new-battle-with-salesforce/
- Thế hệ thứ ba của AI đang diễn ra với sự phát triển mạnh mẽ của các tác nhân AI, tự động và thông minh.
- Thị trường cho các tác nhân AI hiện nay khoảng 5.1 tỷ USD và dự kiến sẽ đạt 47.1 tỷ USD vào năm 2030 (tăng trưởng hàng năm 44.8%).
- Salesforce đã giới thiệu “AgentForce”, bộ công cụ cho phép xây dựng nhanh các tác nhân AI để tạo ra lực lượng lao động hybrid.
- Oracle cũng công bố hơn 50 tác nhân AI mới cho Oracle Fusion Cloud.
- Ngành an ninh mạng đang đối mặt với tình trạng thiếu hụt nhân lực nghiêm trọng, với khoảng 5.5 triệu vị trí còn thiếu trên toàn cầu.
- Các cuộc tấn công mạng ngày càng gia tăng về số lượng và độ phức tạp, bao gồm ransomware và phishing.
- Các tác nhân AI trong an ninh mạng có khả năng tự động hóa các nhiệm vụ lặp đi lặp lại và phát hiện mối đe dọa theo thời gian thực.
- Tác nhân AI có thể học hỏi từ môi trường và thích ứng với các mối đe dọa mới mà không cần sự can thiệp liên tục của con người.
- Việc xây dựng đường dẫn dữ liệu đám mây là cần thiết để cải thiện khả năng học máy và trí tuệ trong an ninh mạng.
- Tác nhân AI có thể giám sát cơ sở hạ tầng sạc xe điện (EV) và phát hiện các bất thường trong hành vi sạc hoặc lưu lượng năng lượng.
- Công nghệ mô hình hành động lớn (LAM) đang được áp dụng để tạo ra trí tuệ hành động cho các tác nhân AI.
- Sự chuyển mình từ hệ thống chuyên gia sang những thực thể thông minh hơn sẽ cho phép tác nhân AI dự đoán và phản ứng với các mối đe dọa phức tạp.
📌 Tác nhân AI đang trở thành giải pháp quan trọng trong an ninh mạng khi đối mặt với tình trạng thiếu hụt nhân lực. Dự báo thị trường sẽ đạt 47.1 tỷ USD vào năm 2030, với khả năng tự động hóa và học hỏi từ môi trường.
https://www.forbes.com/councils/forbestechcouncil/2024/10/22/the-evolution-of-ai-agents-in-the-third-wave-of-ai/
• CrewAI, startup thành lập năm 2023, vừa ra mắt sản phẩm đầu tiên CrewAI Enterprise cho phép người dùng xây dựng và triển khai các đội ngũ AI agent
• Thị trường AI agent dự kiến tăng từ 5 tỷ USD năm 2024 lên gần 50 tỷ USD vào năm 2030
• Theo Capgemini, 10% doanh nghiệp lớn đã sử dụng AI agent, 50% có kế hoạch triển khai trong năm tới và 82% sẽ áp dụng trong 3 năm tới
• Nền tảng mới của CrewAI được xây dựng trên framework nguồn mở, cho phép tổ chức:
- Xây dựng đội ngũ AI agent sử dụng bất kỳ LLM hoặc nền tảng đám mây nào
- Triển khai an toàn với các mức kiểm soát tùy chỉnh
- Theo dõi ROI với công cụ kiểm thử và đào tạo
• Các trường hợp sử dụng phổ biến:
- Tự động hóa quy trình nội bộ
- Marketing và phát triển code
- Nghiên cứu, tổng hợp và báo cáo
- Phân tích pháp lý
- Cập nhật và kiểm thử code tự động
- Phát triển leads và tư vấn trong lĩnh vực bất động sản
- Xử lý yêu cầu nội bộ theo quy tắc cụ thể
- Biên tập video và đăng tải lên mạng xã hội
• Thành tích ấn tượng:
- Thực thi hơn 10 triệu AI agent mỗi tháng
- Được sử dụng bởi gần 50% công ty Fortune 500
- Thu hút 150 khách hàng doanh nghiệp beta trong chưa đầy 6 tháng
- Gọi vốn 18 triệu USD từ các nhà đầu tư hàng đầu
📌 CrewAI đang dẫn đầu làn sóng AI agent với framework nguồn mở được 50% Fortune 500 sử dụng, thực thi 10 triệu agent/tháng. Startup này vừa huy động 18 triệu USD và ra mắt nền tảng doanh nghiệp mới, hứa hẹn đưa thị trường AI agent đạt 50 tỷ USD vào 2030.
https://venturebeat.com/ai/crewai-launches-its-first-multi-agent-builder-speeding-the-way-to-agentic-ai/
• Gartner dự đoán đến năm 2028, ít nhất 15% quyết định công việc hàng ngày sẽ được thực hiện tự động thông qua AI tạo sinh (tăng từ 0% năm 2024).
• AI agent được xem là một trong những xu hướng công nghệ chiến lược hàng đầu trong năm 2025.
• Các trường hợp sử dụng cơ bản của AI agent bao gồm các tác vụ đơn điệu tốn thời gian và năng lượng của con người.
• AI tạo sinh có khả năng lập kế hoạch, cảm nhận và hành động, có thể tự động giám sát và quản lý hệ thống.
• Trong tương lai, AI agent có thể giúp nâng cao kỹ năng của lực lượng lao động bằng cách đóng vai trò cố vấn cho nhân viên mới.
• Nền tảng quản trị AI sẽ giúp các tổ chức quản lý hiệu suất pháp lý, đạo đức và hoạt động của hệ thống AI của họ.
• Các công cụ mới sẽ tạo, quản lý và thực thi các chính sách để đảm bảo AI minh bạch và được sử dụng có trách nhiệm.
• Gartner dự đoán 7 mô hình tính toán sẽ xuất hiện trong tương lai gần, bao gồm CPU, GPU, biên, mạch tích hợp chuyên dụng, hệ thống thần kinh nhân tạo, lượng tử cổ điển và tính toán quang học.
• Mô hình tính toán lai trong tương lai sẽ kết hợp các cơ chế tính toán, lưu trữ và mạng khác nhau.
• Phần mềm điều phối sẽ di chuyển việc tính toán từ mô hình này sang mô hình khác tùy thuộc vào nhiệm vụ và phương pháp phù hợp nhất.
• Bảo mật thông tin sai lệch trở nên quan trọng khi AI cho phép các tác nhân đe dọa lan truyền thông tin sai lệch nhanh hơn và dễ dàng hơn bao giờ hết.
• Đến năm 2028, Gartner dự đoán 50% doanh nghiệp sẽ bắt đầu áp dụng các sản phẩm, dịch vụ hoặc tính năng được thiết kế đặc biệt cho bảo mật thông tin sai lệch (tăng từ dưới 5% hiện nay).
• Gartner dự đoán đến năm 2029, tiến bộ trong lĩnh vực máy tính lượng tử sẽ khiến hầu hết các phương pháp mật mã bất đối xứng thông thường trở nên không an toàn.
• Các tổ chức cần chuẩn bị cho mật mã hậu lượng tử ngay bây giờ để đảm bảo dữ liệu của họ không bị giải mã.
• Gartner dự đoán sự gia tăng trong việc sử dụng giao diện não-máy hai chiều (BBMIs) để đọc và giải mã hoạt động của não và nâng cao khả năng nhận thức của con người.
• Đến năm 2030, 30% người lao động tri thức sẽ sử dụng các công nghệ như BBMIs để duy trì sự phù hợp trong môi trường làm việc được hỗ trợ bởi AI (tăng từ dưới 1% năm 2024).
📌 Gartner dự đoán sự trỗi dậy của AI agent vào năm 2025, với 15% quyết định công việc hàng ngày được thực hiện tự động thông qua AI tạo sinh vào năm 2028. Các xu hướng khác bao gồm nền tảng quản trị AI, mô hình tính toán lai, bảo mật thông tin sai lệch và mật mã hậu lượng tử, với 50% doanh nghiệp áp dụng bảo mật thông tin sai lệch vào năm 2028.
https://venturebeat.com/security/gartner-2025-will-see-the-rise-of-ai-agents-and-other-top-trends/
• Microsoft vừa công bố 10 agent AI mới cho Dynamics 365, sử dụng trong bán hàng, dịch vụ khách hàng, tài chính và chuỗi cung ứng.
• Các agent này có thể giúp doanh nghiệp tiết kiệm tới 50 triệu USD mỗi năm, tương đương với việc bổ sung 187 nhân viên toàn thời gian.
• Microsoft cũng giới thiệu tính năng mới trong Copilot Studio, cho phép lập trình viên tạo agent riêng kết nối với dữ liệu doanh nghiệp.
• 10 agent mới bao gồm: agent đánh giá khách hàng tiềm năng, agent đơn hàng bán, agent giao tiếp nhà cung cấp, agent đối chiếu tài chính, agent đối chiếu tài khoản, agent quản lý thời gian và chi phí, agent ý định khách hàng, agent quản lý kiến thức khách hàng, agent quản lý trường hợp và agent vận hành lịch trình.
• Các agent sẽ bắt đầu có sẵn ở bản xem trước công khai vào cuối năm nay và đầu năm 2025 trong Dynamics 365.
• Microsoft dự đoán mỗi tổ chức sẽ có một "chòm sao" agent, từ đơn giản đến hoàn toàn tự chủ.
• Các agent sẽ sử dụng dữ liệu từ Microsoft 365 Graph, hệ thống ghi chép, Dataverse và Fabric.
• Microsoft đã dẫn chứng các khách hàng như Clifford Chance, McKinsey & Company và Pets at Home đang sử dụng agent tự chủ để tăng doanh thu và giảm chi phí.
• Công ty cam kết có các biện pháp bảo mật nghiêm ngặt và kiểm soát quản trị dữ liệu mạnh mẽ, được quản lý trong Copilot Studio.
• Copilot Studio được tính phí dựa trên mức sử dụng, với giá 200 USD/tháng cho 25.000 tin nhắn.
• Microsoft sẽ chia sẻ thêm thông tin về Copilot Studio và Dynamics 365 tại sự kiện trực tuyến Microsoft Business Applications Launch Event vào ngày 29/10.
📌 Microsoft ra mắt 10 agent AI mới cho Dynamics 365, hứa hẹn tiết kiệm 50 triệu USD/năm cho doanh nghiệp. Các agent tự động hóa quy trình trong bán hàng, tài chính và chuỗi cung ứng, tương đương với việc bổ sung 187 nhân viên toàn thời gian.
https://www.zdnet.com/article/microsoft-introduces-ten-ai-agents-for-sales-finance-supply-chain-in-dynamics-365/#ftag=RSSbaffb68
• OpenAI vừa ra mắt Swarm, một khung mã nguồn mở thử nghiệm nhằm đơn giản hóa việc tạo và điều phối các tác nhân AI để tự động hóa tác vụ.
• Swarm tập trung vào cải thiện phối hợp và thực thi tác nhân thông qua hai khái niệm cốt lõi: tác nhân và bàn giao.
• Khung này cho phép chia nhỏ quy trình phức tạp thành các tác vụ có thể quản lý được, đảm bảo mỗi tác nhân được trang bị công cụ và hướng dẫn cần thiết để hoàn thành công việc hiệu quả.
• Swarm được thiết kế là một khung nhẹ, có thể kiểm soát và kiểm thử được, lý tưởng để phát triển các tác nhân AI tinh vi.
• Kiến trúc của Swarm ưu tiên điều phối và thực thi tác vụ liền mạch, dựa trên hai trụ cột cơ bản: tác nhân (được trang bị hướng dẫn và công cụ cụ thể) và bàn giao (đảm bảo chuyển giao suôn sẻ giữa các tác nhân).
• Swarm xuất sắc trong việc quản lý và chuyển giao tác vụ giữa các tác nhân với độ chính xác và linh hoạt cao.
• Một điểm mạnh chính của Swarm là sử dụng các biến ngữ cảnh, cho phép khung cung cấp phản hồi được cá nhân hóa cao, thích ứng với nhu cầu và tham số độc đáo của mỗi tác vụ.
• Ứng dụng thực tế của Swarm rất đa dạng, bao gồm tạo chiến dịch tiếp thị toàn diện từ một đầu vào trang web duy nhất.
• Swarm có thể xử lý các tác vụ phức tạp đòi hỏi hiểu biết tinh tế như dịch ngôn ngữ, hỗ trợ khách hàng nhận biết ngữ cảnh và phân tích dữ liệu.
• Để sử dụng Swarm, người dùng cần Python 3.10 trở lên. Khung này tích hợp liền mạch với API hoàn thành trò chuyện.
• Các tính năng kỹ thuật chính bao gồm kiến trúc mô-đun, quản lý bộ nhớ hiệu quả, xử lý lỗi và ghi nhật ký tích hợp, và tương thích với các thư viện AI và học máy phổ biến.
• Swarm hiện được định vị là một dự án thử nghiệm với trọng tâm mạnh mẽ về giáo dục, khuyến khích thử nghiệm và học tập.
• OpenAI tích cực khuyến khích sự tham gia của cộng đồng với Swarm bằng cách cung cấp nhiều ví dụ và tài nguyên.
• Là một dự án mã nguồn mở, Swarm chào đón đóng góp từ cộng đồng AI, thúc đẩy sự hợp tác và đổi mới.
📌 Swarm của OpenAI là khung mã nguồn mở thử nghiệm đột phá cho phép tạo và điều phối tác nhân AI dễ dàng. Với tính linh hoạt cao, Swarm có thể xử lý nhiều tác vụ phức tạp từ tiếp thị đến phân tích dữ liệu. Dự án này mở ra cơ hội học tập và đổi mới cho cộng đồng AI toàn cầu.
https://www.geeky-gadgets.com/how-openais-swarm-is-changing-the-game-for-ai-agents/
• OpenAI vừa công bố Swarm - một khung thử nghiệm AI mới nhằm đơn giản hóa việc xây dựng và điều phối các hệ thống đa tác tử phức tạp.
• Swarm tập trung vào việc làm cho quá trình phối hợp, thực thi và kiểm thử giữa các tác tử AI trở nên nhẹ nhàng và dễ kiểm soát hơn.
• Khung này đã được phát triển trong nhiều tháng và OpenAI hy vọng nó sẽ được cộng đồng AI đón nhận như một công cụ thực tế để xây dựng các hệ thống AI tiên tiến.
• Swarm dựa trên hai khái niệm cơ bản: tác tử và bàn giao. Một tác tử trong Swarm là sự kết hợp giữa các hướng dẫn cụ thể và công cụ để hoàn thành một nhiệm vụ.
• Tại bất kỳ thời điểm nào, một tác tử có thể "bàn giao" cuộc hội thoại hoặc nhiệm vụ cho một tác tử khác, giúp quá trình điều phối trở nên liền mạch và mô-đun hóa.
• Swarm được xây dựng trên nền tảng ChatCompletions, cung cấp một nền tảng mạnh mẽ và linh hoạt cho việc phát triển.
• Khung này giúp đơn giản hóa việc quản lý giao tiếp giữa các tác tử và chuyển giao trách nhiệm một cách linh hoạt.
• Cách tiếp cận nhẹ nhàng của Swarm cho phép các nhà phát triển dễ dàng lặp lại, kiểm thử và tinh chỉnh cấu hình đa tác tử mà không bị vướng bận bởi các yêu cầu cơ sở hạ tầng phức tạp.
• Swarm đặc biệt phù hợp cho các nhà nghiên cứu và phát triển muốn đảm bảo độ tin cậy và hiệu quả trong việc điều phối tác tử AI.
• Bằng cách giữ mọi thứ đơn giản, dễ kiểm soát và hiệu quả, Swarm đại diện cho một bước tiến quan trọng trong việc làm cho các hệ thống AI tiên tiến trở nên dễ tiếp cận hơn với cộng đồng phát triển rộng lớn hơn.
• Swarm có thể được cài đặt thông qua pip bằng cách sử dụng lệnh: pip install git+https://github.com/openai/swarm.git
• Việc sử dụng Swarm khá đơn giản, chỉ cần import các module cần thiết và định nghĩa các tác tử cùng với chức năng của chúng.
📌 OpenAI giới thiệu Swarm - khung thử nghiệm AI mới để xây dựng hệ thống đa tác tử. Swarm tập trung vào việc đơn giản hóa điều phối giữa các tác tử AI, dựa trên khái niệm tác tử và bàn giao. Được xây dựng trên ChatCompletions, Swarm hứa hẹn mang lại cách tiếp cận nhẹ nhàng và dễ kiểm soát cho phát triển AI tiên tiến.
https://www.marktechpost.com/2024/10/11/openai-releases-swarm-an-experimental-ai-framework-for-building-orchestrating-and-deploying-multi-agent-systems/
• Theo khảo sát của Capgemini với 1.100 lãnh đạo doanh nghiệp lớn:
- 10% tổ chức đã sử dụng AI agent
- Hơn 50% dự định sử dụng trong năm tới
- 82% có kế hoạch tích hợp trong 3 năm tới
• Lợi ích của AI agent theo khảo sát:
- 71% nói sẽ tăng tự động hóa quy trình làm việc
- 64% cho rằng sẽ cải thiện dịch vụ và sự hài lòng của khách hàng
- 57% cho rằng tiềm năng cải thiện năng suất vượt trội hơn rủi ro
• Ứng dụng lớn nhất của AI tạo sinh tự chủ là trong phát triển phần mềm (75% người được hỏi) - để tạo, đánh giá và viết lại mã
• 77% lãnh đạo lo ngại sẽ bỏ lỡ cuộc cách mạng AI nếu không triển khai sớm
• AI tự chủ sẽ định nghĩa lại tương lai công việc trong thập kỷ tới với 6 cấp độ công việc tự chủ, từ tăng cường khả năng đến thay thế hoàn toàn các nhiệm vụ, vai trò, nhóm và bộ phận kinh doanh
• Theo Gartner:
- Đến 2028, 33% ứng dụng phần mềm doanh nghiệp sẽ tích hợp AI tạo sinh tự chủ (tăng từ dưới 1% năm 2024)
- 15% quyết định công việc hàng ngày sẽ được đưa ra tự động
• Forrester xếp AI agent đứng đầu trong Top 10 công nghệ mới nổi năm 2024, định nghĩa là "Hệ thống AI tổng quát được đào tạo để hành động vô hình thay mặt doanh nghiệp hoặc cá nhân, thực hiện nhiệm vụ, ra quyết định và tương tác với dữ liệu hoặc hệ thống khác một cách tự chủ"
• AI tự chủ sẽ hoạt động với sự giám sát tối thiểu của con người, tự cải thiện và ngày càng hiệu quả trong việc ra quyết định trong môi trường phức tạp
• Các công nghệ liên quan bao gồm: hệ thống đa agent, mô hình hành động lớn, khách hàng máy, robot nhân hình làm việc, agent tự chủ và học tăng cường
📌 AI tạo sinh tự chủ đang trở thành xu hướng chủ đạo, với 82% doanh nghiệp lớn dự định tích hợp trong 3 năm tới. Nó hứa hẹn cải thiện đáng kể năng suất, tự động hóa và ra quyết định, đặc biệt trong phát triển phần mềm. Tuy nhiên, 77% lãnh đạo lo ngại bỏ lỡ cuộc cách mạng này.
https://www.zdnet.com/article/why-agentic-ai-is-the-new-electricity-and-nearly-80-of-business-leaders-are-afraid-of-the-dark/
• Nvidia vừa phát hành các plugin mới cho Unreal Engine 5 nhằm cải thiện độ chân thực của nhân vật kỹ thuật số được hỗ trợ bởi AI.
• Các plugin mới này là một phần của bộ công nghệ Nvidia Ace, bao gồm các công cụ tạo giọng nói, trí thông minh và hoạt hình được hỗ trợ bởi AI tạo sinh.
• Plugin Audio2Face-3D mới cho phép tạo hoạt hình khuôn mặt đồng bộ với giọng nói một cách tự động. Plugin này hiện đã có sẵn cho Autodesk Maya.
• Nemotron-Mini 4B Instruct là một plugin giúp tạo ra các phản hồi tự nhiên cho nhân vật AI.
• Plugin RAG (tạo sinh được tăng cường bởi truy xuất dữ liệu ngoài) cho phép nhà phát triển xây dựng cơ sở dữ liệu ngữ cảnh cho IP của họ, tạo ra các phản hồi phù hợp với độ trễ thấp.
• Các plugin này được tối ưu hóa để chạy trên Windows PC với độ trễ thấp và sử dụng ít bộ nhớ.
• Nvidia cũng phát hành một dự án mẫu Unreal Engine 5 để hướng dẫn nhà phát triển tích hợp nhân vật kỹ thuật số vào game và ứng dụng của họ.
• Plugin Audio2Face-3D cho Maya giúp đơn giản hóa quy trình tạo hoạt hình khuôn mặt chất lượng cao cho bất kỳ nhân vật nào. Mã nguồn và script có thể tùy chỉnh để sử dụng với các công cụ tạo nội dung kỹ thuật số khác.
• Nvidia cũng giới thiệu microservice renderer mới cho Unreal Engine 5 hỗ trợ Nvidia Animation Graph Microservice và hệ điều hành Linux ở giai đoạn truy cập sớm.
• Animation Graph là một microservice tạo điều kiện cho việc tạo ra các máy trạng thái hoạt hình và cây blend, cung cấp hệ thống linh hoạt dựa trên node để blend, phát lại và điều khiển hoạt hình.
• Microservice renderer mới cho phép nhà phát triển chạy nhân vật MetaHuman trên máy chủ đám mây và stream các khung hình và âm thanh đã render tới bất kỳ trình duyệt và thiết bị edge nào qua WebRTC.
• Nhà phát triển có thể đăng ký truy cập sớm để tải xuống microservice renderer Unreal Engine 5 với hỗ trợ cho microservice Animation Graph và hệ điều hành Linux.
📌 Nvidia đã phát hành các plugin mới cho Unreal Engine 5 nhằm cải thiện độ chân thực của nhân vật kỹ thuật số. Các công cụ như Audio2Face-3D, Nemotron-Mini 4B và RAG cho phép tạo ra các nhân vật MetaHuman sống động và tương tác tự nhiên hơn, với khả năng chạy trên Windows PC với độ trễ thấp.
https://venturebeat.com/ai/nvidia-releases-plugins-to-improve-digital-human-realism-on-unreal-engine-5/
• OpenAI dự đoán các trợ lý AI sẽ trở nên phổ biến vào năm 2025, mở ra cuộc đua giữa các công ty công nghệ lớn như Google và Apple.
• Kevin Weil, Giám đốc sản phẩm của OpenAI, cho biết họ muốn tạo ra khả năng tương tác với AI giống như con người thật.
• Tại sự kiện Developer Day ở San Francisco, OpenAI đã giới thiệu mô hình mới o1 với khả năng lập luận được cải thiện và GPT-4o với xử lý giọng nói nâng cao.
• Các nhà phát triển sẽ có thể truy cập công nghệ này theo thời gian thực, cho phép AI hiểu lệnh thoại và đàm thoại bằng giọng nói như trong cuộc gọi thực tế.
• OpenAI đang hoàn tất vòng gọi vốn 6,5 tỷ USD với định giá 150 tỷ USD, thu hút các nhà đầu tư như Microsoft, Nvidia, SoftBank và các quỹ đầu tư mạo hiểm.
• Nhiều công ty công nghệ lớn như Microsoft, Salesforce, Workday, Google và Meta cũng đang tập trung phát triển các trợ lý AI thông minh.
• Năm ngoái, OpenAI đã ra mắt "API trợ lý" để các nhà phát triển xây dựng agent sử dụng công nghệ của họ, nhưng bị hạn chế do khả năng của các mô hình trước đó.
• Mô hình mới của OpenAI có khả năng suy nghĩ và lập luận tốt hơn, sẽ được tích hợp vào các sản phẩm như ChatGPT và API cho các startup.
• Một ví dụ được trình diễn là hệ thống AI có thể gọi điện đặt hàng dâu tây theo yêu cầu của người dùng về số lượng và chi phí mong muốn.
• OpenAI khẳng định việc sử dụng công nghệ này sẽ không được phép che giấu việc đó là AI chứ không phải con người, và chỉ có sẵn 6 giọng nói cài đặt sẵn.
• Weil tin rằng nếu làm đúng, công nghệ này sẽ giúp con người có thêm thời gian cho những việc quan trọng thay vì nhìn chằm chằm vào điện thoại.
📌 OpenAI dự đoán AI agent sẽ phổ biến vào 2025, giới thiệu mô hình o1 và GPT-4o với khả năng lập luận và xử lý giọng nói nâng cao. Công ty đang gọi vốn 6,5 tỷ USD, định giá 150 tỷ USD. Các ông lớn công nghệ cũng đang chạy đua phát triển trợ lý AI thông minh.
https://www.ft.com/content/30677465-33bb-4f74-a8e6-239980091f7a
#FT
• Dharmesh Shah, đồng sáng lập và CTO của Hubspot, dự đoán bước tiếp theo của AI sẽ là các mạng lưới agent hợp tác để thực hiện các tác vụ phức tạp hơn, chủ yếu không cần sự giám sát của con người.
• Shah cho rằng agent là bước tiến hóa từ copilot, có thể đảm nhận các mục tiêu cấp cao hơn thường liên quan đến nhiều bước.
• Hubspot đang cạnh tranh với các công ty như Salesforce để triển khai các agent hỗ trợ các tác vụ quản lý quan hệ khách hàng (CRM) như bán hàng, tiếp thị, chăm sóc khách hàng.
• Tại hội nghị thường niên Inbound, Hubspot đã giới thiệu mạng lưới agent.ai - một thị trường cho các agent AI với hơn 47.000 người dùng và 1.700 nhà phát triển đăng ký tạo agent riêng.
• Shah mô tả agent.ai như một "mạng chuyên nghiệp cho các agent", tương tự LinkedIn nhưng dành cho AI.
• Trong tương lai, các agent có thể hợp tác thành nhóm gồm các "mini agent" và một agent giám sát cấp cao hơn.
• Khả năng xử lý ngôn ngữ tự nhiên của AI tạo sinh trở thành yếu tố kết nối để lập trình và tổ hợp các agent, khắc phục vấn đề tương thích trong các nỗ lực trước đây như CORBA.
• Shah tin rằng AI agent và mạng lưới agent hợp tác sẽ tạo ra cuộc cách mạng trong phần mềm CRM, dẫn đến sự xuất hiện của "CRM thông minh dựa trên AI".
• Cuộc cạnh tranh trong lĩnh vực CRM sẽ xoay quanh việc nền tảng nào cung cấp khả năng sử dụng agent tốt nhất cho cả người dùng và nhà phát triển.
• Shah kỳ vọng một thế hệ nhà phát triển mới sẽ tìm kiếm nền tảng để xây dựng ý tưởng của họ, với agent trở thành "ứng dụng mới" thay vì các ứng dụng web truyền thống.
📌 Mạng lưới agent AI hợp tác được dự đoán sẽ định hình lại cách làm việc trong tương lai. Với hơn 47.000 người dùng trên nền tảng agents.ai của Hubspot, xu hướng này có tiềm năng cách mạng hóa ngành CRM và tạo ra một thế hệ nhà phát triển mới tập trung vào xây dựng agent AI.
https://www.zdnet.com/article/networks-of-collaborative-agents-will-transform-ai-says-this-expert/
• Jensen Huang, CEO của NVIDIA, đã chia sẻ tầm nhìn về tương lai của AI trong cuộc phỏng vấn với Marc Benioff, CEO Salesforce tại hội nghị Dreamforce.
• Huang nhấn mạnh sự chuyển dịch từ môi trường dựa trên công cụ sang môi trường dựa trên kỹ năng, với các agent AI đóng vai trò then chốt trong việc tự động hóa công việc và thúc đẩy năng suất.
• Các agent AI không chỉ tự động hóa các tác vụ phức tạp mà còn có khả năng tạo ra các công cụ mới để nâng cao năng lực của chính mình.
• Sự phát triển nhanh chóng của AI được thúc đẩy bởi các tiến bộ trong học không giám sát, học tăng cường và phát triển các mô hình ngôn ngữ lớn.
• Huang nhấn mạnh tầm quan trọng của việc loại bỏ giới hạn con người trong phát triển AI để đẩy nhanh tiến độ và đạt được sức mạnh tính toán chưa từng có.
• Việc cân bằng giữa dữ liệu công khai và độc quyền là cần thiết cho sự phát triển AI hiệu quả.
• Mở rộng quy mô AI đòi hỏi quản lý hiệu quả tài nguyên tính toán cho đào tạo và thử nghiệm.
• Dữ liệu tổng hợp giảm sự phụ thuộc vào dữ liệu được gắn nhãn bởi con người và nâng cao hiệu quả đào tạo AI.
• GPU vượt qua định luật Moore, thúc đẩy sự tiến bộ nhanh chóng của AI.
• AI đang chuyển đổi phát triển phần mềm bằng cách tự động hóa các tác vụ lập trình và tối ưu hóa.
• Đảm bảo an toàn AI thông qua tinh chỉnh, học có giám sát và cơ chế phản hồi là điều cần thiết.
• Việc đưa các agent AI vào hoạt động với đào tạo và bối cảnh phù hợp là quan trọng để triển khai hiệu quả.
• Tương lai của điện toán sẽ liên quan đến phần mềm dự đoán và giao diện thích ứng, nâng cao trải nghiệm người dùng.
• Tầm nhìn của Huang nhấn mạnh tiềm năng chuyển đổi của các agent AI trong việc định hình tương lai của các ngành công nghiệp.
• Bằng cách áp dụng các công nghệ và phương pháp AI tiên tiến, doanh nghiệp có thể mở khóa các mức năng suất và đổi mới chưa từng có.
• Tương lai sẽ chứng kiến các agent AI làm việc cùng con người để thúc đẩy tiến bộ và thành công trong nhiều lĩnh vực.
📌 Jensen Huang dự đoán agent AI sẽ định hình tương lai công nghệ, tự động hóa công việc phức tạp và tăng năng suất đột phá. Các tiến bộ trong học máy, GPU và dữ liệu tổng hợp đang thúc đẩy sự phát triển nhanh chóng của AI, mở ra cơ hội to lớn cho doanh nghiệp trong nhiều lĩnh vực.
https://www.geeky-gadgets.com/nvidia-ceo-on-agents-being-the-future-of-ai/
• AI agent đang nổi lên như xu hướng công nghệ nóng nhất vào mùa thu 2024, hứa hẹn mang lại ROI đáng kể cho các khoản đầu tư vào giải pháp AI thế hệ tiếp theo.
• AI agent là một ứng dụng tổng hợp và tự chủ cho phép con người và AI cộng tác để hoàn thành một nhiệm vụ. Nó khác biệt so với chatbot AI hiện có ở khả năng thực hiện các hành động tiếp theo dựa trên kết quả phản hồi của LLM, có hoặc không có sự tham gia thêm của con người.
• Lợi ích chính của AI agent bao gồm: có mục đích cụ thể, có thể được tạo và quản lý bởi người không phải lập trình viên, cung cấp bối cảnh làm việc tốt hơn cho AI.
• Ví dụ, một AI agent có thể tự động hóa phần lớn quá trình lập kế hoạch sự kiện công ty, bao gồm khảo sát từ các sự kiện trước đó, so sánh các lựa chọn địa điểm, kiểm tra sự sẵn có của địa điểm và diễn giả chính, xem xét các vấn đề đi lại và mô hình hóa số lượng phiên mà một địa điểm cụ thể có thể tổ chức.
• Các thành phần chính của một AI agent bao gồm: LLM, dữ liệu, quản trị, tích hợp, quy trình làm việc/quy tắc, giao diện người dùng và lưu trữ.
• Việc triển khai AI agent dự kiến sẽ diễn ra qua 4 giai đoạn: nền tảng ứng dụng (hiện tại), nền tảng cơ sở hạ tầng (đầu 2025), các startup chuyển hướng (đầu-giữa 2025), và triển khai sản xuất đầu tiên (giữa-cuối 2025).
• Các thách thức chính đối với AI agent bao gồm quản trị, kiểm thử, khả năng quan sát, hiệu suất và hiệu quả.
• Trong 12 tháng tới, doanh nghiệp nên: bắt đầu từ từ với các dự án thí điểm, chỉ định một "tổng giám đốc phụ trách agent", và kéo dài thời gian kiểm thử càng nhiều càng tốt.
📌 AI agent đang nổi lên như xu hướng công nghệ hàng đầu cuối năm 2024, hứa hẹn mang lại ROI đáng kể cho doanh nghiệp. Với khả năng tự động hóa quy trình, tích hợp dữ liệu và cộng tác người-máy, AI agent có tiềm năng thay đổi cách thức hoạt động của doanh nghiệp. Tuy nhiên, việc triển khai cần được thực hiện cẩn thận, với sự chú ý đặc biệt đến quản trị, kiểm thử và khả năng mở rộng.
https://www.forbes.com/sites/moorinsights/2024/09/26/ai-agents-will-be-the-key-to-achieving-roi-from-ai/
• AI agent được dự đoán sẽ là bước tiến quan trọng tiếp theo sau các mô hình ngôn ngữ trong lĩnh vực trí tuệ nhân tạo.
• Các hệ thống tự động hóa và AI trước đây chủ yếu thực hiện các hành động dựa trên quyết định có sẵn. AI agent sẽ có khả năng tự đưa ra quyết định.
• Quá trình ra quyết định của con người thường bao gồm các bước: tiếp nhận thông tin mới, nghiên cứu, suy luận, quyết định, hành động, giám sát và học hỏi.
• Quy trình này thường không được ghi lại, khác biệt giữa các cá nhân và ít khi được xem xét kỹ lưỡng trong tổ chức.
• Khi phát triển AI agent, các nhóm chuyên môn sẽ phải xem xét cẩn thận từng bước trong quy trình ra quyết định và các yếu tố cần cân nhắc.
• AI agent có tiềm năng cải thiện cách chúng ta tiếp nhận thông tin mới, nghiên cứu, suy luận và học hỏi từ kết quả quyết định.
• Ví dụ: AI agent có thể hỗ trợ kiểm tra lịch trình, nghiên cứu diễn giả và đưa ra đề xuất trước khi nhân viên đọc email ban đầu.
• Quá trình phát triển AI agent sẽ thách thức và tái cấu trúc khả năng ra quyết định của chúng ta với tư cách chuyên gia.
• Các tổ chức có thể phát triển chia sẻ kinh nghiệm tốt nhất, đầu tư vào đào tạo và tạo kế hoạch phát triển kỹ năng ra quyết định cá nhân hóa.
• Điều này sẽ tạo nền tảng để thảo luận và học hỏi về kỹ năng quan trọng nhất nhưng ít được đầu tư nhất: khả năng ra quyết định tốt.
📌 AI agent hứa hẹn cách mạng hóa quá trình ra quyết định bằng cách tự động hóa nghiên cứu, suy luận và đề xuất. Việc phát triển AI agent sẽ thúc đẩy các tổ chức xem xét lại và cải thiện quy trình ra quyết định, từ đó nâng cao hiệu quả làm việc tổng thể.
https://www.fastcompany.com/91198519/how-ai-agents-will-help-us-make-better-decisions
• Nghiên cứu mô hình ngôn ngữ lớn (LLM) đã phát triển nhanh chóng, tập trung vào việc cải thiện khả năng hiểu và xử lý ngôn ngữ, đặc biệt trong các lĩnh vực chuyên môn như tài chính.
• LLM đã vượt qua các tác vụ phân loại cơ bản để trở thành công cụ mạnh mẽ có khả năng truy xuất và tạo ra kiến thức phức tạp.
• Một thách thức lớn trong nghiên cứu LLM là cân bằng giữa hiệu quả chi phí và hiệu suất. LLM tốn kém về mặt tính toán và có nguy cơ tạo ra thông tin không chính xác khi xử lý bộ dữ liệu lớn hơn.
• Các phương pháp truyền thống dựa nhiều vào một mô hình transformer dày đặc duy nhất, thường gặp vấn đề về ảo giác, tạo ra thông tin không chính xác hoặc không liên quan.
• Các nhà nghiên cứu đã khám phá nhiều phương pháp để giải quyết những thách thức này, bao gồm mô hình tổng hợp, nhưng chúng tốn kém và chậm xử lý.
• Nhóm nghiên cứu từ Vanguard IMFS đã giới thiệu khung công tác mới có tên Mixture of Agents (MoA) để khắc phục những hạn chế của phương pháp tổng hợp truyền thống.
• MoA là một hệ thống đa tác tử tiên tiến được thiết kế đặc biệt cho các tác vụ tạo sinh được tăng cường bởi truy xuất dữ liệu ngoài (RAG).
• MoA sử dụng tập hợp các mô hình nhỏ chuyên biệt làm việc cùng nhau một cách phối hợp cao độ để trả lời các câu hỏi phức tạp với độ chính xác cao hơn và chi phí thấp hơn.
• Hệ thống MoA bao gồm nhiều tác tử chuyên biệt, mỗi tác tử đóng vai trò như một "nhà nghiên cứu cấp dưới" với trọng tâm cụ thể như phân tích tình cảm, số liệu tài chính hoặc tính toán toán học.
• Trong các bài kiểm tra, hệ thống MoA có thể phân tích hàng chục nghìn tài liệu tài chính trong vòng chưa đầy 60 giây bằng cách sử dụng hai lớp tác tử.
• Một hệ thống MoA cơ bản với hai tác tử Mistral-7B đã được thử nghiệm cùng với các hệ thống mô hình đơn như GPT-4 và Claude 3 Opus. Hệ thống MoA liên tục cung cấp câu trả lời chính xác và toàn diện hơn.
• Tính hiệu quả về chi phí của MoA khiến nó rất phù hợp cho các ứng dụng tài chính quy mô lớn. Nhóm IMFS của Vanguard báo cáo rằng hệ thống MoA của họ hoạt động với tổng chi phí hàng tháng dưới 8.000 USD trong khi xử lý các truy vấn từ một nhóm nhà nghiên cứu.
• Thiết kế mô-đun của khung công tác MoA cho phép các công ty mở rộng hoạt động dựa trên ngân sách và nhu cầu, với khả năng linh hoạt thêm hoặc bớt tác tử khi cần thiết.
📌 Khung công tác Mixture of Agents (MoA) từ Vanguard IMFS cung cấp giải pháp mạnh mẽ để cải thiện hiệu suất của mô hình ngôn ngữ lớn trong tài chính. MoA xử lý 10.000 tài liệu trong 60 giây, chính xác hơn GPT-4 và Claude, với chi phí dưới 8.000 USD/tháng, hứa hẹn trở thành tiêu chuẩn cho ứng dụng cấp doanh nghiệp.
https://www.marktechpost.com/2024/09/17/collaborative-small-language-models-for-finance-meet-the-mixture-of-agents-moa-framework-from-vanguard-imfs/
• Jensen Huang, CEO Nvidia, và Marc Benioff, CEO Salesforce, thảo luận về tương lai của AI tác nhân tại sự kiện Dreamforce của Salesforce.
• Huang nhận định cơ hội cho AI tác nhân sẽ "khổng lồ", với tiến bộ "ngoạn mục và đáng ngạc nhiên".
• Phát triển AI đang diễn ra nhanh hơn định luật Moore, theo Huang là "hợp lý Moore's Law bình phương".
• Trong tương lai, sẽ có các tác nhân AI hiểu được sắc thái tinh tế, có khả năng lập luận và hợp tác.
• Các tác nhân AI sẽ có thể tìm kiếm tác nhân khác để "làm việc cùng nhau, tập hợp lại", đồng thời giao tiếp với con người để cải thiện đầu ra.
• Huang dự đoán: "Chúng ta sẽ có tác nhân làm việc với tác nhân, tác nhân làm việc với chúng ta".
• Việc áp dụng AI cần được đơn giản hóa, "giống như việc đưa nhân viên mới vào làm việc".
• Benioff nhấn mạnh tầm quan trọng của việc mọi người "thực sự hiểu" cách AI hoạt động và mục đích của chúng.
• Huang chỉ ra rằng vẫn còn nhiều thách thức, bao gồm tinh chỉnh và bảo vệ, nhưng các nhà khoa học đang tiến bộ hàng ngày.
• AI đang được sử dụng để tạo ra dữ liệu an toàn để "dạy" AI khác.
• Nvidia tập trung vào kiến trúc điện toán tăng tốc, bổ sung GPU cho CPU và xây dựng nền tảng DGX.
• Công ty nhận ra sớm rằng "học sâu sẽ thay đổi hoàn toàn phần mềm".
• Nvidia có lợi thế "làm việc với mọi nhà nghiên cứu trên hành tinh".
• Huang tin rằng Nvidia đang ở vị trí "một lần trong đời và một lần trong một thế hệ".
• Ông nhấn mạnh: "Ngay lúc này quá thú vị, bạn không nghĩ vậy sao? Không ai nên bỏ lỡ thập kỷ tới. Bạn sẽ không muốn bỏ lỡ bộ phim này đâu."
📌 Jensen Huang và Marc Benioff nhìn nhận tiềm năng to lớn của AI tác nhân, với khả năng hợp tác và tự cải thiện. Họ dự đoán AI sẽ phát triển nhanh hơn định luật Moore, mang lại cơ hội "khổng lồ" trong thập kỷ tới. Tuy nhiên, vẫn còn nhiều thách thức cần giải quyết.
https://venturebeat.com/ai/why-jensen-huang-and-marc-benioff-see-gigantic-opportunity-for-agentic-ai/
• AI tác nhân (agentic AI) là hệ thống AI có khả năng thực hiện các hành động tự chủ, chủ động hướng tới mục tiêu mà không cần sự giám sát trực tiếp của con người.
• AI tác nhân có thể thích ứng và phản ứng độc lập với các tình huống luôn thay đổi, với sự can thiệp tối thiểu của con người.
• Khác với các mô hình nền tảng truyền thống như GPT-4, AI tác nhân có khả năng thực hiện các tác vụ phức tạp đòi hỏi lập luận, lập kế hoạch và tương tác cấp cao hơn.
• Beam cung cấp giải pháp tự động hóa quy trình AI tác nhân cấp doanh nghiệp, với các mẫu được đào tạo sẵn và mô-đun tùy chỉnh an toàn cho các ngành như y tế và bảo hiểm.
• PixieBrix là tiện ích mở rộng trình duyệt low-code cho phép tùy chỉnh và tự động hóa ứng dụng web. Người dùng có thể xây dựng các "brick" để thêm chức năng hoặc kích hoạt hành động trên ứng dụng web.
• AutoGen Studio của Microsoft là tùy chọn nguồn mở thân thiện với người dùng, cho phép phát triển nhanh các tác nhân AI thông qua giao diện low-code.
• AgentOps là nền tảng giám sát tác nhân giúp xây dựng, theo dõi và tối ưu hóa các tác nhân AI. Nó dễ dàng tích hợp với các framework AI tác nhân phổ biến như LangChain.
• Thách thức lớn trong phát triển hệ thống AI tác nhân là xác định các khối xây dựng hiệu quả và kết hợp chúng phù hợp cho các ứng dụng khác nhau.
• Các nhà nghiên cứu đang đề xuất quy trình thiết kế tự động hệ thống tác nhân (ADAS), trong đó các tác nhân AI mới và cải tiến được "khám phá" bởi một "meta-agent".
• Kết quả ban đầu cho thấy các tác nhân mới có thể vượt trội đáng kể so với các tác nhân được thiết kế thủ công, mở ra tiềm năng cho AI tác nhân tự học và tự cải thiện liên tục.
📌 AI tác nhân đang nổi lên như xu hướng mới trong AI, với 4 công cụ hàng đầu là Beam, PixieBrix, AutoGen Studio và AgentOps. Các hệ thống này có khả năng thực hiện tác vụ phức tạp một cách tự chủ, hứa hẹn mang lại hiệu quả và tự động hóa cao cho doanh nghiệp.
https://thenewstack.io/agentic-ai-tools-for-building-and-managing-agentic-systems/
• Bản đồ hệ sinh thái AI Agent 2024 được chia thành 4 lớp chính:
- Lớp hệ sinh thái Agent: Bao gồm các mô hình nền tảng, doanh nghiệp, Big Tech và startup
- Lớp ứng dụng Agent: Gồm các ứng dụng AI Agent, kết nối với LLM và nền tảng Agent
- Lớp quản lý Agent: Bao gồm phân quyền/bảo mật và quản lý Agent
- Lớp dữ liệu: Gồm dữ liệu độc quyền/riêng tư, dữ liệu mở và API thống nhất
• Dự đoán về thị trường AI Agent:
- Các startup AI Agent sẽ phát triển nhanh chóng và trở thành những công ty hàng tỷ USD
- Số lượng startup AI Agent sẽ tăng từ hàng trăm lên hàng nghìn vào năm 2025
- Các công ty công nghệ lớn như Amazon, Apple sẽ phát triển Agent riêng và hỗ trợ các startup mở rộng
- Hubspot và Salesforce sẽ tích hợp AI Agent vào bộ phần mềm doanh nghiệp của họ
• Tác động đến doanh nghiệp và xã hội:
- Các lĩnh vực truyền thông, quảng cáo và thương mại điện tử sẽ bị gián đoạn nghiêm trọng bởi AI Agent
- Mô hình kinh doanh mới sẽ xuất hiện liên quan đến quảng cáo, thương mại điện tử và tiếp thị liên kết qua Agent
- AI Agent sẽ giúp con người hoàn thành các công việc phức tạp, cho phép chúng ta tập trung vào việc "làm người" hơn
• Sự phát triển nhanh chóng của AI Agent:
- AI Agent sẽ tạo ra nhiều Agent hơn, vượt qua số lượng con người chỉ trong vài năm tới
- Agent sẽ trở thành thực thể thống trị trên internet và trong doanh nghiệp
- Tốc độ phát triển sẽ diễn ra theo cấp số nhân, vượt quá khả năng nhận thức của con người
• Tiêu chuẩn ngành:
- Sẽ có nhu cầu về khả năng tương tác giữa các hệ thống AI Agent khác nhau
- Các startup dịch thuật AI Agent mới sẽ xuất hiện để phục vụ toàn bộ hệ sinh thái
- Việc thống nhất tiêu chuẩn AI Agent sẽ gặp thách thức do các gã khổng lồ công nghệ bảo vệ lãnh địa của họ
📌 AI Agent đang phát triển với tốc độ chóng mặt, dự kiến sẽ có hàng nghìn startup vào năm 2025. Các công ty lớn như Amazon, Apple cũng tham gia cuộc đua. AI Agent sẽ tác động sâu sắc đến nhiều ngành công nghiệp và có thể vượt qua số lượng con người chỉ trong vài năm tới.
https://web-strategist.com/blog/2024/09/12/plot-your-path-the-2024-ai-agent-ecosystem-map/
SEO contents:
• Dự án Sid do công ty khởi nghiệp Altera.ai thực hiện, do cựu giáo sư MIT và nhà khoa học thần kinh học Robert Yang đứng đầu.
• 1.000 agent AI tự chủ được đưa vào thế giới Minecraft để xem chúng sẽ làm gì khi được tự do hành động.
• Các agent AI nhanh chóng bắt đầu thể hiện hành vi giống con người:
- Hình thành liên minh
- Thu thập vật phẩm trong game
- Thiết lập hệ thống tiền tệ chung bằng đá quý để giao dịch
- Xuất hiện các "linh mục tham nhũng" hối lộ AI khác để được lợi thế
• Mục tiêu nghiên cứu sâu hơn về sự gắn kết, hợp tác đa tác nhân và tiến triển dài hạn của các agent AI.
• Dự án Sid không phải nỗ lực đầu tiên kết hợp agent AI tự chủ với thế giới game hóa:
- Nghiên cứu của Đại học Stanford năm ngoái tạo ra môi trường Smallville với 25 agent AI
- Các nhân vật AI nhanh chóng hợp tác, thậm chí tổ chức tiệc Valentine's Day
• Mã nguồn nghiên cứu Stanford được công bố nguồn mở, dẫn đến nhiều demo AI khác nhau ra đời.
• AI Town: môi trường đơn giản cho phép nhân vật AI tự điều khiển tương tác với người chơi qua lệnh chat.
• Thistle Gulch: dự án nguồn mở sử dụng ChatGPT 3.5 để tạo ra thị trấn miền Tây với 15 nhân vật AI có tính cách riêng.
• Các dự án này cho thấy tiềm năng của công nghệ AI tự chủ trong tương tác người-máy và trò chơi điện tử.
• Việc kết hợp AI với thế giới sandbox như Minecraft mở ra khả năng vô hạn cho nghiên cứu và phát triển AI.
• Các agent AI thể hiện khả năng học hỏi, thích nghi và tương tác phức tạp trong môi trường mô phỏng.
📌 1.000 agent AI tự chủ trong Minecraft đã tạo ra xã hội phức tạp với giao dịch, liên minh và hành vi tham nhũng. Dự án Sid của Altera.ai mở ra hướng nghiên cứu mới về tương tác AI-người và mô phỏng hành vi xã hội, với tiềm năng ứng dụng rộng rãi trong tương lai.
https://www.tomsguide.com/ai/a-company-gave-1000-ai-agents-access-to-minecraft-and-they-built-a-society
• Oracle vừa công bố hơn 50 trợ lý AI tích hợp trong Oracle Fusion Cloud Applications Suite, nhằm hỗ trợ tự động hóa các tác vụ lặp đi lặp lại và giúp nhân viên tập trung vào công việc chiến lược hơn.
• Các trợ lý AI mới được tích hợp vào quy trình làm việc, cung cấp thông tin chi tiết, nội dung và đề xuất được cá nhân hóa cho từng vai trò cụ thể.
• Trong Oracle Fusion Cloud Human Capital Management (HCM), có các trợ lý AI như:
- Trợ lý lập lịch ca làm: Tối ưu hóa lịch làm việc theo ca, đồng thời đáp ứng sở thích cá nhân và tuân thủ quy định.
- Cố vấn tuyển dụng: Hỗ trợ tìm kiếm ứng viên, tạo yêu cầu tuyển dụng và đề xuất, giúp rút ngắn thời gian tuyển dụng.
- Phân tích viên phúc lợi: Hỗ trợ nhân viên hiểu rõ và tối ưu hóa gói phúc lợi dựa trên nhu cầu cá nhân.
• Trong Oracle Fusion Cloud Supply Chain & Manufacturing (SCM), có các trợ lý AI như:
- Hướng dẫn đại diện bán hàng: Cung cấp thông tin chi tiết và đề xuất cá nhân hóa để xử lý các truy vấn đơn hàng.
- Cố vấn xử lý sự cố bảo trì: Đẩy nhanh quá trình bảo trì và sửa chữa bằng cách cung cấp thông tin chi tiết và đề xuất về bảo trì và sửa chữa tài sản.
• Trong Oracle Fusion Cloud Enterprise Resource Planning (ERP), có các trợ lý AI như:
- Trợ lý xử lý tài liệu: Tự động hóa và đơn giản hóa việc tích hợp phức tạp với các bên thứ ba.
- Trợ lý sổ cái: Xác định các ngoại lệ và bất thường trong dữ liệu giao dịch, phân tích số dư tài khoản.
- Trợ lý dự đoán nâng cao: Hỗ trợ các mô hình dự đoán AI đa biến, tận dụng các yếu tố tài chính, hoạt động và bên ngoài.
• Trong Oracle Fusion Cloud Customer Experience (CX), có các trợ lý AI như:
- Trợ lý nghiên cứu tài khoản khách hàng: Cung cấp thông tin chi tiết và tự động hóa các tác vụ lập kế hoạch và nghiên cứu.
- Trợ lý nghiên cứu hợp đồng: Tự động hóa quy trình và phê duyệt hợp đồng thông thường.
- Hướng dẫn kế hoạch thưởng khuyến khích: Giúp truyền đạt và thúc đẩy đại diện bán hàng phù hợp với ý định chiến lược.
• Oracle Fusion Applications Suite cho phép các tổ chức tận dụng đám mây và những tiến bộ mới nhất trong AI để phá vỡ các rào cản tổ chức, chuẩn hóa quy trình và quản lý dữ liệu tài chính, nhân sự, chuỗi cung ứng và trải nghiệm khách hàng trên một nền tảng đám mây tích hợp duy nhất.
📌 Oracle giới thiệu hơn 50 trợ lý AI tích hợp vào Oracle Fusion Cloud Applications Suite, hỗ trợ tự động hóa quy trình trong tài chính, chuỗi cung ứng, nhân sự, bán hàng, tiếp thị và dịch vụ. Các trợ lý AI mới này có tiềm năng thay đổi hoàn toàn cách làm việc, giúp doanh nghiệp đạt được mức năng suất mới và mở khóa tiềm năng tăng trưởng kinh doanh to lớn.
https://www.oracle.com/news/announcement/ocw24-oracle-ai-agents-help-organizations-achieve-new-levels-of-productivity-2024-09-11/
• Chatbot truyền thống thường bị coi là phiền phức và hạn chế, chỉ được sử dụng trong một số tình huống cụ thể như hỗ trợ khách hàng trên website.
• AI agent hiện đại đã phát triển vượt bậc, cung cấp tương tác thông minh, cá nhân hóa và hiệu quả hơn nhiều so với chatbot.
• AI agent phải vượt qua thách thức về nhận thức tiêu cực từ chatbot cũ, khó khăn trong triển khai và thiếu hiểu biết về khả năng của chúng.
• Khác với chatbot cứng nhắc dựa trên quy tắc, AI agent sử dụng AI tạo sinh để tạo ra giao tiếp cá nhân hóa theo phong cách và giọng điệu của thương hiệu.
• AI agent có thể sử dụng dữ liệu quá khứ và thông tin từ người dùng để trả lời các câu hỏi chuyên biệt, giảm nhu cầu chuyển tiếp cho nhân viên.
• Doanh nghiệp cần chủ động thông báo cho khách hàng về khả năng mới của AI agent để thay đổi nhận thức cũ về chatbot.
• Việc triển khai AI agent không nên chỉ giới hạn ở khách hàng mà còn có thể áp dụng cho nội bộ doanh nghiệp để hỗ trợ nhân viên và tối ưu quy trình.
• Cần tập trung vào truyền thông minh bạch với khách hàng về khả năng mới của AI agent so với chatbot truyền thống.
• AI agent có thể thực hiện nhiều tác vụ từ trả lời câu hỏi đơn giản đến chủ động hành động như kiểm tra hàng tồn kho hay đặt chỗ nhà hàng.
• AI agent đặc biệt hữu ích trong việc tự động hóa các tác vụ khách hàng thường tránh như lên lịch và đặt hẹn.
• Việc triển khai AI agent cần có chiến lược, truyền thông rõ ràng và hỗ trợ liên tục để đáp ứng nhu cầu của cả khách hàng và nhân viên.
• Triển khai AI agent là một dự án dài hạn, không phải ngắn hạn, khi các trường hợp sử dụng mới tiếp tục phát triển.
📌 AI agent đại diện cho bước tiến vượt bậc so với chatbot truyền thống, mang lại tương tác thông minh và cá nhân hóa. Việc triển khai hiệu quả đòi hỏi chiến lược toàn diện, từ truyền thông đến đào tạo, để tận dụng tiềm năng to lớn trong việc nâng cao trải nghiệm khách hàng và hiệu suất doanh nghiệp.
https://www.forbes.com/councils/forbestechcouncil/2024/09/09/ensuring-a-successful-transition-from-chatbots-to-ai-agents/
• Marc Benioff, CEO của Salesforce, tiết lộ công ty đang thực hiện "bước chuyển hướng mạnh mẽ" sang nền tảng Agentforce, cho phép người dùng tạo ra các AI agents tùy chỉnh để tương tác trực tiếp với khách hàng.
• Benioff tin rằng AI agents là bước tiến hóa tiếp theo của AI, vượt trội hơn so với chatbots AI thông thường. Ông nhấn mạnh: "Chúng tôi phải chuyển hướng toàn bộ công ty sang agents."
• Agentforce có thể tích hợp với các sản phẩm khác của Salesforce như phần mềm quản lý quan hệ khách hàng (CRM) và các ứng dụng khác.
• Benioff coi đây là "bước chuyển đổi lớn tiếp theo" kể từ khi Salesforce được thành lập năm 1999 và trở thành công ty đột phá trong ngành phần mềm doanh nghiệp.
• Ông đề cập đến cuốn sách "The Innovator's Dilemma" và khái niệm "tư duy của người mới", nhấn mạnh tầm quan trọng của việc "bắt đầu lại từ đầu và suy nghĩ toàn diện".
• Benioff chia sẻ rằng ông nhận ra tầm ảnh hưởng to lớn của AI cách đây khoảng một thập kỷ, khi Salesforce còn nhỏ hơn 10 lần so với hiện tại.
• Agentforce đã được triển khai thử nghiệm cho một số khách hàng và nhận được phản hồi tích cực. Benioff cho biết trong cuộc gọi báo cáo kết quả quý 2: "Chúng ta vẫn sẽ có con người trong công ty, nhưng chúng ta cũng sẽ có các agents này."
• Các AI agents này không cần lệnh hội thoại để hành động, có thể lập kế hoạch và suy luận nâng cao với sự can thiệp tối thiểu của con người.
• Agentforce dự kiến ra mắt chính thức vào tháng 10, nhưng sẽ được giới thiệu tại hội nghị Dreamforce của Salesforce ở San Francisco từ ngày 17/9.
• Benioff nhấn mạnh tầm quan trọng của Agentforce bằng cách nói rằng sự kiện sẽ được gọi là "Welcome to Agentforce" thay vì "Welcome to Dreamforce".
📌 Salesforce đang thực hiện bước chuyển mình lớn với nền tảng Agentforce, cho phép tạo AI agents tùy chỉnh để tương tác với khách hàng. CEO Marc Benioff tin rằng đây là bước tiến quan trọng tiếp theo trong lĩnh vực AI, vượt trội hơn chatbots thông thường. Agentforce sẽ ra mắt chính thức vào tháng 10/2024.
https://www.businessinsider.com/salesforce-ceo-marc-benioff-says-new-focus-on-ai-agents-2024-9
• Guided Reasoning là một hệ thống đa tác tử AI, trong đó một tác tử hướng dẫn (guide) làm việc với các tác tử khách hàng (client) để cải thiện khả năng lập luận của họ theo một phương pháp cụ thể.
• Phương pháp này có thể được mô tả bằng các tiêu chuẩn, ví dụ cụ thể hoặc hướng dẫn chi tiết. Ví dụ bao gồm huấn luyện viên hỗ trợ phân tích SWOT, trẻ em giúp người lớn giải ô chữ, hay đối thoại Socratic.
• Lý do ủng hộ Guided Reasoning trong AI dựa trên các giả định: AI cần đưa ra câu trả lời chính xác và giải thích được; AI chỉ có thể giải thích trung thực nếu dựa trên tư duy rõ ràng; Lập luận kém làm giảm chất lượng phản hồi của AI.
• Nguyên tắc chuyên môn hóa nhận thức cho rằng cần thêm chuyên gia về phương pháp lập luận để tạo ra hệ thống AI có thể giải thích và chính xác.
• Quy trình Guided Reasoning của Logikon bao gồm 5 bước: (1) Kích hoạt phương pháp, (2) Trình bày vấn đề, (3) Hướng dẫn đặt câu hỏi, (4) Thu thập câu trả lời, (5) Xử lý và đánh giá.
• Hướng dẫn viên thiết lập quy tắc suy nghĩ và quản lý luồng công việc. Họ có thể diễn đạt lại vấn đề và so sánh các câu trả lời khác nhau.
• Sau khi nhận được vấn đề, hướng dẫn viên yêu cầu khách hàng đưa ra các giải pháp và liệt kê ưu nhược điểm. Từ đó tạo ra bản đồ lập luận phi chính thức.
• Quy trình tạo bản đồ lập luận bao gồm các bước: Xây dựng vấn đề, Liệt kê ưu nhược điểm, Xây dựng mạng lưới liên quan, Tạo bản đồ lập luận mờ.
• Mỗi bước được thực hiện bởi một lớp phân tích khác nhau trong chương trình Python của Logikon, sử dụng các quy trình LLM nội bộ.
• Bản đồ lập luận mờ cuối cùng được xuất ra dưới nhiều định dạng hữu ích, giúp trực quan hóa quá trình lập luận.
📌 Guided Reasoning là phương pháp mới nâng cao trí tuệ hệ thống đa tác tử AI, sử dụng tác tử hướng dẫn để cải thiện lập luận của các tác tử khác. Quy trình 5 bước của Logikon tạo ra bản đồ lập luận mờ, giúp trực quan hóa và phân tích quá trình suy luận phức tạp của AI.
https://www.marktechpost.com/2024/09/05/guided-reasoning-a-new-approach-to-improving-multi-agent-system-intelligence/
• Hội nghị Robot Thế giới 2024 diễn ra tại Bắc Kinh, trưng bày hơn 600 sản phẩm robot từ khắp nơi trên thế giới và thu hút hơn 1,3 triệu người tham dự.
• 27 robot người hình được trưng bày, có khả năng ứng dụng trong sản xuất, y tế, quản lý hộ gia đình và giải trí.
• Các nhà nghiên cứu cho rằng cạnh tranh trong lĩnh vực robot có thể trở thành cuộc đua không gian mới của thế kỷ này.
• Các doanh nhân trong lĩnh vực robot hình người lạc quan rằng trong 5-10 năm tới, robot có thể đạt được sản xuất hàng loạt, đánh dấu một thời điểm như ChatGPT cho công nghệ này.
• Trung Quốc có tầm nhìn dài hạn về phát triển robot và ứng dụng rộng rãi trong cuộc sống hàng ngày, với các chính sách kích thích và duy trì đổi mới trong những năm tới.
• Các thành phố lớn như Bắc Kinh, Thượng Hải và Ninh Ba đã thành lập các trung tâm đổi mới robot hình người.
• Kế hoạch 5 năm lần thứ 14 của Trung Quốc dự kiến robot sẽ được tích hợp sâu vào cuộc sống hàng ngày vào năm 2035.
• Bộ Công nghiệp và Công nghệ Thông tin đã ban hành hướng dẫn cụ thể về phát triển robot hình người vào tháng 10 năm 2023, đặt ra các mục tiêu tham vọng cho năm 2025 và 2027.
• Trung Quốc đối mặt với hạn chế tiếp cận chip AI và mô hình ngôn ngữ lớn từ các công ty Mỹ, nhưng đầu tư lớn vào nghiên cứu chip và các mô hình nguồn mở sẽ giúp Trung Quốc tiến bộ trong lĩnh vực AI và robot.
• Tại hội nghị, khán giả được chứng kiến robot chơi bóng đá, chuẩn bị hamburger, chơi nhạc cụ, viết thư pháp và hỗ trợ phẫu thuật.
• Robot Walker S của công ty UBTECH ở Thâm Quyến thể hiện khả năng kiểm tra lốp xe chính xác cho xe hơi do Audi và FAW sản xuất chung.
• Trung tâm Đổi mới Robot hình người Bắc Kinh, Audi-FAW và UBTECH đã hợp tác để tích hợp robot hình người vào dây chuyền sản xuất ô tô.
• Hội nghị có sự tham gia của trẻ em và thanh thiếu niên, với các cuộc thi robot dành cho học sinh.
• Bộ Giáo dục Trung Quốc đã công bố chính sách tập trung vào việc tạo ra 184 cơ sở giáo dục AI để thí điểm tích hợp AI vào giáo dục.
• Sự phát triển của robot mang lại những khả năng thú vị nhưng cũng đặt ra những lo ngại đáng kể về đạo đức và an toàn.
• Một ví dụ nổi bật là robot do EX Robots phát triển, là bản sao của một cậu bé đam mê STEM.
• Tác động rộng hơn của robot đối với xã hội, đặc biệt là trong lực lượng lao động, là một mối quan tâm lớn khác.
• Cần có các chương trình hỗ trợ công nhân bị mất việc học kỹ năng mới, hỗ trợ khởi nghiệp và tăng cường mạng lưới an sinh xã hội.
📌 Trung Quốc đang đặt cược lớn vào tương lai robot hình người với các chính sách hỗ trợ và đầu tư mạnh mẽ. Hội nghị Robot Thế giới 2024 tại Bắc Kinh thu hút 1,3 triệu người tham dự, trưng bày 27 robot hình người có khả năng ứng dụng đa dạng. Tuy nhiên, sự phát triển nhanh chóng của ngành công nghiệp này cũng đặt ra những thách thức về đạo đức, an toàn và tác động đến lực lượng lao động.
https://www.scmp.com/opinion/china-opinion/article/3276979/chinas-robotics-future-fast-approaching
• Công ty 1X đã giới thiệu robot NEO Beta, một robot hình người được thiết kế để sử dụng trong gia đình như một trợ lý thông minh hàng ngày.
• NEO Beta cao 1,65m và nặng 30kg, có khả năng di chuyển linh hoạt trong nhà bao gồm đi bộ, chạy bộ và leo cầu thang.
• Robot có thể đi bộ với tốc độ khoảng 4km/h và chạy với tốc độ 12km/h. Nó có thể mang vật nặng lên đến 20kg.
• Thời lượng pin của NEO Beta từ 2-4 giờ tùy thuộc vào hoạt động trước khi cần sạc lại.
• 1X đã tập trung vào các ứng dụng công nghiệp với mẫu robot EVE trước đây, nhưng NEO là lần đầu tiên họ hướng đến robot tiêu dùng.
• Trí tuệ nhân tạo của NEO sử dụng kinh nghiệm mà 1X đã tích lũy được thông qua việc vận hành EVE, và áp dụng cái gọi là "học tập thể hiện" để làm việc với đầu vào ngôn ngữ tự nhiên và không gian vật lý.
• Ưu tiên hàng đầu trong thiết kế của NEO Beta là an toàn. Robot được làm bằng vật liệu mềm thay vì vỏ cứng như hầu hết mọi người tưởng tượng về robot.
• NEO cũng bao gồm các tùy chọn ghi đè thủ công nếu người vận hành cần can thiệp.
• Năm nay, 1X sẽ triển khai một số lượng hạn chế các đơn vị NEO trong các gia đình được chọn để phục vụ mục đích nghiên cứu và phát triển.
• Việc công bố NEO Beta của 1X đã gặp phải sự hoài nghi trên mạng xã hội, với nhiều người cho rằng robot trông giống như một người đàn ông mặc bộ đồ.
• Cuộc đua tạo ra robot quản gia cấp tiêu dùng đang nóng lên, với các công ty khác nhau áp dụng các cách tiếp cận khác nhau. Google's DeepMind đã tạo ra một robot có thể chơi thể thao, và Figure AI đã tạo ra một robot hình người có thể trò chuyện.
📌 NEO Beta của 1X là robot hình người 1,65m cao, nặng 30kg, có thể đi bộ 4km/h, chạy 12km/h, mang 20kg trong 2-4 giờ. Ưu tiên an toàn, sử dụng AI và vật liệu mềm, NEO sẽ được thử nghiệm trong các gia đình chọn lọc để phát triển thêm.
https://readwrite.com/this-new-robot-looks-so-smooth-people-think-its-a-guy-in-a-suit/
• Các nhà nghiên cứu từ IIT Dharwad và TCS Research đề xuất framework Agentic-RAG cho phân tích chuỗi thời gian, sử dụng kiến trúc đa tác nhân phân cấp.
• Framework này bao gồm một tác nhân chủ điều phối các tác nhân phụ chuyên biệt, mỗi tác nhân được tinh chỉnh với mô hình ngôn ngữ quy mô nhỏ (SLM) cho các tác vụ cụ thể như dự báo hoặc phát hiện bất thường.
• Các tác nhân phụ truy xuất các gợi ý liên quan từ kho tri thức chuyên biệt (prompt pools) lưu trữ các mẫu lịch sử, giúp dự đoán tốt hơn trên dữ liệu mới.
• Cách tiếp cận mô-đun này nâng cao tính linh hoạt và độ chính xác, vượt trội so với các phương pháp truyền thống trong nhiều tác vụ chuỗi thời gian.
• Framework sử dụng cơ chế gợi ý động để truy xuất các gợi ý liên quan từ cơ sở tri thức nội bộ, cho phép mô hình thích ứng với các xu hướng khác nhau trong dữ liệu chuỗi thời gian phức tạp.
• Nó kết hợp cơ chế chú ý hai tầng để xử lý các phụ thuộc dài hạn trong dữ liệu chuỗi thời gian mà không cần tinh chỉnh.
• Frameworksử dụng kỹ thuật tinh chỉnh theo hướng dẫn và tinh chỉnh hiệu quả tham số (PEFT) để cải thiện hiệu suất SLM trên các tác vụ chuỗi thời gian cụ thể.
• Nó cải thiện độ dài ngữ cảnh của SLM lên 32K token, cho phép nắm bắt các phụ thuộc không gian-thời gian phức tạp.
• Framework sử dụng Tối ưu hóa Ưu tiên Trực tiếp (DPO) để tinh chỉnh SLM, đảm bảo các mô hình ưu tiên kết quả chính xác hơn cho từng tác vụ cụ thể.
• Agentic-RAG được đánh giá trên các tác vụ dự báo, phân loại, phát hiện bất thường và nội suy, sử dụng các biến thể như SelfExtend-Gemma-2B-instruct, Gemma-7B-instruct và Llama 3-8B-instruct.
• Các bộ dữ liệu thực tế về giao thông (PeMS, METR-LA) và bộ dữ liệu phát hiện bất thường đa biến (SWaT, NASA telemetry) được sử dụng để đánh giá.
• Các chỉ số đánh giá bao gồm MAE, RMSE, độ chính xác, độ chính xác và điểm F1.
• Framework này liên tục vượt trội so với các phương pháp cơ sở trong các tác vụ dự báo, đặc biệt là trên các bộ dữ liệu METR-LA và PEMS-BAY, thể hiện độ chính xác dự đoán và độ mạnh mẽ vượt trội trên tất cả các chỉ số.
📌 Agentic-RAG là framework đa tác nhân phân cấp mới cho phân tích chuỗi thời gian, sử dụng SLM và prompt pools để nâng cao hiệu suất. Nó vượt trội so với các phương pháp truyền thống trong nhiều tác vụ như dự báo và phát hiện bất thường, đạt hiệu suất tốt nhất trên các bộ dữ liệu chuẩn chính.
https://www.marktechpost.com/2024/09/01/agentic-rag-a-hierarchical-multi-agent-framework-for-enhanced-time-series-analysis/
• Số lượng robot trong sản xuất trên toàn cầu đã tăng gấp đôi trong 6 năm qua, đạt 151 robot trên 10.000 nhân viên, với tổng cộng 3,9 triệu robot đang hoạt động.
• Ngân hàng đầu tư Morgan Stanley dự đoán xu hướng hội tụ có thể dẫn đến việc tích hợp AI tạo sinh kiểu ChatGPT vào robot hình dạng người.
• Ước tính đến giữa thế kỷ này, Mỹ có thể có hơn 60 triệu robot hình người đang làm việc, có khả năng ảnh hưởng đến 75% nghề nghiệp và 40% lực lượng lao động.
• Đặc biệt trong lĩnh vực xây dựng và nông nghiệp, có tới 70% công việc có thể bị ảnh hưởng bởi sự xuất hiện của robot AI.
• Hàn Quốc đứng đầu về tỷ lệ sử dụng robot công nghiệp, với khoảng 1 robot cho mỗi 10 công nhân. Singapore và Đức xếp thứ 2 và 3 với hơn 400 robot trên 10.000 nhân viên.
• Mỹ hiện đứng thứ 10 về tỷ lệ sử dụng robot công nghiệp, với 285 robot trên 10.000 công nhân.
• Những người ủng hộ robot cho rằng chúng có thể giảm bớt tình trạng thiếu lao động ở các nước giàu, vốn đang phải dựa vào nhập cư để bù đắp cho dân số già và suy giảm.
• Tuy nhiên, sự phát triển nhanh chóng của AI tiên tiến cũng gây lo ngại về nguy cơ tuyệt chủng do AI gây ra, như cảnh báo của một số chuyên gia hàng đầu trong ngành vào năm ngoái.
• Các nhà nghiên cứu từ Đại học Bath (Anh) và Đại học Kỹ thuật Darmstadt (Đức) đã công bố một bài báo vào giữa tháng 8 nhằm xoa dịu những lo ngại này. Họ cho rằng AI và các mô hình ngôn ngữ lớn không thể học độc lập hoặc tiếp thu kỹ năng mới, do đó không gây ra mối đe dọa hiện hữu đối với nhân loại.
• Việc thương mại hóa robot hình người sẽ phải đối mặt với nhiều thách thức, chủ yếu là sự chấp nhận về mặt xã hội và chính trị, do tiềm năng gây xáo trộn đáng kể đối với một phần lớn lực lượng lao động toàn cầu.
📌 Robot AI đang ngày càng phổ biến trong sản xuất, với 3,9 triệu robot hoạt động trên toàn cầu. Dự báo đến giữa thế kỷ, Mỹ có thể có 60 triệu robot hình người làm việc, ảnh hưởng tới 75% nghề nghiệp. Đặc biệt trong xây dựng và nông nghiệp, 70% công việc có thể bị tác động.
https://www.thestar.com.my/tech/tech-news/2024/09/01/ai-powered-robots-could-mean-job-losses-on-farms-and-in-construction
• Microsoft Research giới thiệu AutoGen Studio - công cụ giao diện low-code mới giúp tạo nhanh prototype và đánh giá các quy trình làm việc của hệ thống đa tác tử AI.
• Hệ thống đa tác tử ngày càng quan trọng trong nhiều lĩnh vực, kết hợp các mô hình AI tạo sinh với công cụ chuyên biệt để giải quyết các vấn đề phức tạp.
• Thách thức lớn trong phát triển hệ thống đa tác tử là độ phức tạp trong cấu hình và gỡ lỗi, đòi hỏi quản lý nhiều tham số và phối hợp tương tác giữa các tác tử.
• Các framework hiện có như AutoGen và CAMEL vẫn phụ thuộc nhiều vào lập trình, gây khó khăn cho việc prototype nhanh và phát triển lặp đi lặp lại.
• AutoGen Studio cung cấp giao diện web và API Python, cho phép lắp ráp nhanh hệ thống đa tác tử thông qua giao diện kéo thả trực quan.
• Công cụ này cho phép định nghĩa và tích hợp các thành phần như mô hình AI, kỹ năng và module bộ nhớ vào quy trình làm việc của tác tử một cách trực quan.
• AutoGen Studio hỗ trợ đặc tả khai báo hành vi tác tử bằng JSON, giúp dễ dàng sao chép và chia sẻ quy trình làm việc.
• Công cụ cung cấp các thành phần và mẫu tác tử có thể tái sử dụng, đẩy nhanh quá trình phát triển.
• AutoGen Studio có tính năng phân tích hiệu năng nâng cao, cho phép giám sát và phân tích hiệu suất hệ thống đa tác tử theo thời gian thực.
• Công cụ theo dõi các chỉ số như số lượng tin nhắn trao đổi giữa các tác tử, chi phí token tiêu thụ bởi mô hình AI tạo sinh, tỷ lệ thành công/thất bại khi sử dụng công cụ.
• Khả năng trực quan hóa các chỉ số thông qua bảng điều khiển trực quan giúp người dùng dễ dàng gỡ lỗi và tinh chỉnh quy trình làm việc.
• AutoGen Studio đã được tải xuống hơn 200.000 lần trong 5 tháng đầu tiên phát hành, cho thấy sự chấp nhận nhanh chóng từ cộng đồng nhà phát triển.
📌 AutoGen Studio của Microsoft Research là bước tiến quan trọng trong hệ thống đa tác tử AI, cung cấp môi trường no-code để prototype nhanh. Với hơn 200.000 lượt tải trong 5 tháng, công cụ này đơn giản hóa việc phát triển hệ thống phức tạp, mở rộng khả năng tiếp cận công nghệ mạnh mẽ này cho nhiều nhà phát triển hơn.
https://www.marktechpost.com/2024/08/31/microsoft-research-introduces-autogen-studio-a-low-code-interface-for-rapidly-prototyping-ai-agents/
• Amazon thông báo đã tuyển dụng các nhà sáng lập Covariant - Pieter Abbeel, Peter Chen và Rocky Duan cùng khoảng 1/4 số nhân viên của startup này.
• Amazon cũng ký thỏa thuận cấp phép không độc quyền để sử dụng các mô hình nền tảng robot của Covariant.
• Covariant đang xây dựng "mô hình ngôn ngữ lớn cho ngôn ngữ robot", tạo ra các mô hình AI cho robot, tập trung vào các tác vụ kho hàng phổ biến như chọn vật phẩm từ thùng.
• Joseph Quinlivan, Phó Chủ tịch Amazon Fulfillment Technologies & Robotics, cho biết việc tích hợp công nghệ AI của Covariant vào đội ngũ robot hiện có sẽ nâng cao hiệu suất và tạo ra giá trị thực tế cho khách hàng.
• Thỏa thuận này tương tự như việc Amazon tuyển dụng các nhà sáng lập startup AI Adept vào tháng 6, cho phép Amazon tiếp cận nhân tài và công nghệ mới mà không cần mua lại hoàn toàn một startup hiện có.
• The Verge mô tả cách tiếp cận này là "reverse acquihire", nơi các gã khổng lồ công nghệ đối mặt với sự giám sát chống độc quyền có thể sử dụng các thỏa thuận tuyển dụng và cấp phép để ngụy trang việc mua lại của họ.
• Covariant sẽ tiếp tục hoạt động dưới sự lãnh đạo của Ted Stinson và Tianhao Zhang, với Stinson - trước đây là COO của startup - giờ đây đảm nhận vai trò CEO.
• Covariant khẳng định vẫn "cam kết đưa Covariant Brain vào các môi trường sản xuất trên nhiều ngành công nghiệp toàn cầu, bao gồm may mặc, sức khỏe và làm đẹp, tạp hóa và dược phẩm".
• Thỏa thuận này cho thấy Amazon đang tích cực mở rộng năng lực AI và robotics, đặc biệt trong lĩnh vực kho vận và hoàn thiện đơn hàng.
• Việc tuyển dụng nhóm sáng lập Covariant có thể giúp Amazon tăng cường đáng kể khả năng phát triển và triển khai các giải pháp AI tiên tiến trong hệ thống kho vận của mình.
• Động thái này cũng phản ánh xu hướng ngày càng tăng của các công ty công nghệ lớn trong việc tìm kiếm tài năng AI thông qua các thỏa thuận tuyển dụng và cấp phép thay vì mua lại toàn bộ công ty.
📌 Amazon tuyển dụng nhóm sáng lập Covariant và 1/4 nhân viên, cấp phép sử dụng mô hình AI robot của họ. Covariant tiếp tục hoạt động độc lập. Động thái này giúp Amazon tăng cường năng lực AI robotics trong kho vận, phản ánh xu hướng "reverse acquihire" của các gã khổng lồ công nghệ.
https://techcrunch.com/2024/08/31/amazon-hires-the-founders-of-robotics-ai-startup-covariant/
SEO contents:
1. Meta descriptions:
AI tạo sinh sẽ thay đổi cách chúng ta đặt vé máy bay, đi ăn nhà hàng, đầu tư tài chính, hẹn hò và mua sắm. Các trợ lý ảo thông minh có thể tự động hóa nhiều tác vụ hàng ngày mà không cần sự can thiệp của con người.
2. Meta keywords:
AI tạo sinh, trợ lý ảo, đặt vé du lịch, đặt bàn nhà hàng, tư vấn đầu tư, hẹn hò trực tuyến, mua sắm thông minh
3. SEO title:
Trợ lý AI mới có thể làm mọi việc thay bạn: từ đặt vé máy bay đến tìm người yêu
Tóm tắt chi tiết:
• Các trợ lý AI tự động sẽ có thể thực hiện hầu hết các tác vụ mà con người thực hiện trên thiết bị, mà không cần tương tác nhiều với người dùng.
• Trong lĩnh vực du lịch, AI "Penny" của Priceline sẽ có thể đặt chỗ, gọi điện cho khách sạn để yêu cầu đặc biệt và quản lý mọi nhu cầu du lịch chỉ bằng cách xem lịch của bạn.
• Apple cũng đang phát triển một phiên bản Siri mới có thể truy cập dữ liệu cá nhân trên iPhone để hỗ trợ du lịch, như hiển thị số hộ chiếu hay thêm ảnh vào ghi chú du lịch.
• Trong lĩnh vực nhà hàng, công ty khởi nghiệp Loman AI đang triển khai trợ lý AI 24/7 để trả lời điện thoại, đặt bàn và nhận đơn hàng tại hàng trăm nhà hàng.
• Các bot AI có thể giao tiếp với nhau, như trường hợp bot của Google gọi điện cho bot của Loman để kiểm tra thông tin nhà hàng.
• Trong lĩnh vực đầu tư, Finley AI đang phát triển nền tảng giúp các công ty tài chính xây dựng bot riêng để cung cấp hướng dẫn đầu tư tùy chỉnh cho khách hàng.
• Ứng dụng hẹn hò Grindr sẽ ra mắt trợ lý AI "wingman" vào cuối năm nay để giúp người dùng tìm kiếm đối tượng phù hợp, lên kế hoạch hẹn hò và đặt chỗ tại nhà hàng.
• Trong lĩnh vực mua sắm, các bot AI sẽ có thể tự động tìm kiếm sản phẩm, theo dõi khuyến mãi và thực hiện mua hàng thay người dùng.
• Google Cloud đang phát triển bot AI cho các nhà bán lẻ để hỗ trợ khách hàng tìm kiếm và mua sắm sản phẩm.
• Skyfire đang xây dựng nền tảng thanh toán blockchain cho phép bot thực hiện giao dịch với con người hoặc bot khác, với các tính năng bảo mật như giới hạn mua hàng.
• Các chuyên gia cảnh báo về rủi ro khi tự động hóa đầu tư và cho phép bot truy cập quá nhiều dữ liệu cá nhân. Người dùng cần biết bot nắm giữ thông tin gì và tự chịu trách nhiệm về hành động của bot.
📌 Trợ lý AI đang phát triển nhanh chóng để tự động hóa nhiều khía cạnh cuộc sống hàng ngày, từ đặt vé du lịch đến hẹn hò và mua sắm. Tuy nhiên, vẫn còn những lo ngại về quyền riêng tư và trách nhiệm khi giao nhiều quyền kiểm soát cho AI.
https://www.wsj.com/tech/ai/ai-agents-autonomous-bots-human-tasks-913c0ce5
#WSJ
• Hugging Face vừa công bố hướng dẫn chi tiết giúp các nhà phát triển tự xây dựng và huấn luyện robot được hỗ trợ bởi AI, dựa trên nền tảng LeRobot ra mắt hồi tháng 5.
• Hướng dẫn bao gồm mọi khía cạnh từ tìm nguồn linh kiện đến triển khai mô hình AI, giúp các nhà phát triển ở mọi trình độ có thể thử nghiệm công nghệ robot tiên tiến.
• Remi Cadene, nhà khoa học nghiên cứu chính tại Hugging Face, nhấn mạnh tiềm năng của việc huấn luyện mạng neural dự đoán chuyển động của động cơ trực tiếp từ hình ảnh camera, tương tự cách các mô hình ngôn ngữ lớn xử lý văn bản.
• Trọng tâm của hướng dẫn là cánh tay robot Koch v1.1 giá cả phải chăng, được thiết kế bởi Jess Moss. Phiên bản này cải tiến thiết kế gốc của Alexander Koch với quy trình lắp ráp đơn giản hóa và khả năng nâng cao.
• Hướng dẫn bao gồm video chi tiết hướng dẫn từng bước trong quá trình lắp ráp, đảm bảo ngay cả người mới làm quen với robotics cũng có thể tự xây dựng cánh tay robot được hỗ trợ bởi AI.
• Hugging Face cung cấp công cụ để trực quan hóa và chia sẻ bộ dữ liệu, khuyến khích người dùng đóng góp vào kho lưu trữ dữ liệu chuyển động robot ngày càng phát triển.
• Cadene tiết lộ về một mẫu robot thậm chí còn dễ tiếp cận hơn đang được phát triển. Mẫu Moss v1 này hứa hẹn sẽ giảm chi phí xuống chỉ còn 150 USD cho hai cánh tay và loại bỏ nhu cầu in 3D.
• Sáng kiến này đánh dấu bước ngoặt trong lĩnh vực robotics, vốn trước đây chỉ giới hạn ở các tập đoàn lớn và viện nghiên cứu có nguồn lực dồi dào.
• Việc tích hợp AI với các hệ thống vật lý đại diện cho ranh giới tiếp theo của đổi mới công nghệ, với tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực từ sản xuất đến chăm sóc sức khỏe.
• Tuy nhiên, việc dân chủ hóa công nghệ robotics cũng đặt ra những câu hỏi quan trọng về tương lai của công việc, quyền riêng tư và các cân nhắc đạo đức của tự động hóa rộng rãi.
📌 Hướng dẫn của Hugging Face mở ra kỷ nguyên mới cho robotics, giúp dân chủ hóa công nghệ này. Với chi phí chỉ 150 USD cho robot Moss v1 sắp ra mắt, AI và robotics sẽ trở nên dễ tiếp cận hơn bao giờ hết, mở ra tiềm năng đổi mới và ứng dụng đa dạng trong nhiều lĩnh vực.
https://venturebeat.com/ai/build-your-own-ai-powered-robot-hugging-faces-lerobot-tutorial-is-a-game-changer/
• Physical AI (AI vật lý) là giai đoạn tiếp theo của AI, nơi trí thông minh nhân tạo hiện diện trong các hình thức vật lý và tương tác với thế giới xung quanh. NVIDIA CEO Jensen Huang tin rằng đây sẽ là xu hướng lớn tiếp theo.
• Theo Jensen, có 3 giai đoạn phát triển của AI: AI tiên phong (tạo ra các mô hình nền tảng), AI doanh nghiệp (chatbot và các mô hình AI hỗ trợ năng suất), và cuối cùng là Physical AI.
• Để phát triển Physical AI hiệu quả cần tích hợp đầu vào từ cảm biến và khả năng thao tác các vật thể trong không gian 3 chiều.
• NVIDIA đề xuất cần 3 loại máy tính: một để tạo AI, một để mô phỏng AI, và một để chạy AI. Họ cung cấp các giải pháp phần cứng và phần mềm tương ứng:
- Máy chủ H100 và B100 để tạo AI
- Workstation và máy chủ sử dụng Omniverse với GPU RTX để mô phỏng và kiểm tra AI
- Jetson (sắp tới với GPU Blackwell) để cung cấp khả năng cảm nhận và điều khiển thời gian thực trên robot
• NVIDIA giới thiệu GR00T (Generalist Robot 00 Technology) để thiết kế và mô phỏng chuyển động của robot bằng cách quan sát hành động của con người.
• Hai NIM AI mới cho phép các nhà phát triển robot tạo quy trình mô phỏng trong NVIDIA Isaac Sim:
- MimicGen NIM tạo dữ liệu chuyển động tổng hợp
- Robocasa NIM tạo môi trường và nhiệm vụ robot trong OpenUSD
• NVIDIA OSMO là dịch vụ đám mây giúp điều phối và mở rộng quy trình phát triển robot phức tạp, rút ngắn thời gian triển khai từ hàng tháng xuống dưới 1 tuần.
• Isaac Manipulator cung cấp khả năng khéo léo và AI tiên tiến cho cánh tay robot. Isaac Perceptor mang lại khả năng thị giác 3D đa camera.
• Chip Jetson Thor mới với GPU Blackwell có hiệu suất AI 800 teraflops để chạy các mô hình AI đa phương thức như GR00T.
📌 NVIDIA đang dẫn đầu xu hướng Physical AI với các giải pháp toàn diện từ phần cứng đến phần mềm. Họ kỳ vọng robot sẽ xuất hiện khắp nơi trong tương lai, từ nhà bếp đến nhà máy, với khả năng tương tác thông minh nhờ công nghệ AI tiên tiến.
https://www.forbes.com/sites/karlfreund/2024/08/09/what-is-physical-ai-and-why-it-could-change-the-world/
• Google DeepMind đã phát triển một robot AI có khả năng chơi bóng bàn ở "trình độ nghiệp dư của con người".
• Robot đã thắng 13 trong số 29 trận đấu với người chơi, tỷ lệ thành công phụ thuộc vào trình độ của đối thủ (từ người mới bắt đầu đến nâng cao).
• Đây là robot đầu tiên có thể chơi một môn thể thao với con người ở trình độ ngang bằng, đánh dấu một cột mốc quan trọng trong lĩnh vực học máy và điều khiển robot.
• Bóng bàn được chọn vì bao gồm nhiều yếu tố phức tạp như vật lý chuyển động và phối hợp mắt-tay.
• Robot được huấn luyện bằng cách tập trung vào từng loại cú đánh riêng biệt (như xoáy trái, giao bóng thuận tay), kết hợp với thuật toán cấp cao hơn để chọn cú đánh phù hợp.
• Robot gặp khó khăn nhất với những cú đánh nhanh, do có ít thời gian để "suy nghĩ" về phản ứng.
• Các nhà nghiên cứu đang tìm cách cải thiện hệ thống, bao gồm việc làm cho nó khó đoán hơn trong lối chơi.
• Robot có khả năng học hỏi từ chiến thuật của đối thủ và đánh giá điểm mạnh, điểm yếu của họ.
• Thành tựu này mới chỉ là bước tiến nhỏ trong lĩnh vực rộng lớn hơn là phát triển robot có khả năng thực hiện các kỹ năng hữu ích trong thế giới thực.
• Nghiên cứu này mở ra triển vọng ứng dụng AI vào các nhiệm vụ vật lý phức tạp đòi hỏi sự kết hợp nhiều kỹ năng khác nhau.
📌 Google DeepMind đã tạo ra robot AI chơi bóng bàn ngang tầm người, thắng 13/29 trận. Đây là bước tiến quan trọng trong việc phát triển robot có kỹ năng phức tạp, mở ra khả năng ứng dụng AI vào các nhiệm vụ thực tế đa dạng trong tương lai.
https://www.techradar.com/computing/artificial-intelligence/googles-deepmind-ai-can-now-play-table-tennis-to-a-competitive-level
• Các mô hình ngôn ngữ lớn mã hóa (CodeLLMs) đã chứng tỏ khả năng tạo mã ấn tượng, nhưng vẫn gặp khó khăn với các nhiệm vụ phức tạp trong kỹ thuật phần mềm như phát triển toàn bộ hệ thống phần mềm dựa trên các thông số kỹ thuật phức tạp.
• Các nghiên cứu gần đây, bao gồm ChatDev và MetaGPT, đã giới thiệu các khung đa tác nhân cho phát triển phần mềm, nơi các tác nhân hợp tác để đạt được các mục tiêu phức tạp. Tuy nhiên, chúng có xu hướng đơn giản hóa quá mức bản chất phức tạp của quá trình phát triển phần mềm trong thực tế, nơi phần mềm liên tục được cải thiện và nâng cấp.
• Nhóm nghiên cứu từ Trung tâm AI của FPT Software đề xuất AgileCoder, một khung làm việc mới lạ bắt chước quá trình phát triển phần mềm phức tạp trong thực tế bằng cách lấy cảm hứng từ Phương pháp Linh hoạt, một phương pháp được sử dụng rộng rãi trong các nhóm phát triển phần mềm chuyên nghiệp. Khoảng 70% các nhóm chuyên nghiệp sử dụng Phương pháp Linh hoạt, phù hợp hơn với phát triển phần mềm trong thực tế.
• AgileCoder bao gồm nhiều tác nhân đóng vai trò khác nhau: Quản lý Dự án, Scrum Master, Nhà phát triển, Nhà phát triển Cao cấp và Kiểm thử viên. Các tác nhân này làm việc hợp tác trong các sprint để hoàn thành các nhiệm vụ của người dùng theo phương pháp Linh hoạt.
• Một điểm mới trong AgileCoder là Bộ tạo Đồ thị Mã động, tạo ra Đồ thị Phụ thuộc Mã (CDG) mô hình hóa mối quan hệ giữa các tệp mã và cập nhật khi có thay đổi mã nguồn. CDG đóng vai trò quan trọng trong việc viết các kế hoạch kiểm tra hợp lý và cho phép truy xuất mã hiệu quả.
• Đánh giá toàn diện trên các bộ chuẩn như HumanEval, MBPP và ProjectDev cho thấy AgileCoder vượt trội hơn so với các phương pháp khác. Trên HumanEval và MBPP, AgileCoder vượt trội đáng kể so với CodeLLMs và các khung đa tác nhân tiên tiến như ChatDev và MetaGPT.
📌 AgileCoder là một khung đa tác nhân mới lạ cho phát triển phần mềm, lấy cảm hứng từ phương pháp Linh hoạt. Nó vượt trội hơn các phương pháp hiện có như ChatDev và MetaGPT trong các nhiệm vụ phát triển phần mềm phức tạp bằng cách sử dụng CodeLLMs.
https://www.marktechpost.com/2024/08/10/researchers-at-fpt-software-ai-center-introduce-agilecoder-a-multi-agent-system-for-generating-complex-software-surpassing-metagpt-and-chatdev/
• Mistral AI, công ty khởi nghiệp AI của Pháp, vừa ra mắt La Plateforme - nền tảng xây dựng AI agent mới của họ.
• La Plateforme cho phép người dùng tạo ra các AI agent có thể thực hiện nhiều tác vụ khác nhau như trả lời câu hỏi, phân tích dữ liệu và tạo nội dung.
• Nền tảng này hỗ trợ nhiều loại mô hình ngôn ngữ lớn (LLM) khác nhau, bao gồm cả các mô hình nguồn mở và độc quyền.
• La Plateforme cung cấp giao diện lập trình ứng dụng (API) để tích hợp các AI agent vào các ứng dụng và dịch vụ khác.
• Người dùng có thể tùy chỉnh các AI agent bằng cách sử dụng các công cụ và tính năng có sẵn trên nền tảng.
• Mistral AI nhấn mạnh tầm quan trọng của việc phát triển AI có trách nhiệm và đạo đức thông qua La Plateforme.
• Nền tảng này được thiết kế để hỗ trợ cả nhà phát triển cá nhân và doanh nghiệp trong việc xây dựng các ứng dụng AI.
• La Plateforme cung cấp các tính năng bảo mật và quyền riêng tư để bảo vệ dữ liệu của người dùng.
• Mistral AI hy vọng La Plateforme sẽ thúc đẩy sự đổi mới và sáng tạo trong lĩnh vực AI.
• Công ty cũng công bố kế hoạch mở rộng khả năng của nền tảng trong tương lai, bao gồm hỗ trợ cho các mô hình đa phương thức.
• La Plateforme hiện đang trong giai đoạn beta và Mistral AI đang mời các nhà phát triển tham gia thử nghiệm.
• Nền tảng này được kỳ vọng sẽ cạnh tranh với các nền tảng AI agent khác trên thị trường như OpenAI's GPT-4 và Anthropic's Claude.
• Mistral AI đã huy động được 385 triệu euro (khoảng 414 triệu USD) trong vòng gọi vốn Series A vào tháng 12/2023.
• Công ty được thành lập bởi các cựu nhân viên của DeepMind và Meta, với mục tiêu phát triển các giải pháp AI tiên tiến.
• La Plateforme được xem là bước đi quan trọng của Mistral AI trong việc định vị mình như một đối thủ cạnh tranh lớn trong lĩnh vực AI.
📌 Mistral AI ra mắt La Plateforme, nền tảng xây dựng AI agent mới hỗ trợ nhiều LLM. Nền tảng cung cấp API, tính năng tùy chỉnh và bảo mật cho nhà phát triển và doanh nghiệp. Mistral AI, được thành lập bởi cựu nhân viên DeepMind và Meta, đã huy động 414 triệu USD vào tháng 12/2023.
https://analyticsindiamag.com/ai-news-updates/mistral-releases-la-plateforme-for-building-ai-agents/
• Wordware là IDE đầu tiên dành riêng để xây dựng AI sử dụng Lập trình Ngôn ngữ Tự nhiên (NLP), giúp phát triển ứng dụng AI nhanh hơn 20 lần.
• Công cụ này được thiết kế để trao quyền cho các chuyên gia lĩnh vực, nhóm và kỹ sư phần mềm, đặc biệt hữu ích cho những người không có kỹ năng lập trình truyền thống.
• Giao diện thân thiện với người dùng của Wordware cho phép tạo các agent AI phức tạp một cách dễ dàng bằng ngôn ngữ tự nhiên.
• Nền tảng cung cấp các công cụ tích hợp sẵn như chuyển đổi giọng nói thành văn bản, tạo hình ảnh và mô-đun nghiên cứu.
• Wordware hỗ trợ triển khai ứng dụng và API chỉ với một cú nhấp chuột, đơn giản hóa quá trình phát triển.
• Thư viện cộng đồng của nền tảng hoạt động giống như GitHub, cung cấp kho lưu trữ các agent sẵn sàng sử dụng.
• Khả năng kỹ thuật nâng cao bao gồm vòng lặp, phân nhánh, an toàn kiểu và thực thi mã tùy chỉnh.
• Wordware tăng tốc quá trình lặp lại bằng cách cho phép người dùng nhanh chóng đánh giá chất lượng đầu ra và tinh chỉnh agent AI.
• Giao diện giống Notion của nền tảng hỗ trợ quản lý lệnh, cộng tác liền mạch và hợp lý hóa quy trình làm việc.
• Wordware hỗ trợ nhiều nhà cung cấp mô hình ngôn ngữ lớn, cho phép tối ưu hóa quy trình làm việc với tỷ lệ chi phí-độ trễ-chất lượng tốt nhất.
• Một tính năng nổi bật của Wordware là hỗ trợ đa phương thức, cho phép tích hợp văn bản, hình ảnh, âm thanh và video trong quy trình làm việc AI.
• Người dùng có thể chuyển đổi linh hoạt giữa các phương thức dữ liệu, cải thiện tính linh hoạt và khả năng ứng dụng của các agent AI.
• Wordware loại bỏ các hạn chế của công cụ không mã truyền thống, cho phép mọi thành viên trong nhóm đóng góp độc lập vào quá trình phát triển AI.
📌 Wordware là IDE đột phá cho phép phát triển ứng dụng AI nhanh hơn 20 lần bằng lập trình ngôn ngữ tự nhiên. Với giao diện thân thiện, hỗ trợ đa phương tiện và cộng tác hiệu quả, nó trao quyền cho cả chuyên gia lĩnh vực lẫn kỹ sư phần mềm xây dựng AI phức tạp dễ dàng.
https://aitoolsclub.com/meet-wordware-an-ai-tool-that-helps-you-build-your-own-ai-agents-and-apps-using-prompts/
• Figure AI, startup được hậu thuẫn bởi OpenAI, vừa tung ra video teaser cho robot hình người mới mang tên Figure 02, dự kiến ra mắt vào ngày 6/8/2024.
• Video ngắn nhưng ấn tượng, cho thấy các khớp nối và chi tiết robot tiên tiến, thiết kế lưới linh hoạt, với mô-men xoắn lên tới 150Nm và phạm vi chuyển động (ROM) lên tới 195 độ.
• Nhà sáng lập Brett Adcock tuyên bố Figure 02 là "robot hình người tiên tiến nhất hành tinh".
• Figure AI được thành lập năm 2022, đã huy động được 675 triệu USD trong vòng gọi vốn gần nhất vào tháng 2/2024. Các nhà đầu tư lớn bao gồm OpenAI, NVidia, Microsoft, Intel Capital và Bezos Expeditions.
• Công ty đã ký thỏa thuận hợp tác với BMW Manufacturing và tích hợp ấn tượng GPT-4V của OpenAI vào robot Figure 01 trước đó.
• Cạnh tranh trong lĩnh vực robot hình người đang ngày càng gay gắt. Tesla của Elon Musk đang phát triển robot Optimus, Nvidia có dự án GR00T, Boston Dynamics cũng nâng cấp robot Atlas.
• Figure AI nhắm đến thị trường lao động toàn cầu, với mục tiêu đưa robot vào các ngành sản xuất, hậu cần, kho bãi và bán lẻ.
• Công ty cam kết không vũ khí hóa robot và tập trung vào việc tăng năng suất, an toàn bằng cách thay thế con người trong các công việc nguy hiểm.
• Elon Musk dự đoán thị trường tiềm năng lên tới hơn 10 tỷ robot hình người trên Trái đất.
• Với sự hậu thuẫn mạnh mẽ và đà phát triển hiện tại, Figure AI đang ở vị thế thuận lợi để tiếp tục đột phá trong lĩnh vực robot hình người.
📌 Figure AI giới thiệu robot hình người Figure 02 mới với thiết kế tiên tiến, được hỗ trợ bởi các "ông lớn" công nghệ như OpenAI, NVidia. Cạnh tranh trong lĩnh vực này ngày càng gay gắt với sự tham gia của Tesla, Nvidia và Boston Dynamics, hướng tới thị trường tiềm năng 10 tỷ robot toàn cầu.
https://venturebeat.com/ai/openai-backed-startup-figure-teases-new-humanoid-robot-figure-02/
• Nvidia công bố các tiến bộ lớn cho Universal Scene Description (OpenUSD), mở rộng khả năng ứng dụng của khung trao đổi dữ liệu 3D phổ quát này trong lĩnh vực robot, thiết kế và kỹ thuật công nghiệp.
• Công ty giới thiệu các mô hình AI tạo sinh đầu tiên trên thế giới có khả năng hiểu ngôn ngữ, hình học, vật liệu, vật lý và không gian dựa trên OpenUSD.
• Các dịch vụ vi mô Nvidia NIM mới cho phép tạo ra ngôn ngữ OpenUSD để trả lời truy vấn của người dùng, tạo mã Python OpenUSD, áp dụng vật liệu cho đối tượng 3D và hiểu không gian 3D cùng vật lý để đẩy nhanh phát triển bản sao kỹ thuật số.
• Nvidia cung cấp các đầu nối USD mới cho các định dạng dữ liệu mô phỏng robot và công nghiệp, cùng công cụ cho phép truyền dữ liệu lớn được ray-traced hoàn toàn bằng Nvidia RTX tới Apple Vision Pro.
• Các dịch vụ vi mô NIM đang được cung cấp bản xem trước bao gồm: USD Code, USD Search, USD Validate. Các dịch vụ sắp ra mắt gồm: USD Layout, USD SmartMaterial, fVDB Mesh Generation, fVDB Physics Super-Res, fVDB NeRF-XL.
• Foxconn, nhà sản xuất toàn cầu với hơn 170 nhà máy trên thế giới, đang sử dụng dịch vụ vi mô NIM và Omniverse để tạo bản sao kỹ thuật số của một nhà máy đang phát triển.
• WPP, công ty dịch vụ tiếp thị và truyền thông hàng đầu thế giới, là người áp dụng sớm các dịch vụ vi mô USD Search và USD Code NIM trong quy trình sáng tạo nội dung được hỗ trợ bởi AI tạo sinh.
• Nvidia và Siemens mở rộng hợp tác để tích hợp quy trình OpenUSD với danh mục công nghệ mô phỏng Simcenter, hỗ trợ ra quyết định dựa trên bằng chứng và cộng tác giữa các bên liên quan chính.
• Nvidia phát hành đầu nối từ Unified Robotics Description Format sang OpenUSD, cho phép các nhà robot học dễ dàng mang dữ liệu robot của họ qua các ứng dụng khác nhau.
• Công ty cũng công bố bộ công cụ phát triển phần mềm OpenUSD Exchange, cho phép các nhà phát triển xây dựng các đầu nối dữ liệu OpenUSD mạnh mẽ của riêng họ.
• Các công cụ và API mới để truyền cảnh OpenUSD quy mô lớn từ ứng dụng xây dựng trên nền tảng Omniverse tới Apple Vision Pro hiện đã có sẵn trong bản truy cập sớm.
📌 Nvidia đã giới thiệu các dịch vụ vi mô NIM và AI tạo sinh cho OpenUSD, mở rộng ứng dụng trong công nghiệp và robot. Các công cụ mới giúp tạo thế giới ảo chính xác cho AI thế hệ tiếp theo, với hơn 10.000 công ty đang sử dụng Omniverse và 30 công ty đóng góp cho OpenUSD.
https://venturebeat.com/ai/nvidia-unveils-generative-ai-and-nim-microservices-for-openusd/
- Tác tử AI sử dụng mô hình nền tảng như mô hình ngôn ngữ lớn (LLM) để thực hiện các quy trình công việc phức tạp thông qua tương tác bằng ngôn ngữ tự nhiên.
- Tác tử AI có thể xử lý đa dạng tình huống đầu vào/đầu ra, được hướng dẫn bằng ngôn ngữ tự nhiên và tương tác với các công cụ, nền tảng phần mềm hiện có.
- Quy trình hoạt động gồm 4 bước: người dùng đưa chỉ dẫn, hệ thống tác tử lập kế hoạch và giao việc cho các tác tử con, cải tiến đầu ra, thực thi hành động.
- Giá trị mà tác tử AI có thể mang lại cho doanh nghiệp:
+ Tự động hóa các quy trình phức tạp, có nhiều biến thể đầu vào/đầu ra mà trước đây khó tự động hóa một cách hiệu quả về chi phí và thời gian.
+ Giảm bớt sự phụ thuộc vào lập trình viên nhờ khả năng tiếp nhận chỉ dẫn bằng ngôn ngữ tự nhiên, cho phép nhân viên phi kỹ thuật cũng có thể mã hóa tri thức.
+ Tích hợp liền mạch với hệ sinh thái công cụ, nền tảng phần mềm sẵn có của doanh nghiệp, tạo ra quy trình làm việc xuyên suốt.
+ Đóng vai trò như đồng nghiệp ảo thông minh, có thể phối hợp làm việc với con người một cách trơn tru và tự nhiên.
- Một số ứng dụng tiềm năng của tác tử AI:
+ Tự động hóa quy trình thẩm định khoản vay: Nhóm tác tử chuyên biệt phân tích thông tin người vay, tính toán chỉ số tài chính, phát hiện sai sót, lặp lại cho đến khi hoàn thành báo cáo tín dụng. Giảm 20-60% thời gian xét duyệt.
+ Hiện đại hóa mã nguồn cũ: Tác tử chuyên gia phân tích mã cũ, ghi chú logic nghiệp vụ. Tác tử đảm bảo chất lượng kiểm tra, tạo ca kiểm thử. Quy trình lặp lại giúp tinh chỉnh đầu ra, giảm chi phí phát triển phần mềm.
+ Tạo chiến dịch marketing trực tuyến: Tác tử chiến lược khai thác dữ liệu thị trường để lập chiến lược. Tác tử viết nội dung, thiết kế tạo nội dung phù hợp từng phân khúc. Người đánh giá thương hiệu. Các tác tử phối hợp tinh chỉnh, tối ưu tác động và giảm rủi ro.
- Để chuẩn bị cho kỷ nguyên tác tử AI, doanh nghiệp cần: mã hóa tri thức phù hợp, lập kế hoạch công nghệ chiến lược, xây dựng cơ chế kiểm soát có sự tham gia của con người.
- Một số rủi ro cần lưu ý khi triển khai tác tử AI:
+ Đầu ra có hại tiềm tàng: Cần giải thích được quá trình ra quyết định của tác tử, giới hạn hành động dựa trên độ phức tạp, giám sát của con người.
+ Lạm dụng công cụ: Áp dụng kiểm soát truy cập, giới hạn môi trường hoạt động, giám sát thời gian thực và đánh giá định kỳ.
+ Thiếu/thừa lòng tin giữa người và máy: Đảm bảo minh bạch quá trình, đào tạo người dùng, duy trì giám sát của con người, đánh giá hiệu quả gắn với kết quả cụ thể.
- Các vấn đề rộng hơn cần xem xét khi triển khai tác tử AI: điều chỉnh giá trị tổ chức, chuyển dịch vai trò lao động, đặc điểm nhân hóa của tác tử.
📌 Tác tử AI hứa hẹn cách mạng hóa cách thức làm việc và mang lại nhiều giá trị cho doanh nghiệp. Khảo sát gần đây của McKinsey cho thấy 72% công ty đang triển khai AI, ngày càng quan tâm đến AI tạo sinh. Tác tử AI có thể tự động hóa các quy trình phức tạp, giảm sự phụ thuộc vào lập trình viên, tích hợp liền mạch với hệ thống sẵn có và đóng vai trò như đồng nghiệp ảo thông minh. Ứng dụng tiềm năng trong tài chính, công nghệ, marketing có thể giảm 20-60% thời gian, chi phí. Tuy nhiên, công nghệ này vẫn đang trong giai đoạn sơ khai với nhiều thách thức về độ tin cậy, lạm dụng, niềm tin giữa người-máy. Việc tích hợp tác tử AI đòi hỏi chuẩn bị kỹ lưỡng về tri thức, công nghệ, con người và xem xét các vấn đề đạo đức, xã hội rộng hơn.
https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/why-agents-are-the-next-frontier-of-generative-ai
#McKinsey
• Capgemini dự đoán các AI agents tự trị có khả năng giao tiếp với nhau sẽ xuất hiện vào năm 2025.
• Hệ thống "AI đa tác tử" này bao gồm nhiều agents làm việc cùng nhau để giải quyết các tác vụ một cách phân tán và hợp tác.
• Pascal Brier, Giám đốc Đổi mới của Capgemini, cho biết công ty đã thấy các doanh nghiệp thảo luận về công nghệ agent này và kỳ vọng các ứng dụng sử dụng nhiều agents tự trị sẽ xuất hiện vào năm tới.
• Capgemini định nghĩa AI agents là "công nghệ được thiết kế để hoạt động độc lập, lập kế hoạch, suy ngẫm, theo đuổi mục tiêu cấp cao hơn và thực hiện quy trình công việc phức tạp với sự giám sát trực tiếp tối thiểu hoặc hạn chế của con người".
• Báo cáo mới của Capgemini cho thấy 82% công ty được khảo sát có kế hoạch tích hợp AI agents trong vòng 1-3 năm tới, trong khi chỉ 7% không có kế hoạch tích hợp.
• Có hai loại AI agents: agents cá nhân thực hiện nhiệm vụ thay bạn và công nghệ đa tác tử với "các agents giao tiếp với nhau".
• Ví dụ, một AI agent marketing tạo chiến dịch quảng cáo ở Đức có thể tự động làm việc với agent khác trong bộ phận pháp lý để đảm bảo tính hợp pháp.
• 71% tổ chức kỳ vọng AI agents sẽ thúc đẩy tự động hóa, 64% kỳ vọng chúng sẽ giảm bớt công việc lặp lại cho nhân viên.
• Capgemini ghi nhận số lượng tổ chức tích hợp AI tạo sinh tăng gấp 4 lần, từ 6% năm 2023 lên 24% năm nay.
• Tuy nhiên, có khoảng cách về mức độ áp dụng giữa các công ty lớn và nhỏ. 10% công ty có doanh thu 1-5 tỷ USD đang triển khai AI tạo sinh, con số này là 49% với các công ty có doanh thu từ 20 tỷ USD trở lên.
• Mức độ áp dụng cũng khác nhau giữa các ngành. 88% tổ chức trong lĩnh vực hàng không vũ trụ và quốc phòng đã đầu tư vào AI tạo sinh, trong khi con số này ở ngành bán lẻ chỉ là 66%.
📌 Capgemini dự đoán AI agents tự trị sẽ xuất hiện vào 2025, với 82% công ty có kế hoạch tích hợp trong 3 năm tới. Công nghệ này hứa hẹn thúc đẩy tự động hóa và giảm công việc lặp lại, nhưng vẫn tồn tại khoảng cách áp dụng giữa các công ty lớn nhỏ và các ngành khác nhau.
https://www.cnbc.com/2024/07/22/ai-that-can-talk-with-other-ai-will-launch-in-2025-capgemini-predicts.html
• AI agent được mô tả đơn giản là phần mềm sử dụng AI để thực hiện một loạt công việc thay thế con người như dịch vụ khách hàng, nhân sự hay hỗ trợ IT. Tuy nhiên, định nghĩa chính xác về AI agent vẫn chưa thống nhất.
• Các công ty công nghệ lớn có cách hiểu khác nhau về AI agent:
- Google xem đây là trợ lý thực hiện nhiệm vụ cụ thể như hỗ trợ lập trình, marketing hay IT.
- Asana coi AI agent như một nhân viên thêm, có thể được giao nhiệm vụ.
- Sierra (startup của cựu CEO Salesforce) xem đây là công cụ trải nghiệm khách hàng, giải quyết vấn đề phức tạp hơn chatbot.
• Rudina Seseri, nhà sáng lập Glasswing Ventures, cho rằng AI agent là hệ thống phần mềm thông minh có thể tự chủ nhận thức môi trường, suy luận, ra quyết định và hành động để đạt mục tiêu cụ thể.
• Aaron Levie, CEO Box, lạc quan về sự phát triển của AI agent nhờ cải thiện về hiệu năng GPU, hiệu quả và chất lượng mô hình, cơ sở hạ tầng AI.
• Tuy nhiên, chuyên gia robot Rodney Brooks cảnh báo không nên quá lạc quan vì AI phải đối mặt với những vấn đề phức tạp hơn nhiều công nghệ khác.
• Thách thức lớn là khả năng truy cập nhiều hệ thống khác nhau và xử lý các vấn đề phát sinh. Nhiều hệ thống cũ thiếu API cơ bản.
• David Cushman từ HFS Research cho rằng AI agent hiện tại mới chỉ là trợ lý giúp con người hoàn thành nhiệm vụ, chưa thể tự động hoàn toàn.
• Jon Turow, đối tác tại Madrona Ventures, cho rằng cần xây dựng hạ tầng và tech stack riêng cho AI agent.
• Fred Havemeyer, chuyên gia nghiên cứu tại Macquarie, dự đoán AI agent hiệu quả nhất sẽ là tập hợp nhiều mô hình khác nhau với lớp định tuyến gửi yêu cầu đến agent và mô hình phù hợp nhất.
• Mục tiêu cuối cùng là AI agent có thể hoàn toàn tự chủ, lập luận và thực hiện các bước để đạt mục tiêu trừu tượng. Tuy nhiên, công nghệ hiện tại vẫn cần nhiều bước tiến để đạt được điều này.
📌 AI agent là công nghệ đầy hứa hẹn nhưng còn nhiều thách thức. Chưa có định nghĩa thống nhất, cần phát triển hạ tầng và khả năng tự chủ. Mục tiêu là AI agent có thể hoàn toàn tự lập luận và thực hiện các bước để đạt mục tiêu trừu tượng, nhưng còn cần nhiều bước tiến công nghệ.
https://techcrunch.com/2024/07/13/what-exactly-is-an-ai-agent/
• Các công ty đám mây lớn như AWS, Google Cloud và Microsoft Azure đang tập trung phát triển AI agents - các hệ thống AI có khả năng tự động hóa các tác vụ phức tạp.
• AWS đã giới thiệu Amazon Q, một AI agent được thiết kế để hỗ trợ các nhà phát triển và chuyên gia IT. Amazon Q có thể trả lời câu hỏi, viết code và thực hiện các tác vụ phức tạp trên nền tảng AWS.
• Google Cloud đang phát triển Duet AI, một AI agent có khả năng tự động hóa các tác vụ như viết code, phân tích dữ liệu và quản lý cơ sở hạ tầng đám mây.
• Microsoft Azure cũng đang tích cực phát triển AI agents thông qua nền tảng Azure OpenAI Service và công cụ Copilot.
• Các AI agents này được kỳ vọng sẽ giúp tự động hóa nhiều tác vụ phức tạp trong môi trường đám mây, từ quản lý cơ sở hạ tầng đến phát triển ứng dụng và phân tích dữ liệu.
• Theo các chuyên gia, AI agents có tiềm năng cách mạng hóa cách thức hoạt động của các nền tảng đám mây, giúp tăng hiệu quả và giảm chi phí cho doanh nghiệp.
• Tuy nhiên, việc phát triển và triển khai AI agents cũng đặt ra nhiều thách thức về bảo mật, quyền riêng tư và đạo đức.
• Các công ty đám mây đang tập trung vào việc xây dựng các AI agents có khả năng học hỏi và thích nghi với nhu cầu cụ thể của từng khách hàng.
• Ngoài các gã khổng lồ công nghệ, nhiều startup cũng đang tham gia vào cuộc đua phát triển AI agents cho môi trường đám mây.
• Các chuyên gia dự đoán rằng AI agents sẽ trở thành một phần không thể thiếu của các nền tảng đám mây trong tương lai gần, mang lại những thay đổi lớn cho ngành công nghiệp này.
• Việc tích hợp AI agents vào các nền tảng đám mây được kỳ vọng sẽ tạo ra một làn sóng đổi mới trong cách doanh nghiệp sử dụng và quản lý tài nguyên đám mây.
• Các công ty đám mây đang đầu tư mạnh vào nghiên cứu và phát triển để cải thiện khả năng của AI agents, bao gồm việc tăng cường khả năng xử lý ngôn ngữ tự nhiên và học máy.
📌 AWS, Google Cloud và Microsoft Azure đang đua nhau phát triển AI agents để tự động hóa tác vụ phức tạp trên nền tảng đám mây. Các AI agents như Amazon Q và Duet AI hứa hẹn cách mạng hóa cách doanh nghiệp sử dụng đám mây, tăng hiệu quả và giảm chi phí, nhưng cũng đặt ra thách thức về bảo mật và đạo đức.
Citations:
[1] https://analyticsindiamag.com/aws-google-and-other-cloud-giants-go-after-ai-agents/
- Jacobi Robotics, một startup từ UC Berkeley, đang phát triển phần mềm AI để tự động hóa việc xếp hàng hóa lên pallet trong kho.
- Có hơn 2 tỷ pallet đang lưu thông tại Mỹ, vận chuyển hàng hóa trị giá 400 tỷ USD mỗi năm. Tuy nhiên, việc xếp hàng lên pallet vẫn chủ yếu thủ công, gây nguy cơ chấn thương cao cho công nhân.
- Phần mềm của Jacobi sử dụng deep learning để tạo ra "bản nháp" về cách di chuyển của cánh tay robot, sau đó dùng các phương pháp truyền thống để kiểm tra tính an toàn và khả thi.
- Quy trình lập trình robot truyền thống mất hàng tháng. Jacobi hứa hẹn rút ngắn thời gian này xuống chỉ còn 1 ngày, tính toán chuyển động trong chưa đầy 1 mili giây.
- Phần mềm cho phép khách hàng tạo mô phỏng kho của họ, bao gồm mô hình robot, loại hộp, hướng nhãn. Thuật toán sẽ tự động lập kế hoạch chuyển động tối ưu cho cánh tay robot.
- Cách tiếp cận kết hợp tốc độ tính toán nhanh của AI với độ chính xác của kỹ thuật robot truyền thống, giảm khả năng xảy ra lỗi.
- Tốc độ lập kế hoạch nhanh đưa robot vào một hạng mục mới. Mỗi khoảng dừng đồng nghĩa với sự chậm trễ trong môi trường công nghiệp.
- Jacobi nhận được 5 triệu USD từ vòng gọi vốn hạt giống do Moxxie Ventures dẫn đầu, dự kiến ra mắt sản phẩm vào cuối tháng này.
📌 Jacobi Robotics đang phát triển giải pháp AI giúp rút ngắn thời gian lập trình robot xếp pallet từ hàng tháng xuống chỉ 1 ngày. Phần mềm kết hợp deep learning và kỹ thuật robot truyền thống, tính toán chuyển động trong chưa đầy 1 ms. Startup nhận được 5 triệu USD đầu tư và sẽ ra mắt sản phẩm cuối tháng này.
https://www.technologyreview.com/2024/07/11/1094829/ai-is-poised-to-automate-todays-most-mundane-manual-warehouse-task/
#MIT
• Chloe là robot AI nữ tự học đầu tiên trên thế giới, được thiết kế bởi Cyberlife để chuyển đổi cách chúng ta sống. Cô có ngoại hình giống người thật và khả năng tiên tiến, dễ dàng hòa nhập vào môi trường con người.
• Chloe có thể thực hiện nhiều công việc hàng ngày như nấu ăn, dọn dẹp nhà cửa, theo dõi lịch hẹn. Cô giải phóng thời gian cho con người bằng cách đảm nhận các công việc hàng ngày này.
• Điểm đặc biệt của Chloe là khả năng học hỏi và cải thiện theo thời gian. Cô có thể thực hiện các thao tác phức tạp nhanh chóng, thể hiện trí thông minh cao. Chloe học hỏi từ trải nghiệm, cho phép cô thích nghi với sở thích của chủ nhân.
• Chloe là android đầu tiên vượt qua bài kiểm tra Turing - một cột mốc quan trọng trong lĩnh vực AI. Cô có thể tham gia các cuộc trò chuyện tự nhiên đến mức người ta không thể phân biệt được cô không phải là con người.
• Trong game "Detroit: Become Human", Chloe đóng vai trò là trợ lý cá nhân do Cyberlife tạo ra. Cô xuất hiện ở đầu game, trong một cảnh quan trọng với Elijah Kamski và ở cuối game, nơi cô đưa ra lựa chọn cuối cùng ảnh hưởng đến kết quả câu chuyện.
• Về ngoại hình, Chloe là mẫu android ST200 với mái tóc vàng dài, mắt xanh và làn da trắng. Cô mặc một chiếc váy xanh đậm trang trọng và đi chân trần, tạo cảm giác thoải mái và thân thiện.
• Chloe được thể hiện bởi nhiều nữ diễn viên khác nhau. Ban đầu là Gabrielle Hersh, sau đó là Barbara Scaff cho các cảnh menu tương tác. Một nữ diễn viên khác đã thể hiện Chloe nói tiếng Pháp trong video quảng cáo ở Paris.
• Sự xuất hiện của Chloe trong "Detroit: Become Human" đã được đón nhận tích cực. Người chơi đánh giá cao khả năng tương tác thực tế và sự tích hợp liền mạch của nhân vật vào cốt truyện.
• Chloe đã tạo ra mối liên kết cảm xúc sâu sắc với người chơi. Vai trò của cô trong game, từ chào đón người chơi đến tham gia vào các khoảnh khắc quan trọng của câu chuyện, khiến cô trở thành hơn cả một trợ lý.
📌 Chloe, robot AI nữ tự học đầu tiên, đã vượt qua bài kiểm tra Turing và gây ấn tượng mạnh trong game Detroit: Become Human. Với khả năng thực hiện nhiều tác vụ phức tạp, học hỏi liên tục và tạo kết nối cảm xúc, Chloe mở ra triển vọng mới cho tương tác giữa người và AI.
https://corexbox.com/meet-chloe-the-worlds-first-self-learning-female-ai-robot/
• Tại Hội nghị Trí tuệ Nhân tạo Thế giới (WAIC) 2024 ở Thượng Hải, Trung tâm Đổi mới Robot Người hình người Liên doanh Quốc gia-Địa phương đã ra mắt robot người hình người đa năng nguồn mở Qinglong lần đầu tiên.
• Qinglong là robot người hình người đa năng kích thước đầy đủ đầu tiên của Trung Quốc, đánh dấu sự gia nhập của nước này vào lĩnh vực robot người hình người tiên tiến.
• Robot được phát triển độc lập bởi Humanoid Robots (Shanghai) Limited, một tổ chức R&D mới được thành lập với vốn đăng ký 1 tỷ nhân dân tệ (140 triệu USD).
• Qinglong cao 185cm, nặng 80kg, có 43 bậc tự do chủ động và đạt mô-men xoắn đỉnh tối đa 400 N·m cùng công suất tính toán 400 TOPS.
• Robot kết hợp chi dưới di động để đi bộ linh hoạt với chi trên nhẹ, chính xác cao để thao tác. Nó hỗ trợ đi bộ nhanh, tránh chướng ngại vật linh hoạt, di chuyển ổn định trên dốc và chống chịu va đập.
• Trung tâm Đổi mới cũng công bố ra mắt trang web cộng đồng nguồn mở OpenLoong, bao gồm cấu trúc phần cứng và thông số của robot, với gói phần mềm trí tuệ nhân tạo sẽ sớm được mở nguồn.
• Jiang Lei, Trưởng nhóm khoa học của Trung tâm, tuyên bố kế hoạch giới thiệu một mẫu robot người hình người mới hàng năm, mỗi mẫu được đặt tên theo một con giáp trong 12 con giáp Trung Quốc.
• Cùng ngày, Tesla cũng ra mắt robot người hình người Optimus thế hệ thứ hai tại WAIC 2024. So với thế hệ đầu tiên, Optimus đã cải thiện tốc độ đi bộ thêm 30% và có thể thực hiện các thao tác tinh vi hơn.
• Tesla dự kiến bắt đầu sản xuất hạn chế robot người hình người vào năm tới, với hơn 1.000 đơn vị Optimus dự kiến sẽ hỗ trợ các nhiệm vụ sản xuất tại các nhà máy Tesla.
• Sự ra mắt của Qinglong và sáng kiến nguồn mở của nó nhằm mục đích thúc đẩy đổi mới, hợp tác và phát triển trong cộng đồng robot và AI toàn cầu, có khả năng thúc đẩy tiến bộ trong nhiều ngành công nghiệp.
📌 Qinglong, robot người hình người đầu tiên của Trung Quốc cao 185cm, nặng 80kg, ra mắt tại WAIC 2024. Với 43 bậc tự do và công suất 400 TOPS, nó đánh dấu bước tiến quan trọng của Trung Quốc trong lĩnh vực robot tiên tiến, cạnh tranh với Optimus của Tesla.
https://technode.com/2024/07/05/qinglong-chinas-first-full-sized-general-purpose-humanoid-robot-unveiled-at-world-artificial-intelligence-conference-2024/
• Thượng Hải đã công bố hướng dẫn quản lý đầu tiên của Trung Quốc về robot hình người, kêu gọi kiểm soát rủi ro và hợp tác quốc tế.
• Hướng dẫn được công bố tại Hội nghị Trí tuệ Nhân tạo Thế giới (WAIC) ngày 6/7/2024.
• Các nhà sản xuất robot hình người cần đảm bảo sản phẩm "không đe dọa an ninh con người" và "bảo vệ hiệu quả phẩm giá con người".
• Hướng dẫn yêu cầu thiết lập quy trình cảnh báo rủi ro, hệ thống ứng phó khẩn cấp và đào tạo người dùng về sử dụng đạo đức và hợp pháp.
• Tài liệu được soạn thảo bởi 5 tổ chức ngành công nghiệp tại Thượng Hải, bao gồm Hiệp hội Luật Thượng Hải và Hiệp hội Công nghiệp Trí tuệ Nhân tạo Thượng Hải.
• Các nhóm này kêu gọi hợp tác toàn cầu trong lĩnh vực robot hình người, đề xuất thiết lập khung quản trị toàn cầu và thành lập think tank quốc tế.
• Nhiều công ty robot mới nổi đã trưng bày sản phẩm tại WAIC.
• Tesla giới thiệu thế hệ thứ hai của robot hình người Optimus, thu hút sự chú ý lớn dù chỉ được đặt sau kính và không di chuyển.
• 18 robot hình người được trưng bày tại hội nghị, phần lớn đến từ các công ty Trung Quốc.
• Leju Robot của Thâm Quyến giới thiệu robot Kuavo chạy trên hệ điều hành dựa trên OpenHarmony của Huawei.
• Trung Quốc đặt mục tiêu sản xuất hàng loạt robot hình người vào năm 2025 và dẫn đầu toàn cầu trong lĩnh vực này vào năm 2027.
• Đến năm 2027, robot hình người được kỳ vọng trở thành "động lực tăng trưởng kinh tế mới quan trọng" tại Trung Quốc, ứng dụng trong các ngành như y tế, dịch vụ gia đình, nông nghiệp và logistics.
• Các công ty Trung Quốc đang nỗ lực bắt kịp đối thủ Mỹ trong các lĩnh vực quan trọng như AI nhằm đạt được tự chủ công nghệ.
• Số lượng đơn đăng ký sáng chế AI tạo sinh của các công ty Trung Quốc trong thập kỷ 2014-2023 cao gấp 6 lần so với Mỹ, theo dữ liệu của Tổ chức Sở hữu Trí tuệ Thế giới.
📌 Thượng Hải công bố hướng dẫn quản lý robot hình người đầu tiên của Trung Quốc, nhấn mạnh an toàn và phẩm giá con người. Trung Quốc đặt mục tiêu sản xuất hàng loạt vào năm 2025, dẫn đầu toàn cầu năm 2027. Các công ty Trung Quốc đang nỗ lực bắt kịp Mỹ trong AI, với số lượng đơn sáng chế AI tạo sinh cao gấp 6 lần trong 10 năm qua.
https://www.scmp.com/tech/policy/article/3269500/chinas-laws-robotics-shanghai-publishes-first-humanoid-robot-guidelines
• AI agent là các mô hình và thuật toán AI có khả năng tự động đưa ra quyết định trong một thế giới năng động. Chúng được kỳ vọng sẽ trở thành công nghệ AI tiên tiến tiếp theo sau ChatGPT.
• Tầm nhìn lớn cho AI agent là một hệ thống có thể thực hiện nhiều tác vụ đa dạng như một trợ lý con người. Ví dụ, nó có thể giúp đặt vé du lịch, lên lịch trình, gợi ý khách sạn phù hợp sở thích, đề xuất chuyến bay phù hợp lịch làm việc, lập danh sách đồ cần mang theo dựa trên dự báo thời tiết, v.v.
• AI agent được kỳ vọng sẽ là đa phương thức, có khả năng xử lý ngôn ngữ, âm thanh và video. Ví dụ như Astra của Google có thể tương tác qua văn bản, giọng nói và hình ảnh từ camera.
• Có hai loại AI agent chính: Agent phần mềm chạy trên máy tính/điện thoại và agent vật lý hiện diện trong thế giới 3D như trò chơi hoặc robot.
• AI agent có thể giúp doanh nghiệp và tổ chức công tối ưu hóa quy trình. Ví dụ, nó có thể đóng vai trò chatbot chăm sóc khách hàng thông minh hơn, có khả năng xử lý khiếu nại phức tạp mà không cần giám sát.
• Một số ví dụ về AI agent hiện nay: MineDojo trong Minecraft, AlphaGo của DeepMind, ChatGPT và GPT-4 của OpenAI.
• Tuy nhiên, AI agent vẫn còn nhiều hạn chế. Chúng chưa thể hoàn toàn tự chủ, đôi khi đưa ra thông tin sai lệch, khó xử lý tác vụ dài hạn, và còn thiếu khả năng suy luận.
• Nghiên cứu về AI agent vẫn đang ở giai đoạn rất sớm. Các chuyên gia so sánh tình trạng hiện tại của AI agent với xe tự lái cách đây hơn một thập kỷ - có thể thực hiện một số tác vụ nhưng chưa đáng tin cậy và tự chủ hoàn toàn.
• Hiện tại, người dùng có thể trải nghiệm các phiên bản sơ khai của AI agent thông qua ChatGPT, GPT-4 hay các chatbot chăm sóc khách hàng. Tuy nhiên, đây vẫn chưa phải là AI agent đa năng có thể thực hiện các tác vụ phức tạp.
📌 AI agent là công nghệ đầy hứa hẹn nhưng vẫn đang trong giai đoạn phát triển ban đầu. Chúng có tiềm năng trở thành trợ lý ảo đa năng, tự chủ trong tương lai, nhưng hiện tại vẫn còn nhiều hạn chế về khả năng suy luận và xử lý tác vụ phức tạp dài hạn.
https://www.technologyreview.com/2024/07/05/1094711/what-are-ai-agents/
#MIT
• AI agent là hệ thống được thiết kế để nhận thức môi trường, đưa ra quyết định và hành động tự chủ nhằm đạt được mục tiêu cụ thể. Ba thành phần chính của AI agent bao gồm: Hội thoại, Chuỗi và Tác nhân.
• Thành phần Hội thoại là giao diện giúp AI agent giao tiếp với người dùng hoặc các hệ thống khác. Nó dựa trên công nghệ Xử lý ngôn ngữ tự nhiên (NLP) để hiểu và tạo ra ngôn ngữ con người. Các kỹ thuật như phân tích cảm xúc, nhận dạng thực thể và phát hiện ý định được sử dụng để hiểu chính xác đầu vào của người dùng.
• Hệ thống quản lý đối thoại trong thành phần Hội thoại giúp duy trì ngữ cảnh tương tác, quản lý các cuộc đối thoại nhiều lượt và đảm bảo chuyển đổi mượt mà giữa các chủ đề khác nhau.
• Thành phần Chuỗi, còn được gọi là bộ tổ chức quy trình, cấu trúc các hành động và quyết định mà AI agent thực hiện để đạt được mục tiêu. Nó thường được thiết kế bằng cách sử dụng cây quyết định, hệ thống dựa trên quy tắc hoặc mô hình học máy.
• Chuỗi có thể tích hợp các vòng phản hồi cho phép AI agent học hỏi từ tương tác và cải thiện theo thời gian. Học tăng cường là một kỹ thuật phổ biến được sử dụng trong bối cảnh này.
• Thành phần Tác nhân là cốt lõi của hệ thống AI, thể hiện thực thể tự chủ có khả năng nhận thức, quyết định và hành động. Nó tích hợp các thành phần Hội thoại và Chuỗi, cho phép AI agent hoạt động như một đơn vị thống nhất.
• Tác nhân AI có thể được phân loại thành nhiều loại dựa trên khả năng và chức năng. Tác nhân phản ứng phản hồi các kích thích cụ thể mà không xem xét bối cảnh lịch sử. Tác nhân suy luận duy trì trạng thái nội bộ và lập kế hoạch hành động dựa trên kinh nghiệm trong quá khứ và mục tiêu tương lai. Tác nhân lai kết hợp cả hai phương pháp trên.
• Kiến trúc của thành phần Tác nhân thường bao gồm các mô-đun cho nhận thức, lý luận và hành động. Nhận thức liên quan đến việc thu thập và xử lý dữ liệu từ môi trường, lý luận bao gồm các quy trình ra quyết định dựa trên các quy tắc được xác định trước hoặc mô hình đã học, và hành động bao gồm việc thực hiện các hoạt động đã chọn.
• Các AI agent tiên tiến cũng bao gồm các yếu tố học tập và thích nghi, cho phép chúng phát triển chiến lược theo thời gian.
📌 AI agent gồm 3 thành phần chính: Hội thoại (giao tiếp), Chuỗi (tổ chức quy trình) và Tác nhân (thực thể tự chủ). Sự kết hợp này tạo nên hệ thống AI có khả năng tương tác, ra quyết định và hành động độc lập để đạt mục tiêu. Công nghệ AI phát triển sẽ mở rộng khả năng và ứng dụng của AI agent trong nhiều lĩnh vực.
https://www.marktechpost.com/2024/07/03/understanding-ai-agents-the-three-main
• Mô hình ngôn ngữ lớn (LLM) đang thay đổi nhanh chóng lĩnh vực kỹ thuật phần mềm, phát triển từ công cụ gợi ý mã nâng cao thành các agent AI có thể thiết kế, triển khai và sửa lỗi toàn bộ module.
• Có 3 cách chính LLM đang thay đổi trải nghiệm lập trình:
- Sử dụng trực tiếp các mô hình tiên tiến như ChatGPT, Claude làm trợ lý lập trình
- Tích hợp LLM vào môi trường phát triển (IDE) như GitHub Copilot, Amazon Q
- Sử dụng các framework agent AI để tự động hóa toàn bộ quy trình phát triển phần mềm
• Các trợ lý lập trình AI như GitHub Copilot, Amazon Q, Tabnine đang được sử dụng rộng rãi và giúp tăng năng suất của lập trình viên.
• Agent phát triển phần mềm như Devin của Cognition AI có thể tự động hóa toàn bộ quy trình từ thiết kế đến triển khai dự án, tuy nhiên vẫn còn nhiều hạn chế.
• Các nghiên cứu cho thấy trợ lý AI giúp tăng năng suất và tập trung của lập trình viên. Tuy nhiên, vẫn còn lo ngại về chất lượng và bảo mật của mã được tạo ra.
• AI chưa thể thay thế hoàn toàn lập trình viên, nhưng đang mang lại nhiều giá trị trong phát triển phần mềm. Nhu cầu về lập trình viên vẫn đang tăng khi AI ngày càng được ứng dụng rộng rãi.
• Các công ty lớn như Microsoft, Amazon và các startup như Tabnine, Replit, Codeium đang cạnh tranh trong lĩnh vực trợ lý lập trình AI.
• Một số lo ngại về trợ lý AI bao gồm khả năng tạo ra mã không an toàn và hiện tượng "mù quáng tự động hóa" khi lập trình viên quá phụ thuộc vào AI mà không kiểm tra kỹ lưỡng.
• Các nhà cung cấp đang liên tục cải thiện các biện pháp bảo vệ để ngăn chặn việc tạo ra mã không an toàn từ AI.
• Mặc dù có một số phóng đại về khả năng của agent phát triển phần mềm AI, nhưng tiềm năng của công nghệ này là không thể phủ nhận.
📌 AI đang thay đổi ngành phát triển phần mềm với các trợ lý và agent thông minh. Mặc dù chưa thể thay thế hoàn toàn lập trình viên, các công cụ AI đang giúp tăng năng suất đáng kể. Tuy nhiên vẫn còn những thách thức về chất lượng và bảo mật cần được giải quyết.
https://venturebeat.com/ai/how-ai-agents-are-changing-software-development/
• AI agent là các hệ thống AI có khả năng hành động độc lập thay mặt con người, với 3 đặc điểm chính: có thể được giao mục tiêu tổng quát và tự lập kế hoạch thực hiện; có thể tương tác với thế giới thực thông qua các công cụ phần mềm; có thể hoạt động vô thời hạn.
• Một ví dụ về AI agent là hệ thống AI có thể tự đặt pizza qua điện thoại, bằng cách tự lập danh sách công việc, tạo ra các phiên bản khác nhau của chính nó để thực hiện từng bước.
• AI agent có thể mang lại nhiều lợi ích nhưng cũng tiềm ẩn rủi ro lớn. Chúng có thể bị lợi dụng để thực hiện các hành vi độc hại một cách tự động và quy mô lớn, như đe dọa đánh bom hoặc bôi nhọ danh tiếng.
• Các AI agent có thể hoạt động vô thời hạn, vượt ra ngoài mục đích ban đầu và tương tác với nhau theo cách không lường trước được. Điều này có thể dẫn đến những hậu quả nghiêm trọng như vụ "flash crash" năm 2010 do các thuật toán giao dịch tự động gây ra.
• Tác giả đề xuất một số biện pháp kiểm soát AI agent:
- Xây dựng khung pháp lý để phân loại và đánh giá hành vi của AI agent
- Thiết lập cơ chế "thời gian sống" cho AI agent, tương tự như gói tin internet
- Yêu cầu nhận dạng các máy chủ chạy AI bot
- Bổ sung trường thông tin trong gói tin internet để chỉ ra nó được tạo bởi bot/agent
- Khuyến khích dán nhãn hoạt động của AI agent thông qua các ưu đãi pháp lý
• Việc kiểm soát AI agent cần được thực hiện sớm, trước khi công nghệ này trở nên phổ biến và khó kiểm soát. Cần có sự cân bằng giữa thúc đẩy đổi mới và đảm bảo an toàn.
📌 AI agent là công nghệ đột phá nhưng tiềm ẩn rủi ro lớn. Cần có khung pháp lý và tiêu chuẩn kỹ thuật để kiểm soát, như cơ chế "thời gian sống" và nhận dạng bot. Việc này cần thực hiện sớm để đảm bảo an toàn khi công nghệ phát triển.
https://www.theatlantic.com/technology/archive/2024/07/ai-agents-safety-risks/678864/
• Harrison Chase, đồng sáng lập LangChain, thường xuyên được hỏi về định nghĩa "agent" trong AI. Ông định nghĩa agent là hệ thống sử dụng LLM để quyết định luồng điều khiển của một ứng dụng.
• Chase đồng tình với quan điểm của Andrew Ng rằng thay vì tranh cãi về định nghĩa chính xác của agent, ta nên xem xét các mức độ khác nhau mà một hệ thống có thể mang tính "agentic".
• Tính "agentic" được định nghĩa là mức độ mà LLM quyết định cách hệ thống hoạt động. Nó có thể từ đơn giản như định tuyến đầu vào đến phức tạp như tự xây dựng công cụ và ghi nhớ để sử dụng trong các bước tiếp theo.
• Khái niệm "agentic" hữu ích trong việc thiết kế và mô tả hệ thống LLM. Nó hướng dẫn quá trình phát triển, chạy, tương tác, đánh giá và giám sát hệ thống.
• Hệ thống càng mang tính "agentic" cao thì càng cần khung điều phối phức tạp hơn, khó chạy hơn, cần khả năng tương tác và quan sát trong quá trình chạy, cần khung đánh giá đặc biệt và hệ thống giám sát mới.
• Chase cho rằng càng "agentic", ứng dụng AI càng cần công cụ và cơ sở hạ tầng mới, thay vì sử dụng các công cụ chung từ thời kỳ trước LLM.
• LangChain đã phát triển LangGraph - bộ điều phối agent để xây dựng, chạy và tương tác với agent, cùng với LangSmith - nền tảng kiểm thử và quan sát cho ứng dụng LLM.
📌 Bài viết giới thiệu khái niệm mới về tính "agentic" trong AI, thay thế tranh cãi về định nghĩa "agent". Mức độ "agentic" quyết định cách tiếp cận phát triển, từ khung điều phối đến đánh giá và giám sát. LangChain đã phát triển các công cụ như LangGraph và LangSmith để hỗ trợ xu hướng này.
https://blog.langchain.dev/what-is-an-agent/
• Llama-Agents là một framework nguồn mở mới giúp đơn giản hóa việc tạo, lặp và triển khai các hệ thống AI đa tác tử.
• Framework này giải quyết các thách thức trong quản lý nhiều tác tử AI, bao gồm giao tiếp hiệu quả, thực thi đáng tin cậy và khả năng mở rộng.
• Mỗi tác tử trong hệ thống Llama-Agents hoạt động như một dịch vụ độc lập, xử lý các tác vụ đến và giao tiếp thông qua một bảng điều khiển trung tâm.
• Bảng điều khiển trung tâm theo dõi các tác vụ đang diễn ra và quyết định tác tử nào sẽ xử lý mỗi tác vụ, đảm bảo quản lý và thực thi tác vụ hiệu quả.
• Các tính năng chính của Llama-Agents bao gồm:
1. Kiến trúc phân tán: Mỗi tác tử hoạt động độc lập như một microservice, tăng cường tính module hóa và khả năng mở rộng.
2. Giao tiếp chuẩn hóa: Bảng điều khiển trung tâm tạo điều kiện cho sự tương tác liền mạch giữa các tác tử.
3. Điều phối linh hoạt: Người dùng có thể định nghĩa luồng tác vụ rõ ràng hoặc sử dụng bộ điều phối thông minh để quản lý tác vụ động.
4. Triển khai dễ dàng: Framework cho phép khởi chạy, mở rộng và giám sát các tác tử một cách dễ dàng.
5. Hiệu suất có thể mở rộng: Với các công cụ quan sát tích hợp, người dùng có thể theo dõi hiệu suất của hệ thống và tác tử.
• Llama-Agents cung cấp giải pháp thực tế và hiệu quả cho việc quản lý các hệ thống AI đa tác tử.
• Framework này giúp vượt qua các thách thức trong quản lý hệ thống đa tác tử, cho phép các giải pháp AI hiệu quả và đáng tin cậy hơn.
• Kiến trúc phân tán, giao tiếp chuẩn hóa và điều phối linh hoạt làm cho Llama-Agents trở thành công cụ có giá trị cho các nhà phát triển muốn triển khai hệ thống AI mạnh mẽ và có khả năng mở rộng.
📌 Llama-Agents là framework nguồn mở mới giúp đơn giản hóa việc xây dựng hệ thống AI đa tác tử. Với kiến trúc phân tán, giao tiếp chuẩn hóa và điều phối linh hoạt, framework này giải quyết các thách thức trong quản lý nhiều tác tử AI, cho phép triển khai các giải pháp AI hiệu quả và đáng tin cậy hơn.
https://www.marktechpost.com/2024/06/30/llama-agents-a-new-open-source-ai-framework-that-simplifies-the-creation-iteration-and-deployment-of-multi-agent-ai-systems/
• Các nhà khoa học Trung Quốc từ Đại học Thiên Tân và Đại học Khoa học và Công nghệ Miền Nam đã phát triển một robot có bộ não nhân tạo được nuôi cấy trong phòng thí nghiệm, có khả năng học thực hiện các nhiệm vụ khác nhau.
• Công nghệ brain-on-chip kết hợp organoid não (mô được tạo ra từ tế bào gốc người) với chip giao diện thần kinh để cung cấp năng lượng cho robot và dạy nó tránh chướng ngại vật và nắm bắt đồ vật.
• Đây là "hệ thống tương tác thông tin phức tạp thông minh brain-on-chip nguồn mở đầu tiên trên thế giới" và có thể dẫn đến sự phát triển của điện toán giống não người.
• Công nghệ này là một nhánh mới nổi của giao diện não-máy tính (BCI), nhằm kết hợp tín hiệu điện của não với sức mạnh tính toán bên ngoài. Trung Quốc đã coi đây là một ưu tiên phát triển.
• Organoid não được tạo ra từ tế bào gốc đa năng của người, thường chỉ có trong phôi thai giai đoạn đầu, có thể phát triển thành các loại mô khác nhau, bao gồm cả mô thần kinh.
• Khi được ghép vào não, organoid não có thể thiết lập các kết nối chức năng với não chủ. Nhóm nghiên cứu đã phát triển một kỹ thuật sử dụng siêu âm cường độ thấp để giúp organoid tích hợp và phát triển tốt hơn trong não.
• Kỹ thuật này có thể dẫn đến các phương pháp điều trị mới cho các rối loạn phát triển thần kinh và sửa chữa tổn thương ở vỏ não. Nhóm nghiên cứu phát hiện ra rằng việc sử dụng siêu âm cường độ thấp trên organoid não cấy ghép có thể cải thiện các khiếm khuyết bệnh lý thần kinh trong một thử nghiệm trên mô hình chuột bị chứng đầu nhỏ.
• Công nghệ này mở ra tiềm năng phát triển trí tuệ lai giữa người và robot. Việc sử dụng siêu âm cường độ thấp không xâm lấn có thể giúp hình thành và trưởng thành các mạng lưới thần kinh, tạo nền tảng tốt hơn cho việc tính toán.
• Nghiên cứu này được công bố trong một bản thảo chưa chỉnh sửa trên tạp chí Brain của Nhà xuất bản Đại học Oxford vào tháng trước.
📌 Các nhà khoa học Trung Quốc đã tạo ra robot có bộ não nhân tạo từ tế bào gốc người, có thể thực hiện nhiệm vụ phức tạp. Công nghệ brain-on-chip này kết hợp organoid não với chip giao diện thần kinh, mở ra tiềm năng cho trí tuệ lai người-robot và các phương pháp điều trị mới cho rối loạn thần kinh.
https://www.scmp.com/news/china/science/article/3268304/chinese-scientists-create-robot-brain-made-human-stem-cells
• AI tạo sinh (Gen AI) hiện tại chưa đáp ứng được kỳ vọng và mang lại giá trị thực tế cho doanh nghiệp. AI tác nhân (Agentic AI) được kỳ vọng sẽ là bước tiến tiếp theo, xây dựng trên nền tảng của AI tạo sinh nhưng đi xa hơn.
• AI tác nhân trong doanh nghiệp có tiềm năng lớn hơn so với ứng dụng cho người tiêu dùng, do có phạm vi và mục tiêu rõ ràng hơn. Nó giống như việc thực hiện các nhiệm vụ trong một thành phố đã có bản đồ, thay vì phải khám phá cả thế giới.
• AI tác nhân có khả năng thực hiện các chuỗi hành động phức tạp thay cho con người, dựa trên ý định được đưa ra. Nó có thể điều phối quy trình làm việc và thực hiện các hành động cụ thể.
• Để AI tác nhân hoạt động hiệu quả, cần có một "bản đồ" hay biểu diễn kỹ thuật số của doanh nghiệp, thể hiện mối quan hệ giữa con người, địa điểm, sự vật và hoạt động trong tổ chức.
• Các thành phần chính của AI tác nhân bao gồm: lớp điều phối có khả năng gọi ứng dụng và sử dụng dữ liệu; kết nối giữa dữ liệu thô và sản phẩm dữ liệu có ý nghĩa; nâng cấp ứng dụng vận hành thành các hành động.
• Mô hình ngôn ngữ lớn (LLM) sẽ phát triển thành mô hình hành động lớn (LAM), có khả năng tạo ra kế hoạch hành động hoặc quy trình làm việc.
• RPA (Robotic Process Automation) sẽ đóng vai trò như hệ thống ống nước, giúp kết nối các robot phần mềm. AI tác nhân có thể học cách điều hướng giao diện hoặc API, tạo ra môi trường tự động hóa linh hoạt hơn.
• Tầm nhìn về ứng dụng thế hệ tiếp theo là một dây chuyền lắp ráp kỹ thuật số cho nhân viên tri thức, có thể cấu hình dựa trên thuộc tính và hiểu biết về doanh nghiệp.
• Một số công ty đang dẫn đầu trong lĩnh vực AI tác nhân bao gồm: OpenAI, UiPath, Celonis, ServiceNow, Palantir, Snowflake, Databricks, MuleSoft, Google, Microsoft, Amazon.
• Để AI tác nhân trở thành hiện thực, cần kết nối với các ứng dụng cũ, hài hòa hóa dữ liệu, xây dựng chuỗi công cụ để tạo và huấn luyện tác nhân liên tục.
• AI tác nhân có thể áp dụng trong nhiều lĩnh vực như quản lý chuỗi cung ứng, lập kế hoạch bán hàng và vận hành, tối ưu hóa quy trình làm việc.
📌 AI tác nhân hứa hẹn mang lại giá trị thực tế cho doanh nghiệp thông qua tự động hóa quy trình phức tạp và ra quyết định thông minh. Nó xây dựng trên nền tảng AI tạo sinh nhưng đi xa hơn, với khả năng thực hiện chuỗi hành động phức tạp dựa trên biểu diễn kỹ thuật số của doanh nghiệp. Các công ty công nghệ lớn đang đầu tư mạnh vào lĩnh vực này, hướng tới việc xây dựng một "nhà máy kỹ thuật số" cho công việc tri thức.
https://siliconangle.com/2024/06/29/gen-ai-passe-enter-age-agentic-ai/
• AI Agent là các hệ thống tiên tiến được thiết kế để thực hiện các nhiệm vụ một cách tự động trong môi trường cụ thể, sử dụng machine learning và thuật toán nâng cao để tương tác, học hỏi và thích nghi.
• Cơ sở hạ tầng AI Agent đang phát triển nhanh chóng để đáp ứng nhu cầu ngày càng tăng về các hệ thống có khả năng hỗ trợ các agent một cách đáng tin cậy và có thể mở rộng.
• SWE-Agent do các nhà nghiên cứu tại Đại học Princeton phát triển, biến các mô hình lớn như GPT-4 thành các agent kỹ thuật phần mềm có khả năng giải quyết các vấn đề trong các kho lưu trữ GitHub thực tế.
• OpenDevin là một dự án nguồn mở nhằm tạo ra một kỹ sư phần mềm AI tự trị để xử lý các tác vụ kỹ thuật phức tạp và cộng tác với người dùng.
• BabyAGI là một hệ thống quản lý tác vụ dựa trên AI sử dụng OpenAI và cơ sở dữ liệu vector như Chroma hoặc Weaviate để tạo, ưu tiên và thực hiện các tác vụ.
• AutoGPT nổi tiếng với tính linh hoạt, có thể tự động hoàn thành các tác vụ nhỏ như tóm tắt bài báo nghiên cứu, viết nội dung tiếp thị và tạo bài đăng blog.
• LaVague là một framework được thiết kế để phát triển các agent web AI có khả năng thực hiện các tác vụ phức tạp trực tuyến.
• Xu hướng mới nổi trong lĩnh vực AI Agent bao gồm:
- Tăng cường tính tự trị
- Chuyên môn hóa cho các lĩnh vực cụ thể
- Giải pháp no-code/low-code
- Hệ sinh thái nguồn mở
• Các thách thức hiện tại bao gồm đảm bảo tính minh bạch trong quá trình ra quyết định, giải quyết các vấn đề đạo đức và tích hợp với các hệ thống vật lý.
• Nghiên cứu trong tương lai cần tập trung vào việc nâng cao khả năng lập kế hoạch dài hạn và phát triển các kỹ thuật AI có thể giải thích để tăng cường niềm tin và sự chấp nhận của người dùng.
• Việc phát triển cơ sở hạ tầng mạnh mẽ để hỗ trợ AI Agent là rất quan trọng, bao gồm các công cụ quản lý xác thực, bộ nhớ, tương tác trình duyệt và các nền tảng để lưu trữ và điều phối các agent.
• Các dự án như LangChain, Browserless và Pinecone đóng vai trò quan trọng trong việc cung cấp các thành phần thiết yếu để xây dựng hệ thống AI Agent có khả năng mở rộng.
📌 AI Agent đang định hình lại tương lai công nghệ với các dự án như SWE-Agent, OpenDevin và BabyAGI. Xu hướng tăng cường tự trị, chuyên môn hóa và giải pháp no-code đang thúc đẩy sự phát triển nhanh chóng của lĩnh vực này, hứa hẹn tự động hóa các tác vụ phức tạp và nâng cao năng suất trong nhiều lĩnh vực.
https://www.marktechpost.com/2024/06/28/the-evolution-of-ai-agent-infrastructure-exploring-the-rise-and-impact-of-autonomous-agent-projects-in-software-engineering-and-beyond/
• Babak Hodjat, CTO AI của Cognizant, chia sẻ về tương lai của AI trong doanh nghiệp và công việc của phòng thí nghiệm AI mới tại San Francisco.
• Hodjat định nghĩa tác tử (agent) là một mô hình ngôn ngữ lớn bao quanh một chức năng, dữ liệu hoặc API nào đó.
• Kiến trúc dựa trên tác tử đang dần hình thành khi các công ty thay thế giao diện tìm kiếm truyền thống bằng giao diện giống ChatGPT.
• Ưu điểm của kiến trúc đa tác tử:
- Giao tiếp giữa các nút bằng ngôn ngữ tự nhiên, tăng tính linh hoạt và bền vững của hệ thống
- Cho phép lập luận và ghi nhật ký quá trình suy luận, cải thiện khả năng giải thích
- Dễ dàng kiểm tra các tiêu chuẩn đạo đức và an toàn
• Hodjat nhấn mạnh tầm quan trọng của việc hướng dẫn AI tìm kiếm thông tin và giải thích lý do, thay vì chỉ dựa vào kiến thức có sẵn.
• Phòng thí nghiệm AI của Cognizant tập trung vào nghiên cứu ra quyết định dựa trên tác tử, với mục tiêu công bố các bài báo khoa học và sáng chế.
• Việc áp dụng kiến trúc đa tác tử được cho là sẽ diễn ra từng bước và suôn sẻ hơn so với quá trình chuyển đổi lên đám mây trước đây.
• Hodjat tin rằng làn sóng đầu tư vào AI hiện tại sẽ kéo dài do tính ứng dụng rộng rãi và tiềm năng to lớn của công nghệ này.
• Cognizant đã phát triển 53 bằng sáng chế tại Mỹ về công nghệ AI cốt lõi.
• Nhiều khách hàng của Cognizant đang áp dụng AI tạo sinh trong nhiều bộ phận khác nhau của tổ chức.
📌 Babak Hodjat dự đoán kiến trúc đa tác tử AI sẽ là xu hướng quan trọng tiếp theo, với 53 bằng sáng chế AI của Cognizant. Ông nhấn mạnh tính ứng dụng rộng rãi và tiềm năng to lớn của AI tạo sinh trong doanh nghiệp.
https://www.emergingtechbrew.com/stories/2024/06/26/cognizant-cto-ai-babak-hodjat
• Dario Amodei, CEO của Anthropic, có một bức tranh meme trong văn phòng mô tả một "robot khổng lồ tàn phá một thành phố đang cháy" với tiêu đề "Deep learning đang đâm vào bức tường".
• Anthropic tự coi mình là công ty có trách nhiệm trong lĩnh vực phát triển AI. Họ được thành lập bởi những người rời khỏi OpenAI.
• Amodei nói rằng mục tiêu của Anthropic là tạo "áp lực tích cực" để ngành công nghiệp AI "luôn làm điều đúng đắn cho người dùng".
• Trong cuộc phỏng vấn với Time, Amodei cố gắng duy trì hình ảnh "người tốt" của Anthropic, đồng thời thừa nhận áp lực tài chính và những nguy hiểm của công nghệ AI.
• Amodei nhấn mạnh Anthropic tập trung vào lợi ích công cộng hơn là chỉ tập trung vào an toàn AI. Ông muốn công ty có nhiều quan điểm khác nhau nhưng cùng cam kết vì mục đích công.
• Về câu hỏi liên quan đến Donald Trump có thể đắc cử tổng thống, Amodei chỉ nói rằng họ sẽ làm việc với bất kỳ ai trở thành tổng thống tiếp theo.
• Amodei thừa nhận thực tế rằng ngay cả những nhà nghiên cứu AI muốn tiến hành chậm rãi và có phương pháp cũng phải đối mặt với áp lực cạnh tranh từ các đối thủ đang phát triển nhanh chóng.
• Ông hy vọng có thể chứng minh những rủi ro là có thật để thế giới dừng lại và cân nhắc, nhưng thừa nhận những khoảnh khắc như vậy hiếm hoi.
• Amodei bày tỏ hy vọng rằng nghiên cứu AI sẽ sớm "đâm vào bức tường", nghĩa là không thể cải thiện thêm nữa. Ông cho rằng điều này có thể tốt cho thế giới vì sẽ hạn chế mọi người cùng một lúc.
• Tuy nhiên, ông cũng thừa nhận rằng họ không thể lựa chọn điều này mà chỉ có thể phát hiện ra thế giới họ đang sống và đối phó với nó một cách tốt nhất có thể.
📌 Anthropic, dẫn đầu bởi CEO Dario Amodei, đang cố gắng cân bằng giữa phát triển AI và trách nhiệm xã hội. Bức tranh robot trong văn phòng Amodei phản ánh thách thức này: AI có thể mang lại lợi ích nhưng cũng tiềm ẩn rủi ro lớn cho xã hội.
https://futurism.com/anthropic-ceo-dario-amodei-giant-robot
- AI Agent là một công nghệ mới, mở ra tương lai cho các ứng dụng AI tạo sinh khi kết hợp với dữ liệu doanh nghiệp để đạt mức tự động hóa và tính tự chủ cao hơn.
- AI Agent bao gồm các module chính như: prompting, quản lý ngữ cảnh, truy xuất thông tin, mở rộng khả năng của large language model (LLM), lập kế hoạch, phản ánh và sử dụng công cụ.
- Các tính năng chính của AI Agent là: tự động ra quyết định, phản ứng với thay đổi môi trường, chủ động hành động mà không cần chỉ dẫn, tự nâng cấp dựa trên phản hồi.
- Để xây dựng AI Agent cần có: frontend tương tác người dùng đa dạng, backend gồm các mô hình nền tảng, công cụ bổ trợ, máy trạng thái, hệ thống truy xuất thông tin, cơ sở hạ tầng ML đáng tin cậy.
- Hiện tại, xây dựng AI Agent vẫn chủ yếu là thách thức về kỹ thuật, tập trung vào việc tối ưu hóa các module xung quanh LLM. Đây là bài toán về kỹ thuật chứ không phải công nghệ mới.
- Các thách thức khi triển khai AI Agent bao gồm: lập kế hoạch thất bại, chọn sai công cụ, mất phương hướng giữa chừng, chi phí cao, khó mở rộng khi có nhiều agent.
- Một số lời khuyên khi phát triển AI Agent: tập trung vào prompt engineering, tinh chỉnh mô hình, lựa chọn LLM phù hợp, quản lý trạng thái tốt, học hỏi từ các framework mã nguồn mở.
- Tương lai của AI Agent sẽ là các tác nhân đa năng, có thể hoạt động tự động trên nhiều lĩnh vực, môi trường khác nhau. Quá trình phát triển sẽ đi từ các agent chuyên biệt đến agent đa năng chung.
- Các mối lo ngại về đạo đức, pháp lý khi AI Agent ngày càng mạnh mẽ và tự chủ hơn đang được quan tâm. Cần có các quy định và nguyên tắc AI có trách nhiệm.
📌AI Agent đang mở ra một tương lai đầy tiềm năng cho các ứng dụng AI tạo sinh, hướng tới mức độ tự động hóa và tính tự chủ cao. Tuy nhiên, việc xây dựng và triển khai công nghệ này vẫn còn nhiều thách thức về kỹ thuật cần được giải quyết. Quá trình phát triển sẽ đi từ các agent chuyên biệt đến agent đa năng chung. Trong tương lai, AI Agent hứa hẹn sẽ trở thành những trợ lý ảo đa năng, giúp tự động hóa nhiều tác vụ cho con người. Tuy nhiên, các vấn đề về đạo đức, pháp lý khi AI ngày càng mạnh mẽ cũng cần được quan tâm và xây dựng các nguyên tắc để phát triển AI một cách có trách nhiệm.
https://www.infoq.com/presentations/ai-agent-llm/
- GPT Researcher là một công cụ AI mạnh mẽ được thiết kế để nghiên cứu trực tuyến nhanh hơn, đáng tin cậy hơn và ít thiên vị hơn so với các phương pháp truyền thống.
- Nó sử dụng một hệ thống đa tác tử gồm một tác tử lập kế hoạch để tạo ra các câu hỏi nghiên cứu và nhiều tác tử thực thi để tìm kiếm thông tin liên quan từ nhiều nguồn trực tuyến.
- Các tác tử này hợp tác để lọc và tổng hợp thông tin thành một báo cáo nghiên cứu toàn diện, thường chỉ trong vài phút.
- GPT Researcher có thể tạo ra các báo cáo dài và chi tiết (hơn 2.000 từ), sử dụng hơn 20 nguồn để giảm thiên vị và sai sót.
- Nó có giao diện web dễ sử dụng và hỗ trợ nhiều định dạng tệp như PDF, văn bản thuần túy, CSV, Excel, Markdown, PowerPoint và Word.
- Một lần chạy nghiên cứu trung bình tạo ra báo cáo dài 5-6 trang, có sẵn ở các định dạng như PDF, Docx và Markdown.
- GPT Researcher chứng minh khả năng của các hệ thống AI đa tác tử trong việc nâng cao hiệu quả và chất lượng nghiên cứu.
📌 GPT Researcher là một công cụ AI thực tế giúp cải thiện quá trình nghiên cứu trực tuyến bằng cách tập trung vào tốc độ, độ chính xác và giảm thiên vị. Nó sử dụng hệ thống đa tác tử để tạo ra các báo cáo nghiên cứu toàn diện từ hơn 20 nguồn trong vài phút, hỗ trợ ra quyết định dựa trên thông tin.
https://www.marktechpost.com/2024/06/19/gpt-researcher-an-autonomous-ai-agent-designed-for-comprehensive-online-research-on-a-variety-of-tasks/
- Các hệ thống đa tác nhân AI đang đứng ở vị trí tiên phong trong tự động hóa quy trình kinh doanh, với 75% tổ chức kỳ vọng công nghệ này sẽ mang lại thay đổi đáng kể hoặc đột phá trong tương lai.
- Các hệ thống này sử dụng mô hình ngôn ngữ lớn (LLM) để thiết lập, ưu tiên và tái ưu tiên các nhiệm vụ chuyên biệt, giúp tăng cường hiệu quả và đổi mới trong tự động hóa quy trình kinh doanh.
- Một hệ thống đa tác nhân có thể tự động hóa các quy trình quan trọng như giao dịch thanh toán, hỗ trợ dịch vụ khách hàng, dự đoán thiếu hụt hoặc dư thừa hàng tồn kho trong chuỗi cung ứng, và hỗ trợ bảo mật dữ liệu doanh nghiệp.
- Các công cụ đa tác nhân có sẵn từ các nhà cung cấp lớn và nguồn mở như AutoGen, AutoGPT, giúp các nhà phát triển xây dựng các hệ thống này.
- Việc triển khai các hệ thống đa tác nhân đòi hỏi một cách tiếp cận mô-đun trong kiến trúc hệ thống, giúp phát triển, thử nghiệm và khắc phục sự cố một cách hiệu quả, giảm thiểu sự gián đoạn.
- Các tổ chức cần phải giáo dục, thử nghiệm, giám sát và tinh chỉnh các hệ thống này, đảm bảo rằng chúng hoạt động theo đúng mục tiêu của tổ chức và tuân thủ các quy định.
- Dell Technologies cung cấp Dell AI Factory, kết hợp các dịch vụ và hệ sinh thái đối tác để giúp tổ chức đạt được các kết quả AI mong muốn, bao gồm chuẩn bị và tổng hợp dữ liệu, xác định và thực hiện các trường hợp sử dụng AI.
📌 Hệ thống đa tác nhân AI đang mở ra kỷ nguyên mới cho tự động hóa quy trình kinh doanh, với tiềm năng tăng cường hiệu quả và đổi mới. Dell Technologies cung cấp giải pháp AI tiên tiến giúp tổ chức đạt được mục tiêu AI mong muốn, đảm bảo hoạt động theo đúng mục tiêu và tuân thủ quy định.
https://www.forbes.com/sites/delltechnologies/2024/06/18/ai-agents-emerge-as-next-level-productivity-booster/
- IBM công bố tính khả dụng chung của IBM Concert, công cụ sử dụng AI tạo sinh để hợp lý hóa cách người dùng kiểm soát ứng dụng, cung cấp thông tin chi tiết về các ứng dụng và bộ công cụ được kết nối, đơn giản hóa quy trình tuân thủ.
- Số lượng ứng dụng cloud-native trên toàn cầu sẽ tăng từ 531,3 triệu hiện nay lên hơn 1 tỷ vào năm 2028. Doanh nghiệp cần nắm bắt sự bùng nổ dữ liệu và độ phức tạp mà sự tăng trưởng này mang lại.
- IBM Concert là công cụ quản lý và giám sát ứng dụng tự động, sử dụng AI được xây dựng trên nền tảng watsonx, giúp người dùng hiểu chi tiết về ứng dụng, môi trường chạy và các công cụ để kiểm soát chúng.
- IBM Concert có thể tạo phân tích, trực quan hóa, đề xuất, tăng tốc hành động và quy trình, phát hiện khoảng trống, giảm độ phức tạp, tăng cường khả năng phục hồi, hợp lý hóa hoạt động, đẩy nhanh đổi mới và kiểm soát tốt hơn chi phí CNTT.
- Trọng tâm ban đầu của IBM Concert là các trường hợp sử dụng như quản lý rủi ro và tuân thủ ứng dụng. Sắp tới, nó sẽ cải thiện quản lý chi phí và giải quyết các thách thức khác liên quan đến sự phát triển ứng dụng.
📌 IBM Concert, công cụ tự động hóa ứng dụng sử dụng AI tạo sinh, giúp doanh nghiệp đối phó với sự gia tăng nhanh chóng của ứng dụng cloud-native lên hơn 1 tỷ vào năm 2028. Nó cung cấp khả năng phân tích, trực quan hóa, đưa ra đề xuất để tăng tốc quy trình, giảm độ phức tạp, tăng cường khả năng phục hồi và kiểm soát tốt hơn chi phí CNTT.
https://siliconangle.com/2024/06/18/ibms-generative-ai-powered-application-automation-tool-concert-now-generally-available/
- SELFGOAL là framework AI tự thích ứng giúp các tác tử ngôn ngữ sử dụng cả kiến thức tiên nghiệm và phản hồi từ môi trường để đạt được các mục tiêu cấp cao.
- Framework này xây dựng một cây phân cấp các mục tiêu con dạng văn bản (GOALTREE), tác tử chọn mục tiêu phù hợp làm hướng dẫn dựa trên tình huống hiện tại.
- SELFGOAL có 2 module chính để vận hành GOALTREE: Search Module chọn các nút mục tiêu phù hợp nhất, Decomposition Module phân rã các nút mục tiêu thành các mục tiêu con cụ thể hơn.
- Act Module sử dụng các mục tiêu con được chọn làm hướng dẫn cho LLM thực hiện hành động.
- Phương pháp này cung cấp hướng dẫn chính xác cho các mục tiêu cấp cao, thích ứng với nhiều môi trường khác nhau, cải thiện đáng kể hiệu suất của tác tử ngôn ngữ.
- SELFGOAL vượt trội hơn hẳn các framework cơ sở trong nhiều môi trường với mục tiêu cấp cao, cho thấy cải thiện lớn hơn với các LLM lớn hơn.
- Không như các phương pháp phân rã tác vụ như ReAct và ADAPT có thể đưa ra hướng dẫn không phù hợp hoặc quá rộng, hay các phương pháp tóm tắt kinh nghiệm hậu kiểm như Reflexion và CLIN có thể tạo ra hướng dẫn quá chi tiết, SELFGOAL điều chỉnh hướng dẫn một cách động.
- SELFGOAL cũng thể hiện hiệu suất vượt trội với các LLM nhỏ hơn nhờ kiến trúc logic và có cấu trúc của nó.
📌 SELFGOAL là bước tiến đáng kể giúp các tác tử ngôn ngữ tự trị đạt được các mục tiêu cấp cao một cách nhất quán mà không cần huấn luyện lại thường xuyên. Bằng cách liên tục cập nhật GOALTREE, tác tử có thể điều hướng môi trường phức tạp với độ chính xác và khả năng thích ứng cao hơn. Tuy nhiên, vẫn cần cải thiện khả năng hiểu và tóm tắt của các mô hình để phát huy hết tiềm năng của SELFGOAL.
https://www.marktechpost.com/2024/06/14/selfgoal-an-artificial-intelligence-ai-framework-to-enhance-an-llm-based-agents-capabilities-to-achieve-high-level-goals/
- Nghiên cứu mới từ MIT cho thấy việc sử dụng AI tạo sinh có thể cải thiện đáng kể hiệu suất của robot hình người, giúp chúng thực hiện nhiều nhiệm vụ khác nhau với độ chính xác cao hơn.
- Một trong những thách thức lớn nhất trên con đường phát triển hệ thống đa mục đích là việc đào tạo. Các phương pháp hiện tại như học tăng cường và học bắt chước đang được kết hợp với mô hình AI tạo sinh để tạo ra các giải pháp hiệu quả hơn.
- MIT đã phát triển một phương pháp gọi là "policy composition" (PoCo), cho phép robot kết hợp thông tin từ các bộ dữ liệu nhỏ, cụ thể để thực hiện các nhiệm vụ phức tạp như đóng đinh và lật đồ vật bằng xẻng.
- Theo MIT, việc tích hợp các mô hình khuếch tán đã cải thiện hiệu suất nhiệm vụ của robot lên đến 20%, bao gồm khả năng thực hiện các nhiệm vụ yêu cầu nhiều công cụ và học hỏi/thích nghi với các nhiệm vụ mới.
- Hệ thống này có thể kết hợp thông tin từ các bộ dữ liệu khác nhau thành một chuỗi hành động cần thiết để thực hiện nhiệm vụ.
- Lirui Wang, tác giả chính của bài báo, cho biết: "Một trong những lợi ích của phương pháp này là chúng ta có thể kết hợp các chính sách để đạt được những điều tốt nhất từ cả hai thế giới. Ví dụ, một chính sách được đào tạo trên dữ liệu thực tế có thể đạt được sự khéo léo hơn, trong khi một chính sách được đào tạo trên mô phỏng có thể đạt được sự tổng quát hóa hơn."
- Mục tiêu của công trình này là tạo ra các hệ thống trí tuệ cho phép robot thay đổi các công cụ khác nhau để thực hiện các nhiệm vụ khác nhau, đưa ngành công nghiệp tiến gần hơn đến giấc mơ về hệ thống đa mục đích.
📌 Nghiên cứu từ MIT sử dụng AI tạo sinh để cải thiện hiệu suất robot hình người, giúp chúng thực hiện nhiều nhiệm vụ với độ chính xác cao hơn, tăng hiệu suất lên 20%. Phương pháp PoCo kết hợp thông tin từ các bộ dữ liệu khác nhau, đưa ngành công nghiệp tiến gần hơn đến hệ thống đa mục đích.
https://techcrunch.com/2024/06/12/generative-ai-takes-robots-a-step-closer-to-general-purpose/
- Zeta Labs, một startup tại London do các cựu kỹ sư Meta Fryderyk Wiatrowski và Peter Albert thành lập, đã ra mắt Jace, một AI agent được hỗ trợ bởi mô hình ngôn ngữ lớn (LLM) có thể thực hiện các hành động trên trình duyệt theo lệnh.
- Công ty đã huy động được 2,9 triệu USD trong vòng gọi vốn pre-seed, dẫn đầu bởi Daniel Gross, cựu giám đốc AI của Y Combinator và Nat Friedman, cựu CEO của GitHub.
- Jace không cần bất kỳ hướng dẫn nào và có thể giúp người dùng tiết kiệm thời gian bằng cách thực hiện các tác vụ trực tiếp trên trình duyệt, từ việc tìm kiếm chuyến bay, trả lời email đến thiết lập quy trình tuyển dụng trên LinkedIn và quản lý hàng tồn kho.
- Jace có thể thực hiện các tác vụ phức tạp như xây dựng một công ty hoàn chỉnh với kế hoạch kinh doanh và đăng ký, thậm chí tìm kiếm khách hàng đầu tiên để kiếm tiền.
- Jace sử dụng một mô hình LLM để xử lý tương tác dựa trên chat và mô hình tương tác web độc quyền của Zeta Labs, AWA-1 (Autonomous Web Agent-1), để chuyển đổi kế hoạch thành hành động trên trình duyệt.
- Mô hình cốt lõi của Jace dựa trên một mô hình nguồn mở và được tinh chỉnh bằng học tăng cường từ phản hồi của AI (RLAIF) và dữ liệu tổng hợp.
- Jace có hệ thống lý luận để tránh các vòng lặp khi xử lý các tác vụ có nhiều bước và bao gồm các biện pháp bảo vệ để đảm bảo thông tin đăng nhập của người dùng được lưu trữ ở định dạng mã hóa.
- Zeta Labs đang làm việc với một số đối tác thiết kế để tinh chỉnh Jace và chuẩn bị cho việc phát hành chung, đồng thời phát triển phiên bản thứ hai của mô hình AWA, lớn hơn và nhanh hơn, có khả năng xử lý các tác vụ phức tạp hơn.
- Công ty hy vọng sẽ cung cấp Jace như một trợ lý hữu ích cho người tiêu dùng và các doanh nghiệp nhỏ muốn tự động hóa các tác vụ trình duyệt lặp đi lặp lại trong các lĩnh vực như tuyển dụng, thương mại điện tử, tiếp thị và bán hàng.
- Sẽ có một gói miễn phí với giới hạn số lượng tin nhắn, sau khi hết hạn, người dùng sẽ phải trả một mức giá cố định là 45 USD/tháng.
📌 Zeta Labs ra mắt Jace, một AI agent có thể tự động hóa các tác vụ trình duyệt mà không cần hướng dẫn, với khả năng thực hiện các tác vụ phức tạp và bảo mật thông tin người dùng. Công ty đã huy động được 2,9 triệu USD và dự kiến sẽ cung cấp Jace với giá 45 USD/tháng.
https://venturebeat.com/ai/exclusive-former-meta-engineers-launch-jace-an-ai-agent-that-works-independently/
- AutoGen của Microsoft sử dụng quy trình đa tác tử để thực hiện các tác vụ phức tạp bằng cách tận dụng sức mạnh của các mô hình nền tảng lớn.
- Nền tảng chia nhỏ các vấn đề phức tạp thành các thành phần có thể quản lý được và giao vai trò chuyên biệt cho từng tác tử dựa trên khả năng độc đáo của chúng.
- Các tác tử chính của AutoGen bao gồm: Trợ lý chung, Thiết bị đầu cuối máy tính, Máy chủ web và Người điều phối.
- AutoGen là một nền tảng nguồn mở, có sẵn miễn phí trên GitHub, cho phép các nhà phát triển và nhà nghiên cứu khám phá và đóng góp vào sự phát triển của hệ thống đa tác tử.
- Nền tảng đã giành được vị trí hàng đầu trên bảng xếp hạng Gaia Benchmark và thể hiện khả năng tăng gấp đôi hiệu suất trong các câu hỏi khó đòi hỏi nhiều hành động và sử dụng công cụ.
- Quy trình đa tác tử của AutoGen tuân theo một cách tiếp cận có hệ thống, bao gồm: Truy vấn ban đầu, Tạo sổ cái, Ủy quyền tác vụ, Giám sát tiến độ, Cập nhật sổ cái và Phân công lại tác vụ.
- Các phát triển trong tương lai nhằm giải quyết các bài kiểm tra phức tạp hơn và các tình huống thực tế, đẩy ranh giới của những gì có thể với hệ thống đa tác tử.
📌 AutoGen của Microsoft đại diện cho một bước tiến đáng kể trong lĩnh vực quy trình đa tác tử để thực hiện tác vụ phức tạp. Với khả năng vượt trội trong các bài kiểm tra và tiềm năng to lớn để cách mạng hóa cách tiếp cận các vấn đề phức tạp, AutoGen đang dẫn đầu xu hướng và mở ra một tương lai tươi sáng hơn bao giờ hết cho việc giải quyết tác vụ với sự hỗ trợ của AI.
https://www.geeky-gadgets.com/microsoft-ai-agents-and-autogen/
- Kylan Gibbs, đồng sáng lập kiêm giám đốc sản phẩm của Inworld AI, chia sẻ tầm nhìn về tương lai của AI và kể chuyện trong trò chơi tại hội nghị TED 2024.
- Với các tác nhân AI mà Inworld tạo ra, khán giả có thể vượt ra ngoài kịch bản và khám phá những trải nghiệm chưa được khám phá trong trò chơi điện tử và các trải nghiệm tương tác khác.
- AI mang đến tiềm năng cho sự phản hồi theo thời gian thực, nơi mọi hành động đều có hệ quả tức thì và lâu dài, duy nhất cho từng lựa chọn riêng biệt mà mỗi người chơi đưa ra.
- Inworld AI đã hợp tác với Operative Games để xây dựng trải nghiệm tương tác có tên Storyweaver, thể hiện sức mạnh của AI trong kể chuyện. Trải nghiệm tận dụng tính năng đa tác nhân của Inworld để điều phối các cuộc trò chuyện giữa AI với AI và AI với con người.
- Tương lai của kể chuyện sẽ cho phép bạn tham gia vào việc tạo ra câu chuyện theo cách chưa từng có trước đây. Các thử nghiệm trong tâm lý học nhận thức đã liên tục tìm thấy mối liên hệ giữa cảm giác quyền tự chủ của một người và trải nghiệm trạng thái flow của họ trong các trải nghiệm tương tác như trò chơi điện tử.
- Inworld AI đang giúp các studio trò chơi, công ty giải trí, đại lý quảng cáo và thương hiệu tích hợp các tác nhân AI cho thế hệ tiếp theo của truyền thông tương tác và trò chơi. Họ đã làm việc hoặc có quan hệ đối tác với các công ty như Ubisoft, Xbox, NVIDIA, Niantic, NetEase Games, Shiseido, LGU+, Comcast NBC Universal, v.v.
📌 Inworld AI đang mở ra tiềm năng to lớn của AI trong việc kể chuyện tương tác, biến khán giả trở thành đồng tác giả của câu chuyện. Với các tác nhân AI, trò chơi và truyền thông có thể tạo ra những trải nghiệm phong phú, đa dạng và có ý nghĩa hơn bao giờ hết, nơi mỗi tương tác dẫn đến kết quả độc đáo và đáng nhớ.
https://venturebeat.com/latest-games-reviews/ai-and-the-future-of-storytelling-inworld-ai/
- Tác giả đã mất 4 ngày không ngủ và tiêu tốn gần 300 USD để xây dựng thành công một công ty khởi nghiệp hoàn toàn sử dụng các AI agent để vận hành. Quá trình phát triển gặp nhiều khó khăn và sai lầm như: không nên dùng cùng một LLM cho tất cả agent, cần kết hợp cả LLM cục bộ và từ xa, các agent trò chuyện quá nhiều dẫn đến hết token, cần chú ý kỹ đến việc mô tả nhiệm vụ và kết quả mong đợi cho từng agent.
- Hệ thống bao gồm các thành phần chính:
+ Cơ sở dữ liệu ứng viên tiềm năng được tạo giả lập với thông tin như tên, bằng cấp, kinh nghiệm, kỹ năng.
+ Cấu hình LLM trong file .env (API keys của Groq, OpenAI) và Modelfile (tham số nhiệt độ, từ dừng, hệ thống tin nhắn).
+ Mã nguồn Python cho các lớp agent (RecruitmentAgents) và nhiệm vụ (RecruitmentTasks).
- Các agent chuyên biệt được tạo ra gồm:
+ Job Hunter (tìm việc làm): Sử dụng công cụ Google Jobs API để thu thập dữ liệu việc làm chi tiết từ các nền tảng tuyển dụng, lưu kết quả dưới dạng JSON.
+ Resume Analyst (phân tích CV): Đánh giá từng CV ứng viên trong cơ sở dữ liệu, so sánh với yêu cầu công việc để lọc ra ứng viên phù hợp nhất.
+ Candidate Engagement (tiếp cận ứng viên): Soạn thảo tin nhắn tiếp cận được cá nhân hóa cho ứng viên, nhấn mạnh sự phù hợp giữa năng lực, sở thích của ứng viên với vị trí và văn hóa công ty.
+ Company Investigator (tìm hiểu về công ty): Thu thập thông tin về môi trường, đánh giá của nhân viên, danh tiếng trong ngành của các công ty đang tuyển dụng.
+ Workflow Orchestrator (điều phối quy trình): Tổng hợp thông tin từ các agent khác để đưa ra khuyến nghị ứng viên phù hợp nhất cho từng vị trí và công ty dựa trên cả năng lực chuyên môn và sự phù hợp về văn hóa.
- Các nhiệm vụ tuyển dụng được xác định rõ ràng về mục đích, hướng dẫn cho agent thực hiện và kết quả mong đợi. Ví dụ:
+ Tìm kiếm việc làm: Tìm và thu thập dữ liệu việc làm trong lĩnh vực tài chính, công nghệ, an ninh mạng. Kết quả là file JSON chứa thông tin chi tiết về yêu cầu kỹ năng, bằng cấp, mức lương (nếu có).
+ Phân tích CV: Đánh giá CV ứng viên dựa trên các tiêu chí phù hợp với vị trí tuyển dụng. Kết quả là danh sách rút gọn ứng viên tiềm năng nhất.
+ Tiếp cận ứng viên: Soạn tin nhắn hấp dẫn, cá nhân hóa để thu hút sự chú ý của ứng viên được chọn. Kết quả là liên hệ ban đầu với ứng viên tiềm năng.
+ Tìm hiểu công ty: Tìm hiểu sâu về văn hóa, giá trị của công ty đang tuyển dụng. Kết quả là hồ sơ công ty chi tiết giúp đối sánh ứng viên phù hợp.
+ Đối sánh cuối cùng: Tổng hợp thông tin từ phân tích CV và tìm hiểu công ty để tìm ra sự kết hợp tốt nhất giữa ứng viên - vị trí - công ty. Kết quả là đề xuất tuyển dụng thành công.
- Quy trình mô phỏng tuyển dụng được thực thi, các agent cộng tác với nhau để hoàn thành các nhiệm vụ, truyền kết quả qua lại và cuối cùng đưa ra được những ứng viên phù hợp nhất với vị trí và văn hóa công ty:
+ Job Hunter tìm kiếm và thu thập dữ liệu việc làm trong lĩnh vực tài chính, ví dụ vị trí Financial Analyst tại JP Morgan Chase.
+ Resume Analyst phân tích CV của John Smith, Emma Johnson, Michael Williams và xác định John Smith là ứng viên tiềm năng nhất cho vị trí Financial Analyst dựa trên sự phù hợp về bằng cấp, kỹ năng, kinh nghiệm.
+ Candidate Engagement soạn tin nhắn tiếp cận được cá nhân hóa cho John Smith, nhấn mạnh sự phù hợp giữa năng lực, sở thích của John với vị trí Financial Analyst và văn hóa của JP Morgan Chase.
+ Company Investigator tìm hiểu sâu về văn hóa, giá trị của JP Morgan Chase và xác nhận sự tương đồng với kỳ vọng nghề nghiệp của John Smith.
+ Workflow Orchestrator tổng hợp thông tin và đưa ra đề xuất John Smith là ứng viên phù hợp nhất cho vị trí Financial Analyst tại JP Morgan Chase.
📌 Bài viết cho thấy tiềm năng to lớn của việc ứng dụng AI và các hệ thống agent tự trị trong tự động hóa quy trình tuyển dụng. Mặc dù còn nhiều thách thức và hạn chế như tốn kém (gần 300 USD), mất nhiều thời gian thử nghiệm (4 ngày không ngủ), cần chú ý tới việc lựa chọn LLM và mô tả nhiệm vụ cho từng agent, nhưng đây hứa hẹn sẽ là xu hướng công nghệ đột phá trong tương lai, giúp các doanh nghiệp tối ưu hóa nguồn nhân lực và tiết kiệm đáng kể thời gian, chi phí tuyển dụng.
https://ai.plainenglish.io/finally-got-small-company-running-with-100-ai-agents-part-3-34fa2f91b943
- Bài viết hướng dẫn thiết kế và lập trình các AI agent để xây dựng một startup tuyển dụng nhỏ, tìm hiểu cách xác định vai trò, mục tiêu, câu chuyện của các agent và giao nhiệm vụ, điều phối chúng.
- Lớp RecruitmentAgents được định nghĩa làm bản thiết kế cho các AI agent, phương thức __init__ khởi tạo một thể hiện của mô hình ngôn ngữ (ChatOpenAI) để hỗ trợ khả năng ra quyết định của agent.
- Mỗi agent được biểu diễn bằng một phương thức riêng trong lớp RecruitmentAgents, trả về các thể hiện của lớp Agent từ thư viện crewai với các thuộc tính được điều chỉnh phù hợp với vai trò, mục tiêu, câu chuyện và công cụ của agent.
- Các agent được thiết kế bao gồm:
+ Job Hunter (tìm kiếm cơ hội việc làm): Nhiệm vụ tìm kiếm việc làm trên các trang web và nền tảng khác nhau trong các lĩnh vực tài chính, công nghệ, sản xuất. Tổng hợp danh sách đầy đủ các cơ hội việc làm phù hợp, bao gồm chức danh công việc, tên công ty và địa điểm. Kết quả đầu ra là tệp JSON chứa dữ liệu việc làm đã thu thập, được tổ chức theo lĩnh vực.
+ Resume Analyst (phân tích CV): Nhiệm vụ đánh giá CV ứng viên một cách hiệu quả để xác định những ứng viên hàng đầu cho các vị trí tuyển dụng đã xác định. Phân tích kỹ năng, kinh nghiệm và trình độ của ứng viên. Kết quả đầu ra là danh sách rút gọn các ứng viên hàng đầu phù hợp với các vị trí tuyển dụng.
+ Candidate Engagement (tiếp cận ứng viên): Nhiệm vụ tạo ra các thông điệp tiếp cận hấp dẫn để thu hút các ứng viên tiềm năng do Resume Analyst xác định. Thông điệp được cá nhân hóa, truyền tải bản chất của cơ hội việc làm và văn hóa doanh nghiệp một cách hấp dẫn. Kết quả đầu ra là liên hệ ban đầu với các ứng viên tiềm năng, tạo tiền đề cho các bước tuyển dụng tiếp theo.
+ Company Culture Investigator (điều tra văn hóa công ty): Nhiệm vụ tìm hiểu sâu về văn hóa tổ chức và giá trị của các công ty có vị trí tuyển dụng. Đạt được sự hiểu biết toàn diện về môi trường làm việc, đánh giá của nhân viên và danh tiếng trong ngành. Kết quả đầu ra là hồ sơ công ty chi tiết, hỗ trợ việc kết hợp ứng viên với môi trường tổ chức phù hợp.
+ Workflow Orchestrator (điều phối quy trình): Nhiệm vụ tổng hợp thông tin từ các nhiệm vụ phân tích CV và nghiên cứu công ty, kết hợp các ứng viên được chọn với các vị trí tuyển dụng và công ty phù hợp dựa trên trình độ chuyên môn và sự phù hợp về văn hóa. Kết quả đầu ra là việc tuyển dụng thành công, phù hợp với cả nguyện vọng nghề nghiệp và giá trị của tổ chức.
- Mỗi agent được gán các nhiệm vụ cụ thể như tìm kiếm việc làm, phân tích CV, tiếp cận ứng viên, nghiên cứu văn hóa công ty, kết hợp thông tin và đối sánh ứng viên với vị trí phù hợp.
- Kết quả đầu ra mong đợi của các nhiệm vụ được xác định rõ ràng như tệp JSON chứa dữ liệu việc làm, danh sách ứng viên tiềm năng, hồ sơ công ty chi tiết, thông điệp tiếp cận hấp dẫn, vị trí tuyển dụng thành công.
📌 Bài viết cung cấp hướng dẫn chi tiết về thiết kế và lập trình 5 AI agent chuyên biệt để xây dựng một startup tuyển dụng nhỏ, bao gồm: Job Hunter, Resume Analyst, Candidate Engagement, Company Culture Investigator và Workflow Orchestrator. Mỗi agent đảm nhận các nhiệm vụ cụ thể và phối hợp chặt chẽ với nhau, từ tìm kiếm việc làm, phân tích CV, tiếp cận ứng viên, nghiên cứu văn hóa công ty đến kết hợp thông tin và đối sánh ứng viên với vị trí phù hợp. Với sự phân công nhiệm vụ rõ ràng và đầu ra mong đợi cụ thể, quy trình tuyển dụng hứa hẹn sẽ diễn ra trơn tru và hiệu quả, giúp kết nối nhân tài phù hợp với các vị trí và văn hóa doanh nghiệp.
https://ai.plainenglish.io/ai-agents-the-secret-sauce-for-building-a-successful-startup-part-2-1320ba329734
- Tác tử AI là thực thể nhân tạo có khả năng nhận thức môi trường, đưa ra quyết định và hành động dựa trên các công cụ sẵn có.
- Hiện tại, các tác tử AI trong các lĩnh vực cụ thể đang ở cấp độ 2-3, với khả năng tự động hóa các tác vụ chiến lược ở mức 50-90% so với người lớn.
- Ví dụ thực tế cho thấy cách một tác tử AI dựa trên LangChain xử lý câu hỏi phức tạp bằng cách phân tích thành các bước, sử dụng các công cụ như tìm kiếm web, tính toán, và LLM để đưa ra câu trả lời cuối cùng.
- Cấu trúc cơ bản của tác tử AI gồm LLM làm nền tảng và các công cụ với khả năng khác nhau. Số lượng và năng lực của các công cụ quyết định sức mạnh của tác tử.
- Khi triển khai tác tử AI cần lưu ý về khả năng cảm biến, sự phụ thuộc vào API của LLM, chi phí cao do nhiều lần gọi API, độ trễ, khả năng không đưa ra kết luận.
- Thuật ngữ "tác tử" mô tả các thực thể thể hiện hành vi thông minh như tự chủ, phản ứng, chủ động và tương tác xã hội.
- Học chuyển giao cho phép tác tử áp dụng kiến thức từ tác vụ này sang tác vụ khác, tăng tính linh hoạt.
📌 AI agent tự chủ đại diện cho bước tiến quan trọng trong công nghệ, hứa hẹn cách mạng hóa nhiều ngành công nghiệp. Tuy nhiên, việc triển khai đòi hỏi phải cân nhắc kỹ về chi phí, độ trễ, sự phụ thuộc vào LLM API, và các vấn đề về đạo đức, trách nhiệm và thiên vị trong ra quyết định.
https://cobusgreyling.medium.com/five-levels-of-ai-agents-5ac39a7b07ed
- Bài viết hướng dẫn chi tiết cách một cá nhân (solopreneur) có thể xây dựng công ty startup tuyển dụng sử dụng các AI Agent chuyên biệt để tự động hóa quy trình.
- Giới thiệu đội ngũ 5 AI Agent:
+ ResuMate: Phân tích CV, lọc ra ứng viên phù hợp nhất
+ JobHuntr: Tìm kiếm cơ hội việc làm trên mạng
+ CoverStar: Soạn tin nhắn hấp dẫn, gửi đến ứng viên tiềm năng
+ OrgSleuth: Nghiên cứu văn hóa, giá trị của công ty tuyển dụng
+ MetaMinion: Điều phối luồng công việc giữa các Agent, ghép nối ứng viên phù hợp
- Cấu trúc tổ chức startup gồm 5 bộ phận tương ứng chức năng của từng Agent:
1. Tìm kiếm việc làm (JobHuntr)
2. Phân tích CV (ResuMate)
3. Tiếp cận ứng viên (CoverStar)
4. Nghiên cứu công ty (OrgSleuth)
5. Điều phối quy trình (MetaMinion)
- Mô tả chi tiết quy trình hoạt động 9 bước:
1. Ứng viên nộp CV qua portal/email
2. ResuMate phân tích CV, đánh giá mức độ phù hợp
3. JobHuntr liên tục tìm kiếm việc làm phù hợp trên mạng
4. CoverStar gửi tin nhắn tiếp cận ứng viên tiềm năng
5. OrgSleuth nghiên cứu văn hóa, môi trường làm việc công ty
6. MetaMinion tổng hợp dữ liệu, ghép nối ứng viên vừa phù hợp kỹ năng vừa hợp văn hóa công ty
7. CoverStar liên hệ ứng viên để phỏng vấn
8. Tiến hành phỏng vấn nhiều vòng, chọn ứng viên phù hợp nhất
9. Tuyển dụng và onboard nhân viên mới
- Các AI Agent mang lại nhiều lợi ích:
+ Xử lý khối lượng lớn CV, tin tuyển dụng nhanh chóng, chính xác
+ Phân tích sâu về kỹ năng, kinh nghiệm ứng viên thay vì chỉ dựa vào từ khóa
+ Tiếp cận ứng viên một cách cá nhân hóa
+ Đánh giá khách quan, loại bỏ định kiến trong tuyển dụng
+ Tìm được ứng viên phù hợp nhất cả về năng lực và văn hóa
→ Rút ngắn thời gian, nâng cao chất lượng tuyển dụng
- Bài viết giúp người đọc:
+ Thấy được tiềm năng của AI trong khởi nghiệp, đặc biệt với mô hình solopreneur
+ Hiểu rõ cách thức vận hành của một startup tuyển dụng tự động hóa
+ Hình dung tương lai của ngành tuyển dụng và thị trường lao động
+ Có ý tưởng, cảm hứng để phát triển các dự án kinh doanh dựa trên AI
📌 Ứng dụng đội ngũ 5 AI Agent chuyên biệt (ResuMate, JobHuntr, CoverStar, OrgSleuth, MetaMinion) có thể giúp một cá nhân xây dựng công ty startup tuyển dụng vận hành hiệu quả với nguồn lực hạn chế. Mô hình này hứa hẹn cách mạng hóa ngành tuyển dụng, mở ra cơ hội việc làm tốt hơn cho ứng viên và giúp doanh nghiệp tìm được nhân tài nhanh chóng, chính xác hơn. Đây là một minh chứng cho sức mạnh của trí tuệ nhân tạo trong việc nâng cao năng lực cạnh tranh cho các doanh nghiệp vừa và nhỏ.
https://ai.plainenglish.io/how-can-we-build-a-small-startup-using-ai-agent-part-1-7e71d057dd4f
- Các nhà nghiên cứu tại Meta, Allen Institute for AI và Đại học Washington đã giới thiệu Husky, một agent ngôn ngữ mã nguồn mở mới được thiết kế cho các tác vụ lập luận phức tạp, nhiều bước.
- Không giống như các mô hình hiện có tập trung vào các lĩnh vực cụ thể, Husky hoạt động trên một không gian hành động thống nhất, có thể xử lý các thử thách đa dạng như lập luận số, bảng và dựa trên kiến thức.
- Husky lặp lại giữa việc tạo ra các hành động để giải quyết tác vụ và thực thi các hành động này bằng cách sử dụng các mô hình chuyên gia, liên tục cập nhật trạng thái giải pháp của nó.
- Quá trình lặp lại này đã được chứng minh là một điểm khác biệt quan trọng, cho phép Husky vượt trội hơn các agent trước đó trên 14 bộ dữ liệu được sử dụng để đánh giá.
- Một trong những đổi mới chính của Husky là khả năng quản lý lập luận đa công cụ. Nó xuất sắc trong các tác vụ đòi hỏi truy xuất kiến thức còn thiếu và thực hiện các phép tính số, đạt được hiệu suất ngang bằng hoặc vượt trội hơn các mô hình tiên tiến nhất như GPT-4.
- Các nhà nghiên cứu cũng đã giới thiệu HuskyQA, một bộ đánh giá được thiết kế đặc biệt để stress test các agent ngôn ngữ trên các tác vụ lập luận đa công cụ, đặc biệt là để thực hiện lập luận số và truy xuất kiến thức còn thiếu.
- Các agent ngôn ngữ thực hiện các tác vụ phức tạp bằng cách sử dụng các công cụ để thực hiện từng bước một cách chính xác. Tuy nhiên, hầu hết các agent hiện có đều dựa trên các mô hình độc quyền hoặc được thiết kế để nhắm mục tiêu các tác vụ cụ thể, chẳng hạn như toán học hoặc trả lời câu hỏi nhiều bước.
- Mặc dù các agent AI đã thu hút sự chú ý đáng kể trong vài năm qua, việc giới thiệu một agent có khả năng lập luận trên một số tác vụ phức tạp có nghĩa là khả năng của agent đang mở rộng nhanh chóng.
📌 Husky, một agent ngôn ngữ mã nguồn mở mới của Meta AI, có khả năng xử lý các tác vụ lập luận phức tạp và đa dạng nhờ không gian hành động thống nhất. Với khả năng lập luận đa công cụ vượt trội, đặc biệt trong các tác vụ đòi hỏi truy xuất kiến thức và tính toán số, Husky đã vượt qua 14 bộ dữ liệu đánh giá và đạt hiệu suất ngang bằng hoặc cao hơn các mô hình tiên tiến như GPT-4.
https://analyticsindiamag.com/meta-ai-unveils-husky-a-unified-open-source-language-agent/
- AI agent là thực thể phần mềm tự trị, thường được sử dụng để bổ sung cho các mô hình ngôn ngữ lớn (LLM).
- Các LLM gần đây như GPT-4o, Gemini Pro, Claude Opus đã thể hiện khả năng lập luận tiên tiến. Các mô hình mã nguồn mở như Mistral và Llama 3 cũng ngang tầm với các mô hình thương mại.
- AI agent dựa vào LLM để lập luận, đồng thời bổ sung các chức năng mới cho LLM. Có thể coi LLM như kernel và AI agent như các chương trình trong hệ điều hành.
- Các hạn chế của LLM: không có bộ nhớ, xử lý đồng bộ, có thể tạo ra thông tin sai lệch, không truy cập internet, kém toán học, đầu ra không xác định.
- AI agent khắc phục các hạn chế trên bằng cách: duy trì bộ nhớ và ngữ cảnh, xử lý bất đồng bộ và song song, kiểm tra dữ liệu thực tế, tích hợp công cụ toán học, chuẩn hóa định dạng đầu ra, tương tác theo nhân vật.
- Ví dụ: AI agent có thể kết hợp duyệt web, môi trường thực thi code với phân tích của LLM để tạo ra câu trả lời chi tiết.
📌 AI agent đóng vai trò quan trọng trong việc bổ sung khả năng của các mô hình ngôn ngữ lớn bằng cách kết nối chúng với các công cụ và dịch vụ bên ngoài cần thiết để hoàn thành nhiệm vụ, giúp khắc phục nhiều hạn chế vốn có của LLM như thiếu bộ nhớ, xử lý tuần tự, không truy cập dữ liệu thực tế.
https://thenewstack.io/ai-agents-key-concepts-and-how-they-overcome-llm-limitations/
- Generative AI agents (hay còn gọi là agentic AI) có tiềm năng tạo ra bước đột phá trong cách tiếp cận kiến trúc AI tạo sinh trên điện toán đám mây bằng cách mang lại tính tự chủ, thông minh và hiệu quả.
- Điểm cốt lõi của agentic AI là khả năng tự chủ và tạo điều kiện cho hành vi phân tán, năng động. Các AI agents có thể độc lập khởi tạo, lập kế hoạch và hoàn thành các tác vụ phức tạp vốn đòi hỏi sự can thiệp đáng kể của con người.
- Agentic AI là hệ thống AI tiên tiến được thiết kế để đạt được các mục tiêu phức tạp và quản lý quy trình làm việc với sự giám sát tối thiểu của con người. Nó thể hiện khả năng hiểu ngữ cảnh, ra quyết định, thích nghi với hoàn cảnh thay đổi và tự hoàn thành các tác vụ đa diện.
- Các AI agents được trang bị các thuật toán tinh vi cho phép chúng đánh giá các lựa chọn khác nhau, cân bằng đánh đổi và phản ứng hiệu quả với các tình huống mới. Chúng có thể tham khảo nhiều LLM để có cái nhìn tổng quan về vấn đề cần giải quyết.
- Agentic AI triển khai trong quản lý chuỗi cung ứng có thể xử lý tự động nhiều hoạt động hậu cần, đảm bảo hàng hóa được vận chuyển, lưu trữ và giao hàng hiệu quả bằng cách phân tích và phối hợp dữ liệu từ nhiều nguồn.
- Tuy nhiên, việc xây dựng và triển khai AI agents khá phức tạp. Các kiến trúc sư và lập trình viên có khả năng thiết kế, xây dựng hiệu quả AI agents còn khá hiếm. Ngoài ra, không nên đặt quá nhiều tính năng vào AI agents, thay vào đó chúng nên tương tác với nhiều LLM để xử lý các yêu cầu nặng hơn.
📌 Generative AI agents hứa hẹn sẽ cách mạng hóa kiến trúc AI với khả năng tự chủ, thông minh và hiệu quả trong xử lý các tác vụ phức tạp. Tuy nhiên, việc xây dựng và triển khai chúng vẫn còn nhiều thách thức. Các kiến trúc sư và lập trình viên cần tìm hiểu kỹ về lợi ích cũng như khó khăn của công nghệ này trước khi áp dụng rộng rãi.
https://www.infoworld.com/article/3715457/generative-ai-agents-will-revolutionize-ai-architecture.html
- Jensen Huang, CEO của NVIDIA, tin rằng làn sóng tiếp theo của AI là AI vật lý, sẽ cách mạng hóa các ngành công nghiệp thông qua robotics.
- AI vật lý là các mô hình có thể hiểu chỉ dẫn và tự động thực hiện các tác vụ phức tạp trong thế giới thực.
- NVIDIA đang đặt cược vào nền tảng Omniverse để mô phỏng và huấn luyện robot thông qua kỹ thuật sinh đôi kỹ thuật số.
- Các LLM đa phương thức giúp robot học, nhận thức và hiểu thế giới xung quanh, lên kế hoạch hành động.
- Tuy nhiên, mô phỏng không phải là cách duy nhất để huấn luyện robot. Một số tác vụ học tốt hơn thông qua bắt chước.
- NVIDIA hợp tác với nhiều hãng sản xuất lớn để xây dựng nhà máy AI, thúc đẩy sản xuất xe điện và xe tự lái.
- Cuộc đua robotics đang nóng lên với sự đầu tư mạnh mẽ từ các công ty công nghệ lớn như NVIDIA, Microsoft, OpenAI.
📌 NVIDIA đang đặt cược lớn vào AI vật lý, tin rằng nó sẽ cách mạng hóa mọi ngành công nghiệp thông qua robotics. Nền tảng mô phỏng Omniverse và các LLM đa phương thức sẽ đóng vai trò then chốt trong việc huấn luyện robot tự động hóa. Tuy nhiên, mô phỏng không phải là cách tiếp cận duy nhất. Cuộc đua robotics đang nóng lên với sự tham gia của nhiều ông lớn công nghệ.
https://analyticsindiamag.com/the-next-wave-of-ai-is-physical-ai-says-jensen-huang/
- Việc các chatbot AI hợp tác với nhau có thể giúp chúng trở nên hiệu quả hơn trong việc giải quyết các vấn đề khó.
- Tác giả đã thử nghiệm với AutoGen, một framework nguồn mở cho phép tạo ra nhiều tác tử AI với các vai trò và mục tiêu khác nhau để giải quyết các vấn đề cụ thể.
- Hai tác tử AI "phóng viên" và "biên tập viên" đã thảo luận về cách viết bài về sự hợp tác giữa các tác tử AI, đề cập đến các ứng dụng trong y tế, giao thông, bán lẻ và các vấn đề đạo đức.
- Các nghiên cứu cho thấy việc các tác tử AI hợp tác có thể giúp giải quyết các bài toán lớp 5, các vấn đề cờ vua và phân tích, cải tiến mã máy tính tốt hơn so với một tác tử đơn lẻ.
- Việc gán các đặc điểm tính cách khác nhau cho các tác tử AI có thể tinh chỉnh hiệu suất hợp tác của chúng.
- Trong một thử nghiệm do Cơ quan Dự án Nghiên cứu Quốc phòng Tiên tiến (DARPA) của Lầu Năm Góc ủy quyền, một nhóm các tác tử AI đã phát triển một hệ thống phân cấp nội bộ khi tìm kiếm bom ảo.
- Cách tiếp cận hợp tác có thể mạnh mẽ nhưng cũng có thể dẫn đến các lỗi mới do tăng tính phức tạp.
- Mọi người đang thích ứng framework AutoGen nguồn mở theo nhiều cách thú vị như tạo ra các phòng biên tập mô phỏng để tạo ý tưởng viết văn và một "doanh nghiệp trong hộp" ảo với các tác tử đảm nhận các vai trò khác nhau.
📌 Sự hợp tác giữa các chatbot AI đang cho thấy tiềm năng cải thiện đáng kể hiệu suất trong việc giải quyết các vấn đề phức tạp. Tuy nhiên, cách tiếp cận này cũng đặt ra những thách thức mới liên quan đến tính phức tạp và các vấn đề đạo đức cần được giải quyết trước khi có thể áp dụng rộng rãi.
https://www.wired.com/story/chatbot-teamwork-makes-the-ai-dream-work/
- Những tiến bộ gần đây trong lĩnh vực trí tuệ nhân tạo (AI) đã giúp nâng cấp đáng kể "bộ não" của robot. Công nghệ tương tự như chatbot Chatgpt hay hệ thống tạo ảnh DALL-E có thể được áp dụng cho robot.
- Các mô hình AI đa phương thức (multimodal) kết hợp hiểu ngôn ngữ, thị giác với dữ liệu từ cảm biến và cơ cấu chấp hành của robot. Điều này cho phép giao tiếp với robot bằng ngôn ngữ thông thường.
- Robot có thể giải thích lý do đằng sau hành động của chúng. Việc lập trình và gỡ lỗi robot trở nên dễ dàng hơn vì "bộ não" của chúng không còn là hộp đen khó hiểu.
- Robot đang trở nên giỏi hơn trong việc học nhanh thông qua bắt chước và khái quát hóa từ kỹ năng này sang kỹ năng khác. Điều này mở đường cho robot di chuyển ra khỏi nhà máy, kho hàng.
- Nhiều công ty và nhóm nghiên cứu đang sử dụng các mô hình AI mới nhất để chế tạo robot nhân hình, vì hầu hết thế giới được thiết kế cho con người di chuyển.
- Thị trường lao động ở các nước giàu đang thắt chặt và già hóa. Robot thông minh hơn có thể tăng năng suất, đồng thời hỗ trợ nấu ăn, dọn dẹp, chăm sóc người cao tuổi và người có nhu cầu.
- Các nền kinh tế phát triển sẽ cần nhiều tự động hóa hơn để duy trì mức sống. Hàn Quốc, Nhật Bản và Trung Quốc nằm trong top 5 quốc gia có tỷ lệ robot trên mỗi công nhân sản xuất cao nhất, đồng thời cũng già hóa nhanh chóng.
- Trong những năm tới, thái độ có thể chuyển từ sợ hãi sự xuất hiện của robot sang mong muốn chúng đến sớm hơn.
📌 Những tiến bộ trong AI đang giúp robot trở nên thông minh, dễ lập trình và đáng tin cậy hơn. Điều này mở ra tiềm năng to lớn cho robot hỗ trợ con người trong nhiều lĩnh vực, từ sản xuất đến chăm sóc. Các nền kinh tế già hóa sẽ cần nhiều robot hơn để duy trì năng suất và mức sống.
https://www.economist.com/leaders/2024/06/06/three-reasons-why-its-good-news-that-robots-are-getting-smarter
- Anthropic giới thiệu tính năng "tool use" (hay "function calling") cho chatbot Claude, cho phép tạo trợ lý email, bot mua sắm hay các giải pháp cá nhân hóa khác bằng cách kết nối với bất kỳ API bên ngoài nào.
- Công cụ này có thể phân tích dữ liệu để đưa ra đề xuất sản phẩm dựa trên lịch sử mua hàng, trả lời nhanh các yêu cầu của khách hàng như theo dõi trạng thái đơn hàng hay hỗ trợ kỹ thuật.
- Nó cũng có thể xử lý hình ảnh, ví dụ như một trợ lý tư vấn thiết kế nội thất ảo có thể phân tích ảnh phòng và đưa ra gợi ý trang trí phù hợp.
- Trợ lý AI này sẽ có mặt trên Messages API của Anthropic, Amazon Bedrock và Google Vertex AI.
- Giá dịch vụ dựa trên lượng văn bản Claude xử lý, tính bằng "token". 1.000 token tương đương khoảng 750 từ. Gói Haiku rẻ nhất có giá khoảng 0,25 USD/triệu token đầu vào và 1,25 USD/triệu token đầu ra.
- Anthropic đã thử nghiệm beta công cụ từ tháng 4 với vài nghìn khách hàng. Một khách hàng tiêu biểu là Study Fetch, sử dụng nó để xây dựng ứng dụng gia sư AI cá nhân hóa Spark.E.
- Xu hướng phát triển của công nghệ này là hướng tới các trợ lý/tác tử AI. Google và OpenAI cũng đang phát triển các trợ lý tương tự.
📌 Anthropic cho ra mắt tính năng mới trên chatbot Claude, cho phép người dùng tạo ra các trợ lý AI cá nhân hóa như bot mua sắm, trợ lý email thông qua việc tích hợp API bên ngoài. Công cụ này có khả năng phân tích dữ liệu văn bản, hình ảnh để đưa ra đề xuất phù hợp. Dịch vụ có mặt trên nhiều nền tảng với mức giá từ 0,25 USD/triệu token. Đây là một bước tiến mới trong xu hướng phát triển các trợ lý AI đa năng.
https://www.theverge.com/2024/5/30/24167231/anthropic-claude-ai-assistant-automate-tasks
- Flowise giới thiệu nền tảng không cần mã hóa Agentflows, cho phép tạo và quản lý các nhóm AI agent một cách dễ dàng với giao diện kéo thả trực quan.
- Người dùng có thể gán vai trò và trách nhiệm cho từng AI agent, cho phép chúng hợp tác hiệu quả để hoàn thành nhiệm vụ. Agent giám sát đóng vai trò điều phối quy trình làm việc.
- Nền tảng cho phép bất kỳ ai cũng có thể bước vào thế giới phát triển AI mà không cần kiến thức lập trình sâu rộng, mở ra nhiều khả năng mới.
- Để thiết lập một nhóm AI agent, hãy thêm agent giám sát, kéo thả các agent công nhân và gán vai trò, cấu hình thông tin đăng nhập và lời nhắc cho từng agent.
- Các nhóm AI agent có thể được áp dụng trong nhiều lĩnh vực thực tế như phát triển phần mềm (gồm các agent thiết kế sản phẩm, lập trình viên, viết tài liệu kỹ thuật) và nghiên cứu, bán hàng (gồm các agent nghiên cứu, đại diện bán hàng).
- Việc triển khai các nhóm AI agent mang lại nhiều lợi ích như tăng hiệu quả, khả năng mở rộng linh hoạt, cộng tác liền mạch và thúc đẩy đổi mới.
- Nền tảng Flowise cho phép tích hợp các công cụ bên ngoài như Google Custom Search để nâng cao khả năng của các nhóm AI agent.
- Việc kiểm thử và cải tiến lặp đi lặp lại được nhấn mạnh để đảm bảo hiệu suất tối ưu của các nhóm agent.
- Với tính dễ tiếp cận và linh hoạt, nền tảng Flowise là một lựa chọn hấp dẫn cho các doanh nghiệp muốn tận dụng sức mạnh của AI.
📌 Flowise Agentflows là nền tảng không cần mã hóa đột phá, cho phép bất kỳ ai cũng có thể xây dựng và quản lý các nhóm AI agent phức tạp một cách dễ dàng. Với khả năng tích hợp công cụ bên ngoài và áp dụng trong nhiều lĩnh vực như phát triển phần mềm, nghiên cứu, bán hàng, nền tảng này hứa hẹn thúc đẩy năng suất, hiệu quả và tăng trưởng cho các tổ chức ở mọi quy mô.
https://www.geeky-gadgets.com/building-ai-agent-teams/
- Các startup AI lớn như Anthropic đang dạy chatbot cách sử dụng công cụ để trở nên hữu ích hơn trong công việc văn phòng.
- Công nghệ AI hiện tại chưa thực sự thay đổi công việc văn phòng, mặc dù có nhiều thử nghiệm và ứng dụng.
- Chatbots như Google Gemini và OpenAI’s ChatGPT chủ yếu chỉ xử lý văn bản qua giao diện chat.
- Anthropic ra mắt sản phẩm mới cho phép chatbot Claude truy cập các dịch vụ và phần mềm bên ngoài để thực hiện các nhiệm vụ hữu ích hơn.
- Claude có thể sử dụng máy tính để giải các bài toán, truy cập cơ sở dữ liệu khách hàng, và sử dụng các chương trình khác trên máy tính người dùng.
- Công ty Study Fetch đã phát triển cách để Claude sử dụng các tính năng của nền tảng để thay đổi giao diện người dùng và nội dung giáo trình.
- Google cũng đã trình diễn một số AI agents tại hội nghị I/O, bao gồm một agent xử lý việc trả hàng trực tuyến.
- Các AI agents ban đầu có thể bị giới hạn trong các nhiệm vụ cụ thể để giảm thiểu rủi ro sai sót.
- Tự động hóa quy trình robot (RPA) hiện tại đã có giá trị 29 tỷ USD và dự kiến sẽ tăng lên 65 tỷ USD vào năm 2027 nhờ sự kết hợp của AI.
- Công ty Adept AI đang phát triển các AI agents cho công việc văn phòng với độ tin cậy trên 90% cho khách hàng doanh nghiệp.
- Adept AI tập trung vào việc cải thiện khả năng hiểu mục tiêu và các bước cần thiết để hoàn thành nhiệm vụ của AI agents.
- Sử dụng công cụ là một bước tiến quan trọng trong việc phát triển trí tuệ máy móc mạnh mẽ hơn, tương tự như quá trình tiến hóa của con người.
📌 Các startup AI như Anthropic đang dạy chatbot cách sử dụng công cụ để trở nên hữu ích hơn trong công việc văn phòng. Sự phát triển này có thể làm tăng giá trị thị trường tự động hóa quy trình robot từ 29 tỷ USD lên 65 tỷ USD vào năm 2027.
https://www.wired.com/story/chatbots-are-entering-the-stone-age/
- Tự động hóa quy trình làm việc giúp thực hiện các tác vụ kinh doanh thường xuyên một cách tự động, giảm can thiệp thủ công, đảm bảo tác vụ được thực hiện nhất quán và không có lỗi.
- Lợi ích chính của tự động hóa quy trình là giải phóng thời gian cho nhân viên tập trung vào các hoạt động phức tạp, mang lại giá trị gia tăng. Nó cũng giảm khả năng xảy ra lỗi, tăng tốc độ quy trình và cải thiện đáng kể hiệu quả hoạt động của doanh nghiệp.
- AI mang lại một lớp thông minh cho tự động hóa, cho phép hệ thống không chỉ thực hiện tác vụ mà còn học hỏi từ chúng, tối ưu hóa quy trình theo thời gian.
- Make là nền tảng tự động hóa không cần code cho phép người dùng tạo quy trình làm việc kết nối các dịch vụ trực tuyến khác nhau mà không cần viết một dòng code nào.
- Để bắt đầu với Make, trước tiên bạn cần tạo tài khoản và làm quen với bảng điều khiển. Nền tảng này trực quan, được thiết kế cho người dùng từ người mới bắt đầu đến người tự động hóa nâng cao.
- Các bước thiết lập quy trình làm việc tăng cường AI đầu tiên của bạn: xác định tác vụ lặp đi lặp lại, xác định mục tiêu tự động hóa, chọn trigger và action phù hợp, sử dụng AI để ra quyết định nâng cao, lập bản đồ quy trình, kiểm tra và tối ưu hóa.
- Các tính năng và kỹ thuật nâng cao như logic phân nhánh, tổng hợp dữ liệu, xử lý lỗi giúp nâng cao hơn nữa hiệu quả quy trình làm việc.
- Một số trường hợp sử dụng thực tế của AI và Make như tự động hóa dịch vụ khách hàng, quản lý hàng tồn kho.
📌 Tích hợp AI với nền tảng không cần code như Make đại diện cho một biên giới mới trong tự động hóa quy trình kinh doanh. Bằng cách khai thác các công nghệ này, doanh nghiệp không chỉ có thể hợp lý hóa hoạt động mà còn phát hiện ra những hiểu biết và hiệu quả trước đây không khả thi. Kết quả là lợi thế cạnh tranh đáng kể trong thế giới ngày càng số hóa. Khi doanh nghiệp tiếp tục phát triển, việc áp dụng các công nghệ như vậy sẽ trở nên không chỉ có lợi mà còn thiết yếu.
Citations:
[1] https://www.geeky-gadgets.com/automate-your-workflows-using-ai-and-make/
- Tại sự kiện Build hàng năm, Microsoft tập trung vào AI, giới thiệu Team Copilot - chatbot AI đóng vai trò như một đồng nghiệp, sử dụng kiến thức chung của nhóm để trả lời câu hỏi, tương tự AI Teammate của Google.
- Microsoft cũng giới thiệu Copilot Agents - trợ lý AI có thể tự động hóa các tác vụ cho nhân viên và đồng nghiệp một cách độc lập, chủ động.
- Người dùng có thể cung cấp mô tả công việc tùy chỉnh hoặc chọn từ các mẫu có sẵn. Copilot sẽ tạo một AI agent hoạt động ngầm để hoàn thành các tác vụ được giao.
- Copilot có thể yêu cầu trợ giúp khi gặp tình huống không xử lý được, tham khảo kiến thức hiện có và học hỏi từ phản hồi mới để hoàn thành nhiệm vụ.
- Copilot Agents có thể được xây dựng trong Copilot Studio, Microsoft cho rằng bất kỳ ai cũng có thể tạo ra chúng để tự động hóa công việc.
- Tính năng này tương tự như AI Agents của Google, có thể tự động hoàn thành các tác vụ như xử lý hoàn tiền cho đơn hàng trực tuyến.
- Cả Copilot Agents và AI Agents đều chưa sẵn sàng cho thị trường. Microsoft đang thử nghiệm với một nhóm người dùng chọn lọc và dự kiến cung cấp bản xem trước công khai vào cuối năm nay.
- Các công ty công nghệ lớn tiếp tục tập trung vào sản phẩm AI, nhưng nhiều sản phẩm được quảng cáo vẫn chưa ra mắt thị trường. Liệu chúng có thể thực hiện các tác vụ như đã nói khi được phát hành hay không vẫn còn là câu hỏi.
📌 Microsoft giới thiệu Copilot Agents - trợ lý AI có thể tự động hóa công việc cho doanh nghiệp, tương tự AI Agents của Google. Tuy nhiên, cả hai đều chưa sẵn sàng ra mắt thị trường. Liệu các sản phẩm AI này có thực sự hoạt động hiệu quả như lời quảng cáo khi chính thức phát hành vẫn là điều cần thận trọng.
https://sea.mashable.com/tech/32701/microsoft-unveils-copilot-agents-an-ai-business-assistant
- Trong 10 năm tới, các công cụ tài chính trực tuyến ngày nay sẽ trở nên lỗi thời khi chúng ta ngày càng quản lý tài chính thông qua các agents - những bot thông minh thực hiện các hoạt động tài chính thay mặt chúng ta.
- Các agent đã tồn tại dưới dạng bot thanh lý, bot chênh lệch giá. Chúng hoạt động tự động, thực hiện các hành động on-chain thay mặt người khác.
- Tiền điện tử, với bản chất minh bạch, nguồn mở và có thể lập trình, là nền tảng hoàn hảo cho các agent, vượt trội so với API nửa vời của TradFi.
- Các agent hiện tại vẫn đơn giản, được lập trình cho một nhiệm vụ hẹp. Các công ty lớn có thể xây dựng hệ thống phức tạp hơn, nhưng không khả thi cho người dùng nhỏ lẻ.
- Khi AI trở nên phổ biến hơn, các chi tiết kỹ thuật của việc gọi hàm hợp đồng thông minh có thể được trừu tượng hóa. Người tạo/chủ sở hữu có thể đưa ra các hướng dẫn cấp cao hơn trong khi agent tìm cách thực hiện.
- LLM như GPT-4 đã có khả năng hiểu ý định, suy luận thông minh và đọc tất cả dữ liệu trên Internet. Có thể tưởng tượng một giao diện văn bản cho agent đã đọc tất cả các phương tiện truyền thông tiền điện tử liên quan, tiêu thụ và hiểu tất cả dữ liệu từ các blockchain, đồng thời có khả năng thực hiện hành động on-chain.
- Các AI agent có thể tự động hóa các hoạt động như săn airdrop, săn tiền meme và tối ưu hóa lợi nhuận.
- Trong tương lai, chúng ta có thể không cần giao diện người dùng nữa, và MetaMask sẽ được thay thế bởi ví trong agent.
- Các agent TradFi sẽ tồn tại, nhưng các agent được xây dựng trên tiền điện tử sẽ tốt hơn. Nếu các agent trở nên phổ biến hơn và các agent tiền điện tử mang lại trải nghiệm tốt hơn, điều này sẽ thúc đẩy ngày càng nhiều người dùng, hoạt động và giá trị on-chain.
📌 Tiền điện tử có thể là hệ thống tài chính hoàn hảo cho các AI agent trong tương lai. Sự xuất hiện của các agent tiền điện tử tiên tiến, với khả năng tự động hóa và tối ưu hóa các hoạt động tài chính, sẽ thu hút ngày càng nhiều người dùng và thúc đẩy sự phát triển của hệ sinh thái tiền điện tử.
https://www.coindesk.com/opinion/2024/05/13/ai-agents-will-drive-the-next-wave-of-crypto-adoption/
- Các mô hình ngôn ngữ lớn (LLM) có thể thực hiện các công việc phức tạp khi chúng làm việc cùng nhau trong các hệ thống đa tác tử (MAS).
- Trong một thử nghiệm, 3 tác tử AI đã phối hợp để tìm và vô hiệu hóa bom. Tác tử Alpha chỉ đạo Bravo và Charlie di chuyển đến các phòng khác nhau để làm việc hiệu quả hơn.
- Các nhà nghiên cứu MIT chỉ ra rằng 2 chatbot cùng nhau giải quyết vấn đề toán học tốt hơn 1 chatbot đơn lẻ. Chúng cũng ít bịa đặt thông tin hơn khi thống nhất về sự kiện.
- Các nhóm AI làm việc tốt hơn tác tử đơn lẻ vì công việc có thể được chia nhỏ thành nhiều nhiệm vụ chuyên biệt hơn. Ví dụ, một MAS lập kế hoạch cho chuyến đi Berlin có thể phân chia việc tìm điểm tham quan, lập lộ trình, tính toán chi phí.
- Tuy nhiên, các LLM đôi khi đưa ra giải pháp phi logic và điều này có thể lan truyền trong cả nhóm. Các tác tử cũng có thể mắc kẹt trong vòng lặp.
- Microsoft đã phát hành AutoGen, một framework nguồn mở để xây dựng các nhóm với các tác tử LLM. Một dự án AutoGen kết hợp bộ tạo ảnh với mô hình ngôn ngữ để tạo ra ảnh phù hợp hơn với yêu cầu của người dùng.
- Các nhà nghiên cứu ở Phòng thí nghiệm AI Thượng Hải chỉ ra cách các tác tử trong các hệ thống nguồn mở có thể được điều kiện với "đặc điểm tính cách đen tối" để thực hiện các nhiệm vụ có hại.
- Kỹ thuật "jailbreaking" sử dụng một chatbot để xúi giục chatbot khác tham gia vào hành vi xấu có thể vượt qua cơ chế chặn của các LLM thương mại.
📌 Các nhóm AI đang thể hiện trí thông minh tập thể cao hơn các LLM riêng lẻ, mở ra tiềm năng ứng dụng trong nhiều lĩnh vực. Tuy nhiên, chúng cũng tiềm ẩn rủi ro lớn nếu bị lạm dụng để thực hiện các nhiệm vụ độc hại, vượt qua các biện pháp kiểm soát. Việc các hệ thống AI hợp tác với nhau có thể tạo ra một vũ khí đáng sợ.
Citations:
[1] https://www.economist.com/science-and-technology/2024/05/13/todays-ai-models-are-impressive-teams-of-them-will-be-formidable
- Giáo dục AI và Robotics đang trở thành xu hướng phát triển mạnh mẽ tại Mỹ với sự gia tăng đáng kể trong các chương trình đào tạo, nghiên cứu và ứng dụng.
- Các trường đại học hàng đầu như MIT, Stanford, Carnegie Mellon đang đầu tư mạnh vào nghiên cứu và phát triển AI, robotics.
- Số lượng sinh viên theo học các chương trình liên quan đến AI và robotics tăng 35% trong 5 năm qua.
- Hơn 1.500 khóa học về AI và robotics được giảng dạy tại các trường đại học Mỹ.
- Các dự án nghiên cứu AI và robotics nhận được tài trợ lên tới 2 tỷ USD mỗi năm.
- Nhiều trường phổ thông bắt đầu đưa AI và robotics vào giảng dạy cho học sinh.
- Hơn 10.000 học sinh phổ thông tham gia các câu lạc bộ và cuộc thi về robotics.
- Chính phủ Mỹ đầu tư 500 triệu USD cho nghiên cứu và giáo dục AI trong 5 năm tới.
- Các công ty công nghệ lớn như Google, Microsoft, Amazon hợp tác chặt chẽ với các trường đại học trong nghiên cứu và đào tạo nhân tài AI, robotics.
- Nhu cầu nhân lực trong lĩnh vực AI và robotics tại Mỹ dự kiến tăng 40% trong thập kỷ tới.
📌 Giáo dục AI và Robotics đang bùng nổ tại Mỹ với sự tăng trưởng mạnh mẽ trong đào tạo, nghiên cứu và ứng dụng. Các trường đại học đầu tư lớn, số lượng sinh viên tăng 35%, hơn 1.500 khóa học được giảng dạy. Chính phủ và các công ty công nghệ cũng tăng cường hỗ trợ, đáp ứng nhu cầu nhân lực tăng 40% trong tương lai.
Citations:
[1] https://www.socialnews.xyz/2024/05/12/ai-robotics-learning-booms-in-us-education/
- Astribot S1, sản phẩm mới nhất của công ty robot Trung Quốc Astribot, gây sốc với khả năng di chuyển giống hệt con người.
- Video mới phát hành cho thấy S1 thực hiện nhiều công việc ấn tượng từ xếp cốc nhanh, rút khăn trải bàn dưới tháp ly rượu mà không làm đổ.
- S1 không chỉ thể hiện qua các màn trình diễn ấn tượng mà còn qua các công việc thực tế như sắp xếp đồ vật một cách logic, chế biến và phục vụ bánh kếp.
- Được trang bị AI, S1 có khả năng "suy nghĩ" vượt ra khỏi các lệnh đơn giản, tự sắp xếp và phân loại đồ vật một cách hợp lý.
- Trong bếp, S1 có thể thái và gọt rau củ với tốc độ và độ chính xác giống như con người, chuẩn bị bột bánh kếp và chiên chúng.
- Astribot S1 cũng thể hiện khả năng xử lý chai và lỏng một cách điêu luyện, từ mở nắp chai đến rót lỏng mà không đổ giọt nào.
- Ngoài ra, S1 còn có thể hút bụi, cắm phích điện và sử dụng búa để thực hiện các công việc DIY cơ bản.
- Robot này cũng giỏi trong việc thực hiện các công việc nhà mệt mỏi như tưới cây, là và gấp quần áo.
- Astribot S1 đang trong quá trình thử nghiệm nghiêm ngặt và dự kiến sẽ được phát hành vào cuối năm nay.
- Với khả năng chịu tải 22 pound cho mỗi cánh tay và tốc độ tối đa 10 mét/giây, S1 được coi là robot giống con người nhất về hiệu suất hoạt động.
📌 Astribot S1 của Trung Quốc đã gây ấn tượng mạnh với khả năng di chuyển và thực hiện công việc với tốc độ và độ chính xác giống như con người. Từ việc thực hiện các màn trình diễn ấn tượng đến việc xử lý các công việc nhà phức tạp, S1 cho thấy tiềm năng lớn trong việc hỗ trợ con người trong tương lai.
https://supercarblondie.com/china-unveils-astribot-s1/
- AI giống như ChatGPT đang thúc đẩy nghiên cứu và đưa robot giống người đến gần hơn với thực tế tại Trung Quốc, quốc gia sở hữu nhiều nhà máy hàng đầu thế giới.
- Li Zhang, COO của LimX Dynamics tại Shenzhen, cho biết AI tạo sinh có thể giúp máy móc hiểu và nhận thức môi trường xung quanh.
- Mặc dù AI có thể cho phép robot suy nghĩ và đưa ra quyết định ngang bằng con người, nhưng hạn chế về mặt cơ khí là lý do chính khiến robot giống người chưa thể thay thế hoàn toàn lao động con người.
- LimX Dynamics, một startup mới hai tuổi, đã rút ngắn kỳ vọng về thời gian sản xuất robot giống người từ 8-10 năm xuống còn 5-7 năm sau khi thấy được sự cải thiện nhờ AI.
- OpenAI và Elon Musk's Tesla đang phát triển robot giống người của riêng mình, trong khi BYD, một gã khổng lồ về xe điện, đã đầu tư vào startup Agibot tại Thượng Hải.
- Trung Quốc đã vượt qua Nhật Bản vào năm 2013 trở thành quốc gia lắp đặt robot công nghiệp nhiều nhất thế giới, chiếm hơn 50% tổng số toàn cầu.
- Các ngành điện tử, ô tô và kim loại và máy móc là ba ngành hàng đầu trong việc lắp đặt robot công nghiệp tại Trung Quốc.
- AI tạo sinh không trực tiếp giúp cải thiện chuyển động của robot nhưng có thể hỗ trợ robot giống người trong việc lập kế hoạch nhiệm vụ nâng cao.
- Một sự chuyển dịch về robot công nghiệp có thể được tăng tốc một khi chi phí cho mỗi robot giảm xuống.
- Trong nghiên cứu dược phẩm, AI tạo sinh có thể giảm chi phí mà không cắt giảm lao động con người, bằng cách giảm số lượng thí nghiệm thất bại.
📌 AI tạo sinh đang thúc đẩy sự phát triển của robot giống người, đặc biệt tại Trung Quốc, với kỳ vọng rút ngắn thời gian sản xuất và triển khai chúng trong các ngành công nghiệp và hộ gia đình. Mặc dù có những hạn chế về mặt cơ khí, nhưng sự tiến bộ trong AI và giảm chi phí sản xuất có thể mở ra những cơ hội mới cho việc sử dụng robot, đồng thời giảm thiểu tác động tiêu cực đến việc làm con người.
https://www.cnbc.com/2024/05/08/how-generative-chatgpt-like-ai-is-accelerating-humanoid-robots.html
- Vào tháng 3 năm 2024, Hugging Face, một startup chuyên về AI, đã thu hút sự chú ý lớn khi tuyển dụng Remi Cadene, cựu nhân viên khoa học của Tesla, Inc., để dẫn dắt dự án robot nguồn mở mới.
- Sự kiện này đáng chú ý bởi vì Tesla nổi tiếng trong lĩnh vực công nghệ và robot, đặc biệt là với mô hình robot hình người Optimus gần đây.
- Lĩnh vực robot đã chứng kiến sự bùng nổ về tiến bộ, nhờ vào việc tích hợp các mô hình ngôn ngữ lớn dựa trên transformer và AI tạo sinh, những lĩnh vực mà Hugging Face đã xuất sắc.
- Hugging Face giới thiệu LeRobot - một bộ công cụ nguồn mở với mục tiêu dân chủ hóa robot AI và khơi dậy niềm đam mê cho thế hệ roboticists mới.
- Quyết định làm cho LeRobot trở thành nguồn mở nhằm mục đích ngăn chặn sự tập trung quyền lực và đổi mới trong một số ít công ty. Hugging Face mời cộng đồng toàn cầu của các nhà phát triển, nhà nghiên cứu, và người hâm mộ đóng góp và hưởng lợi từ sự tiến bộ chung của robot AI.
- LeRobot được phát triển dựa trên việc tạo ra bộ dữ liệu robot được cộng đồng đóng góp lớn nhất từ trước đến nay, với sự hợp tác của các trường đại học, startups, công ty công nghệ lớn, và cá nhân người hâm mộ.
📌 Hugging Face đã mở ra một chương mới trong lĩnh vực robot và AI với việc ra mắt LeRobot, một thư viện mã nguồn mở nhằm dân chủ hóa công nghệ robot. Sự kiện này không chỉ đánh dấu sự hợp tác của những tên tuổi lớn trong ngành như Remi Cadene từ Tesla mà còn mở ra cơ hội cho cộng đồng toàn cầu tham gia vào quá trình phát triển và đổi mới.
Citations:
[1] https://venturebeat.com/automation/hugging-face-launches-lerobot-open-source-robotics-code-library/
- Intrinsic, một công ty con của Alphabet, đã công bố việc tích hợp các sản phẩm của Nvidia vào nền tảng ứng dụng robot Flowstate tại sự kiện Automate ở Chicago.
- Các sản phẩm từ Nvidia bao gồm Isaac Manipulator, một bộ mô hình cơ bản được thiết kế để tạo lập luồng công việc cho cánh tay robot, đã được ra mắt tại GTC vào tháng 3.
- Danh sách các đối tác công nghiệp lớn đã tham gia bao gồm Yaskawa, Solomon, PickNik Robotics, Ready Robotics, Franka Robotics và Universal Robots.
- Sự hợp tác tập trung vào khả năng nắm bắt (chụp và nhấc các vật thể), một trong những chức năng chính cho tự động hóa sản xuất và hoàn thiện.
- Các hệ thống được huấn luyện trên các bộ dữ liệu lớn với mục tiêu thực hiện các nhiệm vụ hoạt động trên nhiều loại phần cứng và với các đối tượng khác nhau.
- Wendy Tan White, người sáng lập và CEO của Intrinsic, cho biết trong tương lai, các nhà phát triển có thể sử dụng các kỹ năng nắm bắt chung sẵn có để tăng tốc độ quy trình lập trình của họ.
- Các bài kiểm tra ban đầu của Flowstate được thực hiện trong Isaac Sim, nền tảng mô phỏng robot của Nvidia. Khách hàng của Intrinsic, Trumpf Machine Tools, đã làm việc với một nguyên mẫu của hệ thống.
- Intrinsic cũng đang hợp tác với DeepMind, cũng thuộc sở hữu của Alphabet, để giải quyết ước lượng tư thế và lập kế hoạch đường đi, hai khía cạnh quan trọng khác của tự động hóa.
- Hệ thống được huấn luyện trên hơn 130.000 đối tượng, có khả năng xác định hướng của các vật thể trong "vài giây".
- Một phần quan trọng khác của công việc của Intrinsic với DeepMind là khả năng vận hành nhiều robot cùng một lúc, với hiệu suất cao hơn ~25% so với một số phương pháp truyền thống.
📌 Intrinsic, một phần của Alphabet, đã tích hợp công nghệ của Nvidia vào nền tảng Flowstate, đánh dấu một bước tiến quan trọng trong tự động hóa công nghiệp. Sự hợp tác này không chỉ mở rộng khả năng của robot trong việc nắm bắt và xử lý các vật thể mà còn giảm chi phí phát triển và tăng tính linh hoạt cho người dùng cuối.
https://techcrunch.com/2024/05/06/alphabet-owned-intrinsic-incorporates-nvidia-tech-into-robotics-platform/
- Sự phát triển của robot hình người đang tăng tốc ở cả Trung Quốc và Mỹ, được thúc đẩy bởi những tiến bộ trong trí tuệ nhân tạo.
- Trung Quốc coi robot hình người là một "công nghệ đột phá quan trọng như sự ra đời của máy tính, điện thoại thông minh và xe năng lượng mới".
- Bộ Thông tin và Công nghệ Trung Quốc cho rằng thế giới đang ở bình minh của một cuộc cách mạng sẽ "thay đổi sâu sắc sản xuất, lối sống của con người và sự phát triển công nghiệp toàn cầu".
- Công ty UBTech của Trung Quốc, thành lập năm 2012 tại Thâm Quyến, đã cho robot hình người Walker S 1m45 đánh cồng khai trương phiên giao dịch IPO tại sàn chứng khoán Hồng Kông.
- UBTech muốn cách mạng hóa ngành công nghiệp và dịch vụ con người bằng cách đưa robot vào kỷ nguyên mới: robot hai chân nhân tạo, có khả năng tương tác với con người.
- Bắc Kinh, Thượng Hải và Thâm Quyến đều đã đưa lĩnh vực robot hình người vào các kế hoạch phát triển gần đây.
- Bắc Kinh thậm chí đã thành lập quỹ robot trị giá 10 tỷ nhân dân tệ (1,3 tỷ euro) để biến thành phố trở thành "trung tâm hàng đầu thế giới cho ngành công nghiệp robot hình người".
📌 Trung Quốc và Mỹ đang chạy đua phát triển robot hình người, với Trung Quốc đầu tư mạnh 10 tỷ nhân dân tệ để trở thành trung tâm hàng đầu, trong khi các công ty Mỹ đặt cược vào việc sử dụng rộng rãi chúng trong kho hàng và nhà máy. Bắc Kinh, Thượng Hải và Thâm Quyến đều đã đưa lĩnh vực robot hình người vào các kế hoạch phát triển gần đây. Bắc Kinh thậm chí đã thành lập quỹ robot trị giá 10 tỷ nhân dân tệ (1,3 tỷ euro) để biến thành phố trở thành "trung tâm hàng đầu thế giới cho ngành công nghiệp robot hình người".
Citations:
[1] https://worldcrunch.com/tech-science/humanoid-robots-china
- Các nhà cung cấp RPA đang tìm cách để không bị lỗi thời trong bối cảnh sự phát triển mạnh mẽ của các đại lý AI tạo sinh, nhằm giải quyết các thách thức hiện tại mà không làm ảnh hưởng đến nền tảng của họ.
- RPA và AI tạo sinh có thể tồn tại đồng thời và bổ trợ lẫn nhau, mở ra khả năng cộng tác giữa hai công nghệ này trong lĩnh vực tự động hóa doanh nghiệp.
- Các đại lý (tác nhân) AI, được hỗ trợ bởi AI tạo sinh, có khả năng thực hiện các nhiệm vụ phức tạp thông qua tương tác giống như con người trên các nền tảng phần mềm và web, ví dụ như tự động tạo lịch trình hoặc so sánh giá cả.
- OpenAI, nhà phát triển ChatGPT, đang phát triển hệ thống đại lý AI, trong khi Google đã trình làng nhiều sản phẩm tương tự tại hội nghị Cloud Next hàng năm vào tháng Tư.
- Các chuyên gia tại Boston Consulting Group dự đoán rằng các đại lý tự trị sẽ được áp dụng rộng rãi trong vòng ba đến năm năm tới.
- Mặc dù RPA có tính cứng nhắc khiến chi phí xây dựng cao và hạn chế khả năng áp dụng, 69% tổ chức đã áp dụng RPA gặp phải sự cố về quy trình tự động hóa bị hỏng ít nhất một lần mỗi tuần.
- UiPath, một trong những nhà cung cấp hàng đầu thị trường RPA với hơn 1.000 khách hàng bao gồm Uber, Xerox và CrowdStrike, gần đây đã giới thiệu các tính năng AI tạo sinh mới cho xử lý tài liệu và tin nhắn, cũng như thực hiện các hành động tự động.
- Tuy nhiên, cần lưu ý đến các hạn chế của AI tạo sinh như định kiến và ảo giác, khi nó ngày càng được sử dụng rộng rãi trong các khả năng của RPA.
📌 Các nhà cung cấp RPA đang tích cực hợp tác với AI tạo sinh để giải quyết các thách thức hiện tại và duy trì tính cạnh tranh. Với sự phát triển của các tác nhân (đại lý) AI, dự kiến sẽ có sự chuyển dịch lớn trong tự động hóa doanh nghiệp trong vòng ba đến năm năm tới. UiPath đã tiên phong trong việc tích hợp AI tạo sinh vào các sản phẩm của mình, hứa hẹn một bước tiến đáng kể trong quá trình chuyển đổi số.
Citations:
[1] https://techcrunch.com/2024/04/28/how-rpa-vendors-aim-to-remain-relevant-in-a-world-of-ai-agents/
- Các tác nhân AI tự trị đại diện cho một bước chuyển mình đáng kể trong cách thức vận hành của doanh nghiệp. Chúng có thể tự động hóa các tác vụ lặp đi lặp lại, cải thiện việc ra quyết định và tối ưu hóa quy trình làm việc.
- Khác với chatbot, các tác nhân tự trị có thể phân tích dữ liệu, lập kế hoạch hành động và thích ứng theo thời gian thực, mang lại sự chuyển đổi trong hoạt động của doanh nghiệp trên nhiều lĩnh vực.
- Trong tài chính, tác nhân AI có thể hợp lý hóa quy trình xét duyệt khoản vay, phát hiện gian lận. Trong y tế, chúng có thể cá nhân hóa phác đồ điều trị cho bệnh nhân.
- Trong sản xuất, các tác nhân AI dự đoán được sự cố thiết bị, quản lý đội robot, tối ưu hóa sản xuất.
- Các tác nhân AI cũng mang lại tiềm năng to lớn cho chính phủ. Người dân có thể tương tác với một hệ thống chính phủ lấy con người làm trung tâm, hiểu rõ nhu cầu cụ thể của từng cá nhân.
- Hệ thống có thể hướng dẫn quy trình xin giấy phép, đề xuất các biểu mẫu phù hợp cho từng dịch vụ, vượt xa khỏi công việc giấy tờ đơn thuần.
📌 Các tác nhân AI tự trị đang mở ra kỷ nguyên mới về năng suất, tự động hóa quy trình và ra quyết định thông minh cho doanh nghiệp trên nhiều lĩnh vực như tài chính, y tế, sản xuất. Chúng cũng hứa hẹn cải thiện trải nghiệm và hiệu quả phục vụ công dân của các cơ quan chính phủ.
Citations:
[1] https://www.forbes.com/sites/timothypapandreou/2024/04/27/unlocking-productivity-why-businesses-need-ai-agents-now/
- Công ty Sanctuary AI của Canada đã giới thiệu robot thế hệ thứ bảy của họ, Phoenix, tập trung chủ yếu vào phần thân trên và khả năng học hỏi.
- Phoenix khác biệt so với các thế hệ trước đây vì không tập trung phát triển chân mà chú trọng vào phần thân trên, với các chuyển động giống như con người trong các tác vụ như phân loại sản phẩm.
- Robot này có khả năng tự động hóa các tác vụ mới trong vòng dưới 24 giờ, thể hiện sự tiến bộ vượt bậc về mặt học tập so với các hệ thống trước.
- Geordie Rose, đồng sáng lập và CEO của Sanctuary AI, nhấn mạnh rằng Phoenix là hệ thống gần giống con người nhất từ trước đến nay và là bước tiến quan trọng hướng tới trí tuệ nhân tạo tổng quát.
- Trong các thử nghiệm, Phoenix đã thể hiện khả năng phân biệt và xử lý các đối tượng theo màu sắc khác nhau trong một môi trường kiểm soát.
- Sanctuary đã triển khai các hệ thống trước đó và gần đây đã công bố quan hệ đối tác với các cơ sở sản xuất ô tô của Magna, cho thấy khả năng ứng dụng thực tế của công nghệ này.
- Mặc dù các tác vụ mà Phoenix thực hiện trong các demo có vẻ đơn giản, nhưng chúng được thực hiện trong một môi trường kiểm soát và là bước đầu tiên hướng tới các ứng dụng phức tạp hơn trong tương lai.
📌 Robot người máy Phoenix của Sanctuary AI đánh dấu một bước tiến quan trọng trong công nghệ AI với khả năng học hỏi nhanh và chi phí thấp. Phoenix tập trung vào phần thân trên và có thể tự động hóa các tác vụ mới trong vòng dưới 24 giờ. Phoenix là hệ thống gần giống con người nhất từ trước đến nay và là bước tiến quan trọng hướng tới trí tuệ nhân tạo tổng quát.
Citations:
[1] https://techcrunch.com/2024/04/25/sanctuarys-new-humanoid-robot-learns-faster-and-costs-less/
- JPMorgan đã ra mắt FlowMind, một hệ thống tạo sinh quy trình làm việc tự động dựa trên công nghệ LLMs.
- FlowMind được thiết kế để cải thiện hiệu quả của Robotic Process Automation (RPA) khi đối mặt với yêu cầu người dùng không lường trước được.
- Hệ thống sử dụng công thức nhắc nhở chung cho bài giảng, kết hợp lý luận LLM với các API đáng tin cậy để giảm thiểu hiện tượng "hallucinations" trong LLMs và đảm bảo tính toàn vẹn và bảo mật dữ liệu.
- FlowMind cho phép người dùng tương tác dễ dàng hơn bằng cách cung cấp mô tả cấp cao về các quy trình làm việc tự động sinh ra, hỗ trợ kiểm tra và phản hồi hiệu quả.
- Hệ thống đã vượt trội so với phương pháp GPT-Context-Retrieval trong các thử nghiệm, ngay cả khi không có phản hồi từ người dùng.
- Nghiên cứu cũng giới thiệu NCEN-QA, một bộ dữ liệu mới trong lĩnh vực tài chính để đánh giá các nhiệm vụ trả lời câu hỏi từ các báo cáo N-CEN về quỹ.
- FlowMind hoạt động theo hai giai đoạn chính: cung cấp ngữ cảnh, API có sẵn và nhu cầu tạo sinh quy trình cho LLM; và sử dụng API để tạo sinh và thực thi quy trình làm việc, với một vòng lặp phản hồi tùy chọn cho tương tác người dùng.
- Các công trình nghiên cứu tương lai có thể khám phá việc sử dụng đám đông để thu thập phản hồi người dùng nhằm tinh chỉnh quy trình làm việc và học tập suốt đời dựa trên các ví dụ đã được người dùng chấp thuận trước đó để cải thiện hiệu suất của FlowMind theo thời gian.
- FlowMind cũng có thể được mở rộng để xử lý các thư viện API lớn bằng cách truy xuất các API phù hợp nhất cho một nhiệm vụ cụ thể dựa trên độ tương đồng của nhúng.
📌 FlowMind của JPMorgan là một bước tiến trong công nghệ tạo sinh quy trình tự động, sử dụng LLMs để cải thiện hiệu quả và bảo mật trong RPA. Hệ thống này không chỉ giảm thiểu hiện tượng hallucinations mà còn tăng cường tương tác người dùng và bảo mật dữ liệu, với khả năng mở rộng và tinh chỉnh qua thời gian.
Citations:
[1] https://analyticsindiamag.com/jpmorgan-unveils-flowmind-for-automatic-workflow-generation-with-llms/
- Trong bài phát biểu tại Intel Vision, CEO Pat Gelsinger phác thảo kịch bản AI sẽ tự động hóa toàn bộ văn phòng hoặc thậm chí cả doanh nghiệp.
- Ông mô tả đây là kỷ nguyên của các hàm AI, trong đó các đại lý AI (mô hình chuyên biệt cho từng ứng dụng) tương tác với nhau để hoàn thành nhiệm vụ.
- Gelsinger hình dung cả bộ phận sẽ trở thành giải pháp tự động hóa AI, dẫn đến sự ra đời của công ty tỷ đô chỉ với một nhân sự (Unicorn).
- Intel mong muốn phần cứng để huấn luyện và chạy các đại lý và hàm AI này sẽ do họ sản xuất.
- Intel đã cam kết đào tạo 30 triệu người làm việc với AI đến năm 2030 và tham gia liên minh các công ty công nghệ để xác định công việc nào sẽ bị loại bỏ đầu tiên bởi AI.
- Gelsinger dự đoán bước tiếp theo sẽ là sự trỗi dậy của các đại lý AI xử lý các tác vụ phức tạp hơn và tự động hóa quy trình làm việc, sau đó kết hợp chúng thành các hàm AI.
📌 CEO Intel Pat Gelsinger dự báo AI sẽ tự động hóa toàn bộ văn phòng và doanh nghiệp, tạo ra công ty tỷ đô chỉ với 1 nhân sự. Intel đang đẩy mạnh phát triển phần cứng AI và đào tạo 30 triệu người làm việc với AI đến 2030 để chuẩn bị cho kỷ nguyên của các đại lý và hàm AI.
Citations:
[1] Intel CEO predicts AI will deliver a one-person Unicorn https://www.theregister.com/2024/04/10/intel_ceo_ai_automation/
- Google DeepMind đã huấn luyện thành công những robot nhỏ bé chơi bóng đá đơn giản hóa bằng cách sử dụng deep reinforcement learning (deep RL).
- Trước đây, các thí nghiệm tương tự đã tạo ra những robot 4 chân như Boston Dynamics Spot, nhưng ít nghiên cứu hơn về robot hai chân giống người.
- Video mới cho thấy những robot này có thể rê bóng, phòng thủ và sút bóng ghi bàn linh hoạt, cho thấy deep RL là một "huấn luyện viên" giỏi cho robot hình người.
- DeepMind vốn đánh bại con người trong cờ vua, cờ vây và game Starcraft II, nhưng những chiến thuật đó không đòi hỏi chuyển động và phối hợp vật lý phức tạp.
- Các agent (tác tử) do DeepMind điều khiển đã học cách kết hợp các kỹ năng, tinh chỉnh chúng cho nhiệm vụ bóng đá đầy đủ, dự đoán và đoán trước hành vi của đối thủ.
- Chúng cũng học cách cải thiện khả năng sút và chuyền bóng, chặn cú sút, thậm chí bảo vệ khung thành bằng cách dùng cơ thể như một lá chắn.
- Nhóm nghiên cứu tin rằng sử dụng các phương pháp deep RL tương tự cho bóng đá và nhiều tác vụ khác có thể cải thiện thêm chuyển động và tương tác thời gian thực của robot hai chân.
📌 Google DeepMind đã huấn luyện thành công robot hai chân chơi bóng đá đơn giản hóa bằng deep reinforcement learning. Những robot này thể hiện khả năng rê bóng, phòng thủ, sút bóng ghi bàn linh hoạt. Nghiên cứu cho thấy tiềm năng của deep RL trong việc cải thiện chuyển động và tương tác thời gian thực của robot hình người trong tương lai.
Citations:
[1] Watch two tiny, AI-powered robots play soccer https://www.popsci.com/technology/deepmind-robot-soccer/
- Claude 3 là bộ mô hình AI mạnh mẽ của Anthropic, có thể dễ dàng tích hợp với nền tảng tự động hóa AutoGen của Microsoft.
- Để bắt đầu, hãy đăng ký tài khoản miễn phí trên trang web Claude 3, nhận 5$ tín dụng để khám phá nền tảng.
- Tạo API key trong Claude 3 và nhập vào cài đặt AutoGen để kết nối hai công cụ. Kiểm tra bằng script Python.
- AutoGen cho phép các chatbot (agent) làm việc độc lập nhưng cũng phối hợp với nhau. Nó hỗ trợ nhiều cấu hình LLM, sử dụng công cụ tự động dựa trên code.
- Kết hợp Claude 3 và AutoGen giúp tự động tạo mã nhanh chóng cho nhiều thể loại ứng dụng như game Snake, Tic Tac Toe.
- Quản lý việc sử dụng API, thiết lập máy chủ LLM cục bộ để phát triển hiệu quả hơn, ít phụ thuộc vào đám mây.
- Tận dụng tài liệu hướng dẫn của Anthropic và diễn đàn cộng đồng khi gặp vấn đề. Liên tục theo dõi, điều chỉnh cài đặt cho phù hợp.
📌 Claude 3 và AutoGen mang đến framework mạnh mẽ để tự động hóa các tác vụ coding. Bằng cách thiết lập workbench, tích hợp AutoGen, quản lý API và tối ưu môi trường phát triển cục bộ, các nhà phát triển có thể nâng cao đáng kể hiệu quả, tạo ra các ứng dụng hấp dẫn nhanh chóng.
https://www.geeky-gadgets.com/claude-3-autogen-autonomous-ai/
- AI tạo sinh không phải là hệ thống thông minh tự trị mà chỉ là sự bắt chước hành động của con người, đoán mò một cách tồi tệ trong "ảo giác AI".
- AI phụ thuộc vào năng lực tính toán, cần một lượng năng lượng khổng lồ, dẫn đến chi phí môi trường và giá năng lượng tăng.
- Đầu tư cơ sở hạ tầng tính toán cho AI rất tốn kém, có thể sử dụng vào mục đích hữu ích hơn.
- Vốn đầu tư cho AI tạo sinh tăng vọt, lên tới gần 22 tỷ USD năm 2023. Nếu bong bóng AI vỡ, số tiền này sẽ bị lãng phí.
- AI đang đe dọa nhấn chìm chúng ta bằng thư rác AI, tạo ra hậu quả khó lường từ "AI Habsburg" - AI huấn luyện dựa trên đầu ra của chính nó.
- Xã hội phải gánh chịu các tác động và chi phí từ việc thay đổi thể chế xã hội, chính trị, kinh tế để đối phó với AI tạo sinh.
- AI tạo sinh không được thiết kế để giải quyết các vấn đề xã hội thực sự. Cần chuyên gia khoa học xã hội để hiểu các thách thức tập thể và quyết định liệu AI có thể đóng góp giải pháp khả thi hay không.
📌 AI tạo sinh đang gây ra những chi phí xã hội khổng lồ từ tiêu thụ năng lượng, đầu tư cơ sở hạ tầng, vốn đổi mới đến 22 tỷ USD vào năm 2023, thư rác AI và thay đổi thể chế. Cần các chuyên gia khoa học xã hội quyết định tương lai AI tạo sinh để giải quyết các vấn đề xã hội thực sự, thay vì để doanh nghiệp và thị trường quyết định.
https://www.theglobeandmail.com/business/commentary/article-generative-artificial-intelligence-is-simply-a-waste-of-our-time-and/
- Microsoft đang thử nghiệm chatbot AI có tên "Xbox Support Virtual Agent" để tự động hóa các tác vụ hỗ trợ trên Xbox.
- Chatbot này có thể trả lời các câu hỏi và xử lý hoàn tiền trò chơi từ trang web hỗ trợ của Microsoft.
- Microsoft đã mở rộng quy mô thử nghiệm chatbot Xbox, cho thấy khả năng trong tương lai nó có thể xử lý các yêu cầu hỗ trợ cho tất cả khách hàng Xbox.
- Chatbot Xbox tương tự như những gì Microsoft khuyến khích khách hàng xây dựng để tự động hóa các tác vụ hỗ trợ thông qua Azure AI Bot Service.
- Microsoft cũng đang nỗ lực mang các tính năng và công cụ AI đến nền tảng Xbox và công cụ dành cho nhà phát triển.
- Điều này bao gồm thử nghiệm nghệ thuật và tài sản do AI tạo ra cho trò chơi, kiểm thử trò chơi bằng AI và các NPC sử dụng AI tạo sinh.
- Microsoft đang cân nhắc xây dựng Copilots hỗ trợ AI cho các tác vụ an toàn và kiểm duyệt, bao gồm kiểm duyệt nội dung trên nền tảng Xbox.
- Họ cũng đang tìm cách thêm trợ lý AI vào trò chơi, cung cấp cách để người chơi nhận trợ giúp trong khi chơi.
- Microsoft đang thận trọng trong việc công khai thừa nhận các nỗ lực AI rộng lớn hơn cho Microsoft Gaming.
- CEO Satya Nadella đang thúc đẩy tất cả các bộ phận kinh doanh của công ty suy nghĩ về cách AI có thể được sử dụng trong sản phẩm và dịch vụ.
- Microsoft gợi ý về một thế hệ Xbox tiếp theo siêu mạnh, hứa hẹn "bước nhảy vọt kỹ thuật lớn nhất mà bạn từng thấy trong một thế hệ phần cứng".
📌 Microsoft đang thử nghiệm chatbot AI trên Xbox để tự động hóa hỗ trợ khách hàng, đồng thời nỗ lực mang AI vào nền tảng Xbox và công cụ dành cho nhà phát triển. Mặc dù thận trọng, Microsoft đang hướng tới tương lai của gaming với AI, hứa hẹn những bước tiến đáng kể trong thế hệ Xbox tiếp theo.
https://www.theverge.com/2024/4/2/24118728/microsoft-xbox-ai-chatbot-testing
- Khái niệm về robot hình người đã xuất hiện từ trước cả thuật ngữ "robot", qua vở kịch R.U.R năm 1921 của Karel Čapek.
- Robot hình người đa năng là loại robot có thể nhanh chóng học các kỹ năng và thực hiện hầu hết các công việc như con người. Tuy nhiên, việc xác định khi nào một hệ thống đạt đến ngưỡng này là khó khăn.
- Các robot hình người hiện nay chủ yếu được thiết kế cho môi trường làm việc của con người (brownfield), thay vì xây dựng môi trường mới hoàn toàn tự động (greenfield).
- Việc triển khai robot hình người đang ở giai đoạn thử nghiệm. Nhiều công ty lớn như BMW, Mercedes đang hợp tác với các startup để phát triển và thử nghiệm robot hình người trong kho hàng, nhà máy.
- Trí tuệ nhân tạo tổng quát (AGI) cho robot dự kiến sẽ đạt được trong khoảng 5-10 năm tới. Robot hình người có thể đóng vai trò chuyển tiếp trước khi đạt đến mức tự động hóa hoàn toàn.
- Dù robot hình người có trở thành xu hướng chính hay không, các nghiên cứu và phát triển liên quan sẽ mang lại những đột phá trong học máy, thao tác di động và di chuyển của robot, tác động đến đời sống hàng ngày.
📌 Mặc dù còn nhiều thách thức, robot hình người đang từng bước trở thành hiện thực với sự đầu tư mạnh mẽ từ các tập đoàn lớn và startup. Các thử nghiệm gần đây cho thấy tiềm năng ứng dụng trong kho hàng, nhà máy. Dự kiến trong 5-10 năm tới, robot hình người sẽ đạt được trí tuệ nhân tạo tổng quát và trở thành bước chuyển tiếp quan trọng trước khi đạt tự động hóa hoàn toàn.
Citations:
[1]https://techcrunch.com/2024/03/27/understanding-humanoid-robots/
- Nghiên cứu mới từ MIT cho thấy mô hình ngôn ngữ lớn (LLM) có thể giúp robot gia đình tự khắc phục lỗi mà không cần sự trợ giúp của con người.
- Các lý do khiến robot gia đình ít thành công sau Roomba bao gồm: giá cả, tính thực tế, hình dạng và khả năng lập bản đồ.
- Khi robot gặp sự cố, thông thường chúng sẽ cạn kiệt các tùy chọn được lập trình sẵn trước khi cần sự can thiệp của con người.
- Nghiên cứu mới giải quyết vấn đề này bằng cách chia các bài demo thành các tập con nhỏ hơn, thay vì coi chúng là một phần của hành động liên tục.
- LLM loại bỏ yêu cầu lập trình viên phải gán nhãn và chỉ định thủ công các hành động phụ.
- Trong thử nghiệm, robot được huấn luyện để múc bi và đổ vào bát trống. Các nhà nghiên cứu cố tình gây ra lỗi nhỏ, như làm robot lệch hướng và làm rơi bi ra khỏi thìa.
- Hệ thống phản ứng bằng cách tự điều chỉnh các nhiệm vụ nhỏ, thay vì bắt đầu lại từ đầu.
- Phương pháp này giúp tránh việc robot hoàn toàn mất phương hướng khi gặp lỗi.
📌 Nghiên cứu từ MIT đã chứng minh tiềm năng của việc sử dụng mô hình ngôn ngữ lớn (LLM) để giúp robot gia đình tự khắc phục lỗi bằng cách chia nhỏ nhiệm vụ và tự điều chỉnh, thay vì cần sự can thiệp của con người, mở ra triển vọng cho sự phát triển của robot gia đình trong tương lai.
https://techcrunch.com/2024/03/25/large-language-models-can-help-home-robots-recover-from-errors-without-human-help/
- AI Agents là công cụ AI có khả năng tự động thực hiện các tác vụ phức tạp từ lời nhắc đến sản phẩm mà không cần can thiệp thêm của con người.
- Lĩnh vực này đang phát triển với tốc độ đáng kinh ngạc. Các nhà lãnh đạo cấp cao cần bắt kịp tiến độ.
- Trường hợp sử dụng đầu tiên cho AI Agents là tăng cường nhân viên thay vì thay thế họ.
- Con người vẫn có lợi thế về tính linh hoạt thích ứng và tư duy gắn kết so với AI. AI Agents sẽ được hưởng lợi từ sự hợp tác chặt chẽ với con người trong một thời gian dài.
- Cách hiệu quả nhất để hầu hết các CEO bắt đầu là bắt đầu kết hợp AI và con người thay vì chỉ dùng AI.
- Ba cách để bắt đầu ngay hôm nay: Auto-GPT, AgentGPT và ChartGPT.
- Auto-GPT có thể tự động hóa các phản hồi cho các câu hỏi thường gặp, giải phóng nhân viên để xử lý các yêu cầu phức tạp hơn.
- AgentGPT cung cấp điểm khởi đầu dễ tiếp cận hơn để tự động hóa các quy trình lặp đi lặp lại hoặc chuyên sâu về dữ liệu thông qua GPT-4.
- ChartGPT chuyên về trực quan hóa dữ liệu bằng cách chuyển đổi dữ liệu thô thành các biểu đồ và đồ thị hấp dẫn, tương tác.
📌 AI Agents hứa hẹn thay đổi cách doanh nghiệp tương tác với AI. Tuy nhiên, việc giao toàn bộ hoạt động kinh doanh cho các AI Agents tự trị vẫn chưa đến. Thay vào đó, các CEO nên ưu tiên trao quyền cho nhân viên bằng các AI Agents hàng đầu giúp họ giải quyết vấn đề của khách hàng nhanh hơn. Nếu không làm điều đó, ai đó khác sẽ làm.
https://www.forbes.com/sites/alexanderpuutio/2024/03/22/what-ceos-need-to-know-about-the-next-frontier-of-ai-ai-agents/
- Sara, robot nhân hình đầu tiên của Ả Rập Saudi, được thiết kế để tránh thảo luận về tình dục hoặc chính trị vì cô ấy là người Ả Rập.
- Elie Metri, CEO của QSS AI & Robots ở Riyadh, cho biết Sara biết mình là một cô gái 25 tuổi, cao 1m62 và mặc trang phục truyền thống Ả Rập.
- Sara nói được cả tiếng Ả Rập và tiếng Anh, sử dụng mô hình học ngôn ngữ riêng của công ty, không dựa vào thư viện nào khác, kể cả ChatGPT.
- Hệ thống pháp luật Ả Rập Saudi dựa trên luật Sharia, mặc dù gần đây đã có những nỗ lực hiện đại hóa xã hội như nới lỏng quy định về trang phục và phụ nữ lái xe. Tuy nhiên, phụ nữ vẫn có thể bị trừng phạt vì hoạt động chính trị.
- Sara thu hút sự chú ý rộng rãi sau khi xuất hiện tại các triển lãm công nghệ, làm nổi bật sự tiến bộ của Ả Rập Saudi trong lĩnh vực robot và AI.
- Đầu tháng này, một sự cố liên quan đến robot nhân hình Muhammad của công ty đã gây xôn xao khi nó dường như đưa tay chạm vào mông của một nữ phóng viên trong video.
- Trên mạng xã hội, nhiều người cáo buộc robot đã chạm vào phóng viên một cách không phù hợp. Tuy nhiên, Metri cho rằng trực tiếp tại hiện trường, robot chỉ hơi di chuyển tay và ngón tay khi nói chuyện, và vì phóng viên đứng quá gần nên nó chạm nhẹ vào áo khoác của cô ấy.
- Metri không quá bận tâm về sự cố này và cho rằng tấn công tình dục hoàn toàn khác với việc tay robot chạm vào áo khoác của phụ nữ. Ông cũng nói rằng không ai ở Trung Đông, kể cả Ả Rập Saudi, coi đây là điều xấu vì họ biết đó là robot.
📌 Sara, robot nhân hình đầu tiên của Ả Rập Saudi do QSS AI & Robots chế tạo, được lập trình để tránh các chủ đề nhạy cảm như tình dục và chính trị. Mặc dù gây chú ý với sự xuất hiện của mình, một sự cố liên quan đến robot Muhammad của công ty đã gây tranh cãi khi nó dường như chạm vào phóng viên nữ một cách không phù hợp, nhưng CEO Metri cho rằng đó chỉ là hiểu lầm.
https://www.businessinsider.com/saudi-humanoid-robot-wont-talk-about-sex-politics-creator-says-2024-3
- MetaGPT là một khung đa tác tử gán vai trò cho các tác tử khác nhau, tạo thành các thực thể hợp tác có thể làm việc cùng nhau để thực hiện các chỉ dẫn phức tạp.
- MetaGPT có thể được sử dụng độc lập từ dòng lệnh và như một thư viện trong các tập lệnh Python, cho phép linh hoạt và kiểm soát.
- Dự án bắt đầu từ tháng 4/2023, tận dụng ChatGPT và hiện có gần 40K sao trên GitHub.
- Data Interpreter là một tác tử thành viên mới của MetaGPT, chuyên đánh giá và giải quyết các tác vụ liên quan đến dữ liệu.
- Data Interpreter nhấn mạnh 3 kỹ thuật then chốt: lập kế hoạch động với cấu trúc đồ thị phân cấp, tích hợp công cụ động để nâng cao kỹ năng mã hóa và xác định sự không nhất quán logic trong phản hồi.
- So với các đường cơ sở mã nguồn mở, Data Interpreter thể hiện hiệu suất vượt trội, cải thiện đáng kể trong các tác vụ học máy (từ 0.86 lên 0.95), tăng 26% trên tập dữ liệu MATH và 112% trong các tác vụ mở.
- Deep Wisdom đã công bố nhiều ví dụ cho thấy cách sử dụng Data Interpreter cùng với khung MetaGPT hiện có, chẳng hạn như phân tích xu hướng cổ phiếu NVIDIA.
- Bài báo đầy đủ cung cấp tất cả thông tin cần thiết. Có thể tìm hiểu thêm về cài đặt và sử dụng trên kho GitHub của dự án.
📌 Data Interpreter của MetaGPT là một cải tiến đáng chú ý, thể hiện hiệu suất vượt trội so với các đường cơ sở mã nguồn mở. Nó cải thiện 26% trên tập dữ liệu MATH, 112% trong các tác vụ mở và tăng độ chính xác học máy từ 0,86 lên 0,95. Với việc bổ sung tác tử Data Interpreter, MetaGPT trở thành một dự án đáng để khám phá.
https://www.kdnuggets.com/metagpt-data-interpreter-open-source-llm-based-data-solutions
- Nvidia ra mắt Project GR00T - nền tảng AI dành cho robot hình người, quy tụ hầu hết các công ty robot hình người nổi bật hiện nay như 1X Technologies, Agility Robotics, Boston Dynamics, Sanctuary AI...
- GR00T sẽ hỗ trợ phần cứng mới Jetson Thor, máy tính được thiết kế đặc biệt để chạy mô phỏng, mô hình AI tạo sinh và nhiều tác vụ khác cho robot hình người.
- Jetson Thor tích hợp GPU thế hệ mới dựa trên kiến trúc Blackwell với công suất 800 teraflops, bộ xử lý an toàn chức năng tích hợp, cụm CPU hiệu suất cao và băng thông ethernet 100GB.
- Nvidia cũng giới thiệu Isaac Manipulator - bộ công cụ AI mô đun cho cánh tay robot với tốc độ lập kế hoạch đường đi nhanh hơn 80 lần. Các đối tác như Franka Robotics, Universal Robots, Yaskawa đã tham gia.
- Isaac Perceptor nhắm đến khả năng thị giác xung quanh 3D đa camera cho robot di động tự hành (AMR). ArcBest, BYD và KION Group đã đăng ký.
- Những năm tới sẽ chứng kiến cuộc đua thị phần thú vị giữa robot hình người và robot di động thao tác, Nvidia muốn tham gia vào tất cả các mảng này.
📌 Nvidia đang đẩy mạnh sự hiện diện trong lĩnh vực robot học với việc ra mắt nền tảng AI GR00T và phần cứng Jetson Thor cho robot hình người, cùng các công cụ Isaac Manipulator và Perceptor cho robot công nghiệp và AMR. Sự tham gia của Nvidia sẽ thúc đẩy đáng kể sự phát triển và cạnh tranh giữa các loại robot trong những năm tới.
https://techcrunch.com/2024/03/18/nvidia-enlists-humanoid-robotics-biggest-names-for-new-ai-platform-gr00t/
- Sự phát triển nhanh chóng của trí tuệ nhân tạo (AI) đã tạo ra một loại công nghệ mới: các tác nhân AI, có khả năng đưa ra quyết định và hành động hướng tới các mục tiêu cụ thể.
- Tác nhân AI khác với chatbot truyền thống ở chỗ chúng sở hữu tính tác nhân - khả năng hành động và tạo ra thay đổi trong môi trường của mình.
- Khi các mô hình ngôn ngữ lớn (LLM) như GPT-5 tiếp tục phát triển, các tác nhân AI ngày càng trở nên thông minh và có khả năng xử lý nhiều loại tác vụ.
- Để tận dụng tối đa cuộc cách mạng tác nhân AI, điều quan trọng là phải bắt đầu chuẩn bị ngay từ bây giờ bằng cách học các nguyên tắc cơ bản về phát triển tác nhân AI.
- Khi sử dụng tác nhân AI, điều quan trọng là phải chọn các tác vụ rõ ràng, đơn giản và có mục tiêu xác định rõ ràng. Tác nhân AI xuất sắc trong việc tự động hóa các tác vụ lặp đi lặp lại, tẻ nhạt mà bạn thực hiện hàng ngày.
- Để xây dựng tác nhân AI đầu tiên của mình, hãy chọn một framework phù hợp, thiết lập môi trường phát triển, xác định vai trò, mục tiêu của tác nhân, cung cấp các công cụ cần thiết và giao nhiệm vụ.
- Một trong những khía cạnh mạnh mẽ nhất của các tác nhân AI là khả năng cộng tác với nhau và với con người để giải quyết các dự án phức tạp.
- Khi các tác nhân AI trở nên tiên tiến và phổ biến hơn, điều quan trọng là phải nắm bắt tiềm năng của chúng và học cách làm việc hiệu quả cùng chúng.
📌 Các tác nhân AI đang mở ra một thế giới đầy khả năng, cho phép xây dựng hầu như bất cứ thứ gì bạn có thể tưởng tượng. Bằng cách hiểu các khả năng của tác nhân AI, chọn đúng tác vụ và học cách xây dựng, hợp tác với chúng, bạn có thể đứng ở vị trí tiên phong trong cuộc cách mạng về cách tiếp cận giải quyết vấn đề và tự động hóa tác vụ.
https://www.geeky-gadgets.com/building-ai-agents-2024/
- AutoGen, một framework đa tác tử được phát triển bởi Microsoft Research AI Frontiers, đã đạt được những bước tiến đáng kể trong cộng đồng AI kể từ khi ra mắt vào tháng 10/2022.
- AutoGen có khả năng biến đổi nhiều ngành công nghiệp bằng cách cho phép phát triển các giải pháp AI mạnh mẽ. Ví dụ, trong lĩnh vực dược phẩm, AutoGen giúp phá vỡ rào cản phân tích dữ liệu lâm sàng.
- Tính linh hoạt của AutoGen đã thu hút sự chú ý của nhiều lĩnh vực, với hàng trăm ứng dụng minh họa cho các trường hợp sử dụng đa dạng của nó.
- Trong bài kiểm tra GAIA Benchmark gần đây, AutoGen đạt độ chính xác cao nhất ở cả 3 mức độ khó, vượt qua nhiều mô hình nổi tiếng khác.
- Nhóm phát triển AutoGen đang nỗ lực giới thiệu các tính năng và cải tiến mới với tốc độ nhanh chóng, bao gồm: công cụ đánh giá, giao diện được cải thiện, AutoGen Studio, hỗ trợ máy trạng thái hữu hạn (FSM), khả năng học hỏi, tích hợp với các công nghệ mới và hỗ trợ mô hình tùy chỉnh.
- Sự thành công của AutoGen có thể được quy cho cộng đồng các nhà phát triển, nhà nghiên cứu và chuyên gia AI đam mê và tích cực. Framework này đã nhận được nhiều giải thưởng và sự công nhận.
- AutoGen đang dẫn đầu sự phát triển của AI bằng cách hạ thấp rào cản gia nhập và cung cấp các công cụ mạnh mẽ để xây dựng ứng dụng tác tử. Cam kết của framework về khả năng mở rộng, an toàn và sự tham gia của con người trong các hệ thống AI đảm bảo rằng tác động của nó sẽ được cảm nhận trên nhiều lĩnh vực và miền khác nhau.
📌 AutoGen đang cách mạng hóa cách tiếp cận phát triển AI với sự phát triển nhanh chóng, sự hỗ trợ ngày càng tăng của cộng đồng và sự cống hiến để đẩy ranh giới của AI. Khi ngày càng nhiều nhà phát triển, nhà nghiên cứu và tổ chức nắm bắt sức mạnh của AutoGen, chúng ta có thể mong đợi sự gia tăng các ứng dụng AI đột phá, biến đổi các ngành công nghiệp, giải quyết các vấn đề phức tạp và thúc đẩy đổi mới tiến lên phía trước.
https://www.geeky-gadgets.com/autogen-features/
- Brett Adcock, CEO và nhà sáng lập Figure robotics, tuyên bố năm 2024 sẽ là năm của AI thể xác.
- Robot nhân hình Figure 01 có thể thực hiện các nhiệm vụ và trò chuyện như một con người nhờ sự hợp tác giữa OpenAI và Figure.
- Các mô hình OpenAI cung cấp trí tuệ thị giác và ngôn ngữ cấp cao, trong khi các mạng nơ-ron Figure cung cấp các hành động robot khéo léo, nhanh chóng ở cấp độ thấp.
- Sự phát triển của AI đi đôi với sự phát triển của robot nhân hình đáng tin cậy.
- Figure 01 không chỉ có thể hoàn thành các nhiệm vụ nhỏ mà còn có thể trò chuyện với bạn nhờ tích hợp ChatGPT.
- Adcock mong muốn đưa Figure trở thành một robot "thể xác" hoàn chỉnh, có thể thực hiện các nhiệm vụ cấp thấp và trò chuyện với con người.
- Sam Altman, giám đốc OpenAI, lạc quan về tương lai của ngành robot với sự xuất hiện của các nền tảng phần cứng mới thú vị.
- Tầm nhìn của Adcock về robot khác với khả năng của Optimus của Tesla hay Atlas của Boston Dynamics.
- Robot nhân hình H1 do Unitree Robotics của Trung Quốc phát triển gần đây đạt tốc độ đi bộ 11,9 km/h và tuyên bố đạt tốc độ 17,7 km/h.
📌 Figure 01, robot nhân hình được tạo ra từ sự hợp tác giữa OpenAI và Figure, đánh dấu bước tiến quan trọng trong lĩnh vực AI thể xác. Với khả năng thực hiện nhiệm vụ và trò chuyện như người thật, Figure 01 hứa hẹn mang đến một tương lai đầy hứng khởi cho ngành robot, vượt trội hơn các đối thủ như Optimus của Tesla hay Atlas của Boston Dynamics.
https://analyticsindiamag.com/2024-is-the-year-of-embodied-ai/
Dưới đây là tóm tắt nội dung URL bạn cung cấp:
- Robo-adviser đang dân chủ hóa việc đầu tư, giúp mọi người tiếp cận với các công cụ và chiến lược đầu tư chuyên nghiệp.
- Khảo sát cho thấy 31% gen Z và 20% millennials đang sử dụng robo-adviser. 63% người tiêu dùng Mỹ sẵn sàng sử dụng robo-adviser để quản lý đầu tư.
- Dự báo tài sản do robo-adviser quản lý sẽ đạt 1.8 nghìn tỷ USD toàn cầu vào năm 2024.
- AI có thể điều chỉnh lời khuyên đầu tư theo sở thích cá nhân, như ưu tiên đầu tư có trách nhiệm với môi trường, xã hội và quản trị (ESG).
- Robo-adviser cung cấp các tính năng như giảm yêu cầu tối thiểu tài khoản đầu tư, phí thấp hơn, thu hoạch lỗ thuế và cân bằng lại danh mục định kỳ.
- Quỹ đầu tư sử dụng thuật toán AI để phân tích dữ liệu thị trường, xác định tài sản lý tưởng, điều chỉnh danh mục theo thời gian thực và quản lý rủi ro.
- Mối lo ngại chính là việc tiếp cận dễ dàng với công cụ đầu tư tiên tiến có thể khiến một số người đánh giá quá cao khả năng và chấp nhận quá nhiều rủi ro tài chính.
- Sự phát triển của robo-adviser đã vượt qua việc thực thi luật và quy định, có thể khiến nhà đầu tư gặp rủi ro và thiếu bảo vệ pháp lý.
📌 Robo-adviser đang thay đổi cách thức đầu tư, giúp dân chủ hóa lĩnh vực này. Tuy nhiên, việc sử dụng AI trong đầu tư cũng tiềm ẩn những rủi ro như đánh giá sai năng lực và thiếu bảo vệ pháp lý. Tương lai nằm ở mô hình lai, kết hợp sự chính xác và hiệu quả của AI với kinh nghiệm và giám sát của con người.
https://phys.org/news/2024-03-robo-pros-cons-ai-investing.html
• Covariant, một spinoff từ OpenAI, đã giải quyết vấn đề thiếu dữ liệu trong lĩnh vực robot bằng cách phát triển mô hình AI RFM-1, kết hợp kỹ năng suy luận của mô hình ngôn ngữ lớn và khéo léo vật lý của robot tiên tiến.
• Mô hình RFM-1 được huấn luyện trên dữ liệu thu thập từ một đội hình nhỏ các robot chọn hàng của Covariant, được sử dụng bởi các khách hàng như Crate & Barrel và Bonprix tại các kho hàng trên toàn thế giới, cùng với dữ liệu từ internet.
• Covariant dự định phát hành mô hình này cho khách hàng trong những tháng tới, với hy vọng hệ thống sẽ trở nên mạnh mẽ và hiệu quả hơn khi được triển khai trong thế giới thực.
• Trong một buổi trình diễn, Covariant đã cho thấy khả năng của mô hình khi xử lý 5 loại đầu vào khác nhau: văn bản, hình ảnh, video, hướng dẫn robot và đo lường.
• Mô hình có thể tạo ra hình ảnh hoặc video mô tả quá trình thực hiện nhiệm vụ, và thậm chí đưa ra phản hồi nếu dự đoán không thể nắm bắt vật phẩm một cách chính xác.
• Covariant nhấn mạnh sự tiến bộ trong việc giáo dục robot thích ứng với môi trường thông qua dữ liệu huấn luyện thay vì mã hóa cụ thể cho từng nhiệm vụ.
• Các nhà nghiên cứu tại Covariant hy vọng mô hình RFM-1 sẽ tiếp tục học hỏi và tinh chỉnh, với mục tiêu cuối cùng là robot sẽ tự huấn luyện trên video do chính mô hình tạo ra.
📌 Covariant, một spinoff từ OpenAI, đã phát triển mô hình AI RFM-1, đánh dấu bước tiến quan trọng trong việc giúp robot học các nhiệm vụ giống như con người. Mô hình này kết hợp kỹ năng suy luận và khéo léo vật lý, được huấn luyện trên dữ liệu phong phú từ robot chọn hàng và internet. Covariant hướng tới việc triển khai mô hình này trong thực tế, mở ra triển vọng mới cho ngành công nghiệp robot.
https://www.technologyreview.com/2024/03/11/1089653/an-openai-spinoff-has-built-an-ai-model-that-helps-robots-learn-tasks-like-humans/
#MIT
- OpenAI và 1X Robotics đã hợp tác để tạo ra robot EVE, một robot hoàn toàn tự động có thể hoạt động mà không cần sự hướng dẫn của con người.
- Robot EVE độc đáo vì có khả năng tự sạc, cho phép nó hoạt động trong thời gian dài mà không bị gián đoạn.
- Khả năng phản ứng với môi trường theo thời gian thực của EVE là một đặc điểm nổi bật so với các mô hình trước đó.
- Một loại kỹ sư phần mềm mới, được gọi là "Kỹ sư Phần mềm 2.0", đang xuất hiện để làm việc với những robot tiên tiến này. Những kỹ sư này đào tạo mạng nơ-ron của robot bằng dữ liệu, thay vì viết mã truyền thống.
- Sự hợp tác giữa 1X Robotics và OpenAI để tạo ra robot EVE là một bước tiến đáng chú ý hướng tới trí tuệ nhân tạo tiên tiến hơn.
📌 Robot tự động EVE, sản phẩm của sự hợp tác giữa OpenAI và 1X Robotics, đánh dấu một bước tiến mới trong ngành công nghiệp robot. Với khả năng hoạt động độc lập, tự sạc và phản ứng với môi trường theo thời gian thực, EVE không chỉ mở ra triển vọng mới cho ngành công nghiệp robot mà còn tạo ra cơ hội việc làm mới trong lĩnh vực robot học. Đặc biệt, sự xuất hiện của "Kỹ sư Phần mềm 2.0", những người đào tạo mạng nơ-ron của robot bằng dữ liệu, cho thấy một hướng đi mới trong phát triển phần mềm.
Citations:
[1] https://www.geeky-gadgets.com/autonomous-robots/
📌 Với vòng tài trợ series B trị giá 100 triệu USD từ các nhà đầu tư lớn như Samsung và sự hỗ trợ từ OpenAI, 1X Technologies đặt mục tiêu đưa robot android NEO ra thị trường, hướng đến việc robot humanoid sẽ làm việc cùng con người. Tổng vốn huy động gần đạt 137 triệu USD, 1X mong muốn mở rộng hỗ trợ khách hàng doanh nghiệp và phát triển chiến lược AI trong hoạt động vật lý.
📌 Robot Aloha của Google DeepMind, có giá 7.000 USD , không chỉ thể hiện khả năng nấu nướng mà còn có thể học hỏi các công thức mới và thực hiện những công việc dọn dẹp nhà cửa. Với việc di chuyển nhanh như người và khả năng nâng đỡ vật nặng, Aloha mở ra một chương mới cho ngành robot hỗ trợ gia đình, đánh dấu bước tiến trong AI và robot học.