• Meta vừa bổ sung tính năng AI mới cho kính Ray-Ban Meta, cho phép người dùng sử dụng camera trên kính để nhận thông tin về môi trường xung quanh và ghi nhớ vị trí đỗ xe.
• Kính Ray-Ban Meta giờ đây hỗ trợ quay video cho mục đích AI, cung cấp "trợ giúp liên tục theo thời gian thực".
• Khi được hỏi liệu Meta có sử dụng hình ảnh thu thập từ kính để huấn luyện mô hình AI hay không, công ty từ chối trả lời rõ ràng.
• Anuj Kumar, giám đốc cấp cao phụ trách AI wearables của Meta, nói rằng họ không công khai thảo luận về vấn đề này.
• Một phát ngôn viên khác của Meta cho biết đây không phải là thông tin họ thường chia sẻ ra bên ngoài.
• Việc Meta không đưa ra câu trả lời rõ ràng "không" gợi ý rằng công ty có thể đang có kế hoạch sử dụng hình ảnh từ kính để huấn luyện AI.
• Meta đã huấn luyện AI của mình trên các hình ảnh và story được đăng công khai trên Instagram và Facebook, coi đó là dữ liệu công khai.
• Tuy nhiên, dữ liệu thu thập từ kính Ray-Ban Meta dành riêng để tương tác với AI không giống như hình ảnh đăng công khai trên Instagram.
• Các tính năng AI mới trên kính sẽ chụp nhiều hình ảnh thụ động để cung cấp cho AI trả lời câu hỏi về môi trường xung quanh người đeo.
• Ví dụ, khi hỏi kính giúp chọn trang phục, hàng chục hình ảnh bên trong nhà người đeo sẽ được chụp và tải lên đám mây.
• Trước đây, kính Ray-Ban Meta chủ yếu được sử dụng để chụp ảnh và quay video một cách chủ động, người dùng biết rõ khi nào họ đang chụp.
• Với AI, người dùng không giữ lại những hình ảnh này vì chúng được thu thập chỉ để tương tác với trợ lý AI.
• Meta không xác nhận rõ ràng điều gì xảy ra với hình ảnh từ kính được tải lên máy chủ đám mây để sử dụng AI.
• Người dùng kính Ray-Ban Meta nên nhận thức rằng sử dụng các tính năng AI mới có thể dẫn đến việc Meta thu thập hàng trăm ảnh riêng tư mà họ không có ý định hoặc không biết là đang chia sẻ.
• Nếu Meta thực sự không sử dụng kính Ray-Ban Meta theo cách này, công ty nên tuyên bố rõ ràng để khách hàng biết chính xác những gì đang được chia sẻ với Meta và được sử dụng cho mục đích gì.
📌 Meta từ chối xác nhận việc sử dụng hình ảnh từ kính Ray-Ban Meta để huấn luyện AI, gây lo ngại về quyền riêng tư. Tính năng AI mới có thể thu thập hàng trăm ảnh cá nhân mà người dùng không biết. Meta cần minh bạch hơn về cách xử lý dữ liệu này.
https://www.macrumors.com/2024/10/01/meta-ray-bans-ai-training/
• Raspberry Pi vừa ra mắt một module camera mới có tên Raspberry Pi AI Camera, giá 70 USD.
• Module này sử dụng cảm biến hình ảnh Sony IMX500 kết hợp với chip xử lý RP2040 do Raspberry Pi tự phát triển.
• Camera có khả năng xử lý AI tích hợp, cho phép thực hiện các tác vụ thị giác máy tính mà không ảnh hưởng đến hiệu năng của máy tính Raspberry Pi chính.
• Kích thước của module là 25mm x 24mm, tương đương với Camera Module 3 hiện tại nhưng dày hơn một chút.
• Module được tích hợp sẵn mô hình MobileNet-SSD để nhận diện đối tượng theo thời gian thực.
• Sản phẩm này tương thích với tất cả các máy tính Raspberry Pi hiện có trên thị trường.
• Raspberry Pi cam kết sẽ tiếp tục sản xuất AI Camera ít nhất đến tháng 1/2028, đảm bảo nguồn cung ổn định cho khách hàng.
• Đối tượng sử dụng chính của sản phẩm này là các công ty trong lĩnh vực công nghiệp và nhúng, chiếm tới 72% doanh số của Raspberry Pi.
• Một số ứng dụng tiềm năng bao gồm: cảm biến thành phố thông minh để phát hiện chỗ đỗ xe trống, theo dõi luồng giao thông, kiểm tra chất lượng tự động trong môi trường công nghiệp.
• Lý do các công ty ưa chuộng sản phẩm của Raspberry Pi là vì khả năng sản xuất quy mô lớn và nguồn cung ổn định, giúp tránh gián đoạn trong quy trình sản xuất.
• Raspberry Pi vẫn sẽ tiếp tục bán Camera Module 3 với giá khoảng 25 USD cho những ứng dụng đơn giản hơn.
📌 Raspberry Pi ra mắt module camera AI giá 70 USD, tích hợp chip xử lý RP2040 và cảm biến Sony IMX500. Sản phẩm hứa hẹn mở ra nhiều ứng dụng thị giác máy tính mới trong lĩnh vực công nghiệp và IoT, với cam kết sản xuất đến 2028.
https://techcrunch.com/2024/09/30/raspberry-pi-launches-camera-module-for-vision-based-ai-applications/
• Meta vừa giới thiệu nguyên mẫu kính thông minh Orion, được coi là bước tiến quan trọng trong công nghệ thực tế tăng cường (AR). Orion kết hợp nhiều công nghệ tiên tiến như AR, theo dõi mắt và tay, AI tạo sinh và vòng đeo tay phát hiện cử chỉ.
• Kính Orion sử dụng máy chiếu micro LED và thấu kính carbide silicon để giải quyết thách thức lâu năm về hiển thị AR. Người dùng có thể nhìn xuyên qua kính và thấy các cửa sổ ứng dụng được chiếu lên thấu kính, tạo cảm giác như đang nhúng vào thế giới xung quanh.
• Tuy nhiên, Orion vẫn còn khá cồng kềnh so với kính đọc thông thường, có giá khoảng 10.000 USD và chưa sẵn sàng để bán ra thị trường. Mark Zuckerberg cho biết công ty đã phát triển Orion trong 10 năm qua nhưng vẫn chưa có lộ trình cụ thể để tung ra sản phẩm thương mại.
• Meta không phải công ty duy nhất theo đuổi mục tiêu này. Snap, Google, Apple và cả startup LoveFrom của Jony Ive đều đang phát triển các thiết bị đeo tương tự.
• So với kính thực tế ảo Quest, Orion hướng tới trải nghiệm thoải mái và tự nhiên hơn khi đeo. Đây là bước tiến so với Ray-Ban Meta - kính thông minh hiện tại của Meta với camera, micro, loa và AI tích hợp, giá 299 USD.
• Ray-Ban Meta đang được cải tiến với khả năng xử lý video AI thời gian thực, tích hợp nhiều ứng dụng hơn. Những cải tiến này sẽ được áp dụng cho Orion trong tương lai.
• Thách thức lớn với Orion là cần cải thiện chất lượng đồng thời giảm chi phí. Việc thiếu bàn phím cũng là rào cản, nhưng Meta tin rằng điều khiển bằng giọng nói, cử chỉ tay và mắt sẽ tạo trải nghiệm tự nhiên hơn.
• Meta đang tập trung hoàn thiện các tính năng cơ bản trên Ray-Ban Meta trước khi hướng tới tầm nhìn đầy tham vọng với Orion. Mục tiêu cuối cùng là tạo ra nền tảng máy tính mới có thể thay thế smartphone trong tương lai.
📌 Meta đã đầu tư 10 năm phát triển kính thông minh Orion, tích hợp AR, AI và theo dõi cử chỉ, nhắm tới thay thế smartphone. Dù còn nhiều thách thức về giá (10.000 USD) và kích thước, Orion cho thấy tiềm năng lớn của công nghệ đeo trong tương lai.
https://techcrunch.com/2024/09/28/meta-offers-a-glimpse-through-its-supposed-iphone-killer-orion/
• LoveFrom, studio thiết kế của Jony Ive và Marc Newson, đang hợp tác với OpenAI của Sam Altman để phát triển một thiết bị AI bí mật chưa được đặt tên.
• Mục tiêu là tạo ra "trải nghiệm máy tính ít gây xáo trộn xã hội hơn iPhone". Hình dạng và thời điểm ra mắt của thiết bị vẫn chưa được xác định.
• Dự án nhận được đầu tư từ Emerson Collective của Laurene Powell Jobs và chính Jony Ive.
• Thiết bị có thể là một sản phẩm tiêu dùng để truy cập ChatGPT và Dall-E, cạnh tranh với các tính năng AI mới của Apple trên iPhone 16.
• Một số chuyên gia cho rằng việc tích hợp AI vào smartphone chỉ là sự tiếp nối của mô hình kinh doanh bóc lột người dùng.
• Vẫn chưa rõ thiết bị sẽ là một sản phẩm đơn lẻ hay hệ thống các thành phần kết nối. Cũng chưa biết nó sẽ có màn hình hay không.
• Jony Ive từng bày tỏ quan ngại về tác động tiêu cực của smartphone và mạng xã hội, hạn chế thời gian sử dụng màn hình của con cái.
• LoveFrom đã tuyển dụng khoảng 10 nhân viên cho dự án này, bao gồm nhiều cựu nhân viên Apple.
• Dự án dự kiến huy động tới 1 tỷ USD vốn đầu tư vào cuối năm nay.
• Một số chuyên gia kỳ vọng Ive và nhóm của ông có thể tạo ra một "linh hồn máy tính mới", khuếch đại nhân tính thay vì làm suy giảm nó.
• LoveFrom đang xây dựng hình ảnh về sự chăm chút, thủ công và quản lý tốt - những phẩm chất có thể hữu ích trong việc định hướng hoạt động của OpenAI.
📌 Jony Ive và OpenAI đang phát triển thiết bị AI mới nhằm tạo trải nghiệm máy tính ít gây xáo trộn xã hội hơn iPhone. Dự án huy động 1 tỷ USD, tuyển dụng cựu nhân viên Apple, hướng tới một "linh hồn máy tính mới" khuếch đại nhân tính. Tiềm năng thay đổi tương tác người-máy nhưng vẫn còn nhiều bí ẩn.
https://www.wired.com/story/jony-ive-iphone-of-ai/
• Google và Volkswagen đã hợp tác để tích hợp AI tạo sinh vào ứng dụng di động myVW của Volkswagen.
• Trợ lý ảo myVW mới được hỗ trợ bởi nền tảng AI và máy học của Google Cloud, cùng với chuyên môn từ Google Cloud Consulting.
• Trợ lý ảo sẽ giúp người dùng dễ dàng truy cập thông tin và dịch vụ xe quan trọng. Người dùng có thể đặt câu hỏi như "Làm thế nào để thay lốp xe bị xẹp?" hoặc "Đèn báo trên bảng điều khiển số này có nghĩa là gì?"
• Người dùng cũng có thể chỉ camera điện thoại vào bảng điều khiển để nhận thông tin hữu ích về các đèn báo.
• Trợ lý AI sử dụng dữ liệu xe kết nối của Volkswagen kết hợp với các mô hình Gemini trên nền tảng Vertex AI của Google Cloud.
• Nó cũng sử dụng dữ liệu từ sách hướng dẫn, hướng dẫn từng bước và kênh YouTube của Volkswagen để tinh chỉnh các mô hình Gemini.
• Trợ lý ảo mới sẽ có sẵn cho chủ xe Volkswagen Atlas và Atlas Cross Sport đời 2024.
• Từ năm 2025, hầu hết chủ xe Volkswagen đời 2020 trở lên sẽ có quyền truy cập vào Trợ lý ảo Volkswagen mới thông qua ứng dụng myVW.
• Ứng dụng myVW có thể tải xuống trên cả Apple Store và Google Play Store.
• Abdallah Shanti, CIO của Volkswagen Group of America, cho biết AI đang trở thành công cụ tiện ích giúp chủ xe Volkswagen hiểu rõ hơn về xe của họ và nhận được câu trả lời nhanh hơn, dễ dàng hơn.
• Thomas Kurian, CEO của Google Cloud, nói rằng Volkswagen đang thiết lập một tiêu chuẩn mới cho trải nghiệm người lái bằng cách mang sức mạnh của AI tạo sinh tiên tiến trực tiếp đến khách hàng.
• Đây không phải lần đầu tiên Google tiếp cận ngành công nghiệp ô tô. Vào tháng 7, Alphabet (công ty mẹ của Google) đã chi thêm 5 tỷ USD cho công ty xe tự lái Waymo của mình.
• Sự hợp tác này cho thấy nỗ lực của Google trong việc cung cấp giải pháp xây dựng ứng dụng AI doanh nghiệp, nhằm giành lợi thế cạnh tranh trên thị trường.
📌 Google và Volkswagen hợp tác tích hợp AI vào ứng dụng myVW, giúp chủ xe dễ dàng truy cập thông tin và dịch vụ xe. Từ 2025, hầu hết xe VW đời 2020 trở lên sẽ hỗ trợ trợ lý ảo mới này, đánh dấu bước tiến quan trọng trong việc ứng dụng AI vào ngành ô tô.
https://readwrite.com/google-volkswagen-partner-ai-myvw-smartphone-app/
• Jony Ive, cựu giám đốc thiết kế của Apple, đã xác nhận đang hợp tác với CEO OpenAI Sam Altman để phát triển một dự án phần cứng AI.
• Thông tin này được tiết lộ trong một bài phỏng vấn trên The New York Times, gần 1 năm sau khi có tin đồn về sự hợp tác giữa Ive và Altman.
• Dự án hiện chỉ có 10 nhân viên, nhưng bao gồm những nhân sự chủ chốt như Tang Tan và Evans Hankey - những người từng làm việc với Ive trong dự án iPhone.
• Công ty LoveFrom của Ive đang dẫn dắt thiết kế cho thiết bị mới này.
• Nhóm làm việc tại một tòa nhà văn phòng rộng 2.973 m2 ở San Francisco, nằm trong khu bất động sản trị giá 90 triệu USD mà Ive đã mua.
• Dự án có thể huy động được 1 tỷ USD vốn đầu tư vào cuối năm nay. Tuy nhiên, báo cáo không đề cập đến tin đồn về khoản đầu tư 1 tỷ USD từ CEO SoftBank Masayoshi Son.
• Ive và Altman thảo luận về cách AI tạo sinh có thể tạo ra một thiết bị điện toán mới, vượt trội hơn phần mềm truyền thống trong việc xử lý các yêu cầu phức tạp.
• Có tin đồn thiết bị mới lấy cảm hứng từ công nghệ màn hình cảm ứng và iPhone nguyên bản.
• Tuy nhiên, chi tiết cụ thể về sản phẩm và thời điểm ra mắt vẫn chưa được xác định.
• Marc Newson, đồng sáng lập LoveFrom, cho biết họ vẫn đang trong quá trình xác định sản phẩm AI cụ thể và thời gian ra mắt.
📌 Jony Ive và OpenAI đang phát triển thiết bị AI mới với đội ngũ 10 người. Dự án có thể huy động 1 tỷ USD vốn, lấy cảm hứng từ iPhone và công nghệ cảm ứng. Chi tiết sản phẩm và thời gian ra mắt vẫn chưa xác định.
https://www.theverge.com/2024/9/21/24250867/jony-ive-confirms-collaboration-openai-hardware
• Mã nguồn trong ứng dụng Android Auto mới nhất cho thấy dấu hiệu Gemini AI sắp được tích hợp vào hệ thống thông tin giải trí trên xe hơi.
• Android Authority phát hiện các chuỗi mã như biểu tượng "sparkle" đặc trưng của Gemini, cùng với từ khóa "kitt" - có thể ám chỉ trợ lý AI trong phim Knight Rider thập niên 80.
• Các chuỗi mã khác như "Start conversation" và "GeminiLiveAssistantAction" cũng được tìm thấy, cho thấy khả năng tương tác với Gemini trên bảng điều khiển xe.
• Việc tích hợp Gemini vào Android Auto nằm trong chiến lược mở rộng AI của Google trên nhiều nền tảng và ứng dụng.
• Gemini đang dần thay thế hoặc bổ sung cho Google Assistant trên các sản phẩm của Google.
• Chưa có thông báo chính thức từ Google về thời điểm ra mắt, nhưng có thể sẽ sớm được triển khai.
• Người dùng có thể tương tác với Gemini trên Android Auto tương tự như trên các nền tảng khác, nhận được câu trả lời thông minh và cá nhân hóa.
• Vẫn chưa rõ những tính năng nào sẽ yêu cầu gói Google One AI Premium (giá 20 USD/tháng) để sử dụng đầy đủ.
• Thách thức lớn nhất là vấn đề "ảo giác" của AI, có thể dẫn đến chỉ dẫn sai lệch khi lái xe.
• Gemini trên Android Auto có thể tham chiếu Google Maps để đảm bảo chỉ dẫn chính xác và an toàn.
• Việc tích hợp AI vào hệ thống thông tin giải trí trên xe đặt ra những thách thức mới về an toàn và trải nghiệm người dùng.
• Cần có các biện pháp kiểm soát để đảm bảo AI không gây mất tập trung cho người lái.
• Tính năng này có thể mở ra khả năng điều khiển nhiều chức năng trên xe bằng giọng nói thông minh hơn.
• Sự xuất hiện của Gemini trên Android Auto cho thấy xu hướng AI hóa ngày càng sâu rộng trong ngành công nghiệp ô tô.
📌 Gemini AI sắp được tích hợp vào Android Auto, mở rộng khả năng trợ lý thông minh trên xe hơi. Tuy nhiên, vẫn còn những thách thức về an toàn và trải nghiệm cần được giải quyết. Đây là bước tiến quan trọng trong việc AI hóa ngành công nghiệp ô tô.
https://www.techradar.com/computing/artificial-intelligence/gemini-ai-could-be-making-its-way-into-your-car-with-android-auto
- Kính thông minh thế hệ mới đang chuẩn bị cho sự trở lại mạnh mẽ sau thất bại của Google Glass vào năm 2014.
- Meta và Google đang đầu tư mạnh vào việc phát triển kính thông minh kết hợp giữa thời trang và chức năng, sử dụng AI tạo sinh để nâng cao trải nghiệm người dùng.
- Gene Munster, đối tác quản lý của Deepwater Asset Management, cho rằng người tiêu dùng ngày càng thích công nghệ dễ sử dụng và tin tưởng vào khả năng của AI tạo sinh.
- Kính thông minh mới sẽ có khả năng nhận diện môi trường xung quanh và cung cấp thông tin theo yêu cầu, như nhận diện thực vật hay tìm kiếm đồ vật bị mất.
- Dự đoán rằng thị trường kính thông minh sẽ đạt hàng triệu đơn vị hàng năm trong vòng một thập kỷ tới, dẫn đến việc Apple điều chỉnh các sáng kiến về máy tính không gian của mình.
- AI đã giúp kính thông minh trở nên hữu ích và thân thiện hơn, biến chúng từ một thiết bị phụ kiện thành công cụ thiết yếu trong cả thị trường tiêu dùng và doanh nghiệp.
- Kính thông minh có thể cung cấp dịch vụ dịch thuật thời gian thực, thông báo chủ động và gợi ý nội dung cá nhân hóa dựa trên thói quen người dùng.
- Nhận diện giọng nói và cử chỉ được cải thiện nhờ AI giúp người dùng điều khiển kính dễ dàng hơn.
- Các tính năng âm thanh nổi bật cho phép người dùng nghe podcast và nhạc mà không cần sử dụng tai nghe.
- Kính thông minh mới có camera 12 megapixel cho phép người dùng chụp ảnh và chia sẻ trực tiếp với bạn bè.
- Sự hợp tác giữa Meta và Ray-Ban cho thấy tầm quan trọng của thời trang trong việc phát triển kính thông minh, giúp sản phẩm trở nên hấp dẫn hơn với người tiêu dùng.
- Mặc dù có nhiều cải tiến, thị trường vẫn đang tìm kiếm kính thông minh với chức năng AR tốt hơn mà không làm giảm trọng lượng và thời gian sử dụng pin.
- Dự đoán rằng Apple sẽ tham gia vào thị trường kính thông minh trong 5 năm tới, với các sản phẩm kết hợp giữa kính thông minh và máy tính không gian.
📌 Kính thông minh thế hệ mới có tiềm năng lớn với dự đoán thị trường đạt hàng triệu đơn vị. AI tạo sinh sẽ nâng cao trải nghiệm người dùng, biến kính thông minh thành công cụ thiết yếu trong cuộc sống hàng ngày.
https://www.technewsworld.com/story/ai-enhanced-next-gen-smart-glasses-could-revolutionize-wearables-179339.html
• Kính thông minh tích hợp AI đang trở thành xu hướng thiết bị thông minh mới nhất của các công ty công nghệ Trung Quốc, nhằm tận dụng sự phấn khích của người tiêu dùng về việc kết hợp AI tạo sinh với thiết bị đeo.
• Startup Superhexa được Xiaomi hậu thuẫn vừa ra mắt kính âm thanh AI Jiehuan với giá 699 nhân dân tệ (khoảng 2.400.000 VNĐ), rẻ hơn nhiều so với kính Ray-Ban Meta giá 300 USD (khoảng 7.200.000 VNĐ).
• Kính Jiehuan có chức năng tương tự các sản phẩm cạnh tranh, cho phép truy cập nhanh các mô hình ngôn ngữ lớn (LLM) thông qua loa và micro tích hợp.
• Kính Jiehuan có thời lượng phát nhạc 11 giờ, thời gian chờ lên đến nửa tháng, trọng lượng chỉ 30 gram. Các tính năng khác bao gồm điều hướng bằng giọng nói, trò chuyện AI và dịch thuật âm thanh.
• Từ tháng 4 đến tháng 5, nhiều startup như Liweike, Sharge và các gã khổng lồ công nghệ như Huawei đã lần lượt ra mắt kính AI của riêng mình.
• Sinolink Securities dự đoán lô hàng kính thông minh sẽ đạt 2 triệu chiếc vào cuối năm nay, so với 480.000 chiếc kính thực tế tăng cường được bán ra năm ngoái.
• Tuy nhiên, một số nhà phân tích cảnh báo rằng có thể có ít dư địa tăng trưởng trong lĩnh vực này. Ivan Lam từ Counterpoint cho rằng kính AI hiện tại chỉ là kính thông thường được trang bị loa, camera và AI.
• Các nhà sản xuất cần "cắt giảm trọng lượng, cải thiện trải nghiệm đeo và thời lượng pin" để tiếp tục phát triển.
• Một số công ty kính thông minh đang ưu tiên phong cách và trọng lượng. Solos có trụ sở tại Hong Kong dự định cạnh tranh trực tiếp với Ray-Ban và Meta vào mùa thu này với kính AirGo mới nặng 30 gram và có giá tương tự.
• Even Realities, một startup mới thành lập tại Thâm Quyến, cũng ưu tiên phong cách với kính G1 mới có màn hình LED micro trên ống kính nhưng không có loa, giá khởi điểm 600 USD (khoảng 14.400.000 VNĐ).
• Brilliant Labs, được thành lập tại Hong Kong nhưng sau đó chuyển đến Singapore, đã ra mắt kính Frame với giá 350 USD (khoảng 8.400.000 VNĐ). CEO Bobak Tavangar cho biết công ty hy vọng cách tiếp cận nguồn mở sẽ thúc đẩy việc áp dụng trong nhiều kịch bản khác nhau.
📌 Kính thông minh AI đang bùng nổ tại Trung Quốc với nhiều startup và công ty lớn tham gia. Dự kiến đạt 2 triệu chiếc bán ra năm 2024. Các thách thức chính là giảm trọng lượng, cải thiện pin và trải nghiệm đeo. Tiềm năng lớn nhưng cần đột phá về công nghệ và thiết kế.
https://www.thestar.com.my/tech/tech-news/2024/08/22/ai-smart-glasses-are-the-latest-gadget-gold-rush-for-chinese-tech-firms
• Apple và Google đang tích cực tích hợp AI tạo sinh vào các thiết bị phần cứng của họ. Apple đã công bố hợp tác với OpenAI để đưa GPT-4o vào hệ điều hành iOS, kết nối với trợ lý ảo Siri.
• Google cũng giới thiệu nhiều tính năng AI mới như Gemini-nano chạy trên các thiết bị cạnh, cung cấp năng lượng cho Pixel 8 Pro.
• Smartphone đang trở nên thông minh hơn với AI tạo sinh. Google Pixel 8 cung cấp các tính năng như dịch ngôn ngữ thời gian thực, văn bản dự đoán và chỉnh sửa ảnh nâng cao.
• iPhone 15 Pro của Apple sử dụng AI để tối ưu hóa thời lượng pin và nâng cao hiệu suất camera. Chip A17 Bionic có thể thực hiện hơn 15 nghìn tỷ phép tính mỗi giây.
• Trong lĩnh vực thiết bị nhà thông minh, Amazon đã giới thiệu trải nghiệm Alexa được hỗ trợ bởi AI tạo sinh, giúp trợ lý ảo có tính cách sống động hơn.
• Google Nest Hub sử dụng machine learning để hiểu thói quen và sở thích, điều chỉnh ánh sáng, nhiệt độ và cung cấp thông tin cá nhân hóa.
• Đồng hồ thông minh đang tích hợp AI để cung cấp các tính năng theo dõi sức khỏe nâng cao như đo ECG, đo nồng độ oxy trong máu, theo dõi giấc ngủ và phát hiện nhịp tim bất thường.
• Các thiết bị AI mới đang xuất hiện như Humane AI Pin và Rabbit R1 - trợ lý ảo điều khiển bằng giọng nói có thể đeo trên quần áo.
• Brilliant Labs đang phát triển kính thông minh tích hợp AI, cung cấp khả năng dịch thuật, tìm kiếm web và phân tích hình ảnh ngay trước mắt người dùng.
📌 AI đang nhanh chóng được tích hợp vào các thiết bị hàng ngày, hứa hẹn cuộc sống thông minh và tiện lợi hơn. Từ smartphone đến thiết bị đeo và nhà thông minh, AI đang thay đổi cách chúng ta tương tác với công nghệ, với hơn 15 nghìn tỷ phép tính/giây trên iPhone 15 Pro và các tính năng như dịch thuật thời gian thực trên Google Pixel.
https://indianexpress.com/article/technology/artificial-intelligence/gen-ais-next-target-after-apps-take-over-the-hardware-9525692/
- Nokia và Swisscom Broadcast ra mắt mạng lưới Drones-as-a-Service lớn nhất thế giới tại Thụy Sĩ, nhằm tăng cường khả năng ứng phó khẩn cấp, đưa AI lên bầu trời.
- Nền tảng Nokia Drone Networks được thiết kế để sử dụng bởi các nhà khai thác công cộng và thương mại quy mô lớn, cần triển khai nhanh chóng các mắt thám thính trên không trong trường hợp khẩn cấp.
- Dự án tương tự đã được triển khai tại Bỉ vào tháng 11 năm ngoái, hợp tác với các dịch vụ cứu hỏa trên toàn quốc. Ở cả hai trường hợp, các drone được triển khai từ các trạm mặt đất tiện lợi, với các điều khiển viên từ xa trên toàn quốc.
- Các drone được trang bị camera đa cảm biến, bao gồm cả khả năng hồng ngoại và nhiệt, cũng như các tùy chọn như LIDAR cho chức năng quét bổ sung, tất cả đều được quản lý bởi các mô hình trí tuệ nhân tạo.
- Một phần then chốt của nền tảng này là sử dụng công nghệ không dây 5G, cho phép điều khiển hoàn toàn ngoài tầm nhìn trực tiếp (BVLOS). Khả năng bay ở khoảng cách lớn và sử dụng AI dựa trên đám mây để đánh giá hoạt động làm cho hệ thống này trở nên độc đáo trong lĩnh vực này.
- Một phần trong thông báo có thể thu hút sự chú ý của những người quan tâm đến dân quyền là khả năng của bất kỳ 'cơ quan an toàn công cộng' nào ở Thụy Sĩ thuê mạng lưới drone theo kiểu trả tiền khi sử dụng. Điều này có nghĩa là các cơ quan an ninh hoặc thực thi pháp luật của Thụy Sĩ có thể thu thuê một drone địa phương tiện lợi để tiến hành giám sát hoặc mục tiêu theo nhu cầu, điều này chắc chắn sẽ thu hút sự chú ý của những người quan tâm đến quyền riêng tư và pháp lý.
- Đối tác của Nokia tại Bỉ, CitiMesh, cũng đã làm rõ rằng AI sẽ được sử dụng không chỉ để đánh giá về mặt hình ảnh các mối nguy hiểm về hỏa hoạn và sự cố hóa chất mà còn để kiểm tra kích thước đám đông và tìm kiếm những người mất tích, ví dụ bằng cách lọc ra tất cả những người đang mặc áo khoác đỏ trong video drone trực tiếp.
- Công ty cuối cùng hy vọng sẽ tích hợp các luồng video drone với các camera CCTV trên toàn thành phố để cung cấp độ phủ lớn hơn nữa. Chúng ta có thể không thấy bất kỳ tiềm năng lạm dụng nào ở đây cả.
- Trong khi đó, sản phẩm drone mới của Nokia đang nhanh chóng thu hút khách hàng trên toàn thế giới. Tháng trước, Westcon-Comstor, một nhà cung cấp công nghệ toàn cầu, đã thông báo rằng họ sẽ trở thành nhà phân phối Nokia Drone Networks được phê duyệt tại EU, Vương quốc Anh, Australia, New Zealand và Singapore.
- Công nghệ này cũng vừa được FCC chứng nhận tại Hoa Kỳ, vì vậy hãy theo dõi không gian này, như người ta thường nói. Và, hy vọng rằng nó sẽ không dẫn đến một Terminator phải du hành ngược về quá khứ.
📌 Nokia và Swisscom Broadcast ra mắt mạng lưới Drones-as-a-Service lớn nhất thế giới tại Thụy Sĩ, trang bị AI để tăng cường khả năng ứng phó khẩn cấp. Các drone có thể được các cơ quan an toàn công cộng thuê để giám sát và định vị, gây lo ngại về quyền riêng tư. Công nghệ này đang nhanh chóng phát triển trên toàn cầu.
https://www.tomsguide.com/ai/nokia-ai-drones-in-a-box-is-this-our-first-taste-of-skynet
• Theo tài liệu nội bộ được The Verge công bố, Humane AI Pin đang gặp khó khăn nghiêm trọng về doanh số, với số lượng trả lại sản phẩm hiện đang vượt quá số lượng bán ra.
• Chỉ có khoảng 7.000 thiết bị đang được sử dụng, trong khi mục tiêu ban đầu của công ty là bán được 100.000 chiếc trong năm đầu tiên.
• Tổng cộng đã có khoảng 10.000 thiết bị được bán ra, nhưng 3.000 chiếc đã bị trả lại. Hơn 1.000 đơn đặt hàng trước cũng đã bị hủy sau khi các đánh giá tiêu cực xuất hiện.
• Sản phẩm có giá 700 USD nhưng bị đánh giá là không thực sự hữu ích. Nhiều người dùng và chuyên gia công nghệ đã chỉ trích sản phẩm này gay gắt.
• Vấn đề an toàn cũng xuất hiện khi phụ kiện sạc pin được cho là có nguy cơ gây cháy nổ.
• Humane đang tìm cách khắc phục tình hình, bao gồm việc tìm kiếm một công ty lớn hơn để mua lại. HP được cho là đang xem xét việc mua lại Humane.
• Công ty cũng đang trong quá trình đàm phán với các nhà đầu tư, theo báo cáo của The Information.
• Humane phản đối báo cáo của The Verge, cho rằng có "sai sót" trong dữ liệu tài chính được công bố nhưng không đưa ra chi tiết cụ thể.
• Một vấn đề khác là Humane không có quy trình tân trang sản phẩm trả lại, do hạn chế từ đối tác viễn thông T-Mobile không cho phép gán lại thiết bị cho người dùng thứ cấp.
• Công ty đang giữ lại các sản phẩm bị trả lại với hy vọng giải quyết được vấn đề với T-Mobile.
• Humane đang phát hành các bản cập nhật phần mềm để giải quyết phản hồi của người dùng, nhưng vẫn còn câu hỏi về việc liệu có đáng bỏ ra 700 USD cho một thiết bị thứ cấp kém hiệu quả hơn smartphone hay không.
📌 Humane AI Pin đang gặp khủng hoảng với chỉ 7.000 thiết bị đang được sử dụng, so với mục tiêu 100.000 chiếc. Tỷ lệ trả lại sản phẩm cao (3.000/10.000) và đánh giá tiêu cực đang đe dọa tương lai của sản phẩm này. Công ty đang tìm kiếm giải pháp thông qua cập nhật phần mềm và khả năng được mua lại.
https://www.engadget.com/ai/people-are-returning-humane-ai-pins-faster-than-the-company-can-sell-them-191523105.html
• Meta sẽ tích hợp trợ lý AI Meta vào kính thực tế hỗn hợp Quest từ tháng 8 năm nay. Trên Quest 3, AI có thể nhìn các vật thể thực tế qua video passthrough và cung cấp thông tin về chúng.
• Công nghệ này sử dụng mô hình nguồn mở Llama của Meta. Mô hình AI trên Quest 3 sẽ là mô hình đa phương thức mới, có khả năng xử lý và lý luận về hình ảnh.
• Đây là bước tiến quan trọng trong tầm nhìn dài hạn của Meta về việc sử dụng trợ lý AI làm tính năng trung tâm cho kính và thiết bị đeo thực tế hỗn hợp.
• Michael Abrash, Giám đốc khoa học của Meta Reality Labs, từng chia sẻ rằng các thiết bị đeo của Meta sẽ thu thập nhiều thông tin về thói quen, sở thích và mối quan hệ của người dùng. Dữ liệu này sẽ được đưa vào các mô hình AI mạnh mẽ để đưa ra các suy luận sâu sắc.
• Meta vẫn cần phải cải tiến để làm cho các máy tính đeo đầu nhỏ gọn, nhẹ và thời trang hơn. Họ cũng cần phát minh ra các chip mới đủ nhỏ và mạnh để chạy các mô hình AI.
• Về chính sách AI, Kamala Harris có thể sẽ tiếp tục thúc đẩy các chủ đề chính trong sắc lệnh hành pháp về AI của Biden. Sắc lệnh này yêu cầu các công ty Mỹ phát triển các mô hình AI lớn nhất phải định kỳ báo cáo về các biện pháp an toàn AI cho chính phủ.
• Harris đã gọi việc lựa chọn giữa quy định và tiến bộ là một "lựa chọn sai lầm". Bà cũng cảnh báo rằng AI có thể "gây nguy hiểm cho sự tồn tại của nhân loại" và kêu gọi các lãnh đạo công nghệ có trách nhiệm đạo đức trong việc đảm bảo AI an toàn.
• Anduril, công ty công nghệ quốc phòng, đã được Không quân Mỹ chọn để chế tạo máy bay không người lái tự động trong khuôn khổ sáng kiến Máy bay Chiến đấu Hợp tác (CCA).
• Máy bay không người lái Fury của Anduril có thể bay gần tốc độ âm thanh và chịu được lực G 9G. Chúng được điều khiển bởi nền tảng AI Lattice.
• Mục tiêu của CCA là sử dụng máy bay không người lái làm proxy cho máy bay có phi công, với chi phí đủ thấp để có thể hy sinh trong một số tình huống.
• Chương trình CCA được coi là bước ngoặt trong cách Pentagon nhìn nhận và mua sắm AI cho mục đích quốc phòng.
📌 Meta tích hợp AI vào kính Quest, đánh dấu bước tiến trong tầm nhìn thực tế hỗn hợp. Kamala Harris có thể tiếp tục chính sách AI của Biden, nhấn mạnh an toàn. Anduril giành hợp đồng 1 trong 2 công ty phát triển máy bay chiến đấu tự động cho Không quân Mỹ, mở ra kỷ nguyên mới trong công nghệ quốc phòng.
https://www.fastcompany.com/91162492/meta-adding-ai-to-its-quest-headsets
- Sự kết hợp của AI tạo sinh, những tiến bộ về phần cứng và công nghệ mạng sẽ thúc đẩy sự ra đời của các thiết bị IoT tiêu dùng mới mạnh mẽ.
- Khả năng này sẽ tăng đáng kể tính năng và tiện ích của các thiết bị thông minh hiện có như đồng hồ thông minh, máy hút bụi, máy cắt cỏ, loa thông minh, cũng như các thiết bị gia dụng truyền thống như lò nướng, tủ lạnh.
- Nhiều sản phẩm mới sáng tạo cũng sẽ xuất hiện nhờ công nghệ này như kính thông minh có camera tích hợp AI, robot gia đình đa năng, gương thông minh có thể tư vấn sức khỏe tinh thần.
- Tuy nhiên, việc tích hợp nhanh chóng AI tạo sinh vào IoT tiêu dùng khó xảy ra do chi phí cao, các vấn đề của AI tạo sinh như sai lệch, thiếu tiêu chuẩn triển khai chung và quan ngại về an toàn, quyền riêng tư dữ liệu trong bối cảnh quy định hạn chế.
- Thị trường IoT toàn cầu dự kiến tăng trưởng 14%/năm từ 2023-2027, đạt 124 tỷ USD. Giá trị thiết bị AI sẽ tăng từ 4% lên 12% thị trường.
- Phần mềm IoT sẽ vượt qua phần cứng IoT về quy mô thị trường, 27% tổng thị trường sẽ là IoT tiêu dùng.
- Việc triển khai 5G đòi hỏi đầu tư lớn, ước tính 34 tỷ bảng Anh đến năm 2030 chỉ riêng ở Anh. Tỷ lệ phủ sóng 5G trung bình ở Mỹ, Trung Quốc trên 90% dân số, trong khi ở Mỹ Latin, Trung Đông, châu Phi chỉ đạt 10%.
- Tiếp cận điện vẫn là thách thức ở nhiều nước đang phát triển. 1 tỷ người phụ thuộc vào cơ sở y tế ở nơi nguồn điện không ổn định, khó đáp ứng nhu cầu IoT rộng rãi.
- Công nghệ AI tạo sinh còn non trẻ, dễ gặp lỗi, khó kiểm soát. Các phiên bản rút gọn cho thiết bị IoT còn đang thử nghiệm, chưa rõ mức độ hiệu quả.
- Thiếu các tiêu chuẩn chung về giao tiếp và triển khai giữa các nhà cung cấp. Yếu tố địa chính trị cũng làm chậm tiến trình phát triển tiêu chuẩn.
- Triển khai AI tạo sinh không thể kiểm soát trong nhà gây rủi ro an toàn. Rò rỉ dữ liệu cá nhân cũng là mối lo. Các quy định pháp lý về trách nhiệm pháp lý khi sự cố xảy ra còn chưa rõ ràng.
📌 Sự hội tụ của AI tạo sinh, đổi mới phần cứng và mạng hứa hẹn mang đến các thiết bị IoT tiêu dùng mới mạnh mẽ với nhiều tính năng và tiện ích vượt trội cho cả thiết bị thông minh sẵn có lẫn gia dụng truyền thống. Nhiều sản phẩm sáng tạo như kính thông minh, robot gia đình, gương thông minh cũng sẽ ra đời. Tuy nhiên, chi phí cao, công nghệ AI tạo sinh còn non trẻ, thiếu chuẩn chung, vấn đề an toàn, quyền riêng tư trong bối cảnh quy định hạn chế sẽ là rào cản lớn. Thị trường IoT toàn cầu dự kiến tăng 14%/năm đạt 124 tỷ USD vào 2027, trong đó IoT tiêu dùng chiếm 27%. Việc triển khai hạ tầng 5G đòi hỏi đầu tư khổng lồ và chênh lệch lớn giữa các khu vực. Những thách thức này sẽ khiến sự phát triển của xu hướng tích hợp AI tạo sinh vào IoT tiêu dùng khó diễn ra nhanh chóng trong tương lai gần.
https://www.technologyreview.com/2024/07/10/1094477/housetraining-robot-dogs-how-generative-ai-might-change-consumer-iot/
#MIT
• CMR M-1 được giới thiệu là máy quay phim đầu tiên trên thế giới tích hợp AI, có khả năng biến đổi cảnh quay thành hình ảnh AI ngay trong quá trình quay.
• Thiết bị này là sản phẩm hợp tác giữa SpecialGuestX và 1stAveMachine, sử dụng công nghệ của bộ tạo hình ảnh AI Stable Diffusion để quay phim với các bộ lọc sáng tạo được tạo ra bởi AI.
• Thiết kế của CMR M-1 lấy cảm hứng từ Ciné Kodak - máy quay phim 16mm đầu tiên trên thế giới, với hình dáng hộp vuông đặc trưng của máy quay đầu thế kỷ 20.
• Thông số kỹ thuật của CMR M-1 bao gồm cảm biến FLIR (thường dùng trong thiết bị chụp ảnh nhiệt và hồng ngoại), CPU Snapdragon, khung ngắm và ống kính có thể thay đổi. Máy quay ghi hình với độ phân giải 1368x768 pixel ở tốc độ 12 khung hình/giây.
• Sau khi quay, video được gửi đến dịch vụ điện toán đám mây để xử lý bằng AI. Hiện tại, CMR M-1 vẫn đang trong giai đoạn nguyên mẫu và còn độ trễ giữa quá trình ghi hình và xử lý AI, nhưng SpecialGuestX cho biết sẽ có thể xử lý theo thời gian thực khi các mô hình video AI mới được phát triển.
• Một tính năng độc đáo của CMR M-1 là khe cắm thẻ đặc biệt cho phép người quay phim chọn phong cách hình ảnh AI. Có 5 loại Style Card khác nhau, mỗi loại có LoRA (Low-Ranking Adaptation) riêng. Các thẻ này hoạt động như bộ lọc sáng tạo và có thể được điều chỉnh trên máy quay.
• CMR M-1 cho phép các nhà sáng tạo tinh chỉnh bộ lọc AI của riêng họ, mở ra khả năng sáng tạo mới trong quá trình sản xuất phim.
• Máy quay đã được thử nghiệm tại một bữa tiệc ở Cannes, sử dụng thẻ "Snowy Illusion" để biến người và cảnh vật thành những hình ảnh băng giá kỳ lạ.
• Miguel Espada, đồng sáng lập và giám đốc sáng tạo công nghệ của SpecialGuestX, nhấn mạnh rằng việc tạo ra phim vốn mang tính vật lý, và AI nên là một công cụ mới nâng cao khả năng sáng tạo.
• Aaron Duffy, giám đốc sáng tạo điều hành của SpecialGuestX, hy vọng rằng máy quay nguyên mẫu này sẽ cho phép các nhà sáng tạo "sử dụng AI thay vì ngồi trước bàn phím".
📌 CMR M-1, máy quay phim AI đầu tiên trên thế giới, mở ra kỷ nguyên mới trong sản xuất phim. Với khả năng biến đổi cảnh quay thành hình ảnh AI ngay khi quay và tính năng tùy chỉnh bộ lọc AI, thiết bị này hứa hẹn mang lại cách tiếp cận sáng tạo mới cho các nhà làm phim.
https://petapixel.com/2024/07/08/the-worlds-first-ai-powered-movie-camera-transforms-filmed-footage-cmr-m1/
- Starpery Technology, một trong những nhà sản xuất búp bê tình dục lớn nhất thế giới, đang phát triển robot AI tiên tiến có khả năng tương tác và trò chuyện nhiều hơn.
- Công ty đang huấn luyện mô hình ngôn ngữ lớn của riêng mình cho sản phẩm này và dự kiến sẽ có nguyên mẫu vào tháng 8, bao gồm cả phiên bản nam và nữ.
- CEO Evan Lee cho biết, thách thức công nghệ lớn nhất là đạt được tương tác con người thực tế. Mặc dù đối thoại đơn giản là dễ dàng, nhưng tạo ra phản hồi tương tác đòi hỏi phát triển mô hình phức tạp bởi các công ty phần mềm chuyên biệt.
- Các búp bê mới sẽ được trang bị nhiều cảm biến hơn để phản ứng nhanh với chuyển động và lời nói, tạo ra kết nối cảm xúc thuyết phục hơn.
- Lộ trình của Starpery bao gồm cả việc phát triển robot thực tế hơn. Trong vài năm tới, công ty dự định cung cấp các robot có thể thực hiện các công việc nhà cơ bản, cũng như robot dịch vụ thông minh đầu tiên có thể thực hiện các dịch vụ phức tạp cho người khuyết tật và người già.
- Tesla cũng đang phát triển sản phẩm tương tự, được gọi là Tesla Bots. CEO Elon Musk khẳng định cam kết phát triển chúng trong cuộc họp cổ đông thường niên năm 2024 của công ty. Ông cho biết các robot này sẽ có thể nấu ăn, dọn dẹp, dạy trẻ em và làm việc trong nhà máy, cùng nhiều nhiệm vụ khác.
- Musk dự đoán rằng mỗi hộ gia đình trung lưu Mỹ sẽ có một robot trong vòng 7 năm tới.
- Starpery sẽ phải vượt qua nhiều thách thức kỹ thuật và văn hóa để đạt được kế hoạch của mình. Công ty thường bán sản phẩm ra ngoài Trung Quốc do văn hóa tương đối bảo thủ của nước này. Tuy nhiên, Lee dự định thâm nhập vào thị trường Trung Quốc và ước tính doanh số sẽ vượt qua Mỹ, Nhật Bản và Đức cộng lại, mặc dù các búp bê phải có "thẩm mỹ khác biệt."
📌 Starpery Technology đang phát triển robot AI tiên tiến có khả năng tương tác và làm việc nhà, dự kiến ra mắt nguyên mẫu vào tháng 8. Tesla cũng đang phát triển Tesla Bots với nhiều chức năng tương tự. Starpery dự định thâm nhập thị trường Trung Quốc và dự đoán doanh số sẽ vượt qua Mỹ, Nhật Bản và Đức cộng lại.
https://www.pcmag.com/news/chinese-sex-doll-mega-producer-says-next-gen-ai-bots-are-on-the-way
- Wakefit giới thiệu Wakefit Zense, bộ giải pháp giấc ngủ đầu tiên tại Ấn Độ được hỗ trợ bởi AI, với 2 sản phẩm chính là Regul8 và Track8.
- Regul8 là bộ điều khiển nhiệt độ nệm đầu tiên tại Ấn Độ, cho phép người dùng tự điều chỉnh nhiệt độ từ 15°C đến 40°C hoặc chọn các chế độ cài sẵn. Tính năng "Điều khiển giấc ngủ thông minh" tự động điều chỉnh nhiệt độ dựa trên thời lượng ngủ và các thông số liên quan. Regul8 hỗ trợ tùy chỉnh 2 bên nệm độc lập, đa dụng theo mùa, tương thích với mọi loại giường và nệm, tiết kiệm năng lượng hơn 60% so với điều hòa 1.5 HP.
- Track8 là thiết bị theo dõi giấc ngủ không tiếp xúc sử dụng AI, cung cấp thông tin chính xác về chu kỳ giấc ngủ thông qua tấm cảm biến đặt dưới nệm. Track8 sử dụng AI và machine learning với các thuật toán để phân tích dữ liệu giấc ngủ, cung cấp báo cáo chi tiết về các giai đoạn ngủ, nhịp thở, ngáy, chuyển động và chất lượng giấc ngủ tổng thể, tổng hợp thành điểm số giấc ngủ vào ngày hôm sau.
- Chaitanya Ramalingegowda, đồng sáng lập Wakefit, nhấn mạnh tham vọng xây dựng công nghệ giấc ngủ tiên tiến dành riêng cho Ấn Độ, với Regul8 và Track8 là 2 trong số nhiều sản phẩm thuộc dòng Zense. Công ty tự hào đã phát triển nội bộ và làm cho các sản phẩm này dễ tiếp cận, giá cả phải chăng cho người dân Ấn Độ.
- Yash Dayal, CTO kiêm trưởng dự án Zense, nhấn mạnh thiết kế lấy người dùng làm trung tâm và tích hợp công nghệ mới nhất của Regul8 và Track8, thể hiện mục tiêu cá nhân hóa, quản lý và tiếp cận giấc ngủ cho khách hàng.
- Giá bán lẻ của Regul8 là 44.999 Rs (khoảng 550 USD), Track8 là 10.499 Rs (khoảng 130 USD), hiện đang có giá ưu đãi ra mắt.
- Wakefit sẽ tiếp tục giải quyết các vấn đề giấc ngủ cụ thể bằng các giải pháp chuyên biệt, dựa trên nghiên cứu và phát triển sâu rộng.
- Thành lập năm 2016, Wakefit đã huy động được 145,4 triệu USD qua 5 vòng gọi vốn, vòng gần nhất Series D hoàn tất vào tháng 1/2023, được hậu thuẫn bởi 5 nhà đầu tư như Verlinvest và Susquehanna International Group (SIG).
📌 Wakefit Zense đánh dấu bước tiến công nghệ đột phá của Wakefit trong lĩnh vực giải pháp giấc ngủ tại Ấn Độ. Với Regul8 và Track8, công ty hướng tới cá nhân hóa, quản lý và cải thiện chất lượng giấc ngủ một cách toàn diện cho người tiêu dùng, thông qua việc tích hợp AI và thiết kế lấy người dùng làm trung tâm. Wakefit đã huy động thành công 145,4 triệu USD và sẽ tiếp tục đầu tư nghiên cứu phát triển để giải quyết các vấn đề giấc ngủ đặc thù.
https://analyticsindiamag.com/wakefit-unveils-wakefit-zense-indias-first-ai-powered-sleep-solutions-suite/
- Apple sử dụng mô hình 3 tỷ tham số, có thể là phiên bản chuyên biệt của OpenELM-3B, được tối ưu hóa cho các thiết bị hạn chế tài nguyên.
- Mô hình được huấn luyện trên 1.8 nghìn tỷ token dữ liệu mở, dữ liệu được cấp phép (thỏa thuận 25-50 triệu USD với Shutterstock cho hình ảnh và thỏa thuận 50 triệu USD với các tổ chức tin tức và xuất bản lớn) và dữ liệu công khai từ trình thu thập thông tin AppleBot.
- Mô hình được tinh chỉnh để tuân theo hướng dẫn thông qua kỹ thuật RLHF (reinforcement learning from human feedback) và thuật toán tinh chỉnh lấy mẫu từ chối với ủy ban giáo viên.
- Apple sử dụng nhiều kỹ thuật để cải thiện khả năng của mô hình trong khi vẫn giữ hiệu quả tài nguyên như grouped query attention (GQA), palletization/quantization, và tối ưu hóa đặc biệt phù hợp cho chip Apple như LLM in a flash.
- Các mô hình chỉ chạy trên MacBook với chip M1 trở lên và iPhone 15 Pro/Pro Max với chip A17 Pro.
- Kết quả báo cáo trên iPhone 15 Pro là độ trễ 0.6 mili giây cho mỗi token nhắc nhở và tốc độ tạo 30 token/giây.
- Apple tạo ra các phiên bản tinh chỉnh của mô hình nền tảng để lưu trữ trên thiết bị bằng cách sử dụng bộ chuyển đổi low-rank adaptation (LoRA), cho phép lưu trữ và sử dụng nhiều bộ chuyển đổi LoRA cho các tác vụ khác nhau.
- Đánh giá của con người cho thấy mô hình của Apple nói chung được ưa thích hơn các mô hình khác có kích thước tương đương và một số mô hình lớn hơn.
📌 Apple đã thể hiện khả năng đạt được sự cân bằng giữa độ chính xác và trải nghiệm người dùng tối ưu khi kết hợp các mô hình nhỏ với các kỹ thuật tối ưu hóa, dữ liệu và phần cứng phù hợp. Việc triển khai công nghệ này tới người dùng vào mùa thu sẽ cho thấy liệu bản demo có đạt được kỳ vọng hay không.
https://venturebeat.com/ai/what-we-know-about-apples-on-device-ai/
- Raspberry Pi sẽ bán chip AI thông qua việc hợp tác với nhà sản xuất chip Hailo, cung cấp Bộ kit AI như một tùy chọn mở rộng cho máy tính nhúng Raspberry Pi 5.
- Bộ kit AI tích hợp với phần mềm camera của Raspberry Pi, cho phép chạy các ứng dụng dựa trên AI như chatbot trực tiếp trên thiết bị nhúng nhỏ gọn này.
- Bộ tăng tốc Hailo-8L M.2 trong Bộ kit AI có mức tiêu thụ điện năng dưới 2W, làm mát thụ động, cung cấp 13 TOPS (tera operations per second), thấp hơn so với các chip dự kiến cho laptop AI như bộ xử lý Intel Lunar Lake 40 TOPS.
- Giá bán lẻ của Bộ kit AI là 70 USD, sẽ sớm có sẵn thông qua mạng lưới các nhà bán lẻ được Raspberry Pi phê duyệt trên toàn cầu.
- Xu hướng hiện nay là đưa AI lên các thiết bị di động như laptop, điện thoại bằng cách phát triển các mô hình và bộ xử lý AI nhỏ gọn, ít tiêu tốn năng lượng hơn. Điều này cho phép các ứng dụng như trợ lý lập trình, chỉnh sửa ảnh hỗ trợ AI chạy trực tiếp mà không cần gọi API đến cloud.
- Nhiều hãng phần cứng đang tìm cách tận dụng nhu cầu về AI, như Microsoft giới thiệu dòng PC Copilot Plus với AI tích hợp, AMD ra mắt vi xử lý Ryzen thương hiệu AI, Nvidia sẽ trang bị chip AI cho laptop.
📌 Raspberry Pi hợp tác với Hailo để cung cấp Bộ kit AI 70 USD, mở rộng khả năng cho máy tính nhúng Pi 5 chạy các ứng dụng AI trực tiếp với chip Hailo-8L 13 TOPS tiêu thụ dưới 2W. Đây là một phần của xu hướng các hãng phần cứng như Microsoft, AMD, Nvidia đưa AI lên thiết bị di động thông qua phát triển chip và mô hình AI gọn nhẹ, đáp ứng nhu cầu thị trường.
https://www.theverge.com/2024/6/4/24170818/raspberry-pi-ai-chip-hailo-devices
- Các thiết bị AI đeo được từ các công ty khởi nghiệp Humane và Rabbit bị các nhà đánh giá chê bai, cho điểm rất thấp như 4/10 và 3/10.
- Humane Ai Pin có giá 700 đô la, ban đầu được quảng cáo là có thể thay thế smartphone nhưng sau đó phải thay đổi thông điệp. CEO công ty phải xin lỗi và hứa cải tiến sản phẩm.
- Rabbit R1 giá rẻ hơn 200 đô la cũng bị đánh giá là "chưa hoàn thiện", "không đáng tin cậy".
- Các công ty khởi nghiệp mắc sai lầm khi kỳ vọng sự phấn khích về AI thời ChatGPT sẽ giúp thu hút khách hàng. Thực tế AI tạo sinh không làm phần cứng dễ dàng hơn.
- Các ông lớn công nghệ có lợi thế hơn nhiều vì có thể tận dụng cơ sở hạ tầng, nhân lực, vốn sẵn có để phát triển sản phẩm AI.
- Công ty khởi nghiệp thường chỉ có một cơ hội ra mắt sản phẩm, nếu thất bại thì rất khó gọi vốn tiếp.
- Nhiều công ty khởi nghiệp khác cũng đang phát triển các thiết bị AI như trợ lý ghi nhớ, tai nghe thông minh, la bàn AI.
- Xu hướng này giống thời kỳ bùng nổ thiết bị đeo và gadget trên Kickstarter những năm 2010, khi công nghệ mới giúp dễ chế tạo hơn. Hầu hết đều thất bại, chỉ một số được các ông lớn mua lại.
- Để thành công, công ty khởi nghiệp cần giữ mọi thứ đơn giản, tập trung vào một mục đích, xây dựng danh tiếng thương hiệu.
- Tương lai có thể dễ hơn nếu các mô hình AI nguồn mở nhỏ gọn chạy trực tiếp trên thiết bị xuất hiện. Nhưng vấn đề vẫn là xây dựng phần cứng gì cho phù hợp.
📌 Mặc dù sự bùng nổ của AI tạo sinh đang tạo cơ hội cho các công ty khởi nghiệp phần cứng, việc cạnh tranh với các ông lớn công nghệ vẫn rất khó khăn. Các sản phẩm AI đeo được đầu tiên từ Humane và Rabbit đều thất bại trong đánh giá của giới chuyên môn. Để thành công, họ cần giữ mọi thứ đơn giản, tập trung vào mục đích rõ ràng và xây dựng danh tiếng. Tương lai có thể sáng sủa hơn nếu các mô hình AI nguồn mở gọn nhẹ xuất hiện.
Citations:
[1] https://www.wired.com/story/generative-ai-doesnt-make-hardware-less-hard/
- Apple giới thiệu các mẫu iPad mới, nhấn mạnh khả năng AI tiềm năng nhờ chip M4 với "neural engine" mạnh mẽ hơn.
- Neural engine trên chip M4 của iPad Pro mới có thể thực hiện 38 nghìn tỷ phép tính/giây, gấp đôi so với chip M3.
- Apple đang tăng cường nhận xét về công việc AI, CEO Tim Cook cho rằng AI sẽ mang tính cách mạng và Apple có lợi thế trong kỷ nguyên mới.
- Đối thủ của Apple như Microsoft, Amazon, Google đã ra mắt sản phẩm AI và đầu tư hàng tỷ USD vào cơ sở hạ tầng.
- Apple chưa tiết lộ kế hoạch cụ thể về AI tạo sinh, nhưng có thể sử dụng công nghệ của OpenAI cho iPhone mới.
- iPad Pro 11 inch giá từ 999 USD, bản 13 inch từ 1.299 USD, có màn hình OLED "tandem" cho màu sắc chính xác hơn, bộ nhớ gấp đôi.
- iPad Pro 13 inch dày chỉ 5,1mm, là sản phẩm mỏng nhất của Apple từ trước đến nay.
- iPad Air cũng được cập nhật chip M2, có thêm phiên bản màn hình lớn 13 inch.
📌 Apple đang đẩy mạnh tiềm năng AI trên các mẫu iPad mới với chip M4 neural engine 38 nghìn tỷ phép tính/giây. Dù chậm chân so với đối thủ, CEO Tim Cook khẳng định AI sẽ cách mạng hóa và Apple có lợi thế riêng. iPad Pro siêu mỏng 5,1mm, màn OLED, bộ nhớ gấp đôi, giá từ 999 USD.
https://www.washingtonpost.com/technology/2024/05/07/apple-new-ipad-pro-m4-ai/
- Ethos-U85, thế hệ micro-NPU tiếp theo của Arm, được thiết kế để hỗ trợ các phép biến đổi, mang các mô hình AI tạo sinh đến thiết bị IoT.
- So với thế hệ thứ 2 U65, U85 trong cấu hình lớn nhất có hiệu năng gấp 4 lần và tiết kiệm năng lượng hơn 20%. Nó có thể được điều khiển bởi cả bộ xử lý ứng dụng Cortex-A hoặc vi điều khiển Cortex-M.
- U85 NPU IP có thể cấu hình từ 128-2048 MAC để đạt hiệu suất từ 256 GOPS đến 4 TOPS ở 1 GHz, sử dụng trọng số INT8 với kích hoạt INT16. Kích hoạt INT8 cũng được hỗ trợ.
- Arm đã thêm hỗ trợ cho các toán tử đặc trưng của transformer vào U85 như MATMUL, TRANSPOSE. Chuỗi toán tử elementwise cũng được hỗ trợ thông qua bộ đệm bên trong bổ sung để giảm thiểu truyền dữ liệu trung gian đến SRAM.
- Bộ giải mã trọng số của Ethos-U85 đã được cải tiến hiệu quả hơn. Sự kết hợp của chuỗi toán tử, bộ giải mã trọng số nhanh mới và hiệu quả cải thiện của mảng MAC góp phần vào 20% cải thiện tổng thể về hiệu quả năng lượng.
- Chuỗi công cụ Ethos hiện có của Arm, bao gồm trình biên dịch Vela, sẽ hỗ trợ U85. Nó sử dụng TensorFlowLite cho thời gian chạy vi điều khiển hiện tại, với kế hoạch hỗ trợ ExecuTorch (thời gian chạy PyTorch).
- Nền tảng tham chiếu của Arm cho Ethos-U85, Corstone-320, dành cho các ứng dụng AI cạnh như thị giác, giọng nói, âm thanh.
- Khách hàng có thể thử nghiệm các mô hình AI tạo sinh bằng cách sử dụng các mô phỏng phần cứng ảo của Arm ngay hôm nay, với Ethos-U85 dự kiến sẽ có mặt trên thị trường silicon vào năm 2025.
📌 Ethos-U85 của Arm mang các phép biến đổi đến thiết bị IoT, hỗ trợ các mô hình AI tạo sinh như ViT-Tiny và TinyLlama-1.1B. Với hiệu năng gấp 4 lần và tiết kiệm năng lượng 20% so với thế hệ trước, U85 đánh dấu bước tiến quan trọng trong việc triển khai AI tạo sinh trên các thiết bị nhúng. Tuy nhiên, việc áp dụng transformer trong IoT vẫn còn ở giai đoạn đầu và mức độ áp dụng khác nhau rất lớn giữa các thị trường.
Citations:
[1] https://www.eetimes.com/arm-brings-transformers-to-iot-devices/
- Trong vài tuần qua, tác giả đã thử nghiệm trợ lý ảo AI tích hợp trong kính thông minh Ray-Ban của Meta.
- Trợ lý này được kích hoạt bằng lệnh thoại "Hey Meta", có khả năng trả lời các câu hỏi hoặc nhận diện vật thể trong tầm nhìn của người dùng.
- Mặc dù chưa hoàn hảo, nhưng những lúc trợ lý hoạt động đúng đã đưa người dùng đến lãnh địa của sự đổi mới trong tương lai.
- Ban đầu, Meta không dự đoán vai trò quan trọng của AI tạo sinh trong kính thông minh của họ.
- Trong một cuộc phỏng vấn vào mùa thu năm ngoái, CEO Mark Zuckerberg đã giới thiệu AI đa phương thức này như một "chiều kích hoàn toàn mới" cho kính thông minh.
- Ông gợi ý rằng tính năng này có thể vượt qua cả "hình ảnh hologram siêu chất lượng" để trở thành điểm nổi bật nhất của sản phẩm.
📌 Meta đang dẫn đầu cuộc đua công nghệ đeo AI với kính thông minh Ray-Ban tích hợp trợ lý ảo đa phương thức, có khả năng trả lời câu hỏi và nhận diện vật thể. CEO Mark Zuckerberg coi đây là một chiều kích hoàn toàn mới, thậm chí có thể vượt trội hơn cả công nghệ hologram.
Citations:
[1] https://www.theverge.com/2024/5/3/24148513/meta-rayban-smart-glasses-ai-wearable-race
- Sam Altman, CEO của OpenAI, trong một cuộc phỏng vấn với MIT Technology Review, đã bày tỏ quan điểm rằng tương lai của AI có thể không yêu cầu phần cứng mới.
- Ông Altman cho biết các ứng dụng AI tương lai có thể hoạt động trên nền tảng đám mây mà không cần thiết bị riêng biệt, giúp người dùng tiếp cận AI một cách dễ dàng hơn.
- Dù có tin đồn về việc phát triển thiết bị AI riêng, Altman khẳng định rằng việc tạo ra phần cứng mới cho công nghệ không phải là chuyên môn của ông.
- Các sản phẩm phần cứng AI gần đây như Humane's AI Pin đã nhận được nhiều ý kiến trái chiều, với những đánh giá không mấy tích cực từ các nhà phê bình công nghệ.
- Altman đã mô tả ứng dụng AI tương lai như một "đồng nghiệp siêu năng lực, biết mọi thứ về cuộc sống của tôi, từng email, từng cuộc trò chuyện mà tôi đã từng tham gia" nhưng vẫn giữ được tính độc lập, không phải là một phần mở rộng của bản thân người dùng.
- Trong khi đó, các cuộc thảo luận với Jony Ive và Masayoshi Son về việc phát triển sản phẩm AI mới cho thấy OpenAI vẫn đang tìm kiếm các hướng đi mới cho công nghệ AI.
📌 Sam Altman, CEO của OpenAI, trong cuộc phỏng vấn với MIT Technology Review, đã bày tỏ quan điểm rằng tương lai của AI có thể không cần thiết bị mới. Ông nhấn mạnh rằng các ứng dụng AI có thể tồn tại trên đám mây, giúp người dùng tiếp cận công nghệ một cách dễ dàng hơn mà không cần đến phần cứng riêng biệt.
https://www.businessinsider.com/sam-altman-ai-device-hardware-agents-openai-future-2024-5
- Nhóm nghiên cứu từ Đại học Washington đã phát triển một ống nghe thông minh sử dụng Raspberry Pi và AI để phát hiện bệnh tim từ âm thanh tim.
- Thiết bị này ghi lại âm thanh tim, sau đó sử dụng thuật toán AI để phân tích và phát hiện các dấu hiệu bất thường.
- Ống nghe thông minh có thể giúp chẩn đoán sớm các vấn đề về tim mạch, đặc biệt hữu ích ở các khu vực thiếu bác sĩ chuyên khoa.
- Nhóm nghiên cứu đã huấn luyện mô hình AI trên 1.000 bản ghi âm tim, bao gồm cả những trường hợp bình thường và bất thường.
- Kết quả thử nghiệm cho thấy thiết bị có độ chính xác 87% trong việc phát hiện các vấn đề về tim.
- Ống nghe sử dụng Raspberry Pi 4 với 4GB RAM và bộ chuyển đổi tín hiệu analog-sang-số để ghi âm tim.
- Dữ liệu âm thanh được xử lý bởi một mạng neural tích chập (CNN) được triển khai trên Raspberry Pi.
- Thiết bị có thể hoạt động với pin và không cần kết nối internet, giúp sử dụng được ở các khu vực hẻo lánh.
- Nhóm nghiên cứu hy vọng sẽ cải thiện độ chính xác của thiết bị lên 95% trước khi triển khai rộng rãi.
- Ống nghe thông minh này có tiềm năng cách mạng hóa việc chẩn đoán bệnh tim, đặc biệt ở các nước đang phát triển.
📌 Ống nghe thông minh sử dụng Raspberry Pi và AI, với độ chính xác 87%, hứa hẹn cách mạng hóa việc phát hiện sớm bệnh tim ở các khu vực thiếu bác sĩ chuyên khoa, góp phần cải thiện sức khỏe cộng đồng toàn cầu.
- Apple giới thiệu OpenELM (Open-source Efficient Language Models) gồm 8 mô hình ngôn ngữ lớn (LLMs) hoạt động trực tiếp trên thiết bị thay vì dựa vào máy chủ đám mây.
- Các mô hình OpenELM đã có trên nền tảng chia sẻ mã nguồn AI Hugging Face Hub.
- Theo white paper, Apple sử dụng 2 loại mô hình OpenELM: 4 mô hình pre-trained bằng thư viện CoreNet và 4 mô hình instruction-tuned.
- Apple áp dụng chiến lược layer-wise scaling để tăng cường độ chính xác và hiệu quả.
- Ngoài mô hình cuối cùng, Apple còn cung cấp mã nguồn, log huấn luyện và nhiều phiên bản khác nhau.
- Các nhà nghiên cứu kỳ vọng cách tiếp cận này sẽ thúc đẩy tiến bộ và mang lại "kết quả đáng tin cậy hơn" trong lĩnh vực AI ngôn ngữ tự nhiên.
- OpenELM phá vỡ thông lệ trước đây khi chỉ chia sẻ trọng số mô hình và mã suy luận, huấn luyện trên bộ dữ liệu độc quyền. Giờ đây, Apple chia sẻ toàn bộ framework để huấn luyện và đánh giá mô hình trên bộ dữ liệu công khai.
- Apple phát hành OpenELM nhằm "làm giàu và trao quyền cho cộng đồng nghiên cứu mở" với các mô hình ngôn ngữ tiên tiến. Nhà nghiên cứu có thể khám phá rủi ro, dữ liệu và độ chệch. Nhà phát triển và công ty có thể tùy chỉnh mô hình theo nhu cầu.
- Việc Apple chia sẻ thông tin mở đã trở thành công cụ quan trọng để thu hút các kỹ sư, nhà khoa học và chuyên gia hàng đầu, tạo cơ hội cho các nghiên cứu trước đây không thể thực hiện dưới chính sách bảo mật của Apple.
📌 Apple đã giới thiệu OpenELM với 8 mô hình ngôn ngữ lớn mã nguồn mở chạy trực tiếp trên thiết bị. Việc chia sẻ toàn bộ framework huấn luyện trên dữ liệu công khai đánh dấu bước đột phá so với trước đây, hứa hẹn thúc đẩy nghiên cứu AI và thu hút nhân tài về Apple.
Citations:
[1] https://www.macrumors.com/2024/04/24/apple-ai-open-source-models/
- Axon, nhà sản xuất taser và nhà thầu cảnh sát, đã giới thiệu sản phẩm mới có tên "Draft One", một hệ thống AI được thiết kế để tạo báo cáo cảnh sát từ các bản ghi âm âm thanh của camera thân thể.
- Theo Forbes, việc áp dụng công nghệ AI này đặt ra những mối quan ngại đáng kể về các định kiến và sai sót tiềm ẩn trong các cơ quan thực thi pháp luật, có thể làm trầm trọng thêm các vấn đề như định kiến chủng tộc trong các sở cảnh sát.
- Các mô hình AI có xu hướng "ảo tưởng" về các sự kiện, dẫn đến hỗn loạn tiềm tàng và các cáo buộc vô căn cứ. Dave Maass, giám đốc điều tra công nghệ giám sát của Electronic Frontier Foundation, đã bày tỏ lo ngại về việc cảnh sát sử dụng công nghệ này mà không có chuyên môn về AI.
- Rick Smith, CEO của Axon, cho biết "Draft One", dựa trên mô hình ngôn ngữ lớn GPT-4 của OpenAI, có thể giúp các sĩ quan tiết kiệm thời gian bằng cách giảm nhu cầu viết các báo cáo dài.
- Noah Spitzer-Williams, quản lý sản phẩm AI chính tại Axon, giải thích rằng họ đã "tắt tính sáng tạo" của mô hình để giảm thiểu rủi ro sai sót và ảo tưởng. Mọi thứ mà nó tạo ra chỉ dựa trên bản ghi âm đó mà thôi.
- Mặc dù Axon khẳng định đã điều chỉnh mô hình AI để giảm thiểu rủi ro sai lầm, sự hợp tác giữa thực thi pháp luật và công nghệ AI vẫn chưa được chấp nhận rộng rãi. Người dùng mạng xã hội đã bày tỏ sự phẫn nộ về sản phẩm mới này, lo ngại về các lỗi tiềm tàng và ảnh hưởng đến đời sống của mọi người.
📌 Axon giới thiệu "Draft One", hệ thống AI tự động tạo ra báo cáo của cảnh sát từ ghi âm camera đeo người, gây lo ngại về định kiến và sai sót. Mô hình dựa trên GPT 4, được điều chỉnh để giảm sai lầm, nhưng vẫn còn nhiều tranh cãi về độ tin cậy và ảnh hưởng xã hội của nó.
Citations:
[1] https://futurism.com/police-ai-generates-police-reports-body-cam-footage
- Máy ảnh thơ ca (Poetry Camera) là sáng chế của hai kỹ sư Kelin Zhang và Ryan Mather. Thay vì tạo ra ảnh kỹ thuật số, nó sản sinh ra một bài thơ về những gì nó nhìn thấy.
- Máy ảnh sử dụng board Raspberry Pi kết nối với mô hình GPT-4 của OpenAI để tạo thơ khi chụp ảnh.
- Các thuật toán thị giác máy tính sẽ phân tích dữ liệu hình ảnh, nghiên cứu các yếu tố chính, màu sắc, hoa văn và cảm xúc trong khung hình, trước khi chuyển sang quá trình sinh thơ.
- Những người quan tâm có thể tự xây dựng máy ảnh thơ ca của riêng mình bằng cách lấy các tệp cần thiết trên Github.
- Tác giả bài viết thừa nhận kiến thức hạn chế của mình về việc xây dựng máy ảnh thơ ca AI.
📌 Máy ảnh thơ ca sử dụng AI và thị giác máy tính để phân tích hình ảnh và tạo ra thơ ca thay vì ảnh chụp. Sáng chế độc đáo này kết hợp board Raspberry Pi với mô hình GPT-4, cho phép người dùng tự xây dựng thiết bị của riêng mình thông qua mã nguồn trên Github.
Citations:
[1] https://technabob.com/ai-powered-poetry-camera-creates-poems-instead-of-photos/
- Timekettle X1 AI Interpreter Hub là thiết bị dịch thuật cầm tay sử dụng AI, hỗ trợ tới 40 ngôn ngữ và 93 giọng nói, với khả năng mở rộng trong tương lai.
- Thiết bị hoạt động độc lập, có thể dịch offline cho một số ngôn ngữ, hỗ trợ dịch qua loa ngoài hoặc tai nghe.
- Mỗi hub có một số điện thoại riêng để gọi trực tiếp, đảm bảo bảo mật và mã hóa đầu cuối.
- X1 hub có thiết kế hình khối chữ nhật, dễ cầm và sử dụng bằng một tay với màn hình cảm ứng 3.4 inch, các nút điều khiển, cổng sạc USB-C, loa, điểm kết nối dock và NFC.
- Tai nghe đi kèm có thiết kế nửa trong tai, dễ sử dụng và tránh rơi rớt.
- X1 hub có nhiều chế độ sử dụng như One-on-One, Listen & Play, Ask & Go và Voice Call, phù hợp với các tình huống giao tiếp khác nhau.
- Tính năng dịch thuật của X1 AI Hub dựa trên hai mô hình ngôn ngữ: TurboFast cho phép dịch đồng thời từng từ và BoostClean giúp triệt tiêu tiếng ồn nền.
- Các mô hình dữ liệu được cập nhật phía máy chủ, đảm bảo thiết bị luôn hiệu quả và chính xác.
- Tuy nhiên, X1 AI Interpreter Hub vẫn có một số hạn chế như lặp lại cụm từ, dịch không đúng ngữ cảnh và giá thành cao.
📌 Timekettle X1 AI Interpreter Hub là thiết bị dịch thuật cầm tay tiên tiến, hỗ trợ 40 ngôn ngữ, 93 giọng nói với nhiều chế độ sử dụng linh hoạt. Sử dụng AI và hai mô hình TurboFast, BoostClean, thiết bị đảm bảo dịch thuật chính xác, đồng thời triệt tiêu tiếng ồn. Tuy nhiên, giá thành cao và một số hạn chế về ngữ cảnh là điểm cần cải thiện.
Citations:
[1] https://www.digitaltrends.com/mobile/this-ai-gadget-timekettle-x1-let-me-speak-in-languages-i-dont-know/
- Logitech giới thiệu Logi AI Prompt Builder, phần mềm miễn phí tích hợp phím tắt truy cập ChatGPT vào chuột và bàn phím của hãng.
- Thay vì thêm phím vật lý mới, Logitech cho phép người dùng tạo phím tắt tùy chỉnh để mở cửa sổ Logi AI Prompt Builder khi cần trợ giúp từ ChatGPT.
- Logi AI Prompt Builder đưa ra các gợi ý truy vấn dựa trên văn bản mà người dùng đang soạn thảo, giúp họ dễ dàng tận dụng sức mạnh của AI.
- Phần mềm này miễn phí cho người dùng chuột và bàn phím Logitech tương thích với ứng dụng Logi + Option, bao gồm các dòng phổ biến như MX, Ergo, Signature và Studio Series.
- Ngoài ra, Logitech cũng ra mắt chuột không dây mới Signature AI Edition Mouse với nút nhấn để mở Logi AI Prompt Builder.
- Logitech dự kiến sẽ cung cấp Logi AI Prompt Builder cho nhiều ngôn ngữ và khu vực khác trong tương lai gần.
📌 Logitech mang đến giải pháp sáng tạo để tích hợp trợ lý AI vào chuột và bàn phím thông qua phần mềm Logi AI Prompt Builder miễn phí, cho phép người dùng dễ dàng truy cập ChatGPT mà không cần nâng cấp phần cứng, đồng thời giới thiệu chuột Signature AI Edition Mouse với nút nhấn chuyên dụng.
Citations:
[1] Logitech mouse and keyboard users are getting a free AI upgrade https://www.zdnet.com/article/logitech-mouse-and-keyboard-users-you-are-about-to-get-a-free-ai-upgrade/
- Limitless Pendant là thiết bị đeo AI mới dạng huy hiệu hoặc dây đeo cổ, có thể ghi âm liên tục mọi thứ người dùng nghe được và dùng AI để ghi nhớ, phân tích nội dung.
- Thiết bị này là một phần của hệ thống Limitless mà công ty vừa ra mắt, được đặt tên theo bộ phim cùng tên.
- Trước đó, sản phẩm AI Rewind của Limitless ghi lại mọi hoạt động trên máy tính để giúp người dùng ghi nhớ. Limitless Pendant mở rộng khả năng ghi nhớ ra ngoài máy tính.
- Thiết bị sử dụng công nghệ định hướng chùm tia để ghi âm rõ người nói chuyện trực tiếp, loại bỏ tạp âm xung quanh. Pin của thiết bị kéo dài 100 giờ.
- Limitless Pendant có đèn LED báo hiệu khi đang ghi âm. Nó cũng có "Chế độ đồng ý" phát hiện giọng nói mới và chỉ ghi âm khi được sự cho phép. Chế độ này mặc định bị tắt.
- Mọi bản ghi âm được tải lên Limitless, kết hợp với dữ liệu khác và truy cập được qua ứng dụng.
- Tờ The New York Times nhận xét thiết bị đeo này rất thú vị và kỳ vọng vào tương lai của nó.
📌 Limitless Pendant là thiết bị đeo AI mới có thể ghi âm liên tục các cuộc hội thoại và sử dụng trí tuệ nhân tạo để tóm tắt nội dung, nhắc nhở công việc. Thiết bị pin 100 giờ, có đèn báo ghi âm và chế độ xin phép ghi âm giọng nói mới. Tất cả dữ liệu được đồng bộ lên nền tảng Limitless. The New York Times đánh giá cao tiềm năng của thiết bị đeo thông minh này.
Citations:
[1] https://www.theverge.com/2024/4/15/24130832/limitless-ai-pendant-wearable-meetings
- Google giới thiệu RecurrentGEMM, một mô hình ngôn ngữ AI tiên tiến có thể triển khai trên các thiết bị biên với tài nguyên hạn chế như điện thoại di động và máy tính bảng.
- RecurrentGEMM sử dụng kiến trúc mới gọi là "recurrent GEMM" (GEneral Matrix Multiplication - nhân ma trận tổng quát), cho phép mô hình đạt hiệu suất cao với kích thước nhỏ gọn.
- Mô hình này được huấn luyện trên tập dữ liệu khổng lồ 1,5 nghìn tỷ token, bao gồm các trang web công khai và sách, giúp nó có khả năng hiểu và tạo ra ngôn ngữ tự nhiên ở trình độ cao.
- RecurrentGEMM chỉ nặng 20MB, nhỏ hơn đáng kể so với các mô hình ngôn ngữ khác như GPT-3 (175B) hay PaLM (540B), nhưng vẫn đạt được hiệu suất tương đương trên nhiều tác vụ xử lý ngôn ngữ tự nhiên.
- Với RecurrentGEMM, người dùng có thể trải nghiệm AI tương tác tự nhiên ngay trên thiết bị của mình mà không cần kết nối internet liên tục, đảm bảo quyền riêng tư và bảo mật dữ liệu.
- Google đã thử nghiệm RecurrentGEMM trên nhiều ứng dụng như chatbot, trợ lý ảo, dịch thuật, tóm tắt văn bản, và đạt kết quả rất khả quan.
- Trong tương lai, công nghệ này hứa hẹn sẽ mở ra nhiều khả năng ứng dụng mới cho AI trên các thiết bị biên, từ điện thoại, máy tính bảng, đến cả robot, xe tự lái.
📌 RecurrentGEMM của Google là một bước tiến lớn trong việc đưa AI ngôn ngữ tiên tiến lên các thiết bị biên. Với kích thước chỉ 20MB nhưng hiệu suất cao, mô hình này hứa hẹn mang đến trải nghiệm AI tương tác tự nhiên, bảo mật ngay trên thiết bị cho hàng tỷ người dùng.
Citations:
[1] https://venturebeat.com/ai/googles-recurrentgemma-brings-advanced-language-ai-to-edge-devices/
- Theo các chuyên gia của IBM và Dell, các doanh nghiệp cần đánh giá nỗ lực triển khai AI và cân nhắc lợi ích của việc triển khai tại chỗ hoặc trên đám mây.
- John Roese, Giám đốc Công nghệ Toàn cầu của Dell cho rằng nếu hơn 50% năng lực CNTT của doanh nghiệp phục vụ cho công nghệ dựa trên AI, cần phải xây dựng lại toàn bộ kiến trúc CNTT và tối ưu hóa cho AI.
- Theo Bloomberg Intelligence, AI tạo sinh dự kiến sẽ tạo ra 1.3 nghìn tỷ USD doanh thu và mở rộng tác động từ dưới 1% lên 10% tổng chi tiêu cho phần cứng, phần mềm, dịch vụ CNTT, quảng cáo và gaming vào năm 2032.
- Các doanh nghiệp có thể lựa chọn triển khai AI tạo sinh hoàn toàn trên đám mây công cộng, mang lại lợi ích cho các nhà cung cấp như Meta, Microsoft và Amazon.
- Tuy nhiên, các chuyên gia CNTT cho rằng triển khai AI tùy chỉnh trên phần cứng sở hữu hoặc thuê có thể mang lại lợi ích về chi phí và khả năng tiếp cận.
- Việc sử dụng đám mây công cộng có thể khiến doanh nghiệp phải trả phí cho mỗi giao dịch AI, dẫn đến chi phí cao hơn.
📌 AI tạo sinh được dự báo tạo ra 1,3 nghìn tỷ USD doanh thu vào năm 2032. Các chuyên gia IBM và Dell khuyến nghị doanh nghiệp cân nhắc triển khai AI tại chỗ để tối ưu hóa cơ sở hạ tầng CNTT, giảm chi phí so với sử dụng đám mây công cộng nếu AI chiếm hơn 50% năng lực CNTT.
Citations:
[1] https://www.itbrew.com/stories/2024/04/12/ibm-dell-pros-consider-on-prem-options-for-generative-ai
- NUCA là một máy ảnh nguyên mẫu in 3D và dự án nghệ thuật sử dụng AI để tự động tạo ra ảnh khỏa thân của bất kỳ ai trong vòng 10 giây.
- Dự án này nhằm khơi gợi và đặt câu hỏi về quỹ đạo hiện tại của AI tạo sinh trong việc tái tạo hình ảnh cơ thể.
- NUCA sử dụng bộ phân loại tùy chỉnh để phân tích ảnh và mô tả đối tượng, sau đó tạo ra lời nhắc để nạp vào công cụ tạo ảnh AI Stable Diffusion, kết hợp với mô hình từ Civitai để tạo ra ảnh khỏa thân.
- Máy ảnh cũng sử dụng công cụ hoán đổi khuôn mặt nguồn mở để thêm khuôn mặt từ ảnh chụp vào ảnh do AI tạo ra.
- Toàn bộ quá trình từ khi máy ảnh chụp ảnh đến khi tạo ra ảnh khỏa thân mất khoảng 10 giây, có thể tối ưu hóa xuống còn 5 giây.
- Các video quảng cáo giả và hình ảnh trên trang web NUCA được thiết kế như một sự châm biếm về quảng cáo cho một sản phẩm tiêu dùng thực tế.
- NUCA sẽ được trưng bày trong triển lãm "Uncanny" tại Nüüd ở Berlin vào ngày 29 tháng 6.
- Các phản ứng về dự án này rất đa dạng, từ sốc đến thích thú và muốn chơi với nó.
- NUCA khác với các ứng dụng "cởi đồ" trước đây ở chỗ hình ảnh kết quả hoàn toàn do AI tạo ra thay vì chỉnh sửa ảnh thực bằng AI.
- Máy ảnh thu gọn toàn bộ quá trình tạo ảnh khỏa thân không có sự đồng ý vào một đối tượng duy nhất, đặt người tạo ảnh và người bị "cởi đồ" trong cùng một không gian.
📌 Nuca là một dự án nghệ thuật gây tranh cãi, sử dụng AI để tạo ra ảnh khỏa thân của bất kỳ ai chỉ trong 10 giây. Nó đặt ra câu hỏi về sự đồng thuận, tính công bằng và tác động xã hội của công nghệ này. Mặc dù chỉ là một nguyên mẫu, Nuca cho thấy việc tạo ra deepfake khỏa thân đã trở nên dễ dàng như thế nào.
https://www.404media.co/nuca-camera-turns-every-photo-into-a-nude/
- Tháng 4/2024 đánh dấu sự khởi đầu của kỷ nguyên công nghệ mới với nhiều thiết bị AI ra mắt từ các công ty như Humane, Rabbit, Brilliant, Meta.
- Điểm chung của các thiết bị này là đặt AI làm trung tâm trải nghiệm, giúp xử lý các tác vụ chỉ thông qua giọng nói hay hình ảnh.
- Mặc dù chưa thể thay thế hoàn toàn smartphone, nhưng các thiết bị AI hứa hẹn giảm ma sát tương tác, tối ưu hóa trải nghiệm người dùng tốt hơn.
- Tiềm năng của AI là loại bỏ các bước trung gian phức tạp, chỉ cần ra lệnh là hệ thống tự động thực hiện mọi thứ.
- Tuy nhiên, cách tiếp cận AI cũng đặt ra nhiều thách thức như độ tin cậy của AI, sự nhầm lẫn khi tự động hóa quá nhiều thứ.
- Giải pháp tốt nhất hiện nay là kết hợp ứng dụng web để quản lý tài khoản, lịch sử, cài đặt và màn hình phụ để kiểm tra, can thiệp vào quá trình xử lý của AI.
- Tương tự như thời kỳ đầu của điện thoại di động, các thiết bị AI mới sẽ thử nghiệm đa dạng thiết kế, tính năng trước khi tìm ra công thức hoàn hảo như iPhone sau này.
- Thay vì một giao diện chuẩn hóa, tiềm năng của AI là không cần bất kỳ giao diện nào. Thời gian tới sẽ là kỷ nguyên hỗn loạn nhưng thú vị của các thiết bị AI.
📌 Kỷ nguyên thiết bị AI đã bắt đầu từ tháng 4/2024 với sự ra mắt của hàng loạt sản phẩm từ Humane, Rabbit, Brilliant, Meta. Mặc dù chưa hoàn hảo và đặt ra nhiều thách thức, nhưng các thiết bị này hứa hẹn cách mạng hóa trải nghiệm người dùng nhờ sức mạnh của AI, mở ra tương lai công nghệ mới đầy hỗn loạn nhưng thú vị.
Citations:
[1] https://www.theverge.com/24117865/ai-gadget-era-humane-rabbit-brilliant-meta
- Microsoft đang thử nghiệm chatbot AI có tên "Xbox Support Virtual Agent" để tự động hóa các tác vụ hỗ trợ trên Xbox.
- Chatbot này có thể trả lời các câu hỏi và xử lý hoàn tiền trò chơi từ trang web hỗ trợ của Microsoft.
- Microsoft đã mở rộng quy mô thử nghiệm chatbot Xbox, cho thấy khả năng trong tương lai nó có thể xử lý các yêu cầu hỗ trợ cho tất cả khách hàng Xbox.
- Chatbot Xbox tương tự như những gì Microsoft khuyến khích khách hàng xây dựng để tự động hóa các tác vụ hỗ trợ thông qua Azure AI Bot Service.
- Microsoft cũng đang nỗ lực mang các tính năng và công cụ AI đến nền tảng Xbox và công cụ dành cho nhà phát triển.
- Điều này bao gồm thử nghiệm nghệ thuật và tài sản do AI tạo ra cho trò chơi, kiểm thử trò chơi bằng AI và các NPC sử dụng AI tạo sinh.
- Microsoft đang cân nhắc xây dựng Copilots hỗ trợ AI cho các tác vụ an toàn và kiểm duyệt, bao gồm kiểm duyệt nội dung trên nền tảng Xbox.
- Họ cũng đang tìm cách thêm trợ lý AI vào trò chơi, cung cấp cách để người chơi nhận trợ giúp trong khi chơi.
- Microsoft đang thận trọng trong việc công khai thừa nhận các nỗ lực AI rộng lớn hơn cho Microsoft Gaming.
- CEO Satya Nadella đang thúc đẩy tất cả các bộ phận kinh doanh của công ty suy nghĩ về cách AI có thể được sử dụng trong sản phẩm và dịch vụ.
- Microsoft gợi ý về một thế hệ Xbox tiếp theo siêu mạnh, hứa hẹn "bước nhảy vọt kỹ thuật lớn nhất mà bạn từng thấy trong một thế hệ phần cứng".
📌 Microsoft đang thử nghiệm chatbot AI trên Xbox để tự động hóa hỗ trợ khách hàng, đồng thời nỗ lực mang AI vào nền tảng Xbox và công cụ dành cho nhà phát triển. Mặc dù thận trọng, Microsoft đang hướng tới tương lai của gaming với AI, hứa hẹn những bước tiến đáng kể trong thế hệ Xbox tiếp theo.
https://www.theverge.com/2024/4/2/24118728/microsoft-xbox-ai-chatbot-testing
- Công ty Trung Quốc Intellifusion đã ra mắt hộp AI mới "DeepEye" với chip DeepEdge10 Max tích hợp.
- Chip DeepEdge10 Max được sản xuất trên quy trình 14nm, có cấu hình chiplet với giao diện D2D và sử dụng kiến trúc RISC-V nội địa.
- Hộp AI DeepEye đầu tiên sẽ trang bị chip DeepEdge10Max, hứa hẹn mang lại khả năng tính toán AI 48 TOPS trên hiệu năng huấn luyện INT8.
- Phiên bản tiếp theo dự kiến ra mắt vào nửa đầu năm 2025 sẽ sử dụng chip DeepEdge10Ultra mạnh mẽ hơn, dự kiến cung cấp 96 TOPS.
- Một thiết bị nhẹ cũng được lên kế hoạch ra mắt trong những tháng tới, sử dụng chip DeepEdge10Pro, cung cấp 24 TOPS.
- Intellifusion không phải là một công ty mới trên thị trường Trung Quốc vì đã hợp tác với chính quyền địa phương trong nhiều dự án phúc lợi dân sự, chủ yếu liên quan đến khả năng AI.
- Đây là lần đầu tiên họ tham gia vào thị trường tiêu dùng với mức giá hấp dẫn, lô hộp AI DeepEye đầu tiên được cho là có giá khoảng 1.000 nhân dân tệ.
- Với mức giá này, Intellifusion tin rằng họ cung cấp giải pháp cạnh tranh hơn 90% so với các lựa chọn thay thế chủ yếu bao gồm GPU và có giá cao hơn nhiều.
- Công ty sẽ nhắm mục tiêu sản phẩm của mình đến người dùng doanh nghiệp cấp thấp và trung bình, đáp ứng nhu cầu về sức mạnh tính toán AI ở cấp độ này.
📌 Intellifusion, một công ty Trung Quốc, đã ra mắt hộp AI "DeepEye" với chip DeepEdge10 Max 48 TOPS, cấu hình chiplet và kiến trúc RISC-V nội địa. Công ty đặt mục tiêu cung cấp giải pháp AI giá rẻ, cạnh tranh hơn 90% so với GPU, nhắm đến khách hàng doanh nghiệp cấp thấp và trung bình.
https://wccftech.com/chinese-ai-firm-unveils-deepeye-ai-box-featuring-up-to-48-tops-affordable-designs/
- Apple đang trong quá trình đàm phán tích cực với Google để tích hợp công nghệ AI Gemini vào iPhone và cũng cân nhắc sử dụng ChatGPT của OpenAI.
- CEO Tim Cook đã xác nhận rằng Apple đang dành "một lượng thời gian và công sức đáng kể" cho các tính năng trí tuệ nhân tạo và dự định sẽ giới thiệu chúng cho khách hàng "vào cuối năm nay".
- Báo cáo từ Bloomberg cho biết các tính năng AI được tích hợp vào sản phẩm của Apple có thể sẽ được cung cấp bởi sự kết hợp giữa các mô hình AI của chính Apple và bên thứ ba. Các mô hình của Apple có thể hỗ trợ AI tạo sinh trên thiết bị với iOS 18, trong khi các tính năng AI dựa trên đám mây như tạo văn bản và hình ảnh có thể thông qua hợp tác với Google.
- Trước đó, Samsung đã thêm một loạt tính năng AI mang thương hiệu Galaxy AI vào điện thoại thông minh Galaxy S24 của mình, được hỗ trợ bởi công nghệ AI của Google. Công nghệ AI của Google cũng xuất hiện nổi bật trên thiết bị Pixel 8 của chính họ.
- Apple đã có một thỏa thuận lâu dài với Google để đặt Google Search làm mặc định trên thiết bị của mình, với giá trị ước tính lên đến 18 tỷ USD hàng năm. Tuy nhiên, các thỏa thuận như vậy ngày càng trở nên gây tranh cãi với các cơ quan quản lý.
- Một thỏa thuận AI giữa Apple và Google có thể mở rộng tầm với của công cụ AI của Google đến hơn 2 tỷ iPhone mà Apple hiện có trên thị trường. Tuy nhiên, Bloomberg lưu ý rằng điều này có thể được xem là sự nhượng bộ từ phía Apple, thừa nhận công nghệ AI tạo sinh của riêng họ đang tụt hậu so với các đối thủ.
- Các nhân viên của Apple được cho là đã thử nghiệm một chatbot nội bộ có tên là Apple GPT, và công ty được cho là có một mô hình ngôn ngữ lớn được mã hóa là Ajax, nhưng công nghệ AI của Apple được cho là kém tiên tiến hơn so với các đối thủ.
📌 Apple đang xem xét một bước đi lớn trong lĩnh vực AI bằng cách thảo luận với Google về việc tích hợp công nghệ AI Gemini vào iPhone và cũng cân nhắc sử dụng ChatGPT của OpenAI. điều này có thể được xem là sự nhượng bộ từ phía Apple, thừa nhận công nghệ AI tạo sinh của riêng họ đang tụt hậu so với các đối thủ.
https://www.theverge.com/2024/3/18/24104626/apple-license-google-gemini-generative-ai-openai-chatgpt
- Một nhóm kỹ sư UCLA đã phát minh ra một thiết bị mềm, mỏng, có thể kéo dài chỉ hơn 1 inch vuông có thể gắn vào da bên ngoài cổ họng để giúp những người bị rối loạn dây thanh âm lấy lại chức năng giọng nói.
- Hệ thống sinh học điện tử mới này có thể phát hiện chuyển động trong cơ thanh quản và chuyển đổi tín hiệu thành giọng nói có thể nghe được với sự trợ giúp của công nghệ học máy, đạt độ chính xác gần 95%.
- Thiết bị nhỏ gọn này bao gồm hai thành phần: một thành phần cảm biến tự cấp nguồn phát hiện và chuyển đổi tín hiệu do chuyển động cơ tạo ra thành tín hiệu điện có độ trung thực cao, có thể phân tích được; và một thành phần kích hoạt biến những tín hiệu giọng nói đó thành biểu hiện giọng nói mong muốn.
- Thiết bị này có kích thước 1.2 inch mỗi bên, nặng khoảng 7 gram và chỉ dày 0.06 inch. Nó có thể dễ dàng dính vào cổ họng của một người gần vị trí dây thanh âm và có thể tái sử dụng bằng cách dán lại băng dính sinh học khi cần thiết.
- Các rối loạn giọng nói phổ biến ở mọi lứa tuổi và nhóm nhân khẩu học; nghiên cứu cho thấy gần 30% người sẽ gặp ít nhất một rối loạn như vậy trong đời. Tuy nhiên, với các phương pháp điều trị, quá trình phục hồi giọng nói có thể kéo dài từ 3 tháng đến 1 năm.
- Trong các thử nghiệm, nhóm nghiên cứu đã thử nghiệm công nghệ đeo được trên 8 người lớn khỏe mạnh. Họ thu thập dữ liệu về chuyển động cơ thanh quản và sử dụng thuật toán học máy để tương quan các tín hiệu kết quả với một số từ nhất định. Độ chính xác dự đoán tổng thể của mô hình là 94.68%.
📌 Thiết bị đeo mới sử dụng AI có thể giúp những người mất giọng nói do rối loạn dây thanh âm giao tiếp trở lại với độ chính xác gần 95%. Công nghệ tiên tiến này mang lại giải pháp không xâm lấn, tiện lợi cho bệnh nhân trong giai đoạn trước và sau điều trị, thay thế các phương pháp phục hồi giọng nói truyền thống tốn thời gian từ 3-12 tháng.
https://www.eurasiareview.com/16032024-speaking-without-vocal-cords-thanks-to-new-ai-assisted-wearable-device/
- Aescape, một công ty về robot lối sống, đã mời Mashable trải nghiệm robot massage được hỗ trợ bởi AI tại New York.
- Tác giả ban đầu nghĩ robot massage sẽ chỉ là một thiết bị cầm tay, nhưng hóa ra đó là một chiếc giường massage với cánh tay robot to lớn.
- Với robot, người dùng không cần phải cởi đồ như khi massage bởi con người. Aescape cung cấp đồ thể thao 2 mảnh để mặc trong quá trình massage.
- Người dùng có thể điều chỉnh lực massage theo ý thích thông qua máy tính bảng. Robot có thể massage sâu và mạnh mẽ hơn con người.
- Đôi tay robot không biết mệt mỏi, có thể massage liên tục trong 30 phút mà không cần nghỉ ngơi như con người.
- Trải nghiệm massage bằng robot khiến tác giả cảm thấy thư giãn tuyệt vời, như thể stress tan biến.
- Giá một lần massage 30 phút là 150 USD, tương đương với giá dịch vụ massage cao cấp bởi con người.
📌 Robot massage AI của Aescape mang lại trải nghiệm thư giãn tuyệt vời với đôi tay không biết mệt mỏi, khả năng điều chỉnh lực massage linh hoạt và không phán xét. Dù có giá 150 USD/30 phút, bằng dịch vụ massage cao cấp, nhưng robot hứa hẹn sẽ là đối thủ đáng gờm của các dịch vụ massage truyền thống.
https://mashable.com/article/aescape-ai-robot-massage
- Kính thông minh Ray-Ban của Meta đang được nâng cấp với tính năng Look and Ask mới, biến chúng thành hướng dẫn viên du lịch đeo được.
- CTO của Meta, Andrew Bosworth, đã giới thiệu tính năng mới trên Threads, cho thấy khả năng nhận diện các địa danh nổi tiếng ở San Francisco như Cầu Cổng Vàng, Painted Ladies, Tháp Coit.
- Người dùng đưa ra lệnh như "Look and tell me a cool fact about this bridge", kính sẽ quét khung cảnh phía trước, đối chiếu với cơ sở dữ liệu tri thức của Meta AI (bao gồm cả Bing), và đưa ra thông tin thú vị.
- Các cải tiến khác đang được triển khai như lệnh thoại mới để chia sẻ tương tác Meta AI mới nhất trên WhatsApp và Messenger, điều chỉnh tốc độ đọc của Meta AI.
- Tính năng nhận diện địa danh mới vẫn đang trong giai đoạn beta, có thể chưa hoàn toàn chính xác. Meta đã mở danh sách chờ tham gia beta, nhưng hiện chỉ dành cho người dùng tại Mỹ.
📌 Kính thông minh Meta Ray-Ban đang trở thành hướng dẫn viên du lịch AI với tính năng Look and Ask mới, có thể nhận diện và cung cấp thông tin về các địa danh nổi tiếng. Dù vẫn đang trong giai đoạn beta và chỉ mở cho người dùng Mỹ, đây là một bước tiến thú vị trong việc biến kính thông minh trở nên hữu ích hơn cho du lịch và khám phá.
https://www.techradar.com/computing/virtual-reality-augmented-reality/metas-ray-ban-smart-glasses-are-becoming-ai-powered-tour-guides
• Ứng dụng Seeing AI kết hợp AI tạo sinh GPT-4 Turbo của Azure với khả năng AI Nhận thức Hình ảnh, đảm bảo phản hồi nhanh chóng và chính xác trên bất kỳ smartphone nào có tích hợp các tính năng này.
• Tính năng đọc văn bản thành giọng nói giúp người dùng dễ dàng tiếp cận nội dung văn bản.
• Ứng dụng có nhiều tính năng hữu ích như: đọc mã vạch sản phẩm, mô tả cảnh xung quanh, nhận dạng khuôn mặt và cảm xúc, nhận dạng tiền tệ, xác định màu sắc, chuyển đổi chữ viết tay thành văn bản và phát hiện độ sáng.
• Mặc dù chính xác trong nhiều tình huống, ứng dụng vẫn có hạn chế khi đối mặt với các đối tượng phức tạp hoặc văn bản chuyên ngành như toán học, khoa học.
📌 Ứng dụng Seeing AI của Microsoftkết hợp AI tạo sinh GPT-4 Turbo của Azure với khả năng AI Nhận thức, đọc to văn bản, đọc mã vạch, mô tả cảnh xung quanh, nhận dạng khuôn mặt và cảm xúc, nhận dạng tiền tệ, xác định màu sắc, chuyển đổi chữ viết tay thành văn bản và phát hiện độ sáng
https://www.cryptopolitan.com/microsoft-launches-seeing-ai-app-to-assist/
- Kính thông minh Frame từ Brilliant Labs được cung cấp bởi OpenAI, mang đến khả năng hiển thị thông tin trực tiếp trên kính khi người dùng quan sát môi trường xung quanh.
- Sản phẩm sử dụng màn hình OLED được tích hợp trong kính, có khả năng cung cấp thông tin tức thì, bao gồm nhận dạng và mô tả vật thể, dịch ngôn ngữ nước ngoài, tìm kiếm web AI dựa trên hình ảnh được nhìn thấy, và thậm chí tạo hình ảnh AI (ví dụ: hiển thị sofa của bạn trong một màu sắc khác).
- Giá của kính bắt đầu từ 349 đô la cho phiên bản không cần độ kính và 449 đô la cho phiên bản có độ kính.
- Kính Frame là sản phẩm nguồn mở, cho phép lập trình viên và kỹ sư phát triển các ứng dụng AI của riêng mình.
- Có khả năng sản phẩm này sẽ mở ra một tương lai mới cho việc nhìn và tương tác với thế giới xung quanh thông qua công nghệ trí tuệ nhân tạo.
📌 Kính thông minh Frame từ Brilliant Labs, với sự hỗ trợ của OpenAI, đánh dấu một bước tiến mới trong công nghệ trí tuệ nhân tạo áp dụng vào đời sống hàng ngày. Với màn hình OLED tích hợp và khả năng cung cấp thông tin ngay lập tức từ việc nhận dạng vật thể đến dịch ngôn ngữ, Frame mở ra khả năng tương tác với môi trường xung quanh một cách thông minh và tiện lợi. Giá cả phải chăng với phiên bản không cần độ kính ở mức 349 đô la và phiên bản có độ kính ở mức 449 đô la, cùng với tính năng nguồn mở, khuyến khích sự sáng tạo trong cộng đồng lập trình và kỹ thuật.
Citations:
[1] https://technabob.com/brilliant-labs-frame-ai-powered-eye-glasses/
- Figure, một startup chuyên sản xuất robot humanoid, đã công bố quan hệ đối tác với OpenAI vào ngày 29 tháng 2 năm 2024.
- OpenAI, công ty đứng sau ChatGPT, dự định tích hợp hệ thống trí tuệ nhân tạo của mình vào cơ thể của các robot humanoid thông qua thỏa thuận mới này.
- Figure có trụ sở tại Sunnyvale, California và đã thông báo về việc huy động được 675 triệu đô la vốn đầu tư mạo hiểm.
- Nhóm đầu tư bao gồm nhà sáng lập Amazon Jeff Bezos cùng với Microsoft, nhà sản xuất chip Nvidia và các bộ phận đầu tư mạo hiểm của Amazon, Intel và OpenAI.
- Brett Adcock, CEO của Figure AI, và kỹ sư AI Jenna Reher đã làm việc trên robot humanoid Figure 01 tại cơ sở thử nghiệm của công ty vào ngày 3 tháng 10 năm 2023.
📌 Sự hợp tác giữa Figure và OpenAI đánh dấu một bước tiến quan trọng trong việc kết hợp trí tuệ nhân tạo với robot humanoid, mở ra tiềm năng mới cho ngành công nghệ AI. Với sự hậu thuẫn từ các tên tuổi lớn như Jeff Bezos, Microsoft, Nvidia, cùng các bộ phận đầu tư của Amazon và Intel, Figure có được nguồn lực tài chính đáng kể để thúc đẩy dự án của mình. Việc huy động được 675 triệu đô la vốn đầu tư mạo hiểm cũng phản ánh niềm tin mạnh mẽ của thị trường vào tiềm năng của sự kết hợp giữa AI và robot humanoid, cũng như tầm nhìn của Figure trong tương lai của ngành công nghệ robot.
Citations:
[1] https://apnews.com/article/figure-humanoid-robot-openai-bezos-02ee0bf87ec46021c84646a882133c9a
- Brilliant Labs đã phát triển và ra mắt kính Frame, là loại kính đầu tiên trên thế giới tích hợp trợ lý AI đa chức năng.
- Dự án này nhận được sự hỗ trợ đáng kể từ John Hanke, CEO của Niantic - công ty đã tạo ra Pokémon Go, và đã huy động được 6 triệu USD.
- Nhóm cố vấn và nhà đầu tư của Brilliant Labs bao gồm Coho VC, Brendan Iribe (đồng sáng lập Oculus), Adam Cheyer (đồng sáng lập Siri), và nhiều cá nhân, tổ chức khác.
- Frame không chỉ là một công cụ trợ lý cá nhân mà còn tái định nghĩa khái niệm về công cụ tìm kiếm trong kỷ nguyên kính tăng cường AI, với khả năng kiểm tra giá và nhận diện thông tin bất động sản một cách tức thì.
- Brilliant Labs cam kết với việc phát triển thiết bị nguồn mở, cho phép các nhà phát triển khám phá và chỉnh sửa cả phần cứng và phần mềm của Frame, bao gồm tài liệu sống, mã nguồn mở và sơ đồ phần cứng.
📌 Kính Frame của Brilliant Labs đánh dấu một bước tiến quan trọng trong lĩnh vực công nghệ đeo được, không chỉ với tính năng trợ lý AI đa chức năng mà còn với sự mở cửa cho cộng đồng phát triển. Sự hỗ trợ từ các nhà đầu tư và cố vấn hàng đầu, cùng với cam kết về một nền tảng nguồn mở, cho thấy tiềm năng lớn trong việc cải thiện khả năng tương tác và trải nghiệm của con người với công nghệ. Frame không chỉ là một sản phẩm công nghệ cao cấp mà còn là một bước tiến trong việc hình thành tương lai của công nghệ đeo được, nơi AI và người dùng có thể hợp tác một cách mạch lạc hơn.
Citations:
[1] https://venturebeat.com/games/brilliant-labss-frame-glasses-serve-as-multimodal-ai-assistant/
📌 Tai nghe DEARS, với khả năng dịch thuật thời gian thực chính xác trên 96% trong 138 ngôn ngữ, đang trở thành công cụ không thể thiếu cho bất kỳ ai muốn vượt qua rào cản ngôn ngữ. Với giá khởi điểm ưu đãi khoảng 119 USD, giảm 37% so với giá bán lẻ, và phí dịch vụ hàng năm chỉ 19,9 USD sau năm đầu tiên miễn phí, DEARS không chỉ đảm bảo giao tiếp mượt mà mà còn bảo vệ quyền riêng tư người dùng. Dự án này hứa hẹn thay đổi cách chúng ta tương tác với thế giới đa ngôn ngữ, làm cho việc học hỏi và kết nối văn hóa trở nên dễ dàng hơn bao giờ hết.
📌 Công nghệ AI tạo sinh đang làm thay đổi ngành công nghiệp ô tô với các tính năng mới và trải nghiệm lái xe cá nhân hóa. Từ hệ thống giải trí thông minh đến các trợ lý ảo với khả năng đàm thoại tự nhiên, xe hơi thế hệ tiếp theo hứa hẹn sẽ mang lại sự tiện nghi, an toàn và giải trí tối ưu cho người lái. CES 2024 là bước ngoặt khi nhiều công ty ô tô trình làn các tính năng dựa trên AI, từ Mercedes, Volkswagen đến BMW, và hợp tác với các công ty công nghệ như Amazon và Google, cho thấy hướng đi của ngành công nghiệp này không chỉ dừng lại ở việc nâng cấp phương tiện di chuyển mà còn là trải nghiệm sống động, cá nhân hoá.
📌 Triển lãm CES 2024 đã chứng minh rằng AI không chỉ giới hạn ở các mô hình xe tự lái mà còn mở rộng sang việc cải thiện giao tiếp giữa người lái xe và phương tiện. Với việc Mercedes, Volkswagen, và BMW tích hợp ChatGPT vào hệ thống điều khiển giọng nói, người lái sẽ có trải nghiệm tự nhiên và mượt mà hơn, đồng thời giảm thiểu sự phân tâm và nâng cao an toàn. Các hãng xe lớn như Sony/Honda và Hyundai cũng đang phát triển các ứng dụng AI trong xe hơi, mở ra triển vọng rằng AI sẽ trở thành một phần không thể thiếu trong ngành công nghiệp ô tô. Kỳ vọng này không chỉ đặt ra cho CES 2025 mà còn cho toàn bộ tương lai ngành xe hơi.
📌 Sản phẩm Rabbit R1, ra mắt đầu tiên tại CES 2024, đang tạo nên sức hút mạnh mẽ với giá khởi điểm 199 đô la. Đây là thiết bị điện tử tiêu dùng tích hợp công nghệ AI với giao diện người dùng độc đáo, nhằm cung cấp trải nghiệm tương tác tự nhiên và tiện lợi hơn cho người dùng. Đợt phát hành đầu tiên của Rabbit R1 đã chứng kiến bán hết ngay lập tức 10.000 chiếc, phản ánh nhu cầu mạnh mẽ và sự quan tâm từ công chúng. Với trọng lượng chỉ 115 gram và một ngày đầy đủ pin, cùng việc không yêu cầu phí đăng ký, Rabbit R1 có thể sẽ trở thành một phần không thể thiếu trong cuộc sống hàng ngày. Sự khan hiếm ban đầu có thể làm tăng giá trị của thiết bị và khiến nhiều người càng trông đợi vào các lô hàng tiếp theo.
📌 Ống nhòm thông minh Swarovski AX Visio không chỉ là một bước tiến trong ngành quan sát thiên nhiên với tính năng nhận diện 9000 loài chim nhờ AI mà còn là một tác phẩm thiết kế với sự hợp tác của Marc Newson. Với 390 bộ phận phần cứng, kết hợp hài hòa giữa các tiêu chuẩn bền vững và công nghệ số, AX Visio đại diện cho một hệ thống quan sát động vật hoang dã hiện đại và tiên tiến, dù có giá bán cao ở mức 4.799 USD.
📌 Công ty Rabbit giới thiệu thiết bị di động nhỏ gọn Rabbit R1 tại CES 2024, tích hợp AI với màn hình cảm ứng, nút bấm để nói, bánh xe cuộn analog, micro cho lệnh giọng nói, loa phản hồi và camera Rabbit Eye hỗ trợ Computer Vision quay 360 độ. Rabbit R1 mang lại tiềm năng thay đổi cách chúng ta tương tác với công nghệ thông qua AI, kết hợp giao diện người dùng trực quan với khả năng học hỏi và thực hiện tác vụ phức tạp, đáp ứng nhu cầu người dùng với giá cả phải chăng 199 USD và hứa hẹn cải tiến liên tục thông qua các bản cập nhật tương lai.
📌 Sự bành trướng của AI tạo sinh vào các thiết bị di động qua việc mở rộng Copilot của Microsoft lên iOS và sự xuất hiện của Galaxy AI từ Samsung là những bước tiến quan trọng, đánh dấu sự thâm nhập sâu rộng của AI trong ngành công nghiệp di động. Những đổi mới này không chỉ làm phong phú thêm trải nghiệm người dùng mà còn mở ra cánh cửa mới cho các nhà mạng trong việc phát triển dịch vụ và tạo ra nguồn doanh thu mới thông qua dữ liệu và dịch vụ giọng nói. Tuy nhiên, sự phát triển này cũng kéo theo những thách thức về quản lý dữ liệu và bảo mật, đặc biệt là khi đối mặt với vấn đề deep fakes. Các công ty công nghệ và nhà lập pháp cần làm việc cùng nhau để tạo ra một khuôn khổ pháp lý và đạo đức vững chắc, nhằm tận dụng lợi ích của AI tạo sinh mà vẫn bảo đảm an toàn cho người dùng.
📌 Thị trường TV OLED 8K với AI đang mở rộng, và Samsung đang định hình xu hướng này thông qua việc giới thiệu các sản phẩm mới như QN800D và QN900D, mang đến chất lượng hình ảnh tuyệt vời cùng nhiều tính năng tiên tiến. Các sản phẩm này không chỉ nâng cao trải nghiệm xem phim tại gia mà còn cải thiện đáng kể trải nghiệm chơi game với hỗ trợ VRR 4K 240Hz và AI Motion Enhancer Pro.