Tencent và SenseTime khuấy đảo giới AI với mô hình mới vượt mặt cả GPT-4o và Gemini 2.5

 

  • Tencent ra mắt Hunyuan 3D World Model 1.0, mô hình AI mã nguồn mở đầu tiên có khả năng tạo ra thế giới 3D chi tiết từ văn bản hoặc hình ảnh, hỗ trợ định dạng "3D mesh", phù hợp cho Unity, Unreal và phần mềm dựng hình chuyên nghiệp.

  • Mô hình này hỗ trợ tạo cảnh 3D 360 độ tương tác, đang thử nghiệm phiên bản beta có khả năng di chuyển ảo theo 4 hướng, cùng tính năng xuất ảnh toàn cảnh.

  • Hunyuan sử dụng kiến trúc “biểu diễn và tạo cảnh 3D theo thứ bậc ngữ nghĩa”, chia nhỏ không gian theo tầng lớp ý nghĩa, giúp chỉnh sửa và tạo hiệu ứng chân thực.

  • Tencent công bố khả năng tích hợp hoàn chỉnh với các quy trình đồ họa CG tiêu chuẩn trong phim ảnh và game.

  • SenseTime giới thiệu SenseNova V6.5, mô hình AI đa phương thức mới, vượt qua Google Gemini 2.5 Pro và Claude 4-Sonnet theo một số tiêu chí hiệu năng.

  • So với phiên bản cũ V6, SenseNova V6.5 cải thiện 40% hiệu suất học tăng cường (reinforced learning) và tăng hơn 35% dung lượng xử lý dữ liệu ở giai đoạn suy luận.

  • Mô hình V6.5 xử lý tốt hơn sự tích hợp đa phương thức bao gồm văn bản, hình ảnh và video, thay đổi kiến trúc để nâng cao khả năng xử lý đồng thời.

  • SenseTime cho biết hướng đi tương lai là đầu tư mạnh vào AI tạo sinh và mô hình đa phương thức để thúc đẩy tăng trưởng doanh thu.

  • SenseTime đạt doanh thu 3,8 tỷ nhân dân tệ (khoảng 518 triệu USD) năm 2024, tăng 11%. Lỗ ròng giảm từ 6,5 tỷ xuống còn 4,3 tỷ nhân dân tệ.

  • Tencent ghi nhận quý kinh doanh tốt nhất kể từ khi niêm yết năm 2004, nhờ đầu tư mạnh vào AI và khai thác lĩnh vực game, ứng dụng xã hội.

📌 Tencent và SenseTime đã có bước tiến lớn trong lĩnh vực AI tại WAIC Thượng Hải. Tencent ra mắt mô hình AI 3D mã nguồn mở đầu tiên hỗ trợ môi trường game và phim ảnh, trong khi SenseTime công bố mô hình V6.5 vượt qua Gemini 2.5 Pro và Claude 4-Sonnet, cải thiện 40% học tăng cường và 35% hiệu suất xử lý. Cả hai đều kỳ vọng AI tạo sinh sẽ trở thành nguồn doanh thu chiến lược trong tương lai.

https://www.scmp.com/tech/article/3319751/waic-shanghai-tencent-sensetime-launch-new-ai-models-stir-industry-rivalry

WAIC Shanghai: Tencent, SenseTime launch new AI models to stir up industry rivalry

Big Tech companies are banking on their artificial intelligence businesses to deliver the next wave of revenue streams
 
 
Wency Chenin ShanghaiandAnn Caoin Shanghai
Tencent Holdings and SenseTime launched new artificial intelligence (AI) models at the World Artificial Intelligence Conference (WAIC) in Shanghai on Sunday as Chinese Big Tech companies stepped up their rivalry in the field.
Shenzhen-based social media and gaming powerhouse Tencent unveiled its Hunyuan 3D World Model 1.0, an open-source AI model capable of generating detailed three-dimensional environments, according to a statement. SenseTime, an AI pioneer in China, launched SenseNova V6.5, a new generation of its proprietary AI model series.
Tencent said its latest Hunyuan model could create interactive, 360-degree virtual 3D scenes using natural language prompts or image inputs, thus significantly simplifying the production process for virtual reality experiences and video games.
Tencent said Hunyuan was the industry’s first open-source 3D world-generation AI fully compatible with “CG pipelines” – the standard workflow used for creating 3D graphics and animations in film production, gaming and visual effects.
Meanwhile, SenseTime claimed SenseNova V6.5 had outperformed some of its US peers such as Google’s Gemini 2.5 Pro and Anthropic’s Claude 4-Sonnet. Its unveiling marked the Hong Kong-listed firm’s latest efforts to double down on multimodal AI models, chairman and CEO Xu Li said at the WAIC venue.
The introduction followed months after it launched the previous version called SenseNova V6, a multimodal model released in April that had outperformed OpenAI’s GPT-4o across several metrics.
Xu also touted improved performance compared with the previous generation, as the new model delivered improvements in reinforced learning efficiency by 40 per cent for the training stage, while raising the throughput capacity of data by more than 35 per cent during the inference stage.
“We have changed the architecture of some models for the SenseNova V6.5, so that we can do better in the fusion of multiple modalities, which are not only pictures but also videos and texts,” Xu said at the event.Unlike traditional large language models that focus primarily on text, multimodal AI models integrate various modalities such as images, audio and video to improve comprehension and generation capabilities.
Tencent’s underlying algorithm, introduced as “semantically hierarchical 3D scene representation and generation”, breaks down complex 3D worlds into layers based on meaning, empowering realistic effects and allowing users to edit generated environments.
It supports the export of “3D meshes”, standard 3D objects that can be directly imported into mainstream game engines like Unity and Unreal, as well as professional modelling software, broadening its real-world applications.
Currently available on Tencent’s Hunyuan 3D generation platform, the new model allows users to generate panoramic still images through text or image prompts, although daily usage is limited. An interactive, fully explorable scene generation capability – allowing virtual movement in four directions – is under internal beta testing.
Additionally, the model had been released on open-source AI platforms such as Hugging Face for local deployment, Tencent said. The move was in line with the industry trend toward the open-source AI movement, with past releases of several open multi-modal AI models under its Hunyuan series, it added.
Tencent and SenseTime are banking on their AI businesses as an important revenue stream in the future, fuelled by the global frenzy around generative AI over the past two years.
Tencent, which operates the world’s largest video gaming business by revenue and Chinese super app WeChat, has seen its investments in AI pay off, as the firm posted its best quarter on record since becoming a publicly listed company in 2004.
SenseTime, founded in Hong Kong in 2014, was listed on the city’s stock exchange in 2021. It reported an 11 per cent rise in revenue to 3.8 billion yuan (US$518 million) in 2024, driven by growth in the generative AI segment. Its net loss narrowed to 4.3 billion yuan from 6.5 billion yuan a year earlier.

Không có file đính kèm.

19

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo