混元世界模型2.0发布!一句话,让“龙虾鹅”跑进3D游戏里

这是龙虾鹅跑进3D游戏里的龙虾鹅👇🏻

最近,咱们腾讯的混元小龙虾估计天天都在搬砖干活。今天小编决定给它放个假,世界把它送进中世纪的模型酒馆里度个假。

看着这光影和质感,发布你可能会以为是句话进找了哪位3D建模大师熬夜肝出来的。但实际上,让跑现在只需要敲一句话,游戏就能把一张2D图片变成能跑、龙虾鹅能撞、混元能漫游的世界3D游戏资产。

今天,模型腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0)。发布一句话就能生成3D资产,句话进并直接导入到游戏制作或具身仿真引擎,让跑实现真正的可玩、可用。

支持多种模态输入,无缝兼容游戏引擎

把平面的龙虾鹅塞进3D游戏里,创作门槛低得超乎想象。

你完全不需要懂任何复杂的3D软件,只要像平时说话一样输入一句文字描述,或者直接上传一张图片,模型就能精准解析复杂的语义。

随后,它会一键生成混合了3D高斯泼溅(3DGS)与Mesh表征的真实3D资产。

熟悉AI生成的朋友都知道,此前不少世界模型(比如谷歌Genie 3 和咱们的混元世界模型1.5),本质上生成的还只是一段视频文件。而具备3DGS与Mesh表征的3D资产才能让用户有在真实游戏里的体验。

这些多格式的3D资产还能直接无缝导入到Unity、UE等主流游戏引擎中进行二次编辑,用于快速生成游戏地图和关卡原型。

你可以轻松地给龙虾鹅加个小背包,或者按需调整整个场景的光影。

更爽的是,模型还支持角色模式:你可以操作角色在街道、建筑、场景中自由探索,不限时间,具有物理碰撞,体验就像在真实游戏里一样。

生成的不是视频,而是可用的3D资产

这一次,混元世界模型2.0实现了SOTA级的生成效果。与其他世界模型相比,它在场景完整度(比如极难还原的物体侧面和背面)以及对输入图片的遵循程度上表现更优。

这不仅是因为它以3D生成为主轴,统一了空间理解、生成、重建的架构,更在于其底层多项核心组件的全面提升:

拼得全,单张普通图片秒变全景。传统方法极其依赖精确的相机参数才能生成全景图。混元2.0全新升级了HY-Pano-2.0模型,采用端到端隐式学习方案。单凭普通像素图片,就能自动脑补并推算出360度全景空间。

走得稳,智能寻路拒绝穿墙、跑飞。为了解决漫游过程中的痛点,混元团队结合了VLM与游戏自动寻路算法常用的navmesh表征,自研空间Agent技术。它能智能规划出“环绕物体”、“最大漫游”等五类运镜轨迹,避免角色穿墙、跑飞。

接得顺,画面延展真实不穿帮。针对场景扩展容易断层的问题,混元团队打造了目前业界最强的新视角生成(NVS)模型HY-WorldStereo。靠着强大的空间一致性记忆,让新老场景视觉充分缝合,极速生成且画质不掉。

更沉浸,支持物理碰撞、真交互。所有片段通过HY-WorldMirror 2.0以及自适应Mask gaussian等场景优化算法,最终生成3DGS与Mesh混合表征。这也是能开启角色模式、实现真实物体碰撞交互的核心原因。

发布即开源,人人都能“一句话造世界”

让复杂的3D资产生成变得像聊天一样简单。

混元世界模型(HY-World 系列)自发布以来持续进化:从首个开源3D世界模型 HY-World 1.0,到可实时在线交互的HY-World 1.5,再到如今一键生成3D空间资产的 HY-World 2.0,腾讯混元正在一步步把“AI造世界”从概念变为现实。

目前,混元世界模型2.0已正式开源。不管是萌趣的“龙虾鹅”、游戏开发者的关卡原型,还是设计师的数字孪生场景,曾经需要巨大成本的3D创作,如今都能一句话搞定。

未来,腾讯云将持续以混元AI能力,降低3D内容创作门槛,让每个人都能轻松创造属于自己的3D世界。

推荐阅读
相关推荐
探路“一人公司” | 对话OPC创业者曾繁煜:从10天到5天,AI正在重写短剧生产节奏
“把一部长篇小说改成60集剧本,过去要10到15天,现在大概5天就能完成。”在粤港澳超高清数创产业园一间开放式办公区内,深圳繁煜文化发展有限公司负责人曾繁煜盯着屏幕上不断生成的分镜画面,对记者给出一组
15322193}
前 Neuralink 联创 Max Hodak 加速推进“生物混合型”脑机接口
与传统脑机接口依赖金属电极直接刺激或读取脑信号不同,Science 的方案尝试将“生物”与“电子”结合,也就是在硬件中嵌入实验室培养的神经元,通过光刺激与电信号交互,让这些神经元与人脑自然融合,从而构
672423}
Panmnesia 将于 2026H2 量产全球唯一全功能 CXL 3.2 Switch芯片
PanSwitch 是一款 256 通道 PCIe 6.4 - CXL 3.2 融合交换芯片,支持标准 PCIe 6.4 通信也兼容全部三种 CXL 子协议。同时其率先实现了基于端口的路由 (PBR)
871450}
界面快评 | “宋柚”“120W”式商标文字游戏做不成心机产品的遮羞布
4月15日,据蓝鲸新闻报道,这款以“柚”为核心卖点的产品,香柚与胡柚总添加量仅2.7%,配料表前三为水、果葡糖浆、白砂糖,所谓“果汁含量≥10%”中七成来自苹果浓缩汁。更精妙的是,“宋柚”并非某种特殊
9181088}
三星 Galaxy S26用户反馈隔空投送向iPhone 17传照片丢失位置数据
IT之家注:三星于今年 3 月面向 Galaxy S22 系列至 Galaxy S26 系列推送 One UI 8.5 更新,让 Quick Share 兼容苹果的隔空投送AirDrop),实现跨平台
433914}
特斯拉AI5芯片性能提升40倍,对标英伟达 Blackwell,半导体ETF博时上涨0.89%
流动性方面,半导体ETF博时盘中换手6.44%,成交2292.47万元。拉长时间看,截至4月15日,半导体ETF博时近1周日均成交4772.60万元。消息面上,特斯拉自研芯片迎来重大突破,马斯克宣布下
53382279}
从“表演”到“干活”:消博会发出清晰信号,机器人落地元年来了
第六届中国国际消费品博览会于4月13日至18日在海南省举办。本届消博会,以科技、创新、实用为核心的智能产品为核心亮点。在一号馆科技消费展区,各家企业带来最新产品,从零售管理到智能互动,从能源服务到家庭
616475}
从工具到平台,从功能到结果:迈富时领航AI应用平台的关键一跃
迈富时02556.HK)的优势,在于围绕“模型+数据+平台+场景”体系搭建起来的覆盖全场景、全链条的“AI原生应用平台”,以及在此基础上持续迭代的研发能力,和与跨行业、跨维度企业级客户需求深度结合的能
92306}
台青消博会“初体验”:“亲自来感受,才能发现这里的无限机遇”
第六届消博会正在海南举办,吸引60多个国家和地区的超过3400个品牌参展。带着好奇,来自台北、高雄、台中、宜兰及新北等地的台青踏上海南岛,开启消博会“初体验”。 在科技消费展区,AI眼镜、智能穿戴设
54511981}
骂战升级!格力朱磊5条微博回怼海信,称参与新材料研究是分内事
可能有朋友昨天还没吃到这个瓜,就在 4 月 14 号晚,格力电器的 CMO 朱磊突然在社交平台上开炮,直指海信空调在上海家博会上公然剽窃格力原创的真铜实料宣传语。他尖锐指出:“当产品仍有电机绕组使用铝
61721489}