4月16日,阿里阿里巴巴(以下简称阿里)发布可实时构建和交互的世界世界模型产品——HappyOyster(快乐生蚝)。该产品由阿里ATH(Alibaba Token Hub)创新事业部团队研发,模型与此前爆火的将e较HappyHorse(快乐马)同属一个团队。
《每日经济新闻》记者了解到,谷歌高下HappyOyster基于原生多模态架构而建,阿里支持多模态理解与音视频联合生成。世界目前,模型该产品可实现漫游(Wander)和导演(Direct)两大核心能力,将e较用户可以实时构建可互动、谷歌高下可演绎、阿里可探索的世界AI数字世界。同时,模型用户生成的将e较数字世界,不仅能被完整保存,谷歌高下还能开放给其他用户进行二次创作。
相比大语言模型相对成熟的模型架构和技术范式,世界模型仍属于前沿探索领域。阿里的HappyOyster与谷歌的Genie 3同属于世界模拟器流派。区别在于传统文生视频模型采用输入提示词、等待渲染、获得成片的被动流程,而这一流派采用长时间跨度上的世界演化建模方式。通过学习海量长视频数据,以及文本、动作指令、图像参考等多样控制信号,模型能够主动理解空间、物理与因果规律,预测情节和画面的演变,从而把“被动生成内容”转变为“主动模拟世界演化”,为构建可交互的通用世界模拟器提供了关键技术路径。