首页
看点啥
插画图片
首页 看点啥 虎牙VAM 1.0 - 虎牙发布的实时多模态数字人基础模型

虎牙VAM 1.0 - 虎牙发布的实时多模态数字人基础模型

2026-07-01 0

虎牙VAM 1.0是什么

虎牙VAM 1.0(Vivid Avatar Model)是虎牙推出的基于DiT架构的实时多模态数字人基础模型,一张照片可生成能说话、能唱歌跳舞的AI数字人。模型以480×832分辨率、28帧流式输出实现7×24小时实时直播互动,支持全双工对话、即时打断、弹幕回复与多角色策略游戏,在真实感、身份保持与推理速度上全面领先,适用直播带货、新闻播报、虚拟演唱会等场景。

虎牙VAM 1.0的主要功能

虎牙VAM 1.0的技术原理

如何使用虎牙VAM 1.0

模型处于内测/邀请体验阶段,尚未开放公开。

VAM 1.0的核心优势

VAM 1.0的同类竞品对比

对比维度虎牙 VAM 1.0OmniHuman 1.5架构DiT(Diffusion Transformer)扩散模型 + 音频驱动实时性✅ 实时流式输出,28 FPS❌ 非实时,需预生成视频交互能力✅ 全双工对话,支持打断/接话❌ 单向播报,无实时交互连续运行✅ 7×24小时稳定直播❌ 无法长时间连续运行输入方式照片 + 文字/语音/弹幕照片 + 音频应用场景直播带货、游戏互动、虚拟陪伴短视频生成、口播视频延迟0.77秒/片段分钟级生成多角色✅ 支持10人同场狼人杀博弈❌ 单角色驱动

VAM 1.0的应用场景

喜欢(0)

上一篇

RedKnot - 小红书开源的长文本推理加速引擎

RedKnot - 小红书开源的长文本推理加速引擎

下一篇

算力短缺瓶颈显现:谷歌限制Meta访问Gemini AI模型

算力短缺瓶颈显现:谷歌限制Meta访问Gemini AI模型
猜你喜欢