首页
看点啥
插画图片
首页 看点啥 ViiTorVoice - 云上曲率推出 AI 语音合成模型

ViiTorVoice - 云上曲率推出 AI 语音合成模型

2026-07-03 0

ViiTorVoice是什么

ViiTorVoice 是云上曲率推出的全球首个支持局部编辑的 AI 语音合成模型,登顶 Seed-TTS 权威评测榜首。它采用 NAR 非自回归架构,实现”像改 Word 一样修语音”——可定向替换音频中的某个词或片段,其余音色、节奏、情感完全保持不变。支持无文本跨语种克隆、情绪精准控制及 60ms 超低延迟推理,1B 参数模型已开源。

ViiTorVoice的主要功能

微信关注回复“开源”,加入AI开源项目交流群

如何使用ViiTorVoice

ViiTorVoice的核心优势

ViiTorVoice的项目地址

ViiTorVoice的同类竞品对比

对比维度ViiTorVoiceQwen3-TTS研发方云上曲率阿里巴巴通义实验室核心架构NAR 非自回归(完形填空式)AR 自回归(逐帧链式生成)局部编辑支持片段级定向修改,改词不改全段❌ 不支持,修改一词需整段重生成Seed-TTS 英文 WER1.32(更低=更准)1.54Seed-TTS 中文 WER0.99(行业首个<1.0)1.15首帧延迟<60ms~150-200ms无文本克隆✅ 仅需纯音频即可跨语种克隆❌ 需提供音频+准确转录文本情绪控制词级 Token 精准控制(笑声/叹气等)基础自然语言描述控制

ViiTorVoice的应用场景

喜欢(0)

上一篇

ChatExcel Ultra - 元空AI发布的企业级桌面版AI数据智能体

ChatExcel Ultra - 元空AI发布的企业级桌面版AI数据智能体

下一篇

全球首个英伟达含量为0的万亿模型:成了海外开发者的抢手货

全球首个英伟达含量为0的万亿模型:成了海外开发者的抢手货
猜你喜欢