- 1搭配领先的开源大模型 Heygem + IndexTTS2 + Infinitetalk + QwenImage + Flux + WanAnimate
- 2搭配小白友好的web操作页面
- 3搭配专业的ComfyUI 工作流
- 4支持图片/视频生成数字人
- 5支持文本/音频双重驱动
- 6支持 B站最新开源的 IndexTTS2 语音克隆
- 7基于Top2云GPU平台(仙宫云),可免费体验独享4090系列高端显卡
- 8无需会员,显卡按分钟计费,随用随开,极致性价比
- 9私有部署,安全可高,保障隐私
上传数字人视频 (< 30 s)
上传数字人声音 (可选,< 20s)
生成结果
怎么使用?
本功能每日可用时间:9:00-18:00 (北京时间)
第一步:选择数字人形象
您可以自己上传数字人视频,也可以使用公共数字人形象。如果您自己上传,画面人物请参考示例要求:
标准示例
站姿参考
坐姿参考- 视频时长最少8秒,要有声音;
- 视频画面只能有一个人,五官清晰不遮挡,头部不倾斜或侧向,手势不要出现在面部、嘴巴、脖子;
- 视频背景尽量简洁,不要有其他移动元素干扰;室内固定背景效果最好,户外背景尽量避免路人;
- 视频分辨率最低720P,视频格式为MP4/MOV;
- 如果第三步设置了数字人声音,则视频可以没有人声,但是要有背景音,不能为静音(如果为静音,生成失败);
- 如果第三步没有设置数字人声音,则视频必须有人声,支持中英文,人声音频清晰。
第二步:编写文案
请输入您想要数字人表达的文案。支持中英文双语,(中文同时支持拼音)。
标准示例
- 通过拼音解决中文多音字及音调,比如:'写下了重重的一笔',可以改成 '写下了zhong4 zhong4的一笔', 4则代表重音;
- 按照中英文占比确定阿拉伯数字读法,为了防止中文数字发音不准确,最好用中文数字替换阿拉伯数字,比如'2025'替换成'二零二五',特别注意:中文中使用阿拉伯数字时,需使用中文输入法,即数字前后有空格,否则会发音成 fei
- 中文数字发音参考:'4 0 9 0'会发音四零九零,'4090'会发音四千零九十;
第三步:设置数字人声音(可选)
您可以自己上传数字人声音,也可以使用公共数字人声音。支持中英文。
如果设置了数字人声音,则不会使用视频中的人声。
错误示例
多张人脸
面部过大
未检测到人脸
五官遮挡
使用规则:
- 支持试用,新用户注册即可获得1次免费生成机会。
- 每次生成成功消耗 10 个算力,生成失败不消耗算力。
- 普通用户可以创建5个数字人形象,为了防止滥用,算力>=500,可以解锁10个数字人形象,算力>=2000,则解锁无限个数字人形象。
- 提交成功后,一般 2 分钟左右完成,如果当前使用用户过多,可能需要排队,可以关闭当前页面,后续可以通过右上角,进入历史记录中查看结果
声明:请遵受法律法规,不要生成违法违禁内容。本站仅提供算力服务,如果产生不良影响,与本站无关,一切由生成方承担。
完全免费
本工具完全免费,无需登录,无需算力,即可使用
自主可控
搭配云GPU平台,支持 24G/48G 4090系列显卡,自由选择,自助部署
隐私安全
数据完全存储在第三方独享GPU实例中,他人无法获取,销毁实例即彻底销毁
高峰期无GPU可用,试试抢卡小助手浏览器插件