不用买数字人会员 GitHub这个项目完全开源可以参考
导读:别再以为开源数字人只能“动动嘴”了。最近发现一个被很多人忽略的 GitHub 项目——InfiniteTalk。它不是简单的对口型工具,而是一套完整的 AI 数字人口播方案。以前很多人做数字人,要么订阅付费平台,要么效果一般。而这个项目,只需要一张照片+一段音频或文本,就能生成完整的数字人口播视频。它的核心能力不仅仅是嘴型同步,而是让整个人物跟着声音一起“活...
别再以为开源数字人只能“动动嘴”了。最近发现一个被很多人忽略的 GitHub 项目——InfiniteTalk。它不是简单的对口型工具,而是一套完整的 AI 数字人口播方案。
以前很多人做数字人,要么订阅付费平台,要么效果一般。而这个项目,只需要一张照片+一段音频或文本,就能生成完整的数字人口播视频。
它的核心能力不仅仅是嘴型同步,而是让整个人物跟着声音一起“活”起来。
AI 会分析音频中的语音节奏、停顿、情绪,再驱动嘴型、头部、眼神、眉毛、肩膀等动作同步变化,让画面看起来更加自然,而不是只有嘴巴在机械开合。
它主要支持两种玩法:
第一种,上传一张人物照片,再输入一段音频或文字,就能生成完整的数字人口播视频,无论是知识分享、新闻播报还是唱歌都可以。
第二种,导入已有视频,再替换成新的音频,它会重新调整人物的嘴型和身体动作,让原视频自然匹配新的配音。
底层结合了视频生成模型和音频驱动技术,并采用关键帧优化策略,在保证人物稳定性的同时,也减少背景抖动和画面崩坏。
如果准备本地部署,需要一定硬件配置,官方建议使用 NVIDIA CUDA 环境,24GB 及以上显存、32GB 以上内存,硬盘最好预留 200GB 左右空间,其中模型文件就占用超过 100GB。目前 Mac 暂不支持。
安装流程并不算复杂,配置 Python 环境、安装依赖,再下载官方提供的模型权重即可。
项目采用 Apache-2.0 开源协议,对商业使用也比较友好。
如果你正在做 AI 数字人、短视频自动化、AI 主播或企业口播,这个项目值得收藏研究。
Hackyh'Blog版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!




