SoulX-Podcast: 单人对话克隆工作流:
https://www.runninghub.cn/post/1984255408770596865
/?inviteCode=rh-v1116
SoulX-Podcast: 多人对话工作流:
https://www.runninghub.cn/post/1983788604407357442
/?inviteCode=rh-v1116
Infinite Talk数字人图生视频流V2极速版:
https://www.runninghub.cn/ai-detail/1958192177023225858
/?inviteCode=rh-v1116
Infinite Talk数字人图生视频流双人版:
https://www.runninghub.cn/ai-detail/1984579249786994690
/?inviteCode=rh-v1116
粉丝福利:新用户注册领1000RH币,每天登录还有100币
还有免费的快捷创作让你玩!
SoulX-Podcast项目:
https://github.com/Soul-AILab/SoulX-Podcast?tab=readme-ov-file
ComfyUI-SoulX-Podcast节点项目:
https://github.com/flybirdxx/ComfyUI-SoulX-Podcast
图文笔记
今天给大家分享一套超级适合做播客的高保真音频生成方案——SoulX-Podcast,还能直接联动Infinite Talk做数字人视频,非常高效。
1. 核心亮点
SoulX-Podcast 这个开源项目特别猛的地方在于它支持超长文本、多轮对话,最关键是自带方言基因,像河南话、四川话、粤语这种都能跑得非常自然,韵律感很强。
2. ComfyUI 工作流实操
如果你用 ComfyUI,可以直接下载大佬封装好的节点。工作流的核心逻辑就在于:
* **Loader 设置**:通过 SoulX Podcast Loader 和 Input Parser 两个核心节点搭起来。
* **JSON 文本交互**:输入内容是按 JSON 格式走的,你需要定义 `Speaker` (说话人) 和 `Prompt_text` (对话文本)。
* **方言标签加持**:在文本里插入特定标签,比如 `<|Henan|>`,模型就能瞬间切换到对应的方言语调。
* **参数微调**:参数区建议重点看 Temperature(控制创造力)、Top-p 和重复惩罚系数。如果觉得生成效果太死板,适当拉高 Temperature;如果说话老是复读,就调大重复惩罚。
3. 如何实现双人视频?
视频里演示的 Infinite Talk 工作流是这套流程的“视觉增强版”:
1. 用 SoulX-Podcast 生成高质量长音频。
2. 将音频接入 Infinite Talk 数字人流。
3. 现在有专门的“双人版”工作流,只需要把两个角色的音频分别对应好,就能实现双人对话视频的自动化生成。
建议大家直接去 RunningHub 跑一下我文末整理的链接,里面不仅有单人克隆流,还有多人对话流,新人注册进去领 1000 RH币够玩很久了。





