SoulX-Podcast: 单人对话克隆工作流:

https://www.runninghub.cn/post/1984255408770596865

/?inviteCode=rh-v1116

SoulX-Podcast: 多人对话工作流:

https://www.runninghub.cn/post/1983788604407357442

/?inviteCode=rh-v1116

Infinite Talk数字人图生视频流V2极速版:

https://www.runninghub.cn/ai-detail/1958192177023225858

/?inviteCode=rh-v1116

Infinite Talk数字人图生视频流双人版:

https://www.runninghub.cn/ai-detail/1984579249786994690

/?inviteCode=rh-v1116

粉丝福利:新用户注册领1000RH币,每天登录还有100币

还有免费的快捷创作让你玩!

SoulX-Podcast项目:

https://github.com/Soul-AILab/SoulX-Podcast?tab=readme-ov-file

ComfyUI-SoulX-Podcast节点项目:

https://github.com/flybirdxx/ComfyUI-SoulX-Podcast

图文笔记

今天给大家分享一套超级适合做播客的高保真音频生成方案——SoulX-Podcast,还能直接联动Infinite Talk做数字人视频,非常高效。

1. 核心亮点

SoulX-Podcast 这个开源项目特别猛的地方在于它支持超长文本、多轮对话,最关键是自带方言基因,像河南话、四川话、粤语这种都能跑得非常自然,韵律感很强。

2. ComfyUI 工作流实操

如果你用 ComfyUI,可以直接下载大佬封装好的节点。工作流的核心逻辑就在于:

* **Loader 设置**:通过 SoulX Podcast Loader 和 Input Parser 两个核心节点搭起来。

* **JSON 文本交互**:输入内容是按 JSON 格式走的,你需要定义 `Speaker` (说话人) 和 `Prompt_text` (对话文本)。

* **方言标签加持**:在文本里插入特定标签,比如 `<|Henan|>`,模型就能瞬间切换到对应的方言语调。

* **参数微调**:参数区建议重点看 Temperature(控制创造力)、Top-p 和重复惩罚系数。如果觉得生成效果太死板,适当拉高 Temperature;如果说话老是复读,就调大重复惩罚。

3. 如何实现双人视频?

视频里演示的 Infinite Talk 工作流是这套流程的“视觉增强版”:

1. 用 SoulX-Podcast 生成高质量长音频。

2. 将音频接入 Infinite Talk 数字人流。

3. 现在有专门的“双人版”工作流,只需要把两个角色的音频分别对应好,就能实现双人对话视频的自动化生成。


建议大家直接去 RunningHub 跑一下我文末整理的链接,里面不仅有单人克隆流,还有多人对话流,新人注册进去领 1000 RH币够玩很久了。