进阶

双人对话长视频工作流分享

Name: 塔猴-学习中心-双人对话长视频工作流分享
Availability: InStock
Author: Doc_workBox

加入学习

对口型

学习

作品

介绍

点击登录后开始学习

加入学习

作品鉴赏

暂无作品，敬请期待

发布作品

课程介绍

SoulX-Podcast: 单人对话克隆工作流：

https://www.runninghub.cn/post/1984255408770596865

/?inviteCode=rh-v1116

SoulX-Podcast: 多人对话工作流：

https://www.runninghub.cn/post/1983788604407357442

/?inviteCode=rh-v1116

Infinite Talk数字人图生视频流V2极速版：

https://www.runninghub.cn/ai-detail/1958192177023225858

/?inviteCode=rh-v1116

Infinite Talk数字人图生视频流双人版：

https://www.runninghub.cn/ai-detail/1984579249786994690

/?inviteCode=rh-v1116

粉丝福利：新用户注册领1000RH币，每天登录还有100币

还有免费的快捷创作让你玩！

SoulX-Podcast项目：

https://github.com/Soul-AILab/SoulX-Podcast?tab=readme-ov-file

ComfyUI-SoulX-Podcast节点项目：

https://github.com/flybirdxx/ComfyUI-SoulX-Podcast

图文笔记

今天给大家分享一套超级适合做播客的高保真音频生成方案——SoulX-Podcast，还能直接联动Infinite Talk做数字人视频，非常高效。

1. 核心亮点

SoulX-Podcast 这个开源项目特别猛的地方在于它支持超长文本、多轮对话，最关键是自带方言基因，像河南话、四川话、粤语这种都能跑得非常自然，韵律感很强。

2. ComfyUI 工作流实操

如果你用 ComfyUI，可以直接下载大佬封装好的节点。工作流的核心逻辑就在于：

* **Loader 设置**：通过 SoulX Podcast Loader 和 Input Parser 两个核心节点搭起来。

* **JSON 文本交互**：输入内容是按 JSON 格式走的，你需要定义 `Speaker` (说话人) 和 `Prompt_text` (对话文本)。

* **方言标签加持**：在文本里插入特定标签，比如 `<|Henan|>`，模型就能瞬间切换到对应的方言语调。

* **参数微调**：参数区建议重点看 Temperature（控制创造力）、Top-p 和重复惩罚系数。如果觉得生成效果太死板，适当拉高 Temperature；如果说话老是复读，就调大重复惩罚。

3. 如何实现双人视频？

视频里演示的 Infinite Talk 工作流是这套流程的“视觉增强版”：

1. 用 SoulX-Podcast 生成高质量长音频。

2. 将音频接入 Infinite Talk 数字人流。

3. 现在有专门的“双人版”工作流，只需要把两个角色的音频分别对应好，就能实现双人对话视频的自动化生成。

建议大家直接去 RunningHub 跑一下我文末整理的链接，里面不仅有单人克隆流，还有多人对话流，新人注册进去领 1000 RH币够玩很久了。

Doc_workBox

5粉丝|26课程

关注

AI创作者 ComfyUI全球挑战赛第一期获奖者

双人对话长视频工作流

时长 05:29