AI漫剧创作进阶教程：外网大神Kōda的工作流分享第三期，角色图形/故事板/seedance2.0提示词完整分享（2026最新实操）

2026-06-26 15:16:04

文章摘要

本文分享外网大神Kōda的AI漫剧创作工作流，包括Midjourney创建角色图像、NanoBananaPro微调、GPTImage2生成故事板、Seedance2.0生成视频。此次场景变为低武世界，优化了提示词。还介绍各环节实操流程、工具用途，解答常见问题，如付费、生成时长等，该流程可用于不同战斗场景。

上次我们分享了外网大神Kōda的工作流，会发现他的打斗控制非常精细，有战斗机器人、复杂地形、多敌人对抗。这次他分享了全套的工作流，场景也从未来世界改成了低武世界，敌人增加到4个，借鉴意义更大。

前后对比，我们可以发现Kōda这次优化了提示词，多角色混战，对一致性要求更高，他改用更简练的锁定词和限制词来约束模型。呈现效果出色，结构更专业，也方便我们学习理解。

效果展示

Midjourney 提示词

扁平矢量插画。一位手持武士刀的女性全身像。展示从头到脚的完整身形，双脚清晰可见。居中构图，人物周围留有宽裕的空白。身穿白衬衫，背景为草地；主体与背景色彩对比强烈，线条简洁利落，采用极简扁平配色，呈现高质量矢量风格。
--ar 16:9 --raw --sref 3295658070 --profile ihl81mk --stylize 100

GPT Img 2 提示词

创建一张16:9、充满动感的剑术战斗分镜图。
[主体]
制作一张精致、现代极简风格的分镜图，描绘一名孤独剑客从沉稳的月下架势瞬间转入与怪物的高速战斗。通过十二个分镜格，展示全画幅镜头角度、剑的状态、冲击姿态、流体般的打击特效、画面动向以及敌人的状态。
[标题]
设计一个具有艺术感的标题栏，包含契合场景的排版、细线条、清晰的层级结构、宽裕的间距，以及分镜格外部克制的图形处理。
标题栏必须包含以下两行引号内的文字：
"月下之刃"
"沉稳剑势瞬间爆发为十二帧极具张力的动作画面"
[分镜结构]
采用自动布局，包含 12 个分镜格。
使用紧凑的分镜格标题，格式严格遵循：P## / 镜头标签 / 动作节点名称。
按 P## 顺序，为每个动作节点（BEAT）绘制一个分镜格。
[视觉风格]
分镜格内部采用极简、干净的构图示意图（blocking thumbnails）：开放式轮廓剪影、纤细的石墨质感线条、大面积留白，仅保留表现姿态、接触点、方向、动态拖影（smear）形状及空间位置所需的关键线条。
仅展示身体外轮廓及四肢线条：不画五官、解剖细节、衣物纹理、材质、明暗塑造或阴影填充。
分镜格内部保持单色。最终视频中的色彩元素在此处仅用中性色形状/功能表示；最终色彩与调色方案仅在 prompt_video.txt 中定义。
[参考资料]
图像 A：仅参考主体剪影、发型轮廓、衬衫与裙子/裤子的色块、长剑比例、手部位置以及月亮与云层的构图。
[连续性]
保持角色身份、实体数量、剑的状态、液体特效源点、画面朝向、地形及空间布局的一致性。
每个分镜格均为全画幅构图，严禁使用分屏、四象限分割、画中画或多视图布局。
剑身可呈现光泽或光晕，但不得映出生物的倒影。
倒地、带有标记或受损的状态均指同一角色/物体在分镜间的延续，而非额外的重复个体。
每个分镜格表现凝固的瞬间，每个角色/物体仅呈现一种姿态或状态；避免使用“然后”、“之后”、“之前”、“首先”、“接下来”或“随后”等暗示先后顺序的词汇。
[数量锁定]
在整个序列中，严格保持一名主角、一把剑以及四种指定敌方角色：长角蛮兽、低伏爬行者、带翼袭击者和后方跃击者。仅绘制当前分镜段落（beat）中指定的角色；严禁添加额外生物、重复绘制倒地角色、幽灵残影、分屏复制体或生物倒影。
提及“倒地低伏爬行者”、“倒地带翼袭击者”或“受伤后方跃击者”时，均指原有角色的状态延续，而非新的个体。
[文本规则]
可见文本：仅限两行带引号的标题和简洁的分镜格标题。切勿绘制章节标签、角色名称、实体ID、备注、箭头、引线或注释。
[限制]
避免出现标志、水印、叠加层、额外分镜格、分屏画面、四象限分割、画中画、剑身映出生物倒影、成品插画风格、过于密集的细节、分镜格底色、重复/幽灵实体、可见ID以及数量不一致的情况。
[分镜段落 (Beats)]
针对每个视觉分镜段落（BEAT）绘制一个分镜格：
分镜段落：
P01 / 低位月下架势 / 持剑：低角度宽幅全景；主角位于画面中左侧，长剑斜横于身前，背景为月轮，四名敌人的剪影在草地边缘待命。
P02 / 地面威胁 / 短跑起跑姿态：贴近草地高度的宽幅特写；前景左侧为低伏爬行者的巨爪，主角呈短跑起跑姿态蹲伏，剑尖指向画面右侧，长角蛮兽与带翼袭击者在后方猛冲而来。
P03 / 剑身光晕 / 腕部发力：主角双手与长剑的紧凑特写；一处向外张开的形态位于握柄附近，手腕角度剧烈扭转，刀身表面保持光洁。
P04 / 冲击轮廓 / 斩击轨迹：髋部高度的压缩轮廓；主战者在低姿态前冲中摆出长距离横向斩击姿势，身后激起液态飞溅，残影轨迹保持低位。
P05 / 低位格挡 / 蛮力碰撞：低位宽幅冲击；长角蛮兽从画面左侧冲来，主战者摆出双手横身格挡姿势，接触点锁定在蛮兽手臂与刀身之间。
P06 / 后方压制 / 螺旋上升：长角蛮兽的过肩攻击；主战者在蛮兽手臂下方转身，发丝与裙摆向外飘散，剑锋弧线指向头顶上方的带翼袭击者。
P07 / 高位战线 / 空中突进：高位对角线宽幅动作；主战者悬停于画面右侧，呈长距离突进姿势，下方留有低姿态残影，长角蛮兽向左踉跄，带翼袭击者位于右上角，后方跃起者靠近地平线。
P08 / 地面痕迹 / 新月形滑行：地面特

Seedance 2.0 提示词

以 @[storyboard ref] 作为视觉分镜的基准，确定镜头顺序、镜头语言、场面调度、道具/特效状态、屏幕动向及空间连贯性。渲染最终的画面场景，而非分镜表本身；切勿添加提示词范围之外的事件。
将每一格分镜视为独立的满屏镜头样本。保持角色（C1）及物体的身份特征一致，避免使用分屏或四格画面，且剑身上不得映出任何生物的倒影。
以 @[character ref] 为唯一标准，确定 C1 的最终外观、面容、体型、服装、比例、材质、剑身尺寸及人物神态；分镜中的剪影仅供场面调度参考。
视觉风格
采用所提供海报风格的高速作画（sakuga）2D 动画动作效果：朱红底色、灰白圆月、淡蓝云团、浅色波波头、白衬衫、黑色短袴/裙装色块、闪耀长武士刀、硬朗黑色敌方剪影、黑色墨汁状血花、18-35mm 冲击感构图、拖影帧（smear frames）、楔形速度线、干笔触冲击帧、锐利的图形边缘、受控的刀光闪烁。
音频：布料拂动声、割草声、刀剑鸣响、湿墨撞击声、生物呼吸声、急促的脚步声，以及致命一击前的骤然静寂；无旋律配乐，仅保留源自场景的撞击节奏与快速剪辑的音效点缀。
环境：巨大圆月下的开阔草地，地平线处有低垂云块，稀疏的草丛，极简风格的天空，无其他战斗人员。
情感基调：C1 起初如雕塑般沉稳冷峻，随后化作一道疾驰的刀光；敌方生物因后坐力、滞空及受击姿态而节节败退。
节奏与张力递进：从海报般静止屏息的瞬间爆发，转入高速作画的拖影剪辑、变速镜头、鞭式快剪、爆发式剪辑及单帧冲击闪光，最终定格于圆月背景下的收招姿态，此时仍有两名敌手存活。
分镜节点
P01：低角度广角英雄构图：C1 处于画面中左侧，保持参考姿势，长武士刀斜横身前并散发光芒，圆月位于身后； C2（带角巨兽）、C3（低伏爬行者）、C4（带翼袭击者）和C5（后方跃击者）在草地边缘伺机而动。
P02：草地高度的威胁：C3的利爪伸入画面左侧前景；C1压低身形呈冲刺姿态，刀尖甩向画面右侧，同时C2和C4从后方猛冲而来；画面在利爪处硬切。
P03：手部与刀刃的特写插入镜头：C1握刀的手滑动，手部附近闪现刀刃的亮光，手腕扭转形成一道白色拖影；快速切入冲刺动作。
P04：压缩侧影的中景镜头：C1化作一道横向斩击的轨迹穿过C3；爬行者身后爆开黑色墨汁般的血液，其躯体被击飞，低空甩入草丛。
P05：低位冲击的广角镜头：C2从画面左侧冲来；C1双手横身格挡，刀刃压制住敌方的攻击路线，接触瞬间通过爆发式剪辑强调冲击力。
P06：C2视角的过肩镜头：C1从巨兽手臂下方螺旋穿过，裙摆与长发向外飞扬，剑锋划出弧线，向上挥向头顶上方的C4。
P07：高位斜向广角镜头：C1在场地间向右空中冲刺；下方是倒地的C3，左侧是踉跄的C2，右上角是俯冲而下的C4，远处月亮轮廓下可见渺小的C5。
P08：地面特写插入镜头：C1的双脚在草地上滑行，掠过一道黑色墨迹，脚后跟犁出新月形痕迹，刀刃低位横扫，利用快速剪辑的拖影效果掩盖角度变换。
P09：正面中景打击：C1跃起，将长剑刺入空中的C4体内，锋利的刀刃向前，黑色墨汁般的血液在翅膀后方爆开；接触瞬间进行强力剪辑。
P10：C5视角的怪物视点：C1剑尖向前，如火箭般冲向镜头；画面左侧可见C2，右侧可见倒下的C4正在坠落；变速效果使画面从静止瞬间切换为高速攻击。
P11：侧面剪影的高潮画面：C1全身前冲，拉出长长的动态拖影，在月亮轮廓边缘斩过C5；黑色墨汁般的血液向上飞溅，C2则在远处的左侧后退。
P12：低机位广角全景——C1以滑行急停姿态落在前景中央，发光的武士刀横于身前；C3与C4倒在通道周围；C2尚存，位于远端左侧；C5负伤，位于远端右侧

工作流

Kōda的工作流是四步走：

Midjourney创建角色图像
Nano Banana Pro微调
GPT Image 2生成故事板
Seedance 2.0生成视频

Midjourney，生成高质量的角色图；Nano Banana Pro，免费次数多，用来对角色图像进行局部调整；GPT Image 2，把战斗脚本转化为12格故事板；Seedance 2.0，将故事板转化为连贯的15秒战斗视频

Kōda用了更详细的视频提示词，不是逐镜头描述序列。故事板作为动作流、镜头语言和整体叙事的视觉指南，不是非严格的逐帧蓝图。从结果来看，模型很好地保留了故事板的关键节拍和打斗节奏和。

实操流程

第一步，Midjourney生成角色图

将角色描述提示词粘贴到Midjourney
调整参数（--ar、--sref、--stylize）
生成2-4张候选，选出最满意的一张

6月26日.png

可能有小伙伴没用过Midjourney，这里给大家讲解一下参数。

--ar 16:9：宽屏画幅，适配视频输出比例

--raw：减少Midjourney的默认美化，保留原始风格

--sref：风格参考，锁定特定视觉调性

--stylize 1000：高风格化，让AI在保持参考的同时发挥创意

第二步，Nano Banana Pro微调（可选）

如果Midjourney生成的角色不够理想，如手部姿势、服装褶皱、面部表情等，可以用Nano Banana Pro进行局部编辑。你可以在图上圈出要改的区域，提示AI修改，每天免费额度非常多。

上传Midjourney生成的角色图
用标记面板圈出需要调整的区域
输入修改指令（如调整持剑手的位置，拉长裙摆）

第三步，GPT Image 2生成故事板

进入GPT Image 2
上传角色参考图（Midjourney生成的）
粘贴12格战斗故事板提示词
等待30-60秒，生成完整故事板

6月26日(1).png

和上次的提示词对比，我们会发现角色管理更严格了。这次增加了数量锁定，强调倒地/受伤状态是同一角色的延续，同时增加了禁止重新设计、合并、复制角色，限制更多。

同时风格大幅降噪，上次的故事板还是带细节的成品图，这次改为单色草图。因为GPT Img 2生成的图片噪点太多，一看就是AI生图，这次的分镜图只有石墨质感线条，而且大面积留白，不画五官、不画纹理、不画阴影，只用中性色表示特效位置，显得更贴近动漫脚本，更专业。色彩和质感单独放到seedance提示词里，这样Seedance不会被分镜的色彩束缚挥。

镜头语言方面，上次只写了景别和运动方式，这次每P都标注了具体焦段，低位宽幅、紧凑特写、髋部高度、对角线宽幅等，并且配了明确的镜头运动方向。

第四步，Seedance 2.0生成视频

进入Seedance 2.0
上传故事板作为参考
上传角色参考图
输入视频生成提示词（参考下方模板）
等待生成，输出15秒1080p战斗视频

上次的提示词是按故事板加音效描述生成，这次把情绪弧线挪到了视频提示词中，从专注到爆发，分为启动→现身→攻击→反复格挡→压力升级→停顿→反击→冲击8个情绪节点。并用具体的视觉表现，视线方向、步法节奏、刀刃高度、披风弹开来传递情绪变化。

Seedance 2.0提示词模板

使用 @[故事板] 作为该序列的分镜脚本。将每个分镜格视为单个电影序列中的一个连续镜头，严格按照分镜脚本的顺序进行拍摄。

使用 @[角色参考] 作为主角参考。

情感引导：[描述情绪变化弧线，如"从专注的平静逐渐过渡到可控的危险，最终爆发"]

情绪激荡：[列出关键情绪节点，如"启动 -> 现身 -> 攻击 -> 反复格挡 -> 压力升级 -> 停顿 -> 反击 -> 冲击"]

视觉风格：[描述最终视频的风格，如"高端动画电影风格、电影级写实、温暖的日光"]

镜头语言：[描述镜头运动，如"低角度英雄镜头、地面追踪镜头、快速环绕镜头、广角环境揭示"]

音效：仅使用场景环境音效和动作音效：[列出关键音效，如"风声、剑鸣、冲击声、金属碰撞、布料翻动"]

输出：流畅、物理真实的战斗序列，清晰的空间逻辑、动态镜头、环境互动。

工具推荐

工具	用途	说明
Midjourney	角色定妆照生成	高质量角色图像，支持风格参考和参数微调
Nano Banana Pro	角色图像微调	支持图像标记精准编辑，圈哪改哪
GPT Image 2	故事板生成	30秒生成专业级导演分镜板
Seedance 2.0	故事板→视频	字节跳动下一代视频模型，支持全模态输入，原生4K输出

总结

GPT Image 2用数量锁定、状态延续、画幅强制、单色草图把输入做干净，Seedance用情绪弧线、结构音效把输出做饱满。上游不乱给信息，下游就不会乱发挥，故事板给得越干净，视频就越稳。

这套工作流的本质是让每个工具做最擅长的事，并通过限定词，让每个工具在擅长的范围自由发挥，不要越界。

故事板决定上限，Seedance决定下限。故事板写得越细，Seedance发挥得越稳。

FAQ

Q1：需要付费吗？

A：各工具均有免费额度。Midjourney有试用期，GPT Image 2每日免费生成3-4次，Seedance 2.0每日赠送积分。高频使用建议订阅付费版本。

Q2：Midjourney生成的角色图可以直接用吗？

A：可以，但如果角色姿势、细节不够理想，建议先用Nano Banana Pro微调再输入GPT Image 2。角色图的质量直接影响故事板的一致性。

Q3：故事板一定要12格吗？

A：不一定。Kōda这次用了12格，上次用了15格。关键是格数要匹配视频时长——15秒视频一般10-15个分镜足够，太多会显得碎片化。

Q4：Seedance 2.0能生成多长的视频？

A：标准版支持最长15秒视频。最新Seedance 2.5已支持单次30秒原生输出，4K分辨率。

Q5：生成的角色崩脸怎么办？

A：检查提示词中的参考和数量锁定。确保角色参考图被正确引用，且没有额外角色、重复角色等歧义描述。

Q6：可以商用吗？

A：可以。各工具付费版本生成的内容均可商用，建议在正式商用前查阅各平台的最新服务条款。

Q7：其他类型的战斗场景也能用这套模板吗？

A：完全可以。流程完全一致，替换角色描述、敌人类型、环境和动作节拍即可。Kōda自己就用这套参数化提示词生成了无限种战斗场景变体，只需要改参数就能换主题。

下载.png

塔猴是一个专注于为用户提供系统学习、内容创作与商业连接的AIGC综合服务平台，致力于为每一位AI探索者打造理想的创作、成长家园。

在塔猴，你不仅可以学习众多AIGC类实战课程，获得与时俱进的AIGC技能和视野，还有机会获得长期商业合作和接单机会！

点击进入：https://www.tahou.com/

以上内容不代表本平台立场，仅供读者参考