AI漫剧创作进阶教程:外网大神Kōda的工作流分享第三期,角色图形/故事板/seedance2.0提示词完整分享(2026最新实操)

上次我们分享了外网大神Kōda的工作流,会发现他的打斗控制非常精细,有战斗机器人、复杂地形、多敌人对抗。这次他分享了全套的工作流,场景也从未来世界改成了低武世界,敌人增加到4个,借鉴意义更大。
前后对比,我们可以发现Kōda这次优化了提示词,多角色混战,对一致性要求更高,他改用更简练的锁定词和限制词来约束模型。呈现效果出色,结构更专业,也方便我们学习理解。
效果展示
Midjourney 提示词
扁平矢量插画。一位手持武士刀的女性全身像。展示从头到脚的完整身形,双脚清晰可见。居中构图,人物周围留有宽裕的空白。身穿白衬衫,背景为草地;主体与背景色彩对比强烈,线条简洁利落,采用极简扁平配色,呈现高质量矢量风格。
--ar 16:9 --raw --sref 3295658070 --profile ihl81mk --stylize 100
GPT Img 2 提示词
创建一张16:9、充满动感的剑术战斗分镜图。
[主体]
制作一张精致、现代极简风格的分镜图,描绘一名孤独剑客从沉稳的月下架势瞬间转入与怪物的高速战斗。通过十二个分镜格,展示全画幅镜头角度、剑的状态、冲击姿态、流体般的打击特效、画面动向以及敌人的状态。
[标题]
设计一个具有艺术感的标题栏,包含契合场景的排版、细线条、清晰的层级结构、宽裕的间距,以及分镜格外部克制的图形处理。
标题栏必须包含以下两行引号内的文字:
"月下之刃"
"沉稳剑势瞬间爆发为十二帧极具张力的动作画面"
[分镜结构]
采用自动布局,包含 12 个分镜格。
使用紧凑的分镜格标题,格式严格遵循:P## / 镜头标签 / 动作节点名称。
按 P## 顺序,为每个动作节点(BEAT)绘制一个分镜格。
[视觉风格]
分镜格内部采用极简、干净的构图示意图(blocking thumbnails):开放式轮廓剪影、纤细的石墨质感线条、大面积留白,仅保留表现姿态、接触点、方向、动态拖影(smear)形状及空间位置所需的关键线条。
仅展示身体外轮廓及四肢线条:不画五官、解剖细节、衣物纹理、材质、明暗塑造或阴影填充。
分镜格内部保持单色。最终视频中的色彩元素在此处仅用中性色形状/功能表示;最终色彩与调色方案仅在 prompt_video.txt 中定义。
[参考资料]
图像 A:仅参考主体剪影、发型轮廓、衬衫与裙子/裤子的色块、长剑比例、手部位置以及月亮与云层的构图。
[连续性]
保持角色身份、实体数量、剑的状态、液体特效源点、画面朝向、地形及空间布局的一致性。
每个分镜格均为全画幅构图,严禁使用分屏、四象限分割、画中画或多视图布局。
剑身可呈现光泽或光晕,但不得映出生物的倒影。
倒地、带有标记或受损的状态均指同一角色/物体在分镜间的延续,而非额外的重复个体。
每个分镜格表现凝固的瞬间,每个角色/物体仅呈现一种姿态或状态;避免使用“然后”、“之后”、“之前”、“首先”、“接下来”或“随后”等暗示先后顺序的词汇。
[数量锁定]
在整个序列中,严格保持一名主角、一把剑以及四种指定敌方角色:长角蛮兽、低伏爬行者、带翼袭击者和后方跃击者。仅绘制当前分镜段落(beat)中指定的角色;严禁添加额外生物、重复绘制倒地角色、幽灵残影、分屏复制体或生物倒影。
提及“倒地低伏爬行者”、“倒地带翼袭击者”或“受伤后方跃击者”时,均指原有角色的状态延续,而非新的个体。
[文本规则]
可见文本:仅限两行带引号的标题和简洁的分镜格标题。切勿绘制章节标签、角色名称、实体ID、备注、箭头、引线或注释。
[限制]
避免出现标志、水印、叠加层、额外分镜格、分屏画面、四象限分割、画中画、剑身映出生物倒影、成品插画风格、过于密集的细节、分镜格底色、重复/幽灵实体、可见ID以及数量不一致的情况。
[分镜段落 (Beats)]
针对每个视觉分镜段落(BEAT)绘制一个分镜格:
分镜段落:
P01 / 低位月下架势 / 持剑:低角度宽幅全景;主角位于画面中左侧,长剑斜横于身前,背景为月轮,四名敌人的剪影在草地边缘待命。
P02 / 地面威胁 / 短跑起跑姿态:贴近草地高度的宽幅特写;前景左侧为低伏爬行者的巨爪,主角呈短跑起跑姿态蹲伏,剑尖指向画面右侧,长角蛮兽与带翼袭击者在后方猛冲而来。
P03 / 剑身光晕 / 腕部发力:主角双手与长剑的紧凑特写;一处向外张开的形态位于握柄附近,手腕角度剧烈扭转,刀身表面保持光洁。
P04 / 冲击轮廓 / 斩击轨迹:髋部高度的压缩轮廓;主战者在低姿态前冲中摆出长距离横向斩击姿势,身后激起液态飞溅,残影轨迹保持低位。
P05 / 低位格挡 / 蛮力碰撞:低位宽幅冲击;长角蛮兽从画面左侧冲来,主战者摆出双手横身格挡姿势,接触点锁定在蛮兽手臂与刀身之间。
P06 / 后方压制 / 螺旋上升:长角蛮兽的过肩攻击;主战者在蛮兽手臂下方转身,发丝与裙摆向外飘散,剑锋弧线指向头顶上方的带翼袭击者。
P07 / 高位战线 / 空中突进:高位对角线宽幅动作;主战者悬停于画面右侧,呈长距离突进姿势,下方留有低姿态残影,长角蛮兽向左踉跄,带翼袭击者位于右上角,后方跃起者靠近地平线。
P08 / 地面痕迹 / 新月形滑行:地面特
Seedance 2.0 提示词
以 @[storyboard ref] 作为视觉分镜的基准,确定镜头顺序、镜头语言、场面调度、道具/特效状态、屏幕动向及空间连贯性。渲染最终的画面场景,而非分镜表本身;切勿添加提示词范围之外的事件。
将每一格分镜视为独立的满屏镜头样本。保持角色(C1)及物体的身份特征一致,避免使用分屏或四格画面,且剑身上不得映出任何生物的倒影。
以 @[character ref] 为唯一标准,确定 C1 的最终外观、面容、体型、服装、比例、材质、剑身尺寸及人物神态;分镜中的剪影仅供场面调度参考。
视觉风格
采用所提供海报风格的高速作画(sakuga)2D 动画动作效果:朱红底色、灰白圆月、淡蓝云团、浅色波波头、白衬衫、黑色短袴/裙装色块、闪耀长武士刀、硬朗黑色敌方剪影、黑色墨汁状血花、18-35mm 冲击感构图、拖影帧(smear frames)、楔形速度线、干笔触冲击帧、锐利的图形边缘、受控的刀光闪烁。
音频:布料拂动声、割草声、刀剑鸣响、湿墨撞击声、生物呼吸声、急促的脚步声,以及致命一击前的骤然静寂;无旋律配乐,仅保留源自场景的撞击节奏与快速剪辑的音效点缀。
环境:巨大圆月下的开阔草地,地平线处有低垂云块,稀疏的草丛,极简风格的天空,无其他战斗人员。
情感基调:C1 起初如雕塑般沉稳冷峻,随后化作一道疾驰的刀光;敌方生物因后坐力、滞空及受击姿态而节节败退。
节奏与张力递进:从海报般静止屏息的瞬间爆发,转入高速作画的拖影剪辑、变速镜头、鞭式快剪、爆发式剪辑及单帧冲击闪光,最终定格于圆月背景下的收招姿态,此时仍有两名敌手存活。
分镜节点
P01:低角度广角英雄构图:C1 处于画面中左侧,保持参考姿势,长武士刀斜横身前并散发光芒,圆月位于身后; C2(带角巨兽)、C3(低伏爬行者)、C4(带翼袭击者)和C5(后方跃击者)在草地边缘伺机而动。
P02:草地高度的威胁:C3的利爪伸入画面左侧前景;C1压低身形呈冲刺姿态,刀尖甩向画面右侧,同时C2和C4从后方猛冲而来;画面在利爪处硬切。
P03:手部与刀刃的特写插入镜头:C1握刀的手滑动,手部附近闪现刀刃的亮光,手腕扭转形成一道白色拖影;快速切入冲刺动作。
P04:压缩侧影的中景镜头:C1化作一道横向斩击的轨迹穿过C3;爬行者身后爆开黑色墨汁般的血液,其躯体被击飞,低空甩入草丛。
P05:低位冲击的广角镜头:C2从画面左侧冲来;C1双手横身格挡,刀刃压制住敌方的攻击路线,接触瞬间通过爆发式剪辑强调冲击力。
P06:C2视角的过肩镜头:C1从巨兽手臂下方螺旋穿过,裙摆与长发向外飞扬,剑锋划出弧线,向上挥向头顶上方的C4。
P07:高位斜向广角镜头:C1在场地间向右空中冲刺;下方是倒地的C3,左侧是踉跄的C2,右上角是俯冲而下的C4,远处月亮轮廓下可见渺小的C5。
P08:地面特写插入镜头:C1的双脚在草地上滑行,掠过一道黑色墨迹,脚后跟犁出新月形痕迹,刀刃低位横扫,利用快速剪辑的拖影效果掩盖角度变换。
P09:正面中景打击:C1跃起,将长剑刺入空中的C4体内,锋利的刀刃向前,黑色墨汁般的血液在翅膀后方爆开;接触瞬间进行强力剪辑。
P10:C5视角的怪物视点:C1剑尖向前,如火箭般冲向镜头;画面左侧可见C2,右侧可见倒下的C4正在坠落;变速效果使画面从静止瞬间切换为高速攻击。
P11:侧面剪影的高潮画面:C1全身前冲,拉出长长的动态拖影,在月亮轮廓边缘斩过C5;黑色墨汁般的血液向上飞溅,C2则在远处的左侧后退。
P12:低机位广角全景——C1以滑行急停姿态落在前景中央,发光的武士刀横于身前;C3与C4倒在通道周围;C2尚存,位于远端左侧;C5负伤,位于远端右侧

工作流
Kōda的工作流是四步走:
- Midjourney创建角色图像
- Nano Banana Pro微调
- GPT Image 2生成故事板
- Seedance 2.0生成视频
Midjourney,生成高质量的角色图;Nano Banana Pro,免费次数多,用来对角色图像进行局部调整;GPT Image 2,把战斗脚本转化为12格故事板;Seedance 2.0,将故事板转化为连贯的15秒战斗视频
Kōda用了更详细的视频提示词,不是逐镜头描述序列。故事板作为动作流、镜头语言和整体叙事的视觉指南,不是非严格的逐帧蓝图。从结果来看,模型很好地保留了故事板的关键节拍和打斗节奏和。

实操流程
第一步,Midjourney生成角色图
- 将角色描述提示词粘贴到Midjourney
- 调整参数(--ar、--sref、--stylize)
- 生成2-4张候选,选出最满意的一张

可能有小伙伴没用过Midjourney,这里给大家讲解一下参数。
--ar 16:9:宽屏画幅,适配视频输出比例
--raw:减少Midjourney的默认美化,保留原始风格
--sref:风格参考,锁定特定视觉调性
--stylize 1000:高风格化,让AI在保持参考的同时发挥创意
第二步,Nano Banana Pro微调(可选)
如果Midjourney生成的角色不够理想,如手部姿势、服装褶皱、面部表情等,可以用Nano Banana Pro进行局部编辑。你可以在图上圈出要改的区域,提示AI修改,每天免费额度非常多。
- 上传Midjourney生成的角色图
- 用标记面板圈出需要调整的区域
- 输入修改指令(如调整持剑手的位置,拉长裙摆)
第三步,GPT Image 2生成故事板
- 进入GPT Image 2
- 上传角色参考图(Midjourney生成的)
- 粘贴12格战斗故事板提示词
- 等待30-60秒,生成完整故事板

和上次的提示词对比,我们会发现角色管理更严格了。 这次增加了数量锁定,强调倒地/受伤状态是同一角色的延续,同时增加了禁止重新设计、合并、复制角色,限制更多。
同时风格大幅降噪,上次的故事板还是带细节的成品图,这次改为单色草图。因为GPT Img 2生成的图片噪点太多,一看就是AI生图,这次的分镜图只有石墨质感线条,而且大面积留白,不画五官、不画纹理、不画阴影,只用中性色表示特效位置,显得更贴近动漫脚本,更专业。色彩和质感单独放到seedance提示词里,这样Seedance不会被分镜的色彩束缚挥。
镜头语言方面,上次只写了景别和运动方式,这次每P都标注了具体焦段,低位宽幅、紧凑特写、髋部高度、对角线宽幅等,并且配了明确的镜头运动方向。
第四步,Seedance 2.0生成视频
- 进入Seedance 2.0
- 上传故事板作为参考
- 上传角色参考图
- 输入视频生成提示词(参考下方模板)
- 等待生成,输出15秒1080p战斗视频

上次的提示词是按故事板加音效描述生成,这次把情绪弧线挪到了视频提示词中,从专注到爆发,分为启动→现身→攻击→反复格挡→压力升级→停顿→反击→冲击8个情绪节点。并用具体的视觉表现,视线方向、步法节奏、刀刃高度、披风弹开来传递情绪变化。

Seedance 2.0提示词模板
使用 @[故事板] 作为该序列的分镜脚本。将每个分镜格视为单个电影序列中的一个连续镜头,严格按照分镜脚本的顺序进行拍摄。
使用 @[角色参考] 作为主角参考。
情感引导:[描述情绪变化弧线,如"从专注的平静逐渐过渡到可控的危险,最终爆发"]
情绪激荡:[列出关键情绪节点,如"启动 -> 现身 -> 攻击 -> 反复格挡 -> 压力升级 -> 停顿 -> 反击 -> 冲击"]
视觉风格:[描述最终视频的风格,如"高端动画电影风格、电影级写实、温暖的日光"]
镜头语言:[描述镜头运动,如"低角度英雄镜头、地面追踪镜头、快速环绕镜头、广角环境揭示"]
音效:仅使用场景环境音效和动作音效:[列出关键音效,如"风声、剑鸣、冲击声、金属碰撞、布料翻动"]
输出:流畅、物理真实的战斗序列,清晰的空间逻辑、动态镜头、环境互动。

工具推荐
工具 | 用途 | 说明 |
Midjourney | 角色定妆照生成 | 高质量角色图像,支持风格参考和参数微调 |
Nano Banana Pro | 角色图像微调 | 支持图像标记精准编辑,圈哪改哪 |
GPT Image 2 | 故事板生成 | 30秒生成专业级导演分镜板 |
Seedance 2.0 | 故事板→视频 | 字节跳动下一代视频模型,支持全模态输入,原生4K输出 |

总结
GPT Image 2用数量锁定、状态延续、画幅强制、单色草图把输入做干净,Seedance用情绪弧线、结构音效把输出做饱满。上游不乱给信息,下游就不会乱发挥,故事板给得越干净,视频就越稳。
这套工作流的本质是让每个工具做最擅长的事,并通过限定词,让每个工具在擅长的范围自由发挥,不要越界。
故事板决定上限,Seedance决定下限。故事板写得越细,Seedance发挥得越稳。

FAQ
Q1:需要付费吗?
A:各工具均有免费额度。Midjourney有试用期,GPT Image 2每日免费生成3-4次,Seedance 2.0每日赠送积分。高频使用建议订阅付费版本。
Q2:Midjourney生成的角色图可以直接用吗?
A:可以,但如果角色姿势、细节不够理想,建议先用Nano Banana Pro微调再输入GPT Image 2。角色图的质量直接影响故事板的一致性。
Q3:故事板一定要12格吗?
A:不一定。Kōda这次用了12格,上次用了15格。关键是格数要匹配视频时长——15秒视频一般10-15个分镜足够,太多会显得碎片化。
Q4:Seedance 2.0能生成多长的视频?
A:标准版支持最长15秒视频。最新Seedance 2.5已支持单次30秒原生输出,4K分辨率。
Q5:生成的角色崩脸怎么办?
A:检查提示词中的参考和数量锁定 。确保角色参考图被正确引用,且没有额外角色、重复角色等歧义描述。
Q6:可以商用吗?
A:可以。各工具付费版本生成的内容均可商用,建议在正式商用前查阅各平台的最新服务条款。
Q7:其他类型的战斗场景也能用这套模板吗?
A:完全可以。流程完全一致,替换角色描述、敌人类型、环境和动作节拍即可。Kōda自己就用这套参数化提示词生成了无限种战斗场景变体,只需要改参数就能换主题。

塔猴是一个专注于为用户提供系统学习、内容创作与商业连接的AIGC综合服务平台,致力于为每一位AI探索者打造理想的创作、成长家园。
在塔猴,你不仅可以学习众多AIGC类实战课程,获得与时俱进的AIGC技能和视野,还有机会获得长期商业合作和接单机会!




