用 GLM-4.6V + Coding Plan,自动剪辑你的游戏高光时刻
目录
刚在游戏里打出一波丝血反杀、五杀的操作,肾上腺素还在飙升,看着结算画面,想剪个视频发朋友圈,又觉得一个镜头太少了。看着一下午那长达3小时、好几个G的录像文件,拖进度条拖到手麻,精彩那秒就是找不到。
这放在过去,就像还在用8M网速下载3A大作,时代在进步,体验却还停留在过去。
别急,今天我就教你用智谱AI的GLM Coding Plan(AI辅助编程)加上GLM-4.6V(大模型),用低代码、自动化的新互联网思维,快速搭建一个AI自动化视频剪辑SaaS工具。
这样你就有了你的私人后期团队:你负责打游戏(产出内容),它负责剪辑。
一、 技术栈选型:三大核心组件
咱们的策略是云原生 + AI,用高性能组件组装出一套最小的可行性产品。
1. 算力:GLM-4.6V

这就是整个系统的中枢大脑。
- 选型理由: 它具备超长上下文窗口(128k),能硬吃1小时长视频。它能对视频流进行帧级理解,不仅能看懂画面,还能听懂解说。
- 成本优势: 现在的API调用价格极具竞争力(5.9元/1000万tokens)。按照互联网产品的计费逻辑,你的单次请求成本几乎可以忽略不计,非常适合个人开发者。

2. 开发环境:GLM Coding Plan

这是智谱新出的AI Native IDE解决方案。
- 应用场景: 使用 VS Code 插件 Cline即可快速安装,非常方便。
- 效能提升: 20元/月的订阅费,直接集成在VS Code或Cursor里。你只需要输入提示词,它就能自动生成Python脚本、调试API接口、编写前端代码,开发效率提升10倍不止。
3. 基础设施:阿里云OSS + FFmpeg

- OSS(对象存储): 解决大文件的存储与分发问题。本地视频AI无法直接读取,必须通过云端存储生成公网URL,实现数据的云端流转。
- FFmpeg: 它是最底层的多媒体处理引擎,负责根据AI输出的时间戳,精准执行视频的剪切、转码和合成。
二、 系统架构:三层工作流
别被架构劝退,这个系统的逻辑非常清晰,是一个简单的 输入/输出 流水线:
Step 1:数据上云
- 模块: Upload Service
- 功能: 将本地MP4文件推送到OSS对象存储,获取带签名的公网URL。
Step 2:智能推理
- 模块: Inference Engine
- 功能: GLM-4.6V 读取URL,进行多模态分析,提取高光片段的时间轴数据。
Step 3:渲染导出
- 模块: Render Service
- 功能: 前端展示JSON结果,用户确认后,后端调用FFmpeg执行Clip操作并导出成品。
这就形成了闭环:数据输入 > AI推理 > 人工决策 > 自动化执行。
三、 Debug实录
在开发过程中,有两个关键的问题需要注意,Coding Plan能帮你快速填坑。
1. 解决本地限制(云端读取方案)
刚开始做,你会发现GLM-4.6V报错,因为你传的是 C:\Games\Highlight.mp4。
原因分析: 大模型运行在云端服务器,无法访问你的本地文件系统。
解决方案: 在Coding Plan里下达指令:
“帮我写一个Python脚本,集成阿里云OSS SDK。功能要求:上传本地视频,配置Bucket权限,并返回一个有效期1小时的带签名URL。”
它会直接生成符合鉴权标准的代码,你只需要填入 AccessKey ID 和 Secret 即可,省去了翻阅繁杂API文档的时间。
2. 优化提取精度(提示词)
如果你只对AI说:“帮我找精彩片段”,这就是典型的模糊需求,会导致输出结果甚至不如随机截取。 这时候,提示词工程就是最佳手段。你需要用结构化的语言来定义“什么是高光时刻”。
提示词优化:
- Role(角色): 你是资深游戏数据分析师,专注于捕捉用户行为中的高价值瞬间。
- Criteria(筛选标准):
- Priority S(情绪峰值): 团灭对方(Ace)、极限反杀、多杀音效触发。
- Priority A(传播钩子): 极具戏剧性的失误、全场欢呼。
- Priority B(高频交互): 密集的技能释放与团战。
- Output Config(输出配置):
- Threshold(阈值): 评分 < 0.7 的低质量数据直接Drop。
- Format(格式): 严格输出 JSON格式(字段:start_time, end_time, reason, score),禁止输出Markdown废话。
把这段提示词封装进API Payload,你会发现模型的召回率和准确率大幅提升。
四、 前端打造
后端逻辑跑通了,前端界面不能太简陋。我们可以打造任意风格的UI界面。

打开Coding Plan,直接下达需求:
“使用 TailwindCSS 构建一个深色模式的单页应用。布局要求:左侧为片段列表,中间为视频预览,右侧为AI分析日志。UI风格参考专业的非线性编辑软件(NLE),按钮添加Hover动效,字体使用等宽字体以体现科技感。”
交付结果:
- 可视化列表: AI分析出的“五杀时刻(Score: 9.8)”以卡片形式排列。
- 交互联动: 点击列表项,播放器seek到对应时间戳,实现“所见即所得”。
- 智能弹幕: 右侧实时显示AI的分析Reason:“检测到高频操作与击杀音效,判定为高光时刻。”
这哪里是写代码,这是在进行快速原型设计。
五、 部署上线
当第一次跑通全流程:
- Input: 拖入昨晚的
LOL_Replay.mp4。 - Processing: 观察控制台日志滚动,等待推理完成。
- Review: 屏幕上精准列出了5个关键帧区间。
- Export: 点击“导出”,几秒钟后,成品视频在本地渲染完成。
这种感觉,就像看着自己编写的自动化脚本完美运行了一整夜。
在此刻,你是掌控系统的架构师,Coding Plan帮你搞定了繁琐的Syntax,GLM-4.6V帮你搞定了非结构化数据的理解。
结语
别被AI吓住,也别光看不练。 智谱的官方文档(传送门在这),投入极低的沉没成本,用几个小时的开发时间,把这套自动化工作流搭建起来。
当你用自己开发的工具,通过自动化流水线产出第一条爆款视频时,成就感拉满。



