不只美妆,小红书发布FireRed-Image-Edit 1.1模型,起底3亿月活背后的AI全家桶

2026-03-09 14:40:43

就在昨天(3月8日),科技圈又被一条消息悄悄刷屏。

当很多人还沉浸在妇女节电商促销,当互联网的视线还聚焦在各大厂的算力口水战时,小红书正式推送了 FireRed-Image-Edit 1.1 版本图像编辑模型。

第一眼看,不就只是个图像编辑模型,这么多公司都在做。但看完技术报告后,发现这件事不只是修图那么简单

在很多人的印象里,小红书依然是那个教人穿搭、种草美妆的 App——一个充满口红、包包和探店攻略的生活社区,在AI开源上怎么跟阿里、腾讯、字节等大厂比?

但据观察,小红书的这个"火红"模型不仅在多项测试中拿下 SOTA(当前最优),更在部分维度超越了 Nano-Banana 和 Seedream 4.0 等闭源模型。

小红书手里攥着的AI底牌,到底是什么?


4.5 秒出图,专治翻车

玩开源修图模型,抽卡是绕不去的坎——经常写了一堆提示词,一看成图就连环翻车。

抽还是要抽的,但可以少抽

FireRed 1.1 版本的核心功能是:ID 一致性、多元融合

一个男生站在球场边,要通过提示词让他身上同时出现十多个元素(滑板、斗牛犬、球衣、棒球帽、城市背景等),按传统模型的逻辑,这种复杂提示词基本属于灾难现场。

FireRed 直接把这些元素强行融合,人物表情、姿态甚至光影都保持一致



FireRed 多元素融合演示

另一组 Demo 更有意思——一张欧美 Y2K 妆容风格的照片,只需一句指令:“改成夜店灯光风格。”

模型不仅改变背景,还自动调整妆面光泽、色调、环境氛围,整个画面像是重新拍摄

在优化上,FireRed 1.1 也下了不少功夫:原生支持 ComfyUI 节点、GGUF 格式,开发者几乎开箱即用;显存仅需 30GB,端到端生成时间 4.5 秒

这套模型并不只是给大厂服务器准备的,普通AI用户也玩得动



FireRed 风格迁移演示

1.6 亿张图洗出的最强编辑模型

这么强的生成质量,小红书到底做了什么?

答案其实很简单:数据,而且是海量数据。

FireRed 的训练集规模非常夸张——总计 1.6 亿张图片,包括 9000 万文生图数据、7000 万图像编辑数据,但真正用于训练的高质量数据只有 1 亿对

换句话说,小红书团队做了一件极其耗时的事:对大规模数据进行清洗。



FireRed 训练数据清洗

就像淘金一样,先把 1.6 亿素材扔进筛子,再一点点过滤杂质,最后留下最有价值的那部分。

FireRed 的训练流程可以简单理解为三步:

① 预训练——给 AI 打地基
② SFT 微调——教 AI 规则(如何修改人物、如何处理背景、如何保持一致性)
③ 强化学习——不断给模型打分,让 AI 逐渐与人类审美对齐

这样,模型不只学会了画图,而是学会了画"好看"的图。

一套流程下来,在小红书自建的 REDEdit-Bench 测试中,1.1 版本综合评分 7.943,超越 Qwen Image Edit、FLUX.2 等一众模型,稳坐 C 位



REDEdit-Bench 榜单

起底小红书的 AI 野心

把视线推远,就会发现小红书这步棋下得很大

FireRed-Image-Edit 的发布,只是冰山一角。

真正有意思的是它背后的团队——由技术负责人张德兵领导,项目代号叫「小地瓜」。听起来像零食,但不要小觑,这是小红书的大模型体系核心。

目前 FireRed 系列已形成完整的 AI 矩阵:

  • ASR 语音识别 / TTS 语音合成
  • Chat 大模型 / OCR 文字识别

而最神秘的一条产品线叫 OpenStoryline——据业内消息,这是一个对话式视频编辑器,目标直接瞄准短视频生产流程

在资本赛道,小红书的战略是"自研 + 投资":除内部研发团队外,还投资了 MiniMax月之暗面,朋友圈的扩展让投资者更具安全感。


04. AI 帖子超过了化妆品帖子

技术最终还是要回到业务,而小红书内部有一个惊人的变化

目前平台上,AI 生成内容的帖子数量,已经超过了传统化妆品内容

这几乎是一次社区文化的转折点。过去的小红书是种草社区,现在它正在变成 AI 创作者社区——越来越多 AI 创业者、设计师和开发者在这里分享工具、提示词和模型玩法。

小红书已陆续上线:达芬奇助手、AI 宠物、点点、AI 搜索,甚至全资收购了一家 AI 搜索公司



小红书 AI 宠物聊天界面

这种变迁的底层逻辑在于:用户来到社区,不再只是寻找攻略或买东西,而是在寻找情绪共鸣和个性表达

小红书极其聪明地利用 GenAI 工具重塑了从"搜索发现"到"种草拔草"的整个内容飞轮。品牌不再单纯依赖昂贵的付费流量,而是利用AI生成极具网感的定制内容,实现破圈的有机增长


结语

FireRed-Image-Edit 1.1 采用 Apache 2.0 开源协议,任何开发者都可以基于它进行二次开发。

这是小红书从社交平台转向AI研发的一次高调通知

客观来看,前方依然潜藏暗礁:30GB 的显存门槛将不少开发者挡在门外;在复杂的视频或多层交互场景下,模型的稳定性依然需要时间打磨。

但有一点可以确定——

当种草社区遇上生成式AI,小红书的前景,一片光明。
(微信公众号:Tahou_2025)



关注塔猴公众号,回复“1”加入专属社群

扫码下载塔猴APP,查看更多干货

声明:该内容由作者自行发布,观点内容仅供参考,不代表平台立场;如有侵权,请联系平台删除。
标签:
图像生成与编辑
开源大模型
模型训练
语音识别(ASR)
语音合成(TTS)
短视频制作