重要免责声明与警告
在开始之前,必须强调以下几点:
-
开发者限定: 如果你不是开发者或没有本地部署应用的经验,请不要尝试。这涉及代码和配置文件修改。
-
必须在受控环境中运行: 切勿在你日常使用的主机上直接运行 OpenClaw。它会尝试访问你所有的应用、文件甚至信用卡信息。请务必在独立的设备、虚拟机中运行。
-
操作风险: 这里的步骤涉及修改核心逻辑,如果操作不当可能会导致 OpenClaw 无法运行。
概述
OpenClaw 是一个可以在本地部署的强大 AI,它可以连接到其他平台并自主执行任务。但其 API 调用成本高得惊人,仅仅待机的情况下,每天也能消耗数美元。
本指南有四个步骤,通过以下几项优化,您可以将每月的 API 支出从 $1500+ 降到 $30-50,节省最多可达 97%,同时保持 OpenClaw 的高效运行。
OpenClaw 官网截图
解决方案
第一步:会话初始化
问题: 每次启动时,OpenClaw 会加载大量历史记录(例如 Identity.md、User.md 等),这些内容在大多数情况下并不需要。这样会造成大量的 token 浪费,尤其是会话频繁时。
解决方案: 在系统提示词中加入会话初始化规则,控制每次会话加载的内容,只加载必要的文件和信息。
会话初始化规则:
会话开始时:
1.仅加载以下文件:
- SOUL.md
- USER.md
- IDENTITY.md
- memory/YYYY-MM-DD.md(如存在)
2.不自动加载:
- MEMORY.md
- 之前的消息记录
- 工具输出
3.用户询问历史时:
- 使用 memory_search() 查询所需内容
- 只加载相关片段,而非整个文件
4.每次会话结束时更新 memory/YYYY-MM-DD.md:
- 记录处理过的内容
- 做出的决定
- 阻碍因素与下一步计划
效果: 通过这种方式,每次会话初始化只加载 8KB 的数据,而不是 50KB 的历史记录,节省 80% 的上下文成本。
第二步:模型路由优化
Claude 3 Haiku 模型
问题: OpenClaw 默认使用高成本的 Claude Sonnet 模型处理所有任务,而一些简单的任务(如文件状态检查、常规命令执行等)不需要如此强大的模型。
解决方案: 将默认模型设置为便宜且高效的 Haiku 模型,仅在需要进行架构决策、复杂代码审查或安全分析时切换到 Sonnet 模型。
配置步骤:
打开配置文件 ~/.openclaw/openclaw.json,设置 Haiku 为默认模型。
{
"agents": {
"defaults": {
"model": {
"primary": "anthropic/claude-haiku-4-5"
},
"models": {
"anthropic/claude-sonnet-4-5": {
"alias": "sonnet"
},
"anthropic/claude-haiku-4-5": {
"alias": "haiku"
}
}
}
}
}
在系统提示词中添加模型选择规则:
- 默认使用 Haiku 模型
- 仅在以下情况下切换到 Sonnet 模型:
- 架构决策
- 复杂代码审查
- 安全分析
- 复杂调试与推理
- 战略性多项目决策
效果: 常规任务使用 Haiku 模型,大幅降低每月的模型费用,将原本的 $50-70 降至 $5-10。
第三步:活跃检测优化
Ollama 官方标志
问题: OpenClaw 默认使用付费 API 来进行活跃检测(Heartbeat),这种常规的任务会导致不必要的 token 浪费。
解决方案: 将心跳检测迁移到免费的本地 LLM(如 Ollama)上,避免每次检测都消耗付费 API token。
步骤:
1. 安装 Ollama 并下载轻量模型(如 Llama 3.2)。
curl -fsSL https://ollama.ai/install.sh | sh
ollama pull llama3.2:3b
2. 更新配置文件 ~/.openclaw/openclaw.json,将活跃检测指向 Ollama 本地 LLM。
{
"heartbeat": {
"every": "1h",
"model": "ollama/llama3.2:3b",
"session": "main",
"target": "slack",
"prompt": "检查:是否有阻碍、机会或进展需要更新?"
}
}
效果: 活跃检测成本从每月 $5-15 降至 $0,完全避免了额外的费用。
第四步:速率限制与预算控制
问题: 自动化任务可能因为频繁的 API 调用而消耗大量 token,尤其是在没有速率限制的情况下,可能会出现死循环。
解决方案: 在系统提示词中加入速率限制规则,并设置每日和每月预算控制,防止 token 被过度消耗。
速率限制与预算控制规则:
- API 调用间隔至少 5 秒
- 搜索间隔至少 10 秒
- 每次批量搜索最多 5 个结果,休息 2 分钟
- 如果遇到 429 错误:停止,等待 5 分钟后重试
预算设置:
- 每日预算:$5(达到 75% 时提醒)
- 每月预算:$200(达到 75% 时提醒)
效果: 通过控制 API 调用频率和设置预算,您可以避免高频率调用导致的意外费用,同时确保月度支出在可控范围内。
优化后的成果对比
| 指标 | 优化前 | 优化后 |
|---|---|---|
| 活跃检测 | 每天空烧 $3-$5 | $0 |
| 模型使用 | 全部使用 Sonnet/Opus | 85% Haiku + 15% 本地模型 |
| 上下文 | 每次加载 50KB+ 并不断累积 | 仅加载必要信息 (<2KB) |
| API 错误 | 频繁触发 429 | 内置配速,运行流畅 |
| 单任务成本 | 复杂任务需 $100+ | 同等任务仅需 $6 |
案例:
运行一个通宵的复杂任务:利用 14 个子 Agent 抓取网络、寻找潜在客户、阅读博客、分析决策者、寻找邮箱并撰写个性化开发信。
- 耗时: 6 小时
- 产出: 完成了外包需要一个月才能完成的工作量
- 总成本: 仅 $6 美元
总结
OpenClaw 极其强大,但它的默认设置是性能优先。如果不进行配置,它会非常花钱。
通过实施以上四项优化,您可以显著降低 OpenClaw 的使用成本。每项优化都是针对不同的成本因素进行针对性调整,从而实现最优化的成本控制。



