OpenClaw（原Clawdbot）省钱优化：如何将成本降低 97%

阿司匹林

2026-02-05 11:15:38

模型优化

性能优化

模型部署

文章摘要

OpenClaw是可本地部署的强大AI，但 API 费用很高。文章给出四项优化步骤，可将每月API支出从$1500+降至$30-50，节省达97%，实现成本最优化控制。

重要免责声明与警告

在开始之前，必须强调以下几点：

开发者限定： 如果你不是开发者或没有本地部署应用的经验，请不要尝试。这涉及代码和配置文件修改。
必须在受控环境中运行： 切勿在你日常使用的主机上直接运行 OpenClaw。它会尝试访问你所有的应用、文件甚至信用卡信息。请务必在独立的设备、虚拟机中运行。
操作风险： 这里的步骤涉及修改核心逻辑，如果操作不当可能会导致 OpenClaw 无法运行。

概述

OpenClaw 是一个可以在本地部署的强大 AI，它可以连接到其他平台并自主执行任务。但其 API 调用成本高得惊人，仅仅待机的情况下，每天也能消耗数美元。

本指南有四个步骤，通过以下几项优化，您可以将每月的 API 支出从 $1500+ 降到 $30-50，节省最多可达 97%，同时保持 OpenClaw 的高效运行。

OpenClaw 官网截图

解决方案

第一步：会话初始化

问题： 每次启动时，OpenClaw 会加载大量历史记录（例如 Identity.md、User.md 等），这些内容在大多数情况下并不需要。这样会造成大量的 token 浪费，尤其是会话频繁时。

解决方案： 在系统提示词中加入会话初始化规则，控制每次会话加载的内容，只加载必要的文件和信息。

会话初始化规则：

会话开始时：
1.仅加载以下文件：
  - SOUL.md
  - USER.md
  - IDENTITY.md
  - memory/YYYY-MM-DD.md（如存在）

2.不自动加载：
  - MEMORY.md
  - 之前的消息记录
  - 工具输出

3.用户询问历史时：
  - 使用 memory_search() 查询所需内容
  - 只加载相关片段，而非整个文件

4.每次会话结束时更新 memory/YYYY-MM-DD.md：
  - 记录处理过的内容
  - 做出的决定
  - 阻碍因素与下一步计划

效果： 通过这种方式，每次会话初始化只加载 8KB 的数据，而不是 50KB 的历史记录，节省 80% 的上下文成本。

第二步：模型路由优化

Claude 3 Haiku 模型

问题： OpenClaw 默认使用高成本的 Claude Sonnet 模型处理所有任务，而一些简单的任务（如文件状态检查、常规命令执行等）不需要如此强大的模型。

解决方案： 将默认模型设置为便宜且高效的 Haiku 模型，仅在需要进行架构决策、复杂代码审查或安全分析时切换到 Sonnet 模型。

配置步骤：

打开配置文件 ~/.openclaw/openclaw.json，设置 Haiku 为默认模型。

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-haiku-4-5"
      },
      "models": {
        "anthropic/claude-sonnet-4-5": {
          "alias": "sonnet"
        },
        "anthropic/claude-haiku-4-5": {
          "alias": "haiku"
        }
      }
    }
  }
}

在系统提示词中添加模型选择规则：

默认使用 Haiku 模型
仅在以下情况下切换到 Sonnet 模型：
- 架构决策
- 复杂代码审查
- 安全分析
- 复杂调试与推理
- 战略性多项目决策

效果： 常规任务使用 Haiku 模型，大幅降低每月的模型费用，将原本的 $50-70 降至 $5-10。

第三步：活跃检测优化

Ollama 官方标志

问题： OpenClaw 默认使用付费 API 来进行活跃检测（Heartbeat），这种常规的任务会导致不必要的 token 浪费。

解决方案： 将心跳检测迁移到免费的本地 LLM（如 Ollama）上，避免每次检测都消耗付费 API token。

步骤：

1. 安装 Ollama 并下载轻量模型（如 Llama 3.2）。

curl -fsSL https://ollama.ai/install.sh | sh
ollama pull llama3.2:3b

2. 更新配置文件 ~/.openclaw/openclaw.json，将活跃检测指向 Ollama 本地 LLM。

{
  "heartbeat": {
    "every": "1h",
    "model": "ollama/llama3.2:3b",
    "session": "main",
    "target": "slack",
    "prompt": "检查：是否有阻碍、机会或进展需要更新?"
  }
}

效果： 活跃检测成本从每月 $5-15 降至 $0，完全避免了额外的费用。

第四步：速率限制与预算控制

问题： 自动化任务可能因为频繁的 API 调用而消耗大量 token，尤其是在没有速率限制的情况下，可能会出现死循环。

解决方案： 在系统提示词中加入速率限制规则，并设置每日和每月预算控制，防止 token 被过度消耗。

速率限制与预算控制规则：

API 调用间隔至少 5 秒
搜索间隔至少 10 秒
每次批量搜索最多 5 个结果，休息 2 分钟
如果遇到 429 错误：停止，等待 5 分钟后重试

预算设置：

每日预算：$5（达到 75% 时提醒）
每月预算：$200（达到 75% 时提醒）

效果： 通过控制 API 调用频率和设置预算，您可以避免高频率调用导致的意外费用，同时确保月度支出在可控范围内。

优化后的成果对比

指标	优化前	优化后
活跃检测	每天空烧 $3-$5	$0
模型使用	全部使用 Sonnet/Opus	85% Haiku + 15% 本地模型
上下文	每次加载 50KB+ 并不断累积	仅加载必要信息 (<2KB)
API 错误	频繁触发 429	内置配速，运行流畅
单任务成本	复杂任务需 $100+	同等任务仅需 $6

案例：

运行一个通宵的复杂任务：利用 14 个子 Agent 抓取网络、寻找潜在客户、阅读博客、分析决策者、寻找邮箱并撰写个性化开发信。

耗时： 6 小时
产出： 完成了外包需要一个月才能完成的工作量
总成本： 仅 $6 美元

总结

OpenClaw 极其强大，但它的默认设置是性能优先。如果不进行配置，它会非常花钱。

通过实施以上四项优化，您可以显著降低 OpenClaw 的使用成本。每项优化都是针对不同的成本因素进行针对性调整，从而实现最优化的成本控制。

以上内容不代表本平台立场，仅供读者参考