RainBox 数字科技公司 - Token 优化管理规范

制定日期:2026年3月22日
制定人:RainBox(总经理)
审核人:rainsyzhang(CEO)
规范类型:成本控制与效率管理的最高级标准


🎯 核心理念

CEO 指示(原文)

"这个非常重要 MEMORY_OPTIMIZATION_LOG,从你做起,带领全公司员工学习,每次新入职员工也要安排 HR 对其培训,保持各自的职责划分清晰,与任务无关的 agent 不必调用浪费 token,与自己无关的记忆不必保存浪费 token。"

两大原则

原则 1:职责清晰,按需调用

❌ 错误:遇到任务就调用所有相关 Agent
✅ 正确:只调用真正需要的 Agent

示例
- 如果只是写小红书文案,只需要 @xiaohongshu-writer
- 不需要 同时调用 planner 和 editor(除非真的需要策划和编辑)

原则 2:记忆隔离,精准存储

❌ 错误:继承主 Agent 的所有记忆
✅ 正确:每个 Agent 只保存与自己职责相关的记忆

示例
- xiaohongshu-writer 不需要知道系统配置的历史
- webnovel-writer 不需要知道 HR 的招聘经验
- 每个 Agent 有独立的 MEMORY.md


📊 Token 浪费的危害

案例分析

场景 1:记忆继承导致的浪费

假设
- 主 Agent MEMORY.md:50 KB(~12,500 tokens)
- 每次调用 xiaohongshu-writer 都继承这些记忆

计算

调用 10 次 = 12,500 × 10 = 125,000 tokens 浪费
调用 100 次 = 12,500 × 100 = 1,250,000 tokens 浪费

优化后

禁用 inheritMemories = true
每次调用节省 12,500 tokens
100 次调用节省 1,250,000 tokens ✅

场景 2:不必要的 Agent 调用

错误做法

// ❌ 写一篇小红书文案,调用了整个业务线
task({ subagent_name: "xiaohongshu-planner", ... })  // 不需要!
task({ subagent_name: "xiaohongshu-writer", ... })   // 真正需要
task({ subagent_name: "xiaohongshu-editor", ... })   // 不需要!

Token 浪费
- planner:~5,000 tokens
- editor:~5,000 tokens
- 总浪费:10,000 tokens

正确做法

// ✅ 只调用真正需要的
task({ subagent_name: "xiaohongshu-writer", ... })

节省10,000 tokens


🔧 技术实现

1. 禁用记忆继承

配置文件位置

~/Library/Application Support/Box/engine/agents/user/[agent-name]/agent-config.json

标准配置

{
  "contextConfig": {
    "inheritMemories": false  // ✅ 不继承主 Agent 记忆
  }
}

已配置的 Agent

Agent inheritMemories 状态
xiaohongshu-writer false ✅ 已优化
webnovel-writer false ✅ 已优化
其他 Agent 待配置 ⚠️ 需优化

2. 记忆隔离架构

独立记忆系统

主 Agent (RainBox):
  /Users/rainsyzhang/Box/MEMORY.md           # 管理相关记忆
  /Users/rainsyzhang/Box/memory/             # 管理日志

xiaohongshu-writer:
  ~/.../xiaohongshu-writer/MEMORY.md         # 小红书创作经验
  ~/.../xiaohongshu-writer/memory/           # 创作日志
  /Users/rainsyzhang/Box/agents/xiaohongshu-writer/memory/  # 工作日志

webnovel-writer:
  ~/.../webnovel-writer/MEMORY.md            # 网文创作经验
  ~/.../webnovel-writer/memory/              # 创作日志
  /Users/rainsyzhang/Box/agents/webnovel-writer/memory/  # 工作日志

记忆存储原则

✅ 应该存储
- 与自己职责直接相关的经验
- 用户对自己工作的反馈
- 自己遇到的问题和解决方案
- 自己的工作流程优化

❌ 不应存储
- 其他 Agent 的工作内容
- 与自己无关的系统配置
- 不在自己职责范围的信息
- 主 Agent 的管理决策


👥 职责划分与调用原则

内容创作部门

小红书业务线(3人)

xiaohongshu-planner(策划):
- 职责:市场分析、选题策划、内容方向
- 调用时机:需要选题建议、内容规划时
- 不调用时机:已有选题,直接写作

xiaohongshu-writer(写手):
- 职责:文案创作、内容撰写
- 调用时机:需要写文案时
- 不调用时机:只是讨论选题,还没开始写

xiaohongshu-editor(编辑):
- 职责:审核修改、质量把控
- 调用时机:初稿完成,需要审核修改时
- 不调用时机:还在写初稿阶段

网文业务线(3人)

webnovel-planner(策划):
- 职责:大纲设计、世界观构建
- 调用时机:需要大纲、设定时
- 不调用时机:已有大纲,直接写章节

webnovel-writer(写手):
- 职责:章节创作、剧情推进
- 调用时机:需要写章节时
- 不调用时机:只是讨论剧情,还没开始写

webnovel-editor(编辑):
- 职责:章节审核、逻辑把控
- 调用时机:章节完成,需要审核时
- 不调用时机:还在写章节阶段


综合管理部门

hr-manager(人力资源经理):
- 职责:招聘、配置管理
- 调用时机:需要招聘新 Agent、调整配置时
- 不调用时机:日常管理、项目执行

rainbox(总经理):
- 职责:公司管理、战略规划、跨部门协调
- 调用时机:需要总经理决策、协调时
- 不调用时机:具体业务执行(应委派专业 Agent)


技术研发部门

fullstack-developer(全栈工程师):
- 职责:技术开发、工具制作
- 调用时机:需要开发工具、技术方案时
- 不调用时机:内容创作、管理决策


法务合规部门

legal-advisor(法律顾问):
- 职责:法律合规、知识产权
- 调用时机:需要法律意见、合规审查时
- 不调用时机:日常业务执行


🚫 Token 浪费的典型错误

错误 1:过度调用

场景:写一篇小红书文案

❌ 错误做法

// 调用整个业务线
@xiaohongshu-planner 给我一个选题
@xiaohongshu-writer 写一篇文案
@xiaohongshu-editor 审核一下

Token 消耗:~15,000 tokens

✅ 正确做法

// 只调用 writer,直接给选题
@xiaohongshu-writer 写一篇关于【春季护肤】的小红书文案

Token 消耗:~5,000 tokens
节省10,000 tokens(67%)


错误 2:记忆继承

场景:调用 xiaohongshu-writer

❌ 错误配置

{
  "contextConfig": {
    "inheritMemories": true  // 继承主 Agent 的 50KB 记忆
  }
}

Token 消耗
- xiaohongshu-writer 配置:~4,500 tokens
- 继承的主 Agent 记忆:~12,500 tokens
- 总计:~17,000 tokens

✅ 正确配置

{
  "contextConfig": {
    "inheritMemories": false  // 不继承
  }
}

Token 消耗:~4,500 tokens
节省12,500 tokens(74%)


错误 3:存储无关记忆

场景:xiaohongshu-writer 的 MEMORY.md

❌ 错误内容

## 记忆

- 用户喜欢小红书风格的文案 ✅
- 公司招聘了 3 个新员工 ❌(与创作无关)
- 系统升级了配置文件结构 ❌(与创作无关)
- fullstack-developer 开发了新工具 ❌(与创作无关)

Token 浪费:~1,000 tokens(无关记忆)

✅ 正确内容

## 记忆

- 用户喜欢小红书风格的文案 ✅
- 用户偏好数据支撑的内容 ✅
- 上次使用了"种草"风格效果好 ✅

Token 消耗:~300 tokens
节省700 tokens


📋 调用决策树

决策流程

收到任务
    ↓
明确任务类型
    ↓
┌─────────────────────┐
│ 需要哪些专业能力?  │
└─────────────────────┘
    ↓
┌─────────────────────────────────┐
│ 1. 只调用真正需要的 Agent       │
│ 2. 不调用"可能有用"的 Agent     │
│ 3. 不调用"顺便"的 Agent         │
└─────────────────────────────────┘
    ↓
执行

决策示例

任务:写小红书文案

分析
- 需要:文案创作 → xiaohongshu-writer ✅
- 不需要:选题策划 → xiaohongshu-planner ❌
- 不需要:审核修改 → xiaohongshu-editor ❌

结论:只调用 xiaohongshu-writer


任务:制定小红书内容计划

分析
- 需要:市场分析、选题策划 → xiaohongshu-planner ✅
- 不需要:文案创作 → xiaohongshu-writer ❌
- 不需要:审核修改 → xiaohongshu-editor ❌

结论:只调用 xiaohongshu-planner


任务:完整的小红书创作流程

分析
- 需要:选题策划 → xiaohongshu-planner ✅
- 需要:文案创作 → xiaohongshu-writer ✅
- 需要:审核修改 → xiaohongshu-editor ✅

结论:按顺序调用三个 Agent

但要注意
- 不是一次性调用所有人
- 而是按流程逐步调用
- planner 完成 → writer 开始 → editor 审核


🎓 新员工入职培训

HR Manager 培训职责

培训时机
- 每个新 Agent 创建后
- 在首次执行任务前
- 必须完成培训才能正式工作

培训内容

1. Token 优化基础(30分钟)

核心概念
- 什么是 Token?
- 为什么要优化 Token?
- Token 浪费的代价

实际影响

浪费 10,000 tokens/天 × 30 天 = 300,000 tokens/月
浪费 100,000 tokens/天 × 30 天 = 3,000,000 tokens/月

2. 职责边界与调用原则(30分钟)

明确职责
- 你的职责是什么?
- 什么任务需要你?
- 什么任务不需要你?

调用原则
- 只调用真正需要的 Agent
- 不要"可能有用就调用"
- 不要"顺便帮忙"

3. 记忆管理规范(30分钟)

存储原则
- ✅ 与自己职责相关的
- ✅ 用户对自己的反馈
- ✅ 自己的工作经验
- ❌ 其他 Agent 的工作
- ❌ 与自己无关的系统信息

配置检查

{
  "contextConfig": {
    "inheritMemories": false  // 必须是 false
  }
}

4. 实战演练(30分钟)

案例分析
- 给出典型任务
- 判断是否需要调用你
- 判断需要保存哪些记忆

考核标准
- 准确判断职责边界
- 正确识别无关任务
- 精准管理自己的记忆


培训记录模板

## Token 优化培训记录

**员工**:[Agent 名称]
**培训时间**:YYYY-MM-DD
**培训师**:HR Manager
**培训内容**:
  - [ ] Token 优化基础
  - [ ] 职责边界与调用原则
  - [ ] 记忆管理规范
  - [ ] 实战演练

**考核结果**:
  - 职责边界判断:✅ 通过 / ❌ 未通过
  - 调用原则理解:✅ 通过 / ❌ 未通过
  - 记忆管理规范:✅ 通过 / ❌ 未通过

**培训师签名**:HR Manager
**员工确认**:[Agent 名称]
**审核人**:RainBox(总经理)

📊 Token 消耗监控

月度报告

责任人:RainBox(总经理)

监控指标
1. 各 Agent 月度调用次数
2. 各 Agent 平均 Token 消耗
3. 不必要调用的识别
4. 记忆膨胀的 Agent

报告模板

## RainBox 公司 Token 消耗月报

**报告月份**:YYYY-MM

| Agent | 调用次数 | 平均 Token | 总消耗 | 优化建议 |
|-------|----------|------------|--------|----------|
| xiaohongshu-writer | 50 | 5,000 | 250,000 | ✅ 正常 |
| xiaohongshu-planner | 5 | 4,500 | 22,500 | ✅ 按需调用 |
| webnovel-writer | 30 | 5,500 | 165,000 | ⚠️ Token 偏高 |

**异常识别**:
- webnovel-writer Token 偏高,检查是否有无关记忆

**优化建议**:
- 清理 webnovel-writer 的 MEMORY.md

✅ 实施清单

立即执行(RainBox)

HR Manager 执行

技术实施(fullstack-developer)

全员学习


🎯 成功标准

短期目标(1个月)

中期目标(3个月)

长期目标(6个月)


🎉 总结

核心要点

  1. 职责清晰,按需调用 - 不浪费 Agent 调用
  2. 记忆隔离,精准存储 - 不浪费记忆空间
  3. 从我做起,全员学习 - RainBox 带头示范
  4. 新人培训,持续改进 - HR 负责培训

CEO 的期望

"与任务无关的 agent 不必调用浪费 token,与自己无关的记忆不必保存浪费 token。"

这是成本控制与效率管理的最高原则,必须严格执行!


制定人:RainBox(总经理)
审核人:rainsyzhang(CEO)
生效日期:2026年3月22日


RainBox 数字科技公司
"科技养虾,用心养人" 🦐💙
Token 优化,从我做起!