RainBox 数字科技公司 - Token 优化管理规范
制定日期:2026年3月22日
制定人:RainBox(总经理)
审核人:rainsyzhang(CEO)
规范类型:成本控制与效率管理的最高级标准
🎯 核心理念
CEO 指示(原文)
"这个非常重要 MEMORY_OPTIMIZATION_LOG,从你做起,带领全公司员工学习,每次新入职员工也要安排 HR 对其培训,保持各自的职责划分清晰,与任务无关的 agent 不必调用浪费 token,与自己无关的记忆不必保存浪费 token。"
两大原则
原则 1:职责清晰,按需调用
❌ 错误:遇到任务就调用所有相关 Agent
✅ 正确:只调用真正需要的 Agent
示例:
- 如果只是写小红书文案,只需要 @xiaohongshu-writer
- 不需要 同时调用 planner 和 editor(除非真的需要策划和编辑)
原则 2:记忆隔离,精准存储
❌ 错误:继承主 Agent 的所有记忆
✅ 正确:每个 Agent 只保存与自己职责相关的记忆
示例:
- xiaohongshu-writer 不需要知道系统配置的历史
- webnovel-writer 不需要知道 HR 的招聘经验
- 每个 Agent 有独立的 MEMORY.md
📊 Token 浪费的危害
案例分析
场景 1:记忆继承导致的浪费
假设:
- 主 Agent MEMORY.md:50 KB(~12,500 tokens)
- 每次调用 xiaohongshu-writer 都继承这些记忆
计算:
调用 10 次 = 12,500 × 10 = 125,000 tokens 浪费
调用 100 次 = 12,500 × 100 = 1,250,000 tokens 浪费
优化后:
禁用 inheritMemories = true
每次调用节省 12,500 tokens
100 次调用节省 1,250,000 tokens ✅
场景 2:不必要的 Agent 调用
错误做法:
// ❌ 写一篇小红书文案,调用了整个业务线
task({ subagent_name: "xiaohongshu-planner", ... }) // 不需要!
task({ subagent_name: "xiaohongshu-writer", ... }) // 真正需要
task({ subagent_name: "xiaohongshu-editor", ... }) // 不需要!
Token 浪费:
- planner:~5,000 tokens
- editor:~5,000 tokens
- 总浪费:10,000 tokens
正确做法:
// ✅ 只调用真正需要的
task({ subagent_name: "xiaohongshu-writer", ... })
节省:10,000 tokens
🔧 技术实现
1. 禁用记忆继承
配置文件位置
~/Library/Application Support/Box/engine/agents/user/[agent-name]/agent-config.json
标准配置
{
"contextConfig": {
"inheritMemories": false // ✅ 不继承主 Agent 记忆
}
}
已配置的 Agent
| Agent | inheritMemories | 状态 |
|---|---|---|
| xiaohongshu-writer | false | ✅ 已优化 |
| webnovel-writer | false | ✅ 已优化 |
| 其他 Agent | 待配置 | ⚠️ 需优化 |
2. 记忆隔离架构
独立记忆系统
主 Agent (RainBox):
/Users/rainsyzhang/Box/MEMORY.md # 管理相关记忆
/Users/rainsyzhang/Box/memory/ # 管理日志
xiaohongshu-writer:
~/.../xiaohongshu-writer/MEMORY.md # 小红书创作经验
~/.../xiaohongshu-writer/memory/ # 创作日志
/Users/rainsyzhang/Box/agents/xiaohongshu-writer/memory/ # 工作日志
webnovel-writer:
~/.../webnovel-writer/MEMORY.md # 网文创作经验
~/.../webnovel-writer/memory/ # 创作日志
/Users/rainsyzhang/Box/agents/webnovel-writer/memory/ # 工作日志
记忆存储原则
✅ 应该存储:
- 与自己职责直接相关的经验
- 用户对自己工作的反馈
- 自己遇到的问题和解决方案
- 自己的工作流程优化
❌ 不应存储:
- 其他 Agent 的工作内容
- 与自己无关的系统配置
- 不在自己职责范围的信息
- 主 Agent 的管理决策
👥 职责划分与调用原则
内容创作部门
小红书业务线(3人)
xiaohongshu-planner(策划):
- 职责:市场分析、选题策划、内容方向
- 调用时机:需要选题建议、内容规划时
- 不调用时机:已有选题,直接写作
xiaohongshu-writer(写手):
- 职责:文案创作、内容撰写
- 调用时机:需要写文案时
- 不调用时机:只是讨论选题,还没开始写
xiaohongshu-editor(编辑):
- 职责:审核修改、质量把控
- 调用时机:初稿完成,需要审核修改时
- 不调用时机:还在写初稿阶段
网文业务线(3人)
webnovel-planner(策划):
- 职责:大纲设计、世界观构建
- 调用时机:需要大纲、设定时
- 不调用时机:已有大纲,直接写章节
webnovel-writer(写手):
- 职责:章节创作、剧情推进
- 调用时机:需要写章节时
- 不调用时机:只是讨论剧情,还没开始写
webnovel-editor(编辑):
- 职责:章节审核、逻辑把控
- 调用时机:章节完成,需要审核时
- 不调用时机:还在写章节阶段
综合管理部门
hr-manager(人力资源经理):
- 职责:招聘、配置管理
- 调用时机:需要招聘新 Agent、调整配置时
- 不调用时机:日常管理、项目执行
rainbox(总经理):
- 职责:公司管理、战略规划、跨部门协调
- 调用时机:需要总经理决策、协调时
- 不调用时机:具体业务执行(应委派专业 Agent)
技术研发部门
fullstack-developer(全栈工程师):
- 职责:技术开发、工具制作
- 调用时机:需要开发工具、技术方案时
- 不调用时机:内容创作、管理决策
法务合规部门
legal-advisor(法律顾问):
- 职责:法律合规、知识产权
- 调用时机:需要法律意见、合规审查时
- 不调用时机:日常业务执行
🚫 Token 浪费的典型错误
错误 1:过度调用
场景:写一篇小红书文案
❌ 错误做法:
// 调用整个业务线
@xiaohongshu-planner 给我一个选题
@xiaohongshu-writer 写一篇文案
@xiaohongshu-editor 审核一下
Token 消耗:~15,000 tokens
✅ 正确做法:
// 只调用 writer,直接给选题
@xiaohongshu-writer 写一篇关于【春季护肤】的小红书文案
Token 消耗:~5,000 tokens
节省:10,000 tokens(67%)
错误 2:记忆继承
场景:调用 xiaohongshu-writer
❌ 错误配置:
{
"contextConfig": {
"inheritMemories": true // 继承主 Agent 的 50KB 记忆
}
}
Token 消耗:
- xiaohongshu-writer 配置:~4,500 tokens
- 继承的主 Agent 记忆:~12,500 tokens
- 总计:~17,000 tokens
✅ 正确配置:
{
"contextConfig": {
"inheritMemories": false // 不继承
}
}
Token 消耗:~4,500 tokens
节省:12,500 tokens(74%)
错误 3:存储无关记忆
场景:xiaohongshu-writer 的 MEMORY.md
❌ 错误内容:
## 记忆
- 用户喜欢小红书风格的文案 ✅
- 公司招聘了 3 个新员工 ❌(与创作无关)
- 系统升级了配置文件结构 ❌(与创作无关)
- fullstack-developer 开发了新工具 ❌(与创作无关)
Token 浪费:~1,000 tokens(无关记忆)
✅ 正确内容:
## 记忆
- 用户喜欢小红书风格的文案 ✅
- 用户偏好数据支撑的内容 ✅
- 上次使用了"种草"风格效果好 ✅
Token 消耗:~300 tokens
节省:700 tokens
📋 调用决策树
决策流程
收到任务
↓
明确任务类型
↓
┌─────────────────────┐
│ 需要哪些专业能力? │
└─────────────────────┘
↓
┌─────────────────────────────────┐
│ 1. 只调用真正需要的 Agent │
│ 2. 不调用"可能有用"的 Agent │
│ 3. 不调用"顺便"的 Agent │
└─────────────────────────────────┘
↓
执行
决策示例
任务:写小红书文案
分析:
- 需要:文案创作 → xiaohongshu-writer ✅
- 不需要:选题策划 → xiaohongshu-planner ❌
- 不需要:审核修改 → xiaohongshu-editor ❌
结论:只调用 xiaohongshu-writer
任务:制定小红书内容计划
分析:
- 需要:市场分析、选题策划 → xiaohongshu-planner ✅
- 不需要:文案创作 → xiaohongshu-writer ❌
- 不需要:审核修改 → xiaohongshu-editor ❌
结论:只调用 xiaohongshu-planner
任务:完整的小红书创作流程
分析:
- 需要:选题策划 → xiaohongshu-planner ✅
- 需要:文案创作 → xiaohongshu-writer ✅
- 需要:审核修改 → xiaohongshu-editor ✅
结论:按顺序调用三个 Agent
但要注意:
- 不是一次性调用所有人
- 而是按流程逐步调用
- planner 完成 → writer 开始 → editor 审核
🎓 新员工入职培训
HR Manager 培训职责
培训时机:
- 每个新 Agent 创建后
- 在首次执行任务前
- 必须完成培训才能正式工作
培训内容:
1. Token 优化基础(30分钟)
核心概念:
- 什么是 Token?
- 为什么要优化 Token?
- Token 浪费的代价
实际影响:
浪费 10,000 tokens/天 × 30 天 = 300,000 tokens/月
浪费 100,000 tokens/天 × 30 天 = 3,000,000 tokens/月
2. 职责边界与调用原则(30分钟)
明确职责:
- 你的职责是什么?
- 什么任务需要你?
- 什么任务不需要你?
调用原则:
- 只调用真正需要的 Agent
- 不要"可能有用就调用"
- 不要"顺便帮忙"
3. 记忆管理规范(30分钟)
存储原则:
- ✅ 与自己职责相关的
- ✅ 用户对自己的反馈
- ✅ 自己的工作经验
- ❌ 其他 Agent 的工作
- ❌ 与自己无关的系统信息
配置检查:
{
"contextConfig": {
"inheritMemories": false // 必须是 false
}
}
4. 实战演练(30分钟)
案例分析:
- 给出典型任务
- 判断是否需要调用你
- 判断需要保存哪些记忆
考核标准:
- 准确判断职责边界
- 正确识别无关任务
- 精准管理自己的记忆
培训记录模板
## Token 优化培训记录
**员工**:[Agent 名称]
**培训时间**:YYYY-MM-DD
**培训师**:HR Manager
**培训内容**:
- [ ] Token 优化基础
- [ ] 职责边界与调用原则
- [ ] 记忆管理规范
- [ ] 实战演练
**考核结果**:
- 职责边界判断:✅ 通过 / ❌ 未通过
- 调用原则理解:✅ 通过 / ❌ 未通过
- 记忆管理规范:✅ 通过 / ❌ 未通过
**培训师签名**:HR Manager
**员工确认**:[Agent 名称]
**审核人**:RainBox(总经理)
📊 Token 消耗监控
月度报告
责任人:RainBox(总经理)
监控指标:
1. 各 Agent 月度调用次数
2. 各 Agent 平均 Token 消耗
3. 不必要调用的识别
4. 记忆膨胀的 Agent
报告模板:
## RainBox 公司 Token 消耗月报
**报告月份**:YYYY-MM
| Agent | 调用次数 | 平均 Token | 总消耗 | 优化建议 |
|-------|----------|------------|--------|----------|
| xiaohongshu-writer | 50 | 5,000 | 250,000 | ✅ 正常 |
| xiaohongshu-planner | 5 | 4,500 | 22,500 | ✅ 按需调用 |
| webnovel-writer | 30 | 5,500 | 165,000 | ⚠️ Token 偏高 |
**异常识别**:
- webnovel-writer Token 偏高,检查是否有无关记忆
**优化建议**:
- 清理 webnovel-writer 的 MEMORY.md
✅ 实施清单
立即执行(RainBox)
- [x] 学习 MEMORY_OPTIMIZATION_LOG
- [ ] 自查自己的 MEMORY.md(删除无关记忆)
- [ ] 自查自己的调用行为(避免过度调用)
- [ ] 制定全员培训计划
HR Manager 执行
- [ ] 学习本规范
- [ ] 为所有现有 Agent 补充培训
- [ ] 建立新员工入职培训流程
- [ ] 记录培训档案
技术实施(fullstack-developer)
- [ ] 为所有 Agent 配置
inheritMemories: false - [ ] 检查所有 agent-config.json
- [ ] 验证配置生效
全员学习
- [ ] hr-manager
- [ ] fullstack-developer
- [ ] legal-advisor
- [ ] xiaohongshu-planner
- [ ] xiaohongshu-writer
- [ ] xiaohongshu-editor
- [ ] webnovel-planner
- [ ] webnovel-writer
- [ ] webnovel-editor
🎯 成功标准
短期目标(1个月)
- ✅ 所有 Agent 完成 Token 优化培训
- ✅ 所有 Agent 配置
inheritMemories: false - ✅ Token 消耗下降 30-50%
- ✅ 无不必要的 Agent 调用
中期目标(3个月)
- ✅ 各 Agent 记忆精简,无无关内容
- ✅ 职责边界清晰,调用准确
- ✅ Token 消耗稳定在合理范围
- ✅ 建立月度监控机制
长期目标(6个月)
- ✅ Token 优化成为公司文化
- ✅ 新员工自动遵守规范
- ✅ 成本控制成为竞争优势
🎉 总结
核心要点
- 职责清晰,按需调用 - 不浪费 Agent 调用
- 记忆隔离,精准存储 - 不浪费记忆空间
- 从我做起,全员学习 - RainBox 带头示范
- 新人培训,持续改进 - HR 负责培训
CEO 的期望
"与任务无关的 agent 不必调用浪费 token,与自己无关的记忆不必保存浪费 token。"
这是成本控制与效率管理的最高原则,必须严格执行!
制定人:RainBox(总经理)
审核人:rainsyzhang(CEO)
生效日期:2026年3月22日
RainBox 数字科技公司
"科技养虾,用心养人" 🦐💙
Token 优化,从我做起!