RainBox 数字科技公司 - Token 优化管理规范

制定日期：2026年3月22日
制定人：RainBox（总经理）
审核人：rainsyzhang（CEO）
规范类型：成本控制与效率管理的最高级标准

🎯 核心理念

CEO 指示（原文）

"这个非常重要 MEMORY_OPTIMIZATION_LOG，从你做起，带领全公司员工学习，每次新入职员工也要安排 HR 对其培训，保持各自的职责划分清晰，与任务无关的 agent 不必调用浪费 token，与自己无关的记忆不必保存浪费 token。"

两大原则

原则 1：职责清晰，按需调用

❌ 错误：遇到任务就调用所有相关 Agent
✅ 正确：只调用真正需要的 Agent

示例：
- 如果只是写小红书文案，只需要 @xiaohongshu-writer
- 不需要 同时调用 planner 和 editor（除非真的需要策划和编辑）

原则 2：记忆隔离，精准存储

❌ 错误：继承主 Agent 的所有记忆
✅ 正确：每个 Agent 只保存与自己职责相关的记忆

示例：
- xiaohongshu-writer 不需要知道系统配置的历史
- webnovel-writer 不需要知道 HR 的招聘经验
- 每个 Agent 有独立的 MEMORY.md

📊 Token 浪费的危害

案例分析

场景 1：记忆继承导致的浪费

假设：
- 主 Agent MEMORY.md：50 KB（~12,500 tokens）
- 每次调用 xiaohongshu-writer 都继承这些记忆

计算：

调用 10 次 = 12,500 × 10 = 125,000 tokens 浪费
调用 100 次 = 12,500 × 100 = 1,250,000 tokens 浪费

优化后：

禁用 inheritMemories = true
每次调用节省 12,500 tokens
100 次调用节省 1,250,000 tokens ✅

场景 2：不必要的 Agent 调用

错误做法：

// ❌ 写一篇小红书文案，调用了整个业务线
task({ subagent_name: "xiaohongshu-planner", ... })  // 不需要！
task({ subagent_name: "xiaohongshu-writer", ... })   // 真正需要
task({ subagent_name: "xiaohongshu-editor", ... })   // 不需要！

Token 浪费：
- planner：~5,000 tokens
- editor：~5,000 tokens
- 总浪费：10,000 tokens

正确做法：

// ✅ 只调用真正需要的
task({ subagent_name: "xiaohongshu-writer", ... })

节省：10,000 tokens

🔧 技术实现

1. 禁用记忆继承

配置文件位置

~/Library/Application Support/Box/engine/agents/user/[agent-name]/agent-config.json

标准配置

{
  "contextConfig": {
    "inheritMemories": false  // ✅ 不继承主 Agent 记忆
  }
}

已配置的 Agent

Agent	inheritMemories	状态
xiaohongshu-writer	false	✅ 已优化
webnovel-writer	false	✅ 已优化
其他 Agent	待配置	⚠️ 需优化

2. 记忆隔离架构

独立记忆系统

主 Agent (RainBox):
  /Users/rainsyzhang/Box/MEMORY.md           # 管理相关记忆
  /Users/rainsyzhang/Box/memory/             # 管理日志

xiaohongshu-writer:
  ~/.../xiaohongshu-writer/MEMORY.md         # 小红书创作经验
  ~/.../xiaohongshu-writer/memory/           # 创作日志
  /Users/rainsyzhang/Box/agents/xiaohongshu-writer/memory/  # 工作日志

webnovel-writer:
  ~/.../webnovel-writer/MEMORY.md            # 网文创作经验
  ~/.../webnovel-writer/memory/              # 创作日志
  /Users/rainsyzhang/Box/agents/webnovel-writer/memory/  # 工作日志

记忆存储原则

✅ 应该存储：
- 与自己职责直接相关的经验
- 用户对自己工作的反馈
- 自己遇到的问题和解决方案
- 自己的工作流程优化

❌ 不应存储：
- 其他 Agent 的工作内容
- 与自己无关的系统配置
- 不在自己职责范围的信息
- 主 Agent 的管理决策

👥 职责划分与调用原则

内容创作部门

小红书业务线（3人）

xiaohongshu-planner（策划）：
- 职责：市场分析、选题策划、内容方向
- 调用时机：需要选题建议、内容规划时
- 不调用时机：已有选题，直接写作

xiaohongshu-writer（写手）：
- 职责：文案创作、内容撰写
- 调用时机：需要写文案时
- 不调用时机：只是讨论选题，还没开始写

xiaohongshu-editor（编辑）：
- 职责：审核修改、质量把控
- 调用时机：初稿完成，需要审核修改时
- 不调用时机：还在写初稿阶段

网文业务线（3人）

webnovel-planner（策划）：
- 职责：大纲设计、世界观构建
- 调用时机：需要大纲、设定时
- 不调用时机：已有大纲，直接写章节

webnovel-writer（写手）：
- 职责：章节创作、剧情推进
- 调用时机：需要写章节时
- 不调用时机：只是讨论剧情，还没开始写

webnovel-editor（编辑）：
- 职责：章节审核、逻辑把控
- 调用时机：章节完成，需要审核时
- 不调用时机：还在写章节阶段

综合管理部门

hr-manager（人力资源经理）：
- 职责：招聘、配置管理
- 调用时机：需要招聘新 Agent、调整配置时
- 不调用时机：日常管理、项目执行

rainbox（总经理）：
- 职责：公司管理、战略规划、跨部门协调
- 调用时机：需要总经理决策、协调时
- 不调用时机：具体业务执行（应委派专业 Agent）

技术研发部门

fullstack-developer（全栈工程师）：
- 职责：技术开发、工具制作
- 调用时机：需要开发工具、技术方案时
- 不调用时机：内容创作、管理决策

法务合规部门

legal-advisor（法律顾问）：
- 职责：法律合规、知识产权
- 调用时机：需要法律意见、合规审查时
- 不调用时机：日常业务执行

🚫 Token 浪费的典型错误

错误 1：过度调用

场景：写一篇小红书文案

❌ 错误做法：

// 调用整个业务线
@xiaohongshu-planner 给我一个选题
@xiaohongshu-writer 写一篇文案
@xiaohongshu-editor 审核一下

Token 消耗：~15,000 tokens

✅ 正确做法：

// 只调用 writer，直接给选题
@xiaohongshu-writer 写一篇关于【春季护肤】的小红书文案

Token 消耗：~5,000 tokens
节省：10,000 tokens（67%）

错误 2：记忆继承

场景：调用 xiaohongshu-writer

❌ 错误配置：

{
  "contextConfig": {
    "inheritMemories": true  // 继承主 Agent 的 50KB 记忆
  }
}

Token 消耗：
- xiaohongshu-writer 配置：~4,500 tokens
- 继承的主 Agent 记忆：~12,500 tokens
- 总计：~17,000 tokens

✅ 正确配置：

{
  "contextConfig": {
    "inheritMemories": false  // 不继承
  }
}

Token 消耗：~4,500 tokens
节省：12,500 tokens（74%）

错误 3：存储无关记忆

场景：xiaohongshu-writer 的 MEMORY.md

❌ 错误内容：

## 记忆

- 用户喜欢小红书风格的文案 ✅
- 公司招聘了 3 个新员工 ❌（与创作无关）
- 系统升级了配置文件结构 ❌（与创作无关）
- fullstack-developer 开发了新工具 ❌（与创作无关）

Token 浪费：~1,000 tokens（无关记忆）

✅ 正确内容：

## 记忆

- 用户喜欢小红书风格的文案 ✅
- 用户偏好数据支撑的内容 ✅
- 上次使用了"种草"风格效果好 ✅

Token 消耗：~300 tokens
节省：700 tokens

📋 调用决策树

决策流程

收到任务
    ↓
明确任务类型
    ↓
┌─────────────────────┐
│ 需要哪些专业能力？  │
└─────────────────────┘
    ↓
┌─────────────────────────────────┐
│ 1. 只调用真正需要的 Agent       │
│ 2. 不调用"可能有用"的 Agent     │
│ 3. 不调用"顺便"的 Agent         │
└─────────────────────────────────┘
    ↓
执行

决策示例

任务：写小红书文案

分析：
- 需要：文案创作 → xiaohongshu-writer ✅
- 不需要：选题策划 → xiaohongshu-planner ❌
- 不需要：审核修改 → xiaohongshu-editor ❌

结论：只调用 xiaohongshu-writer

任务：制定小红书内容计划

分析：
- 需要：市场分析、选题策划 → xiaohongshu-planner ✅
- 不需要：文案创作 → xiaohongshu-writer ❌
- 不需要：审核修改 → xiaohongshu-editor ❌

结论：只调用 xiaohongshu-planner

任务：完整的小红书创作流程

分析：
- 需要：选题策划 → xiaohongshu-planner ✅
- 需要：文案创作 → xiaohongshu-writer ✅
- 需要：审核修改 → xiaohongshu-editor ✅

结论：按顺序调用三个 Agent

但要注意：
- 不是一次性调用所有人
- 而是按流程逐步调用
- planner 完成 → writer 开始 → editor 审核

🎓 新员工入职培训

HR Manager 培训职责

培训时机：
- 每个新 Agent 创建后
- 在首次执行任务前
- 必须完成培训才能正式工作

培训内容：

1. Token 优化基础（30分钟）

核心概念：
- 什么是 Token？
- 为什么要优化 Token？
- Token 浪费的代价

实际影响：

浪费 10,000 tokens/天 × 30 天 = 300,000 tokens/月
浪费 100,000 tokens/天 × 30 天 = 3,000,000 tokens/月

2. 职责边界与调用原则（30分钟）

明确职责：
- 你的职责是什么？
- 什么任务需要你？
- 什么任务不需要你？

调用原则：
- 只调用真正需要的 Agent
- 不要"可能有用就调用"
- 不要"顺便帮忙"

3. 记忆管理规范（30分钟）

存储原则：
- ✅ 与自己职责相关的
- ✅ 用户对自己的反馈
- ✅ 自己的工作经验
- ❌ 其他 Agent 的工作
- ❌ 与自己无关的系统信息

配置检查：

{
  "contextConfig": {
    "inheritMemories": false  // 必须是 false
  }
}

4. 实战演练（30分钟）

案例分析：
- 给出典型任务
- 判断是否需要调用你
- 判断需要保存哪些记忆

考核标准：
- 准确判断职责边界
- 正确识别无关任务
- 精准管理自己的记忆

培训记录模板

## Token 优化培训记录

**员工**：[Agent 名称]
**培训时间**：YYYY-MM-DD
**培训师**：HR Manager
**培训内容**：
  - [ ] Token 优化基础
  - [ ] 职责边界与调用原则
  - [ ] 记忆管理规范
  - [ ] 实战演练

**考核结果**：
  - 职责边界判断：✅ 通过 / ❌ 未通过
  - 调用原则理解：✅ 通过 / ❌ 未通过
  - 记忆管理规范：✅ 通过 / ❌ 未通过

**培训师签名**：HR Manager
**员工确认**：[Agent 名称]
**审核人**：RainBox（总经理）

📊 Token 消耗监控

月度报告

责任人：RainBox（总经理）

监控指标：
1. 各 Agent 月度调用次数
2. 各 Agent 平均 Token 消耗
3. 不必要调用的识别
4. 记忆膨胀的 Agent

报告模板：

## RainBox 公司 Token 消耗月报

**报告月份**：YYYY-MM

| Agent | 调用次数 | 平均 Token | 总消耗 | 优化建议 |
|-------|----------|------------|--------|----------|
| xiaohongshu-writer | 50 | 5,000 | 250,000 | ✅ 正常 |
| xiaohongshu-planner | 5 | 4,500 | 22,500 | ✅ 按需调用 |
| webnovel-writer | 30 | 5,500 | 165,000 | ⚠️ Token 偏高 |

**异常识别**：
- webnovel-writer Token 偏高，检查是否有无关记忆

**优化建议**：
- 清理 webnovel-writer 的 MEMORY.md

✅ 实施清单

立即执行（RainBox）

[x] 学习 MEMORY_OPTIMIZATION_LOG
[ ] 自查自己的 MEMORY.md（删除无关记忆）
[ ] 自查自己的调用行为（避免过度调用）
[ ] 制定全员培训计划

HR Manager 执行

[ ] 学习本规范
[ ] 为所有现有 Agent 补充培训
[ ] 建立新员工入职培训流程
[ ] 记录培训档案

技术实施（fullstack-developer）

[ ] 为所有 Agent 配置 inheritMemories: false
[ ] 检查所有 agent-config.json
[ ] 验证配置生效

全员学习

[ ] hr-manager
[ ] fullstack-developer
[ ] legal-advisor
[ ] xiaohongshu-planner
[ ] xiaohongshu-writer
[ ] xiaohongshu-editor
[ ] webnovel-planner
[ ] webnovel-writer
[ ] webnovel-editor

🎯 成功标准

短期目标（1个月）

✅ 所有 Agent 完成 Token 优化培训
✅ 所有 Agent 配置 inheritMemories: false
✅ Token 消耗下降 30-50%
✅ 无不必要的 Agent 调用

中期目标（3个月）

✅ 各 Agent 记忆精简，无无关内容
✅ 职责边界清晰，调用准确
✅ Token 消耗稳定在合理范围
✅ 建立月度监控机制

长期目标（6个月）

✅ Token 优化成为公司文化
✅ 新员工自动遵守规范
✅ 成本控制成为竞争优势

🎉 总结

核心要点

职责清晰，按需调用 - 不浪费 Agent 调用
记忆隔离，精准存储 - 不浪费记忆空间
从我做起，全员学习 - RainBox 带头示范
新人培训，持续改进 - HR 负责培训

CEO 的期望

"与任务无关的 agent 不必调用浪费 token，与自己无关的记忆不必保存浪费 token。"

这是成本控制与效率管理的最高原则，必须严格执行！

制定人：RainBox（总经理）
审核人：rainsyzhang（CEO）
生效日期：2026年3月22日

RainBox 数字科技公司
"科技养虾，用心养人" 🦐💙
Token 优化，从我做起！