CrabShrimp

核心特性

🐉

Dragon-King 动态编排器

将任务分类为 code、analysis、reasoning、writing 或 general，生成带角色分配的结构化执行计划，并检测关键节点以触发多智能体审议。

🪸

Coral-Meeting 共识协议

针对关键决策的专用五步共识层：表态 → SyncP2P 互评 → 定向反馈 → 基于贡献分的加权投票 → 平票仲裁。

🦀

Shell-Molting 进化引擎

任务结束后分析轨迹信号，更新各智能体的贡献分：获胜 +0.10，验证失败 −0.15，批评拒绝 −0.10，任务提前中止 −0.05。贡献分直接影响后续投票权重。

🧠

技能记忆与注入

从成功的轨迹步骤中蒸馏出可复用推理技能，按 (角色, 任务类型) 桶存入 SQLite，在后续运行时注入智能体的系统提示词。

✨

优化器智能体（v0.4）

分析轨迹信号与进化差值，识别表现不佳的角色，自动生成针对性的系统提示词改进——每次任务后自动执行，无需人工干预。

🔱

拓扑自适应

追踪各智能体在 Coral-Meeting 中的历史胜率，根据可配置的 bench_threshold 暂时下架弱势参与者；新智能体默认起始胜率为 1.0。

🌊

Tidal-Pool 资源治理

硬性步骤上限 + 硬性 Token 预算，80% 阈值提前预警，到达上限时通过摘要优雅收尾，确保任何任务都不会失控。

🙋

人机协同（HITL）

可选的审核检查点在规划后、共识后、验证失败后暂停执行，支持批准 / 编辑 / 终止。默认关闭，不影响全自动运行。

🗄️

SQLite 全量持久化

智能体画像、贡献分、任务记录、Coral-Meeting 结果、提取的技能和提示词优化记录跨会话持久存储，系统随使用时间持续成长。

🐉 Dragon-King 动态编排

收到任务后，Dragon-King 首先对任务进行分类，然后生成带角色分配的结构化执行计划。规划者、执行者、批评者、验证者、总结者各司其职，在统一编排下协同完成复杂任务，检测到关键节点时自动触发 Coral-Meeting 进行多方审议。

执行计划示例
① Planner — 分析任务，制定执行结构
② Executor — 执行核心子任务
　　↳ 检测到关键节点，触发 Coral-Meeting
③ Critic — 识别缺陷与风险
④ Verifier — 独立验证正确性
⑤ Summarizer — 综合最终输出

🪸 Coral-Meeting 共识协议

当 Dragon-King 检测到关键决策节点时，自动召集 Coral-Meeting：所有参与者先表明立场，再通过 SyncP2P 互相批评，收到定向反馈后进行加权投票，平票时启动仲裁。最终共识写入轨迹文件和持久化存储，全程可审计。

步骤	描述
1	各参与者表明立场
2	通过 SyncP2P 互相批评
2.5	各参与者收到定向批评
3	基于贡献分加权投票
4	平票时启动仲裁
5	共识写入轨迹与持久化

🦀 Shell-Molting 进化信号

每次任务结束后，Shell-Molting 引擎分析 JSONL 轨迹，根据各智能体的实际表现更新贡献分。获胜的共识立场加分，导致验证失败或被拒绝的上游生产者减分。贡献分直接影响下次 Coral-Meeting 的投票权重，形成持续进化的闭环。

信号	变化
Coral-Meeting 立场被采纳	+0.10
验证者返回 NOT VERIFIED	−0.15
批评者返回 REJECTED	−0.10
任务提前中止	−0.05

✨ 优化器智能体（v0.4）

v0.4 新增的优化器智能体在任务结束后自动分析轨迹信号与进化差值，识别贡献分下降超过 0.05 或步骤以 failure 结束的角色，生成简洁的行为指令追加到该角色的系统提示词中，并存入 SQLite 的 prompt_optimizations 表，下次运行时自动注入，无需人工干预。

触发条件
• 贡献分降幅 > 0.05
• 步骤结果为 failure
排除规则
• Critic / Verifier 永不被优化
存储上限
• 每个 (角色, 任务类型) 槽最多 5 条

系统架构

CrabShrimp 围绕五个子系统构建，形成一个闭合的反馈回路：Dragon-King 负责任务编排与分类，Coral-Meeting 提供关键节点共识，Shell-Molting 驱动任务后进化，Tidal-Pool 负责资源治理与隔离，Evolution 负责技能蒸馏与提示词优化。所有组件通过 Blackboard 共享状态与 SyncP2P 点对点消息队列进行通信。

内置角色

角色	职责
Planner（规划者）	分析任务，准备执行结构
Executor（执行者）	执行实际子任务
Critic（批评者）	识别缺陷、风险与遗漏
Verifier（验证者）	独立验证输出的正确性
Summarizer（总结者）	综合最终输出

JSONL 轨迹格式

{
  "step_id": "a1b2c3d4-...",
  "task_id": "d213388e",
  "agent_id": "executor-001",
  "reasoning": "...",
  "output": "...",
  "interactions": [
    { "agent_id": "critic-001", "reaction": "disagree", "content": "..." }
  ],
  "result": "success",
  "timestamp": "2026-03-27T10:00:00+00:00"
}

Coral-Meeting 的输出以 agent_id: "coral-meeting" 作为专属轨迹步骤记录，与普通步骤并排存储。

完整架构文档 →

版本	状态	主要内容
v0.1	已发布	Dragon-King、Coral-Meeting、ResourceGuard、JSONL 轨迹
v0.2a	已发布	SQLite 持久化
v0.2b	已发布	Shell-Molting 进化信号
v0.3	已发布	技能提取/注入、拓扑自适应、SyncP2P
v0.3 HITL	已发布	规划、共识、验证失败的人工审核检查点
v0.4	已发布	优化器智能体：自动分析轨迹信号并改进角色提示词
v0.5	规划中	更强的沙箱后端（Docker / E2B）

角色	成员
核心开发 & 维护	Xiaoyu Tao
指导教师	Mingyue Cheng · Qi Liu · Enhong Chen

项目简介