协作决策与自主进化的多智能体运行时
协作产生更丰富的轨迹 · 轨迹驱动更强的进化 · 进化实现更好的协作
v0.4.0 · Python 3.11+ · LiteLLM · MIT License
大多数多智能体框架只专注于协作或进化其中之一,而非将两者设计为单一反馈回路。CrabShrimp 将它们视为一个飞轮:
更好的协作 → 更丰富的轨迹 → 更强的进化 → 更好的协作
CrabShrimp 通过结构化的任务执行流程编排一组专职智能体(规划者、执行者、批评者、验证者、总结者),配合关键节点审议、任务后进化信号、可复用技能记忆和可选的人工审核检查点。所有状态持久化于 SQLite,每次运行均生成 JSONL 轨迹文件以供完整审计。
将任务分类为 code、analysis、reasoning、writing 或 general,生成带角色分配的结构化执行计划,并检测关键节点以触发多智能体审议。
针对关键决策的专用五步共识层:表态 → SyncP2P 互评 → 定向反馈 → 基于贡献分的加权投票 → 平票仲裁。
任务结束后分析轨迹信号,更新各智能体的贡献分:获胜 +0.10,验证失败 −0.15,批评拒绝 −0.10,任务提前中止 −0.05。贡献分直接影响后续投票权重。
从成功的轨迹步骤中蒸馏出可复用推理技能,按 (角色, 任务类型) 桶存入 SQLite,在后续运行时注入智能体的系统提示词。
分析轨迹信号与进化差值,识别表现不佳的角色,自动生成针对性的系统提示词改进——每次任务后自动执行,无需人工干预。
追踪各智能体在 Coral-Meeting 中的历史胜率,根据可配置的 bench_threshold 暂时下架弱势参与者;新智能体默认起始胜率为 1.0。
硬性步骤上限 + 硬性 Token 预算,80% 阈值提前预警,到达上限时通过摘要优雅收尾,确保任何任务都不会失控。
可选的审核检查点在规划后、共识后、验证失败后暂停执行,支持批准 / 编辑 / 终止。默认关闭,不影响全自动运行。
智能体画像、贡献分、任务记录、Coral-Meeting 结果、提取的技能和提示词优化记录跨会话持久存储,系统随使用时间持续成长。
收到任务后,Dragon-King 首先对任务进行分类,然后生成带角色分配的结构化执行计划。规划者、执行者、批评者、验证者、总结者各司其职,在统一编排下协同完成复杂任务,检测到关键节点时自动触发 Coral-Meeting 进行多方审议。
当 Dragon-King 检测到关键决策节点时,自动召集 Coral-Meeting:所有参与者先表明立场,再通过 SyncP2P 互相批评,收到定向反馈后进行加权投票,平票时启动仲裁。最终共识写入轨迹文件和持久化存储,全程可审计。
| 步骤 | 描述 |
|---|---|
| 1 | 各参与者表明立场 |
| 2 | 通过 SyncP2P 互相批评 |
| 2.5 | 各参与者收到定向批评 |
| 3 | 基于贡献分加权投票 |
| 4 | 平票时启动仲裁 |
| 5 | 共识写入轨迹与持久化 |
每次任务结束后,Shell-Molting 引擎分析 JSONL 轨迹,根据各智能体的实际表现更新贡献分。获胜的共识立场加分,导致验证失败或被拒绝的上游生产者减分。贡献分直接影响下次 Coral-Meeting 的投票权重,形成持续进化的闭环。
| 信号 | 变化 |
|---|---|
| Coral-Meeting 立场被采纳 | +0.10 |
| 验证者返回 NOT VERIFIED | −0.15 |
| 批评者返回 REJECTED | −0.10 |
| 任务提前中止 | −0.05 |
v0.4 新增的优化器智能体在任务结束后自动分析轨迹信号与进化差值,识别贡献分下降超过 0.05 或步骤以 failure 结束的角色,生成简洁的行为指令追加到该角色的系统提示词中,并存入 SQLite 的 prompt_optimizations 表,下次运行时自动注入,无需人工干预。
failureCrabShrimp 围绕五个子系统构建,形成一个闭合的反馈回路:Dragon-King 负责任务编排与分类,Coral-Meeting 提供关键节点共识,Shell-Molting 驱动任务后进化,Tidal-Pool 负责资源治理与隔离,Evolution 负责技能蒸馏与提示词优化。所有组件通过 Blackboard 共享状态与 SyncP2P 点对点消息队列进行通信。
| 角色 | 职责 |
|---|---|
| Planner(规划者) | 分析任务,准备执行结构 |
| Executor(执行者) | 执行实际子任务 |
| Critic(批评者) | 识别缺陷、风险与遗漏 |
| Verifier(验证者) | 独立验证输出的正确性 |
| Summarizer(总结者) | 综合最终输出 |
Coral-Meeting 的输出以 agent_id: "coral-meeting" 作为专属轨迹步骤记录,与普通步骤并排存储。
克隆仓库、配置 API Key,一条命令即可运行:
| 版本 | 状态 | 主要内容 |
|---|---|---|
| v0.1 | 已发布 | Dragon-King、Coral-Meeting、ResourceGuard、JSONL 轨迹 |
| v0.2a | 已发布 | SQLite 持久化 |
| v0.2b | 已发布 | Shell-Molting 进化信号 |
| v0.3 | 已发布 | 技能提取/注入、拓扑自适应、SyncP2P |
| v0.3 HITL | 已发布 | 规划、共识、验证失败的人工审核检查点 |
| v0.4 | 已发布 | 优化器智能体:自动分析轨迹信号并改进角色提示词 |
| v0.5 | 规划中 | 更强的沙箱后端(Docker / E2B) |
CrabShrimp 由以下成员构建与维护,基于 MIT 协议开源。
| 角色 | 成员 |
|---|---|
| 核心开发 & 维护 | Xiaoyu Tao |
| 指导教师 | Mingyue Cheng · Qi Liu · Enhong Chen |