CrabShrimp

协作决策与自主进化的多智能体运行时
协作产生更丰富的轨迹 · 轨迹驱动更强的进化 · 进化实现更好的协作

v0.4.0  ·  Python 3.11+  ·  LiteLLM  ·  MIT License

一句话介绍: CrabShrimp 是一个开源多智能体运行时,将协作自主进化设计为单一反馈飞轮——多个角色智能体协作完成任务,生成丰富的执行轨迹,轨迹驱动进化信号和技能蒸馏,进化后的智能体在下次任务中协作得更好。个体棋子,集体智慧。

项目简介

大多数多智能体框架只专注于协作进化其中之一,而非将两者设计为单一反馈回路。CrabShrimp 将它们视为一个飞轮:

更好的协作 → 更丰富的轨迹 → 更强的进化 → 更好的协作

CrabShrimp 通过结构化的任务执行流程编排一组专职智能体(规划者、执行者、批评者、验证者、总结者),配合关键节点审议、任务后进化信号、可复用技能记忆和可选的人工审核检查点。所有状态持久化于 SQLite,每次运行均生成 JSONL 轨迹文件以供完整审计。

CrabShrimp 架构图

核心特性

🐉

Dragon-King 动态编排器

将任务分类为 codeanalysisreasoningwritinggeneral,生成带角色分配的结构化执行计划,并检测关键节点以触发多智能体审议。

🪸

Coral-Meeting 共识协议

针对关键决策的专用五步共识层:表态 → SyncP2P 互评 → 定向反馈 → 基于贡献分的加权投票 → 平票仲裁。

🦀

Shell-Molting 进化引擎

任务结束后分析轨迹信号,更新各智能体的贡献分:获胜 +0.10,验证失败 −0.15,批评拒绝 −0.10,任务提前中止 −0.05。贡献分直接影响后续投票权重。

🧠

技能记忆与注入

从成功的轨迹步骤中蒸馏出可复用推理技能,按 (角色, 任务类型) 桶存入 SQLite,在后续运行时注入智能体的系统提示词。

优化器智能体(v0.4)

分析轨迹信号与进化差值,识别表现不佳的角色,自动生成针对性的系统提示词改进——每次任务后自动执行,无需人工干预。

🔱

拓扑自适应

追踪各智能体在 Coral-Meeting 中的历史胜率,根据可配置的 bench_threshold 暂时下架弱势参与者;新智能体默认起始胜率为 1.0。

🌊

Tidal-Pool 资源治理

硬性步骤上限 + 硬性 Token 预算,80% 阈值提前预警,到达上限时通过摘要优雅收尾,确保任何任务都不会失控。

🙋

人机协同(HITL)

可选的审核检查点在规划后、共识后、验证失败后暂停执行,支持批准 / 编辑 / 终止。默认关闭,不影响全自动运行。

🗄️

SQLite 全量持久化

智能体画像、贡献分、任务记录、Coral-Meeting 结果、提取的技能和提示词优化记录跨会话持久存储,系统随使用时间持续成长。

🐉 Dragon-King 动态编排

收到任务后,Dragon-King 首先对任务进行分类,然后生成带角色分配的结构化执行计划。规划者、执行者、批评者、验证者、总结者各司其职,在统一编排下协同完成复杂任务,检测到关键节点时自动触发 Coral-Meeting 进行多方审议。

执行计划示例
Planner — 分析任务,制定执行结构
Executor — 执行核心子任务
  ↳ 检测到关键节点,触发 Coral-Meeting
Critic — 识别缺陷与风险
Verifier — 独立验证正确性
Summarizer — 综合最终输出

🪸 Coral-Meeting 共识协议

当 Dragon-King 检测到关键决策节点时,自动召集 Coral-Meeting:所有参与者先表明立场,再通过 SyncP2P 互相批评,收到定向反馈后进行加权投票,平票时启动仲裁。最终共识写入轨迹文件和持久化存储,全程可审计。

步骤描述
1各参与者表明立场
2通过 SyncP2P 互相批评
2.5各参与者收到定向批评
3基于贡献分加权投票
4平票时启动仲裁
5共识写入轨迹与持久化

🦀 Shell-Molting 进化信号

每次任务结束后,Shell-Molting 引擎分析 JSONL 轨迹,根据各智能体的实际表现更新贡献分。获胜的共识立场加分,导致验证失败或被拒绝的上游生产者减分。贡献分直接影响下次 Coral-Meeting 的投票权重,形成持续进化的闭环。

信号变化
Coral-Meeting 立场被采纳+0.10
验证者返回 NOT VERIFIED−0.15
批评者返回 REJECTED−0.10
任务提前中止−0.05

✨ 优化器智能体(v0.4)

v0.4 新增的优化器智能体在任务结束后自动分析轨迹信号与进化差值,识别贡献分下降超过 0.05 或步骤以 failure 结束的角色,生成简洁的行为指令追加到该角色的系统提示词中,并存入 SQLite 的 prompt_optimizations 表,下次运行时自动注入,无需人工干预。

触发条件
• 贡献分降幅 > 0.05
• 步骤结果为 failure
排除规则
• Critic / Verifier 永不被优化
存储上限
• 每个 (角色, 任务类型) 槽最多 5 条

系统架构

CrabShrimp 围绕五个子系统构建,形成一个闭合的反馈回路:Dragon-King 负责任务编排与分类,Coral-Meeting 提供关键节点共识,Shell-Molting 驱动任务后进化,Tidal-Pool 负责资源治理与隔离,Evolution 负责技能蒸馏与提示词优化。所有组件通过 Blackboard 共享状态与 SyncP2P 点对点消息队列进行通信。

CrabShrimp 完整架构图

内置角色

角色职责
Planner(规划者)分析任务,准备执行结构
Executor(执行者)执行实际子任务
Critic(批评者)识别缺陷、风险与遗漏
Verifier(验证者)独立验证输出的正确性
Summarizer(总结者)综合最终输出

JSONL 轨迹格式

{ "step_id": "a1b2c3d4-...", "task_id": "d213388e", "agent_id": "executor-001", "reasoning": "...", "output": "...", "interactions": [ { "agent_id": "critic-001", "reaction": "disagree", "content": "..." } ], "result": "success", "timestamp": "2026-03-27T10:00:00+00:00" }

Coral-Meeting 的输出以 agent_id: "coral-meeting" 作为专属轨迹步骤记录,与普通步骤并排存储。

快速上手

克隆仓库、配置 API Key,一条命令即可运行:

git clone https://github.com/Xiaoyu-Tao/CrabShrimp cd CrabShrimp pip install -e ".[dev]" cp .env.example .env # 在 .env 中填入 API Key crabshrimp run --task "解释 Transformer 注意力机制的核心思想"

最小配置

# Anthropic 直连 CRABSHRIMP_MODEL=claude-sonnet-4-6 ANTHROPIC_API_KEY=sk-ant-xxx # OpenAI 兼容代理 CRABSHRIMP_MODEL=openai/claude-sonnet-4-6 OPENAI_API_KEY=sk-xxx CRABSHRIMP_API_BASE=https://api.example.com/v1

常用命令示例

# 自定义资源限制 crabshrimp run --task "..." --step-limit 10 --token-budget 50000 # 切换模型 crabshrimp run --task "..." --model gpt-4o # 关闭 Coral-Meeting crabshrimp run --task "..." --no-coral-meeting # 开启优化器智能体(v0.4) crabshrimp run --task "..." --optimize # 开启人机协同 crabshrimp run --task "..." --hitl # 降低下架阈值 crabshrimp run --task "..." --bench-threshold 0.3

路线图

版本状态主要内容
v0.1已发布Dragon-King、Coral-Meeting、ResourceGuard、JSONL 轨迹
v0.2a已发布SQLite 持久化
v0.2b已发布Shell-Molting 进化信号
v0.3已发布技能提取/注入、拓扑自适应、SyncP2P
v0.3 HITL已发布规划、共识、验证失败的人工审核检查点
v0.4已发布优化器智能体:自动分析轨迹信号并改进角色提示词
v0.5规划中更强的沙箱后端(Docker / E2B)

团队

CrabShrimp 由以下成员构建与维护,基于 MIT 协议开源。

角色成员
核心开发 & 维护Xiaoyu Tao
指导教师Mingyue Cheng · Qi Liu · Enhong Chen

引用

@misc{crabshrimp2026, title = {CrabShrimp: A Multi-Agent Runtime for Collaborative Decision-Making and Autonomous Evolution}, author = {Tao, Xiaoyu and Cheng, Mingyue and Liu, Qi and Chen, Enhong}, year = {2026}, howpublished = {\url{https://github.com/Xiaoyu-Tao/CrabShrimp}}, note = {Individual pawns, collective intelligence.} }