Claude Code 再工程三剑客:Superpowers、GSD、Oh-My-ClaudeCode 深度指南
当 Claude Code 从"代码补全工具"进化为"AI 软件工程师",如何让它真正可靠地完成复杂项目?答案是:给它一套工程纪律。本文深入解析三大框架的设计哲学、工作原理和使用规范,帮你找到最适合的那把刀。
引言:为什么需要再工程框架?
裸跑 Claude Code 的典型体验是这样的:你描述一个需求,它热情地开始写代码,三个小时后你发现——方向跑偏了、测试没写、架构一团糟。速度和浪费同时 scale up。
问题的根源不是模型不够聪明,而是 Context Rot(上下文腐烂):随着对话变长,模型逐渐丢失早期信息,导致后期决策基于不完整的记忆。三大框架的核心目标都是同一个:对抗上下文腐烂,让 AI 编程从"碰运气"变成"可工程化"的流程。
但它们的实现路径截然不同。
一、Superpowers:纪律即自由
基本信息
| 属性 | 值 |
|---|---|
| GitHub Stars | 127k+ |
| 作者 | Jesse Vincent(@obra) |
| 许可证 | MIT |
| 安装方式 | Plugin Marketplace |
| 定位 | TDD 优先的软件工程纪律框架 |
工作原理
Superpowers 的核心理念是 “铁律驱动”(Iron Laws):一套不可绕过的工程规则,嵌入为 Claude Code 的 Skills。每当 Claude 要执行任何任务前,它会自动检查是否有匹配的 Skill,如果有,必须使用——这不是建议,是强制。
整个框架构建在 Claude Code 原生的 Skills + Subagents 机制上,不引入额外运行时。
七阶段闭环工作流
graph LR
A[1. Brainstorming<br/>苏格拉底式提问] --> B[2. Writing Plans<br/>生成 PLAN.md]
B --> C[3. Executing Plans<br/>子代理逐任务执行]
C --> D[4. TDD<br/>RED-GREEN-REFACTOR]
D --> E[5. Code Review<br/>双阶段审查]
E --> F{通过?}
F -->|是| C
F -->|否| G[6. Systematic Debugging<br/>根因分析]
G --> D
C --> H[7. Finishing Branch<br/>合并/PR/清理]
每个阶段详解:
-
Brainstorming(苏格拉底式头脑风暴)
- 不是直接开始写代码,而是先通过提问澄清需求
- 挑战模糊假设,暴露隐藏约束
- 自动创建 Git worktree 隔离工作区
-
Writing Plans(编写实施计划)
- 生成
PLAN.md文件,包含每个任务的精确文件路径、完整代码、验证步骤 - 任务粒度控制在 2-5 分钟可完成
- 计划即状态日志:session 中断后可通过 unchecked 项恢复进度
- 生成
-
Executing Plans(子代理执行)
- 每个任务派发独立 subagent,工作在隔离的 worktree 中
- 子代理之间互不干扰,天然支持并行开发
- 完成后自动进入代码审查
-
TDD(测试驱动开发)
- 强制执行 RED-GREEN-REFACTOR 循环:
- 🔴 RED:先写失败的测试
- 🟢 GREEN:写最少代码让测试通过
- 🔵 REFACTOR:重构优化
- 如果发现没有测试就写了实现代码,会自动删除并重新来过
- 强制执行 RED-GREEN-REFACTOR 循环:
-
Code Review(双阶段代码审查)
- 第一阶段:规格合规性审查——代码是否实现了计划中的需求
- 第二阶段:代码质量审查——可读性、性能、安全性
- 严重问题(Critical)会阻断进度,必须修复才能继续
-
Systematic Debugging(系统化调试)
- 4 阶段根因分析:现象 → 假设 → 验证 → 修复
- 包含根因追踪(root-cause-tracing)、纵深防御(defense-in-depth)等技术
-
Finishing Branch(完成分支)
- 验证所有测试通过
- 提供选项:合并 / 创建 PR / 保留 worktree / 丢弃
- 自动清理工作区
安装与使用
# 安装(Claude Code 2.0.13+)
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace
# 重启 Claude Code 后生效
在 CLAUDE.md 中添加自动加载:
On every task, check for relevant Superpowers skills and use them.
核心命令:
| 命令 | 作用 |
|---|---|
/superpowers:brainstorm |
交互式需求梳理 |
/superpowers:write-plan |
生成详细实施计划 |
/superpowers:execute-plan |
子代理批量执行 + 审查 |
二、GSD(Get Shit Done):实用主义者的选择
基本信息
| 属性 | 值 |
|---|---|
| GitHub Stars | 46k+ |
| 作者 | Lex(@officialtaches) |
| 许可证 | MIT |
| 安装方式 | npx / 手动复制 |
| 定位 | 上下文工程层,让 Claude Code 可靠地"把事做完" |
工作原理
GSD 的设计哲学是 “复杂在系统内部,简单在用户体验”。它不追求企业级流程模拟,而是通过三组核心技术解决 AI 编程的核心痛点:
- XML Prompt Formatting:将结构化信息编码为 XML,比自然语言更精确
- Subagent Orchestration:并行派发多个专用代理,绕过单上下文窗口限制
- State Management:用 Markdown 文件 + Node.js CLI 工具追踪项目状态
整个系统只依赖 ~50 个 Markdown 文件 + 一个 Node.js CLI helper + 几个 Hooks,零额外运行时。
四阶段工作流
graph LR
A[1. Discuss<br/>需求讨论] --> B[2. Plan<br/>生成规格 + 任务]
B --> C[3. Execute<br/>并行子代理实现]
C --> D[4. Verify<br/>人工验证检查点]
D -->|确认| C
D -->|完成| E[✅ 交付]
核心特性:
- CONCERNS.md 自动生成:一键扫描代码库,输出安全漏洞、性能瓶颈、技术债、脆弱代码的完整报告
- 多代理并行分析:同时启动 4 个研究代理调查不同领域,避免单上下文窗口的"幻觉"问题
- Human-in-the-Loop:每个阶段完成后暂停等待人工确认,不会一跑到底失控
- PlanCheck 自检:计划执行前由 AI 自我审查,发现问题自动修正
安装与使用
# Claude Code 安装(全局)
npx get-shit-done-cc --claude --global
# 或本地安装到当前项目
npx get-shit-done-cc --claude --local
# 其他 AI 编码工具也支持
npx get-shit-done-cc --opencode --global
npx get-shit-done-cc --gemini --global
npx get-shit-done-cc --codex --global
验证安装:
/gsd:help
核心命令:
| 命令 | 作用 |
|---|---|
/gsd:new-project |
启动新项目(支持 --auto 跳过交互) |
/gsd:plan |
为现有项目生成实施计划 |
/gsd:verify-work |
验证已完成的工作 |
再工程中的具体步骤
场景:对一个遗留项目进行再工程
# 步骤 1:启动 GSD
/gsd:new-project --auto "重构认证模块,从 Session 迁移到 JWT"
# 步骤 2:GSD 自动执行
# - 初始化 Git 仓库
# - 扫描代码库生成 CONCERNS.md
# - 并行启动 4 个研究代理分析代码
# - 通过苏格拉底式提问细化需求(auto 模式跳过)
# 步骤 3:生成规格和任务计划
# - GSD 创建 SPEC.md(详细规格文档)
# - 生成任务列表,标注依赖关系
# - PlanCheck 自检通过
# 步骤 4:并行执行
# - 多个子代理同时实现不同模块
# - 每完成一个阶段暂停等待你确认
# - 自动运行测试验证
# 步骤 5:验证与交付
/gsd:verify-work
三、Oh-My-ClaudeCode(OMC):团队级多代理编排
基本信息
| 属性 | 值 |
|---|---|
| GitHub Stars | 9.9k+ |
| 作者 | Yeachan Heo |
| 许可证 | MIT |
| 安装方式 | Git clone + setup |
| 定位 | 团队优先的多代理编排系统 |
工作原理
OMC 是三个框架中架构最复杂的,构建在 四层互锁系统 之上:
- Hooks 层:监听 Claude Code 的 11 个生命周期事件,实现代理委派和状态持久化
- Skills 层:注入特定行为,28 个内置技能覆盖开发全流程
- Agents 层:19 个专用代理,各自负责不同领域的工作
- State 层:跨 context reset 追踪进度,解决会话丢失问题
关键创新:Magic Keywords(魔法关键词)
OMC 在 Hooks 中注册了关键词检测器,当你的 prompt 中出现特定关键词时,自动触发对应代理。例如输入包含 autopilot 时自动进入全自动执行模式,包含 ralph 时进入苏格拉底式对话模式。
核心能力
| 能力 | 说明 |
|---|---|
| 19 个专用代理 | 研究、编码、测试、审查、部署等领域各有专家 |
| 28 个内置技能 | 覆盖从需求分析到发布上线的全流程 |
| Magic Keywords | 关键词自动触发对应工作模式 |
| Learner 技能 | 从当前会话中提取可复用技能 |
| Deep Interview | 苏格拉底式深度需求访谈 |
| Trace 技能 | 基于证据的因果追踪,定位问题根因 |
| HUD 状态栏 | 实时显示当前代理状态和进度 |
| 跨会话记忆 | PreCompact 事件触发时保存关键信息 |
安装与使用
# 克隆并安装
git clone https://github.com/Yeachan-Heo/oh-my-claudecode.git
cd oh-my-claudecode
# 运行安装向导
# 在 Claude Code 中执行
/oh-my-claudecode:omc-setup
# 诊断安装是否正常
/oh-my-claudecode:omc-doctor
核心命令:
| 命令 | 作用 |
|---|---|
/oh-my-claudecode:deep-interview |
苏格拉底式深度需求访谈 |
/oh-my-claudecode:trace |
因果追踪定位问题 |
/oh-my-claudecode:learner |
从会话中提取可复用技能 |
/oh-my-claudecode:skill |
管理本地技能(增删查) |
/oh-my-claudecode:release |
自动化发布工作流 |
/oh-my-claudecode:cancel |
取消当前执行模式 |
/oh-my-claudecode:deepinit |
生成层级式 AGENTS.md |
四、三大框架深度对比
核心维度对比
| 维度 | Superpowers | GSD | Oh-My-ClaudeCode |
|---|---|---|---|
| 设计哲学 | 纪律即自由,铁律不可绕过 | 实用主义,复杂在内部简单在外 | 团队优先,多代理编排 |
| 工作流阶段 | 7 阶段完整闭环 | 4 阶段精简流程 | 按需触发,无固定流程 |
| TDD 强制性 | ✅ 强制 RED-GREEN-REFACTOR | ❌ 不强制 | ❌ 不强制 |
| 并行子代理 | ✅ worktree 隔离 | ✅ 多代理并行 | ✅ 19 个专用代理 |
| 上下文防腐 | PLAN.md + worktree | XML prompt + state files | PreCompact + State 层 |
| 人工检查点 | 任务间自动审查 | 阶段间人工确认 | 可配置 |
| 跨会话恢复 | ✅ unchecked 项恢复 | ✅ 状态文件追踪 | ✅ State 层持久化 |
| 代码审查 | ✅ 双阶段自动审查 | ❌ 无内置审查 | ✅ 专用审查代理 |
| 学习成本 | 中等 | 低 | 高 |
| 安装复杂度 | 低(Plugin Marketplace) | 低(npx 一键) | 中(需要 clone + setup) |
| 平台支持 | Claude Code / Codex / Gemini | Claude Code / Codex / Gemini / OpenCode / Copilot | Claude Code |
| GitHub Stars | 127k+ | 46k+ | 9.9k+ |
| 社区活跃度 | 非常高 | 高 | 中等 |
再工程场景适用性
graph TD
subgraph "选择决策树"
A[再工程任务] --> B{项目规模}
B -->|大型遗留系统<br/>100+ 文件| C{是否需要<br/>严格测试保障?}
B -->|中小型重构<br/><50 文件| D{是否追求<br/>最快速度?}
B -->|团队协作| E[Oh-My-ClaudeCode]
C -->|是| F[Superpowers]
C -->|否| G[GSD]
D -->|是| G
D -->|否| F
end
具体场景推荐
| 场景 | 推荐框架 | 原因 |
|---|---|---|
| 遗留系统全面重构 | Superpowers | TDD 强制保障 + 双阶段审查,确保重构不引入回归 |
| 快速原型到生产化 | GSD | 轻量快速,Discuss 阶段细化需求,自动验证 |
| 微服务架构迁移 | Superpowers | worktree 隔离 + 任务粒度控制,适合大规模文件修改 |
| 团队协作开发 | Oh-My-ClaudeCode | 19 个专用代理分工明确,支持多角色协作 |
| 个人 Side Project | GSD | 零学习成本,/gsd:new-project 一键启动 |
| 代码质量审计 | GSD | CONCERNS.md 一键生成安全/性能/技术债报告 |
| 持续交付流水线 | Oh-My-ClaudeCode | 内置 release 技能,自动化发布流程 |
| Bug 根因分析 | Oh-My-ClaudeCode | Trace 技能提供因果追踪 |
| 跨会话长周期项目 | Superpowers | PLAN.md 作为恢复机制,session 中断无损 |
| 多 AI 编码工具混用 | GSD | 支持 6 种编码工具(Claude Code / Codex / Gemini / OpenCode / Copilot / Antigravity) |
五、实战:用 Superpowers 进行再工程
以下是一个完整的再工程案例,展示 Superpowers 的实际工作方式。
任务:将一个 Express.js REST API 迁移到 Fastify
# 步骤 1:在项目目录启动 Claude Code
claude
# 步骤 2:描述需求,Superpowers 自动激活 brainstorming
> 我想把这个 Express API 迁移到 Fastify,保持所有端点和中间件行为一致
# Superpowers 自动执行:
# 1. 苏格拉底式提问(~5分钟)
# - 有哪些中间件在用?
# - 有自定义错误处理吗?
# - WebSocket 端点需要迁移吗?
# - 性能基准数据有吗?
#
# 2. 创建 worktree 隔离
# $ git worktree add ../project-fastify-migration
#
# 3. 生成 PLAN.md
生成的 PLAN.md 结构示例:
# Express → Fastify Migration Plan
## Overview
将 /api/v1 下的 23 个端点从 Express 迁移到 Fastify
## Phase 1: Foundation (4 tasks)
- [ ] Task 1: Install fastify + fastify-cli (2min)
- [ ] Task 2: Create fastify app skeleton (3min)
- [ ] Task 3: Migrate CORS middleware (2min)
- [ ] Task 4: Migrate auth middleware (5min)
## Phase 2: Route Migration (12 tasks)
- [ ] Task 5: /api/v1/users GET (3min)
- [ ] Task 6: /api/v1/users POST (4min)
...
## Rollback
如果 Phase 2 出现问题,删除 worktree 分支即可完整回滚。
# 步骤 3:执行计划
/superpowers:execute-plan
# Superpowers 自动执行:
# - 为每个任务派发独立 subagent
# - TDD 循环:先写测试 → 看失败 → 实现 → 看通过
# - 每完成一个任务自动审查
# - Critical 问题阻断进度
# - 你可以离开 1-2 小时,它自主推进
# 步骤 4:完成
# Superpowers 提示:
# ✓ All 23 endpoints migrated
# ✓ All 47 tests passing
# Options: [Merge] [Create PR] [Keep Worktree] [Discard]
六、常见问题与避坑指南
Q1:这些框架会显著增加 Token 消耗吗?
是的,但 ROI 值得。 Superpowers 和 GSD 的规划阶段会消耗额外 Token,但换来的是:
- 避免返工(一次做对比改三次省得多)
- 减少调试时间(TDD 让问题提前暴露)
- 节省人工审查时间(自动审查替代人工 Code Review)
GSD 特别注意:多位用户反馈 GSD 在规划阶段可能耗尽 Claude Pro 的月度 Token 额度。建议在 API plan 或有充足额度的环境下使用。
Q2:可以同时使用多个框架吗?
技术上可以,但不推荐。 三个框架都会注入 Skills 和 Hooks,可能产生冲突。选择一个主力框架,根据需要添加特定技能即可。
Q3:裸跑 Claude Code 真的不够吗?
社区有争议。有观点认为 Opus 4.6 等强模型已经"天然具备"规划、TDD、审查能力,框架只是"训练轮"。但大多数实践者认为:框架的价值不在于教会模型新能力,而在于对抗上下文腐烂和提供可恢复的状态管理。对于超过 30 分钟的开发任务,框架的投入产出比非常清晰。
Q4:如何选择入门框架?
如果你:
- 追求代码质量和测试覆盖 → Superpowers
- 想快速出活、不想学太多 → GSD
- 是团队开发、需要角色分工 → Oh-My-ClaudeCode
- 混用多种 AI 编码工具 → GSD(唯一支持 6 种工具)
七、总结
| Superpowers | GSD | Oh-My-ClaudeCode | |
|---|---|---|---|
| 一句话 | 用铁律锻造企业级代码 | 让 Claude Code 把事做完 | 团队级 AI 开发操作系统 |
| 适合谁 | 严肃开发者 | 实用主义者 | 技术团队 |
| 核心理念 | 纪律即自由 | 简单即正义 | 编排即力量 |
三个框架代表了 AI 辅助编程工程化的三种范式:
- Superpowers 是"自上而下"的——用严格的流程确保质量
- GSD 是"自下而上"的——用上下文工程让 AI 自然地做对
- Oh-My-ClaudeCode 是"由内而外"的——用多代理协作扩展能力边界
没有最好的框架,只有最适合你工作方式的那一个。建议:从 GSD 开始(5 分钟上手),当你发现需要更严格的纪律时迁移到 Superpowers,当团队协作成为瓶颈时考虑 Oh-My-ClaudeCode。