Claude Code Agency Workflow: 2025年我们如何管理项目
总结
我们运营一家无头网站开发公司,Claude Code 处理了 60-70% 的实现工作,这些工作以前需要整个团队完成。我们每个 MVP 的成本从 35,000-50,000 美元降至 8,000-15,000 美元。首次部署的时间从 6-8 周缩短到 10-18 天。但 AI 并没有替代一切——它只替代了特定的、界限明确的任务。以下是哪些有效、哪些无效,以及我们仍然为之付费的人工工作。
目录
- 为什么我们围绕 Claude Code 重建机构
- Claude Code 机构工作流实际上是什么样的?
- AI 在我们项目中处理的工作
- 我们仍然为人工工作付费的部分
- 真实数据:每个 MVP 的成本和部署时间
- 我们的 Claude Code 项目设置
- 一个人的十亿美元公司真的存在吗?
- 哪些还不行
- 我们现在如何确定客户项目范围
- 创始人数学:每周时间分配
- 常见问题
为什么我们围绕 Claude Code 重建机构
我们没有计划这一点。到 2024 年末,我们是一个 4 人的无头开发公司,以每小时 150 美元的价格提供 Next.js 和无头 CMS 工作。到 2025 年 3 月,在将 Claude Code——最初是 Claude 3.5 Sonnet,现在是 Claude 4 Sonnet——集成到每个项目后,其中两个角色已经从根本上改变。不是被消除。而是改变了。一名高级开发人员成为了全职 AI 指导工程师。另一位完全转向代码审查和架构工作。
催化剂是一个 Sanity + Next.js 14 项目,我们使用 Claude Code 来搭建整个模式层、生成 GROQ 查询、构建 14 个页面模板,并编写部署管道。原本需要 120 个计费小时的工作在 34 小时内完成。我们相互看了看,说:"我们需要重组一切。"
这就是诚实的起源。不是宏大战略。只是一个完成得太快的项目。
Claude Code 机构工作流实际上是什么样的?
以下是活跃客户构建中典型的一周:
星期一:架构 + 启动
- 我:2 小时定义组件架构、数据模型、API 契约
- 我:1 小时编写 CLAUDE.md 项目说明(下面会详细介绍)
- Claude Code:生成初始项目框架、安装依赖、配置 TypeScript 严格模式、设置 linting
星期二至星期四:构建冲刺
- 我:每天 1-2 小时审查 Claude Code 输出、捕捉错误、重新定向
- Claude Code:每天 6-8 项任务——页面组件、API 路由、CMS 模式定义、实用函数、测试文件
- 我:架构调整、复杂状态管理决策、客户 Slack 线程
星期五:集成 + 质量保证
- 我:3-4 小时手动质量保证、无障碍审计、性能测试
- Claude Code:修复质量保证中发现的错误、编写缺失的测试、生成文档
- 我:客户演示准备、部署到暂存环境
活跃构建中每周的总人工小时数:18-24。低于我们 AI 前工作流的 35-45 小时。
AI 在我们项目中处理的工作
以下是具体的任务清单——Claude Code 每周在实际客户项目中执行的操作:
代码生成(70-80% 自动化)
- React/Next.js 组件:页面布局、Figma 规格描述的 UI 组件、表单处理程序
- CMS 模式:Sanity 模式类型、作为迁移脚本的 Contentful 内容模型、Payload CMS 集合配置
- API 路由:Next.js Route Handlers、tRPC 程序、webhook 端点
- 数据库操作:Prisma 模式更改、迁移文件、种子脚本
- TypeScript 类型:从 API 响应生成类型、Zod 验证模式、共享类型包
代码审计(每周节省 4-6 小时)
- 在重构项目前审查现有代码库
- 识别未使用的依赖、死代码、类型不一致
- 生成带有特定 file:line 参考的审计报告
内容草稿(每周节省 3-5 小时)
- RFP 回复和技术提案
- 项目文档和 README 文件
- 面向客户的技术解释
- SOW 初稿(始终由人类审查和重写)
测试(每周节省 5-8 小时)
- 实用函数的 Vitest 单元测试
- Playwright e2e 测试框架
- 测试数据生成和 fixtures
- 我们可能遗漏的边界情况识别
我们仍然为人工工作付费的部分
| 任务 | 为什么 AI 还做不了(暂时) | 我们雇用的人员 | 典型成本 |
|---|---|---|---|
| 品牌策略 | 需要理解客户的市场地位、竞争对手、客户心理,AI 在这些方面会产生幻觉 | 合同品牌战略家 | 3,000-8,000 美元/项目 |
| 文案方向 | 语调、声音和说服力架构需要人类判断 | 自由文案撰写人 | 2,000-5,000 美元/项目 |
| 销售电话 | 客户希望与了解其业务的真实人员交谈 | 我们自己处理 | 我们的时间 |
| 视觉设计 | Figma 工作、艺术指导、设计系统 | 合同设计师 | 4,000-12,000 美元/项目 |
| 复杂的 DevOps | Kubernetes 配置、多地区部署、受管制行业的 CI/CD | 合同 DevOps 工程师 | 150-200 美元/小时 |
| 法律审查 | 合同、MSA、IP 条款 | 律师 | 350-500 美元/小时 |
| 无障碍审计 | 自动化工具捕捉 30-40% 的问题;真正的屏幕阅读器测试需要人工 | A11y 专家 | 1,500-3,000 美元/审计 |
| 用户研究 | 与实际用户交谈、综合反馈 | UX 研究员 | 100-150 美元/小时 |
这是 8 个类别,其中人工是不可协商的。
真实数据:每个 MVP 的成本和部署时间
以下是我们最后 6 个客户项目(2025 年第一季度至第二季度)的实际数字,已匿名处理:
| 项目 | 技术栈 | 旧版估计 | AI 辅助实际 | 部署时间 |
|---|---|---|---|---|
| SaaS 营销网站 | Next.js 15 + Sanity v3 | 38,000 美元 | 11,500 美元 | 12 天 |
| 电商店面 | Next.js 15 + Shopify Storefront API | 52,000 美元 | 18,200 美元 | 18 天 |
| 创意机构的投资组合/CMS | Astro 5 + Payload CMS 3.0 | 28,000 美元 | 8,400 美元 | 10 天 |
| SaaS 仪表板 MVP | Next.js 15 + Supabase + Prisma | 45,000 美元 | 14,800 美元 | 16 天 |
| 非营利网站重新设计 | Next.js 14 + Contentful | 32,000 美元 | 9,200 美元 | 11 天 |
| 开发者文档网站 | Astro 5 + MDX + Algolia | 22,000 美元 | 7,600 美元 | 8 天 |
"旧版估计"是我们在 2023 年用旧团队结构会提报的价格。"AI 辅助实际"是客户在 2025 年支付的价格。
成本削减:62%。首次部署时间:12.5 天。
这些都是我们最擅长的项目——无头 CMS 网站和 Next.js 应用。涉及复杂 RBAC 系统、实时协作应用或任何涉及复杂分布式系统的内容会有不同的结果。
我们的 Claude Code 项目设置
每个项目都以 repo 根目录中的 CLAUDE.md 文件开始。这是我们为改进 AI 输出质量所做的最有影响力的事情。以下是我们的模板结构:
# 项目:[客户名称]
## 技术栈
- 框架:Next.js 15.1 (App Router)
- CMS:Sanity v3.72
- 样式:Tailwind CSS v4.0
- 语言:TypeScript 5.7(严格模式)
- 包管理器:pnpm 9.x
- Node:22 LTS
## 架构决策
- 所有数据获取在服务器组件中进行
- 客户端组件仅用于交互
- GROQ 查询与页面组件并置
- 无桶导出
- 优先使用命名导出
## 代码约定
- 对条件类使用 `cn()` 实用程序(已在 lib/utils.ts 中)
- 在路由段级别的错误边界
- 所有图像通过 next/image 且带明确尺寸
- 表单使用 react-hook-form + zod
## 文件结构
[src/ 目录的树输出]
## 已知约束
- 客户需要 WCAG 2.2 AA
- 必须支持 IE——开玩笑。Chrome 120+、Safari 17+、Firefox 121+
- 部署目标:Vercel(Pro 计划,us-east-1)
## 不要
- 在未询问的情况下安装新依赖
- 在 src/ 外创建文件
- 使用默认导出(Next.js 页面/布局除外)
- 在 Tailwind 类之外编写 CSS
此文件消除了大约 40% 的"Claude 走偏了"事件。没有它,你会得到与你项目模式不匹配的通用代码。有了它,Claude Code 生成的组件看起来就像你的团队写的一样。
我们在搭建阶段也使用 claude --dangerously-skip-permissions(从不在生产分支中),并在完成初始设置后切换到交互式审批模式。每个项目的 API 使用成本:通常 40-120 美元用于完整构建,在 Claude 4 Sonnet 上运行。
一个人的十亿美元公司真的存在吗?
没有。但这是一个思想实验,揭示了我们所处位置的一些真实情况。
Evartology 在 Substack 上的文章——"如何在 2026 年独自运营一家公司"——列出了一个令人印象深刻的技术栈:AI 用于工程、营销、销售、运营,甚至招聘。这是一个组织得很好的剧本,我同意其中约 60%。关于使用 AI 进行内容草稿、代码生成和操作文档的部分与我们的经验相符。但该文章低估了信任的不可化约性。客户不买代码。他们购买的是某人理解他们问题的信心。这是一个人类的事情。
Henry 在 Substack 上关于一位独立创始人用 AI 代理"克隆自己"的文章更具可信度。关于使用 AI 处理客户支持分类和首稿回复的具体例子引起了共鸣——我们对技术提案草稿做了类似的事情。但"克隆"的框架过度夸大了。实际发生的是任务委派给 AI。你没有克隆你的判断力。你只是卸载了你的打字工作。
Nate 关于一人公司的执行摘要涉及 Carta 数据,显示独立创始人初创公司的比例呈上升趋势。这是真的。Carta 在 2025 年初的数据显示独立注册公司的趋势上升。但 Carta 上的独立注册公司与独立运营的公司不同。大多数这些创始人雇佣承包商、机构(比如我们)和兼职角色。他们在上限表上是独立的,而不是在实践中独立。
我们的看法:这个概念的现实版本不是一个人做十亿美元。而是一个人(或一个很小的团队)以 70-80% 的利润率做 100 万至 500 万美元的收入,处理曾经需要 8-12 个人的工作。这不是幻想。我们正在看到它发生。但它需要 AI 能力、领域专业知识和现有的专业网络。不仅仅是一个 ChatGPT 订阅。
哪些还不行
1. 复杂的多文件重构
Claude Code 可以完美地重构单个文件。但当你需要跨 15+ 个文件进行协调更改时——比如说,更改一个接触 API 路由、组件、类型、测试和 CMS 模式的数据模型——它在文件 8-10 之后会失去连贯性。我们见过它引入破坏性的循环依赖、忘记更新它在会话早期接触的文件中的导入,以及静默跳过文件。我们的解决方法:将重构分成 3-4 个文件批次,并在每个批次之间验证。
2. Figma 中的设计到代码
尽管炒作如此,从 Figma 设计生成生产质量的组件仍然是最好情况下 60% 准确率的任务。Claude Code(或任何 LLM)无法直接查看你的 Figma 文件。你用文字描述布局或粘贴截图。输出大致上获得正确的结构,但错过了间距、响应断点和交互状态。我们仍然有一个人将设计转换为组件,然后使用 Claude Code 来填充变体和状态。
3. 性能优化
Claude Code 会告诉你添加 React.memo(),就这样完事。真正的性能工作——通过 React DevTools 分析识别不必要的重新渲染、通过分析 Sanity 的执行计划来优化 GROQ 查询、通过审计第三方脚本来减少 CLS——需要人类对运行时行为的观察。AI 无法分析你的应用。
4. 调试生产问题
当某些东西在凌晨 2 点崩溃,错误是一个神秘的 Vercel Edge Runtime 超时时,Claude Code 可以提出可能性。但它无法查看你的 Datadog 仪表板、将时间与部署相关联、检查 CDN 缓存是否已清除,或意识到问题实际上是域名转移后 48 小时发生的 DNS 传播延迟。生产调试具有大量上下文,AI 上下文窗口仍然太窄。
5. 任何需要视觉判断的事物
这个动画太快了吗?这种配色对奢侈品牌来说感觉合适吗?空白平衡了吗?Claude Code 在这里没有意见。别问。
6. 长时间会话连贯性
在单个 Claude Code 会话中连续工作约 45-60 分钟后,我们注意到质量下降。它开始重复会话早期的模式,即使上下文已更改。它忘记 CLAUDE.md 中的约束。我们遵循每 45 分钟重启一次会话的规则。这是真实的生产力税——可能每天花费 20-30 分钟的重新定位时间。
我们现在如何确定客户项目范围
我们的范围确定过程从根本上改变了。以下是前后对比:
之前(2023 年)
- 发现电话(1 小时)
- 内部架构讨论(2 小时)
- 详细的 SOW,包括每个功能的小时估计(4-6 小时)
- 客户审查循环(1-2 周)
- 签署合同 → 启动
之后(2025 年)
- 发现电话(45 分钟)
- Claude Code 从通话记录生成 SOW 初稿(15 分钟的提示)
- 我审查和重写 SOW(1 小时)
- 我们使用 Claude Code 构建最困难技术挑战的一次性概念证明(2-3 小时)
- 范围现在基于实际实现数据,而不是猜测
- 客户审查(3-5 天)
- 签署合同 → 启动
第 4 步是关键区别。我们过去会根据经验估计"Shopify Storefront API 集成:40 小时"。现在我们实际构建一个粗略版本,在 2-3 小时内完成,知道这是 22 小时的 AI 辅助工作。我们的估计在 15% 范围内的实际结果。它们以前在 30-40% 范围内。
这使我们每个项目的无账单售前工作成本增加了 3-4 小时。但我们的成交率从约 35% 上升到约 55%,因为客户在签署前看到了一个有效的原型。
创始人数学:每周时间分配
以下是我作为使用 Claude Code 的机构创始人每周时间的实际分配:
| 活动 | 小时/周 | AI 辅助? |
|---|---|---|
| 客户电话和 Slack | 6 | 否 |
| 架构和技术决策 | 5 | 部分(Claude Code 用于研究) |
| AI 输出代码审查 | 8 | 否 |
| 指导 Claude Code 会话 | 6 | N/A(这就是 AI 工作) |
| 业务运营(发票、合同、规划) | 3 | 部分(初稿) |
| 销售和提案 | 3 | 部分(初稿) |
| 手动质量保证和测试 | 3 | 否 |
| 学习和保持最新 | 2 | 否 |
| 总计 | 36 |
每周 36 小时。不是 80 小时。不是 20 小时。这是在运营每月收入 60,000-80,000 美元、任何时间有 2 个活跃客户项目的机构时。
AI 前,这个相同的产出需要 3.5 个全职员工和我的 50 小时工作周。数学是真实的。但要注意:其中 22 个小时仍然是纯人工工作。AI 没有消除工作。它改变了思考与打字的比例。
常见问题
Claude Code 在机构工作中每月成本多少? 我们在所有项目的 Claude API 使用上花费大约每月 180-300 美元。这是在 Claude 4 Sonnet 模型上。个别项目成本范围从 40-120 美元,取决于范围和会话计数。
Claude Code 可以替代初级开发人员吗? 它替代初级开发人员的产出,但不替代角色。仍然有人需要指导、审查和纠正 AI 的工作。那个人需要具有高级水平的判断力。没有专家审查的 AI 生成代码更快地交付错误。
什么是与 Claude Code 工作流配对的最佳 CMS? Sanity v3,因为它的模式定义是 TypeScript 文件,Claude Code 生成得非常出色。Payload CMS 3.0 是接近第二位。Contentful 有效,但其管理 API 对 AI 来说更复杂,可靠性较差。
Claude Code 适用于移动应用开发吗? 我们在 React Native (Expo SDK 52) 项目中使用它,获得了组件生成和导航设置的不错结果。它在本机模块配置和特定平台调试方面遇到了更多困难。相比网页项目的 60-70% 生产力提升,这里约为 40-50%。
你如何处理 AI 生成代码的客户 IP 问题? 我们的 MSA 包含一个条款,说明所有成果都是原创工作产品,不管使用了什么工具。Anthropic 的条款(截至 2025 年 6 月)向用户授予输出权利。我们不向 API 发送客户专有数据——仅发送代码模式和通用实现。
Claude Code 生成不正确的代码时会发生什么? 这发生在大约 15-20% 的任务中。我们的工作流通过对每个 PR 进行强制人工代码审查来解释这一点。常见的失败模式:不正确的 TypeScript 泛型、来自训练数据的过时 API 模式,以及缺失的边界情况错误处理。我们在每个估计中预算审查时间。