Claude Code Agency Workflow -- Social Animal

总结

我们运营一家无头网站开发公司，Claude Code 处理了 60-70% 的实现工作，这些工作以前需要整个团队完成。我们每个 MVP 的成本从 35,000-50,000 美元降至 8,000-15,000 美元。首次部署的时间从 6-8 周缩短到 10-18 天。但 AI 并没有替代一切——它只替代了特定的、界限明确的任务。以下是哪些有效、哪些无效，以及我们仍然为之付费的人工工作。

为什么我们围绕 Claude Code 重建机构
Claude Code 机构工作流实际上是什么样的？
AI 在我们项目中处理的工作
我们仍然为人工工作付费的部分
真实数据：每个 MVP 的成本和部署时间
我们的 Claude Code 项目设置
一个人的十亿美元公司真的存在吗？
哪些还不行
我们现在如何确定客户项目范围
创始人数学：每周时间分配
常见问题

为什么我们围绕 Claude Code 重建机构

我们没有计划这一点。到 2024 年末，我们是一个 4 人的无头开发公司，以每小时 150 美元的价格提供 Next.js 和无头 CMS 工作。到 2025 年 3 月，在将 Claude Code——最初是 Claude 3.5 Sonnet，现在是 Claude 4 Sonnet——集成到每个项目后，其中两个角色已经从根本上改变。不是被消除。而是改变了。一名高级开发人员成为了全职 AI 指导工程师。另一位完全转向代码审查和架构工作。

催化剂是一个 Sanity + Next.js 14 项目，我们使用 Claude Code 来搭建整个模式层、生成 GROQ 查询、构建 14 个页面模板，并编写部署管道。原本需要 120 个计费小时的工作在 34 小时内完成。我们相互看了看，说："我们需要重组一切。"

这就是诚实的起源。不是宏大战略。只是一个完成得太快的项目。

Claude Code 机构工作流实际上是什么样的？

以下是活跃客户构建中典型的一周：

星期一：架构 + 启动

我：2 小时定义组件架构、数据模型、API 契约
我：1 小时编写 CLAUDE.md 项目说明（下面会详细介绍）
Claude Code：生成初始项目框架、安装依赖、配置 TypeScript 严格模式、设置 linting

星期二至星期四：构建冲刺

我：每天 1-2 小时审查 Claude Code 输出、捕捉错误、重新定向
Claude Code：每天 6-8 项任务——页面组件、API 路由、CMS 模式定义、实用函数、测试文件
我：架构调整、复杂状态管理决策、客户 Slack 线程

星期五：集成 + 质量保证

我：3-4 小时手动质量保证、无障碍审计、性能测试
Claude Code：修复质量保证中发现的错误、编写缺失的测试、生成文档
我：客户演示准备、部署到暂存环境

活跃构建中每周的总人工小时数：18-24。低于我们 AI 前工作流的 35-45 小时。

AI 在我们项目中处理的工作

以下是具体的任务清单——Claude Code 每周在实际客户项目中执行的操作：

代码生成（70-80% 自动化）

React/Next.js 组件：页面布局、Figma 规格描述的 UI 组件、表单处理程序
CMS 模式：Sanity 模式类型、作为迁移脚本的 Contentful 内容模型、Payload CMS 集合配置
API 路由：Next.js Route Handlers、tRPC 程序、webhook 端点
数据库操作：Prisma 模式更改、迁移文件、种子脚本
TypeScript 类型：从 API 响应生成类型、Zod 验证模式、共享类型包

代码审计（每周节省 4-6 小时）

在重构项目前审查现有代码库
识别未使用的依赖、死代码、类型不一致
生成带有特定 file:line 参考的审计报告

内容草稿（每周节省 3-5 小时）

RFP 回复和技术提案
项目文档和 README 文件
面向客户的技术解释
SOW 初稿（始终由人类审查和重写）

测试（每周节省 5-8 小时）

实用函数的 Vitest 单元测试
Playwright e2e 测试框架
测试数据生成和 fixtures
我们可能遗漏的边界情况识别

我们仍然为人工工作付费的部分

任务	为什么 AI 还做不了（暂时）	我们雇用的人员	典型成本
品牌策略	需要理解客户的市场地位、竞争对手、客户心理，AI 在这些方面会产生幻觉	合同品牌战略家	3,000-8,000 美元/项目
文案方向	语调、声音和说服力架构需要人类判断	自由文案撰写人	2,000-5,000 美元/项目
销售电话	客户希望与了解其业务的真实人员交谈	我们自己处理	我们的时间
视觉设计	Figma 工作、艺术指导、设计系统	合同设计师	4,000-12,000 美元/项目
复杂的 DevOps	Kubernetes 配置、多地区部署、受管制行业的 CI/CD	合同 DevOps 工程师	150-200 美元/小时
法律审查	合同、MSA、IP 条款	律师	350-500 美元/小时
无障碍审计	自动化工具捕捉 30-40% 的问题；真正的屏幕阅读器测试需要人工	A11y 专家	1,500-3,000 美元/审计
用户研究	与实际用户交谈、综合反馈	UX 研究员	100-150 美元/小时

这是 8 个类别，其中人工是不可协商的。

真实数据：每个 MVP 的成本和部署时间

以下是我们最后 6 个客户项目（2025 年第一季度至第二季度）的实际数字，已匿名处理：

项目	技术栈	旧版估计	AI 辅助实际	部署时间
SaaS 营销网站	Next.js 15 + Sanity v3	38,000 美元	11,500 美元	12 天
电商店面	Next.js 15 + Shopify Storefront API	52,000 美元	18,200 美元	18 天
创意机构的投资组合/CMS	Astro 5 + Payload CMS 3.0	28,000 美元	8,400 美元	10 天
SaaS 仪表板 MVP	Next.js 15 + Supabase + Prisma	45,000 美元	14,800 美元	16 天
非营利网站重新设计	Next.js 14 + Contentful	32,000 美元	9,200 美元	11 天
开发者文档网站	Astro 5 + MDX + Algolia	22,000 美元	7,600 美元	8 天

"旧版估计"是我们在 2023 年用旧团队结构会提报的价格。"AI 辅助实际"是客户在 2025 年支付的价格。

成本削减：62%。首次部署时间：12.5 天。

这些都是我们最擅长的项目——无头 CMS 网站和 Next.js 应用。涉及复杂 RBAC 系统、实时协作应用或任何涉及复杂分布式系统的内容会有不同的结果。

我们的 Claude Code 项目设置

每个项目都以 repo 根目录中的 CLAUDE.md 文件开始。这是我们为改进 AI 输出质量所做的最有影响力的事情。以下是我们的模板结构：

# 项目：[客户名称]

## 技术栈
- 框架：Next.js 15.1 (App Router)
- CMS：Sanity v3.72
- 样式：Tailwind CSS v4.0
- 语言：TypeScript 5.7（严格模式）
- 包管理器：pnpm 9.x
- Node：22 LTS

## 架构决策
- 所有数据获取在服务器组件中进行
- 客户端组件仅用于交互
- GROQ 查询与页面组件并置
- 无桶导出
- 优先使用命名导出

## 代码约定
- 对条件类使用 `cn()` 实用程序（已在 lib/utils.ts 中）
- 在路由段级别的错误边界
- 所有图像通过 next/image 且带明确尺寸
- 表单使用 react-hook-form + zod

## 文件结构
[src/ 目录的树输出]

## 已知约束
- 客户需要 WCAG 2.2 AA
- 必须支持 IE——开玩笑。Chrome 120+、Safari 17+、Firefox 121+
- 部署目标：Vercel（Pro 计划，us-east-1）

## 不要
- 在未询问的情况下安装新依赖
- 在 src/ 外创建文件
- 使用默认导出（Next.js 页面/布局除外）
- 在 Tailwind 类之外编写 CSS

此文件消除了大约 40% 的"Claude 走偏了"事件。没有它，你会得到与你项目模式不匹配的通用代码。有了它，Claude Code 生成的组件看起来就像你的团队写的一样。

我们在搭建阶段也使用 claude --dangerously-skip-permissions（从不在生产分支中），并在完成初始设置后切换到交互式审批模式。每个项目的 API 使用成本：通常 40-120 美元用于完整构建，在 Claude 4 Sonnet 上运行。

一个人的十亿美元公司真的存在吗？

没有。但这是一个思想实验，揭示了我们所处位置的一些真实情况。

Evartology 在 Substack 上的文章——"如何在 2026 年独自运营一家公司"——列出了一个令人印象深刻的技术栈：AI 用于工程、营销、销售、运营，甚至招聘。这是一个组织得很好的剧本，我同意其中约 60%。关于使用 AI 进行内容草稿、代码生成和操作文档的部分与我们的经验相符。但该文章低估了信任的不可化约性。客户不买代码。他们购买的是某人理解他们问题的信心。这是一个人类的事情。

Henry 在 Substack 上关于一位独立创始人用 AI 代理"克隆自己"的文章更具可信度。关于使用 AI 处理客户支持分类和首稿回复的具体例子引起了共鸣——我们对技术提案草稿做了类似的事情。但"克隆"的框架过度夸大了。实际发生的是任务委派给 AI。你没有克隆你的判断力。你只是卸载了你的打字工作。

Nate 关于一人公司的执行摘要涉及 Carta 数据，显示独立创始人初创公司的比例呈上升趋势。这是真的。Carta 在 2025 年初的数据显示独立注册公司的趋势上升。但 Carta 上的独立注册公司与独立运营的公司不同。大多数这些创始人雇佣承包商、机构（比如我们）和兼职角色。他们在上限表上是独立的，而不是在实践中独立。

我们的看法：这个概念的现实版本不是一个人做十亿美元。而是一个人（或一个很小的团队）以 70-80% 的利润率做 100 万至 500 万美元的收入，处理曾经需要 8-12 个人的工作。这不是幻想。我们正在看到它发生。但它需要 AI 能力、领域专业知识和现有的专业网络。不仅仅是一个 ChatGPT 订阅。

哪些还不行

1. 复杂的多文件重构

Claude Code 可以完美地重构单个文件。但当你需要跨 15+ 个文件进行协调更改时——比如说，更改一个接触 API 路由、组件、类型、测试和 CMS 模式的数据模型——它在文件 8-10 之后会失去连贯性。我们见过它引入破坏性的循环依赖、忘记更新它在会话早期接触的文件中的导入，以及静默跳过文件。我们的解决方法：将重构分成 3-4 个文件批次，并在每个批次之间验证。

2. Figma 中的设计到代码

尽管炒作如此，从 Figma 设计生成生产质量的组件仍然是最好情况下 60% 准确率的任务。Claude Code（或任何 LLM）无法直接查看你的 Figma 文件。你用文字描述布局或粘贴截图。输出大致上获得正确的结构，但错过了间距、响应断点和交互状态。我们仍然有一个人将设计转换为组件，然后使用 Claude Code 来填充变体和状态。

3. 性能优化

Claude Code 会告诉你添加 React.memo()，就这样完事。真正的性能工作——通过 React DevTools 分析识别不必要的重新渲染、通过分析 Sanity 的执行计划来优化 GROQ 查询、通过审计第三方脚本来减少 CLS——需要人类对运行时行为的观察。AI 无法分析你的应用。

4. 调试生产问题

当某些东西在凌晨 2 点崩溃，错误是一个神秘的 Vercel Edge Runtime 超时时，Claude Code 可以提出可能性。但它无法查看你的 Datadog 仪表板、将时间与部署相关联、检查 CDN 缓存是否已清除，或意识到问题实际上是域名转移后 48 小时发生的 DNS 传播延迟。生产调试具有大量上下文，AI 上下文窗口仍然太窄。

5. 任何需要视觉判断的事物

这个动画太快了吗？这种配色对奢侈品牌来说感觉合适吗？空白平衡了吗？Claude Code 在这里没有意见。别问。

6. 长时间会话连贯性

在单个 Claude Code 会话中连续工作约 45-60 分钟后，我们注意到质量下降。它开始重复会话早期的模式，即使上下文已更改。它忘记 CLAUDE.md 中的约束。我们遵循每 45 分钟重启一次会话的规则。这是真实的生产力税——可能每天花费 20-30 分钟的重新定位时间。

我们现在如何确定客户项目范围

我们的范围确定过程从根本上改变了。以下是前后对比：

之前（2023 年）

发现电话（1 小时）
内部架构讨论（2 小时）
详细的 SOW，包括每个功能的小时估计（4-6 小时）
客户审查循环（1-2 周）
签署合同 → 启动

之后（2025 年）

发现电话（45 分钟）
Claude Code 从通话记录生成 SOW 初稿（15 分钟的提示）
我审查和重写 SOW（1 小时）
我们使用 Claude Code 构建最困难技术挑战的一次性概念证明（2-3 小时）
范围现在基于实际实现数据，而不是猜测
客户审查（3-5 天）
签署合同 → 启动

第 4 步是关键区别。我们过去会根据经验估计"Shopify Storefront API 集成：40 小时"。现在我们实际构建一个粗略版本，在 2-3 小时内完成，知道这是 22 小时的 AI 辅助工作。我们的估计在 15% 范围内的实际结果。它们以前在 30-40% 范围内。

这使我们每个项目的无账单售前工作成本增加了 3-4 小时。但我们的成交率从约 35% 上升到约 55%，因为客户在签署前看到了一个有效的原型。

创始人数学：每周时间分配

以下是我作为使用 Claude Code 的机构创始人每周时间的实际分配：

活动	小时/周	AI 辅助？
客户电话和 Slack	6	否
架构和技术决策	5	部分（Claude Code 用于研究）
AI 输出代码审查	8	否
指导 Claude Code 会话	6	N/A（这就是 AI 工作）
业务运营（发票、合同、规划）	3	部分（初稿）
销售和提案	3	部分（初稿）
手动质量保证和测试	3	否
学习和保持最新	2	否
总计	36

每周 36 小时。不是 80 小时。不是 20 小时。这是在运营每月收入 60,000-80,000 美元、任何时间有 2 个活跃客户项目的机构时。

AI 前，这个相同的产出需要 3.5 个全职员工和我的 50 小时工作周。数学是真实的。但要注意：其中 22 个小时仍然是纯人工工作。AI 没有消除工作。它改变了思考与打字的比例。

常见问题

Claude Code 在机构工作中每月成本多少？ 我们在所有项目的 Claude API 使用上花费大约每月 180-300 美元。这是在 Claude 4 Sonnet 模型上。个别项目成本范围从 40-120 美元，取决于范围和会话计数。

Claude Code 可以替代初级开发人员吗？ 它替代初级开发人员的产出，但不替代角色。仍然有人需要指导、审查和纠正 AI 的工作。那个人需要具有高级水平的判断力。没有专家审查的 AI 生成代码更快地交付错误。

什么是与 Claude Code 工作流配对的最佳 CMS？ Sanity v3，因为它的模式定义是 TypeScript 文件，Claude Code 生成得非常出色。Payload CMS 3.0 是接近第二位。Contentful 有效，但其管理 API 对 AI 来说更复杂，可靠性较差。

Claude Code 适用于移动应用开发吗？ 我们在 React Native (Expo SDK 52) 项目中使用它，获得了组件生成和导航设置的不错结果。它在本机模块配置和特定平台调试方面遇到了更多困难。相比网页项目的 60-70% 生产力提升，这里约为 40-50%。

你如何处理 AI 生成代码的客户 IP 问题？ 我们的 MSA 包含一个条款，说明所有成果都是原创工作产品，不管使用了什么工具。Anthropic 的条款（截至 2025 年 6 月）向用户授予输出权利。我们不向 API 发送客户专有数据——仅发送代码模式和通用实现。

Claude Code 生成不正确的代码时会发生什么？ 这发生在大约 15-20% 的任务中。我们的工作流通过对每个 PR 进行强制人工代码审查来解释这一点。常见的失败模式：不正确的 TypeScript 泛型、来自训练数据的过时 API 模式，以及缺失的边界情况错误处理。我们在每个估计中预算审查时间。

Claude Code Agency Workflow: 2025年我们如何管理项目

总结

目录

为什么我们围绕 Claude Code 重建机构

Claude Code 机构工作流实际上是什么样的？

星期一：架构 + 启动

星期二至星期四：构建冲刺

星期五：集成 + 质量保证

AI 在我们项目中处理的工作

代码生成（70-80% 自动化）

代码审计（每周节省 4-6 小时）

内容草稿（每周节省 3-5 小时）

测试（每周节省 5-8 小时）

我们仍然为人工工作付费的部分

真实数据：每个 MVP 的成本和部署时间

我们的 Claude Code 项目设置

一个人的十亿美元公司真的存在吗？

哪些还不行

1. 复杂的多文件重构

2. Figma 中的设计到代码

3. 性能优化

4. 调试生产问题

5. 任何需要视觉判断的事物

6. 长时间会话连贯性

我们现在如何确定客户项目范围

之前（2023 年）

之后（2025 年）

创始人数学：每周时间分配

常见问题

Let's build
something together.

总结

目录

为什么我们围绕 Claude Code 重建机构

Claude Code 机构工作流实际上是什么样的？

星期一：架构 + 启动

星期二至星期四：构建冲刺

星期五：集成 + 质量保证

AI 在我们项目中处理的工作

代码生成（70-80% 自动化）

代码审计（每周节省 4-6 小时）

内容草稿（每周节省 3-5 小时）

测试（每周节省 5-8 小时）

我们仍然为人工工作付费的部分

真实数据：每个 MVP 的成本和部署时间

我们的 Claude Code 项目设置

一个人的十亿美元公司真的存在吗？

哪些还不行

1. 复杂的多文件重构

2. Figma 中的设计到代码

3. 性能优化

4. 调试生产问题

5. 任何需要视觉判断的事物

6. 长时间会话连贯性

我们现在如何确定客户项目范围

之前（2023 年）

之后（2025 年）

创始人数学：每周时间分配

常见问题

Let's build something together.

Let's build
something together.