总结

我们运营一家无头网站开发公司,Claude Code 处理了 60-70% 的实现工作,这些工作以前需要整个团队完成。我们每个 MVP 的成本从 35,000-50,000 美元降至 8,000-15,000 美元。首次部署的时间从 6-8 周缩短到 10-18 天。但 AI 并没有替代一切——它只替代了特定的、界限明确的任务。以下是哪些有效、哪些无效,以及我们仍然为之付费的人工工作。

目录

为什么我们围绕 Claude Code 重建机构

我们没有计划这一点。到 2024 年末,我们是一个 4 人的无头开发公司,以每小时 150 美元的价格提供 Next.js 和无头 CMS 工作。到 2025 年 3 月,在将 Claude Code——最初是 Claude 3.5 Sonnet,现在是 Claude 4 Sonnet——集成到每个项目后,其中两个角色已经从根本上改变。不是被消除。而是改变了。一名高级开发人员成为了全职 AI 指导工程师。另一位完全转向代码审查和架构工作。

催化剂是一个 Sanity + Next.js 14 项目,我们使用 Claude Code 来搭建整个模式层、生成 GROQ 查询、构建 14 个页面模板,并编写部署管道。原本需要 120 个计费小时的工作在 34 小时内完成。我们相互看了看,说:"我们需要重组一切。"

这就是诚实的起源。不是宏大战略。只是一个完成得太快的项目。

Claude Code 机构工作流实际上是什么样的?

以下是活跃客户构建中典型的一周:

星期一:架构 + 启动

  • 我:2 小时定义组件架构、数据模型、API 契约
  • 我:1 小时编写 CLAUDE.md 项目说明(下面会详细介绍)
  • Claude Code:生成初始项目框架、安装依赖、配置 TypeScript 严格模式、设置 linting

星期二至星期四:构建冲刺

  • 我:每天 1-2 小时审查 Claude Code 输出、捕捉错误、重新定向
  • Claude Code:每天 6-8 项任务——页面组件、API 路由、CMS 模式定义、实用函数、测试文件
  • 我:架构调整、复杂状态管理决策、客户 Slack 线程

星期五:集成 + 质量保证

  • 我:3-4 小时手动质量保证、无障碍审计、性能测试
  • Claude Code:修复质量保证中发现的错误、编写缺失的测试、生成文档
  • 我:客户演示准备、部署到暂存环境

活跃构建中每周的总人工小时数:18-24。低于我们 AI 前工作流的 35-45 小时。

AI 在我们项目中处理的工作

以下是具体的任务清单——Claude Code 每周在实际客户项目中执行的操作:

代码生成(70-80% 自动化)

  • React/Next.js 组件:页面布局、Figma 规格描述的 UI 组件、表单处理程序
  • CMS 模式:Sanity 模式类型、作为迁移脚本的 Contentful 内容模型、Payload CMS 集合配置
  • API 路由:Next.js Route Handlers、tRPC 程序、webhook 端点
  • 数据库操作:Prisma 模式更改、迁移文件、种子脚本
  • TypeScript 类型:从 API 响应生成类型、Zod 验证模式、共享类型包

代码审计(每周节省 4-6 小时)

  • 在重构项目前审查现有代码库
  • 识别未使用的依赖、死代码、类型不一致
  • 生成带有特定 file:line 参考的审计报告

内容草稿(每周节省 3-5 小时)

  • RFP 回复和技术提案
  • 项目文档和 README 文件
  • 面向客户的技术解释
  • SOW 初稿(始终由人类审查和重写)

测试(每周节省 5-8 小时)

  • 实用函数的 Vitest 单元测试
  • Playwright e2e 测试框架
  • 测试数据生成和 fixtures
  • 我们可能遗漏的边界情况识别

我们仍然为人工工作付费的部分

任务 为什么 AI 还做不了(暂时) 我们雇用的人员 典型成本
品牌策略 需要理解客户的市场地位、竞争对手、客户心理,AI 在这些方面会产生幻觉 合同品牌战略家 3,000-8,000 美元/项目
文案方向 语调、声音和说服力架构需要人类判断 自由文案撰写人 2,000-5,000 美元/项目
销售电话 客户希望与了解其业务的真实人员交谈 我们自己处理 我们的时间
视觉设计 Figma 工作、艺术指导、设计系统 合同设计师 4,000-12,000 美元/项目
复杂的 DevOps Kubernetes 配置、多地区部署、受管制行业的 CI/CD 合同 DevOps 工程师 150-200 美元/小时
法律审查 合同、MSA、IP 条款 律师 350-500 美元/小时
无障碍审计 自动化工具捕捉 30-40% 的问题;真正的屏幕阅读器测试需要人工 A11y 专家 1,500-3,000 美元/审计
用户研究 与实际用户交谈、综合反馈 UX 研究员 100-150 美元/小时

这是 8 个类别,其中人工是不可协商的。

真实数据:每个 MVP 的成本和部署时间

以下是我们最后 6 个客户项目(2025 年第一季度至第二季度)的实际数字,已匿名处理:

项目 技术栈 旧版估计 AI 辅助实际 部署时间
SaaS 营销网站 Next.js 15 + Sanity v3 38,000 美元 11,500 美元 12 天
电商店面 Next.js 15 + Shopify Storefront API 52,000 美元 18,200 美元 18 天
创意机构的投资组合/CMS Astro 5 + Payload CMS 3.0 28,000 美元 8,400 美元 10 天
SaaS 仪表板 MVP Next.js 15 + Supabase + Prisma 45,000 美元 14,800 美元 16 天
非营利网站重新设计 Next.js 14 + Contentful 32,000 美元 9,200 美元 11 天
开发者文档网站 Astro 5 + MDX + Algolia 22,000 美元 7,600 美元 8 天

"旧版估计"是我们在 2023 年用旧团队结构会提报的价格。"AI 辅助实际"是客户在 2025 年支付的价格。

成本削减:62%。首次部署时间:12.5 天

这些都是我们最擅长的项目——无头 CMS 网站和 Next.js 应用。涉及复杂 RBAC 系统、实时协作应用或任何涉及复杂分布式系统的内容会有不同的结果。

我们的 Claude Code 项目设置

每个项目都以 repo 根目录中的 CLAUDE.md 文件开始。这是我们为改进 AI 输出质量所做的最有影响力的事情。以下是我们的模板结构:

# 项目:[客户名称]

## 技术栈
- 框架:Next.js 15.1 (App Router)
- CMS:Sanity v3.72
- 样式:Tailwind CSS v4.0
- 语言:TypeScript 5.7(严格模式)
- 包管理器:pnpm 9.x
- Node:22 LTS

## 架构决策
- 所有数据获取在服务器组件中进行
- 客户端组件仅用于交互
- GROQ 查询与页面组件并置
- 无桶导出
- 优先使用命名导出

## 代码约定
- 对条件类使用 `cn()` 实用程序(已在 lib/utils.ts 中)
- 在路由段级别的错误边界
- 所有图像通过 next/image 且带明确尺寸
- 表单使用 react-hook-form + zod

## 文件结构
[src/ 目录的树输出]

## 已知约束
- 客户需要 WCAG 2.2 AA
- 必须支持 IE——开玩笑。Chrome 120+、Safari 17+、Firefox 121+
- 部署目标:Vercel(Pro 计划,us-east-1)

## 不要
- 在未询问的情况下安装新依赖
- 在 src/ 外创建文件
- 使用默认导出(Next.js 页面/布局除外)
- 在 Tailwind 类之外编写 CSS

此文件消除了大约 40% 的"Claude 走偏了"事件。没有它,你会得到与你项目模式不匹配的通用代码。有了它,Claude Code 生成的组件看起来就像你的团队写的一样。

我们在搭建阶段也使用 claude --dangerously-skip-permissions(从不在生产分支中),并在完成初始设置后切换到交互式审批模式。每个项目的 API 使用成本:通常 40-120 美元用于完整构建,在 Claude 4 Sonnet 上运行。

一个人的十亿美元公司真的存在吗?

没有。但这是一个思想实验,揭示了我们所处位置的一些真实情况。

Evartology 在 Substack 上的文章——"如何在 2026 年独自运营一家公司"——列出了一个令人印象深刻的技术栈:AI 用于工程、营销、销售、运营,甚至招聘。这是一个组织得很好的剧本,我同意其中约 60%。关于使用 AI 进行内容草稿、代码生成和操作文档的部分与我们的经验相符。但该文章低估了信任的不可化约性。客户不买代码。他们购买的是某人理解他们问题的信心。这是一个人类的事情。

Henry 在 Substack 上关于一位独立创始人用 AI 代理"克隆自己"的文章更具可信度。关于使用 AI 处理客户支持分类和首稿回复的具体例子引起了共鸣——我们对技术提案草稿做了类似的事情。但"克隆"的框架过度夸大了。实际发生的是任务委派给 AI。你没有克隆你的判断力。你只是卸载了你的打字工作。

Nate 关于一人公司的执行摘要涉及 Carta 数据,显示独立创始人初创公司的比例呈上升趋势。这是真的。Carta 在 2025 年初的数据显示独立注册公司的趋势上升。但 Carta 上的独立注册公司与独立运营的公司不同。大多数这些创始人雇佣承包商、机构(比如我们)和兼职角色。他们在上限表上是独立的,而不是在实践中独立。

我们的看法:这个概念的现实版本不是一个人做十亿美元。而是一个人(或一个很小的团队)以 70-80% 的利润率做 100 万至 500 万美元的收入,处理曾经需要 8-12 个人的工作。这不是幻想。我们正在看到它发生。但它需要 AI 能力、领域专业知识和现有的专业网络。不仅仅是一个 ChatGPT 订阅。

哪些还不行

1. 复杂的多文件重构

Claude Code 可以完美地重构单个文件。但当你需要跨 15+ 个文件进行协调更改时——比如说,更改一个接触 API 路由、组件、类型、测试和 CMS 模式的数据模型——它在文件 8-10 之后会失去连贯性。我们见过它引入破坏性的循环依赖、忘记更新它在会话早期接触的文件中的导入,以及静默跳过文件。我们的解决方法:将重构分成 3-4 个文件批次,并在每个批次之间验证。

2. Figma 中的设计到代码

尽管炒作如此,从 Figma 设计生成生产质量的组件仍然是最好情况下 60% 准确率的任务。Claude Code(或任何 LLM)无法直接查看你的 Figma 文件。你用文字描述布局或粘贴截图。输出大致上获得正确的结构,但错过了间距、响应断点和交互状态。我们仍然有一个人将设计转换为组件,然后使用 Claude Code 来填充变体和状态。

3. 性能优化

Claude Code 会告诉你添加 React.memo(),就这样完事。真正的性能工作——通过 React DevTools 分析识别不必要的重新渲染、通过分析 Sanity 的执行计划来优化 GROQ 查询、通过审计第三方脚本来减少 CLS——需要人类对运行时行为的观察。AI 无法分析你的应用。

4. 调试生产问题

当某些东西在凌晨 2 点崩溃,错误是一个神秘的 Vercel Edge Runtime 超时时,Claude Code 可以提出可能性。但它无法查看你的 Datadog 仪表板、将时间与部署相关联、检查 CDN 缓存是否已清除,或意识到问题实际上是域名转移后 48 小时发生的 DNS 传播延迟。生产调试具有大量上下文,AI 上下文窗口仍然太窄。

5. 任何需要视觉判断的事物

这个动画太快了吗?这种配色对奢侈品牌来说感觉合适吗?空白平衡了吗?Claude Code 在这里没有意见。别问。

6. 长时间会话连贯性

在单个 Claude Code 会话中连续工作约 45-60 分钟后,我们注意到质量下降。它开始重复会话早期的模式,即使上下文已更改。它忘记 CLAUDE.md 中的约束。我们遵循每 45 分钟重启一次会话的规则。这是真实的生产力税——可能每天花费 20-30 分钟的重新定位时间。

我们现在如何确定客户项目范围

我们的范围确定过程从根本上改变了。以下是前后对比:

之前(2023 年)

  1. 发现电话(1 小时)
  2. 内部架构讨论(2 小时)
  3. 详细的 SOW,包括每个功能的小时估计(4-6 小时)
  4. 客户审查循环(1-2 周)
  5. 签署合同 → 启动

之后(2025 年)

  1. 发现电话(45 分钟)
  2. Claude Code 从通话记录生成 SOW 初稿(15 分钟的提示)
  3. 我审查和重写 SOW(1 小时)
  4. 我们使用 Claude Code 构建最困难技术挑战的一次性概念证明(2-3 小时)
  5. 范围现在基于实际实现数据,而不是猜测
  6. 客户审查(3-5 天)
  7. 签署合同 → 启动

第 4 步是关键区别。我们过去会根据经验估计"Shopify Storefront API 集成:40 小时"。现在我们实际构建一个粗略版本,在 2-3 小时内完成,知道这是 22 小时的 AI 辅助工作。我们的估计在 15% 范围内的实际结果。它们以前在 30-40% 范围内。

这使我们每个项目的无账单售前工作成本增加了 3-4 小时。但我们的成交率从约 35% 上升到约 55%,因为客户在签署前看到了一个有效的原型。

创始人数学:每周时间分配

以下是我作为使用 Claude Code 的机构创始人每周时间的实际分配:

活动 小时/周 AI 辅助?
客户电话和 Slack 6
架构和技术决策 5 部分(Claude Code 用于研究)
AI 输出代码审查 8
指导 Claude Code 会话 6 N/A(这就是 AI 工作)
业务运营(发票、合同、规划) 3 部分(初稿)
销售和提案 3 部分(初稿)
手动质量保证和测试 3
学习和保持最新 2
总计 36

每周 36 小时。不是 80 小时。不是 20 小时。这是在运营每月收入 60,000-80,000 美元、任何时间有 2 个活跃客户项目的机构时。

AI 前,这个相同的产出需要 3.5 个全职员工和我的 50 小时工作周。数学是真实的。但要注意:其中 22 个小时仍然是纯人工工作。AI 没有消除工作。它改变了思考与打字的比例。

常见问题

Claude Code 在机构工作中每月成本多少? 我们在所有项目的 Claude API 使用上花费大约每月 180-300 美元。这是在 Claude 4 Sonnet 模型上。个别项目成本范围从 40-120 美元,取决于范围和会话计数。

Claude Code 可以替代初级开发人员吗? 它替代初级开发人员的产出,但不替代角色。仍然有人需要指导、审查和纠正 AI 的工作。那个人需要具有高级水平的判断力。没有专家审查的 AI 生成代码更快地交付错误。

什么是与 Claude Code 工作流配对的最佳 CMS? Sanity v3,因为它的模式定义是 TypeScript 文件,Claude Code 生成得非常出色。Payload CMS 3.0 是接近第二位。Contentful 有效,但其管理 API 对 AI 来说更复杂,可靠性较差。

Claude Code 适用于移动应用开发吗? 我们在 React Native (Expo SDK 52) 项目中使用它,获得了组件生成和导航设置的不错结果。它在本机模块配置和特定平台调试方面遇到了更多困难。相比网页项目的 60-70% 生产力提升,这里约为 40-50%。

你如何处理 AI 生成代码的客户 IP 问题? 我们的 MSA 包含一个条款,说明所有成果都是原创工作产品,不管使用了什么工具。Anthropic 的条款(截至 2025 年 6 月)向用户授予输出权利。我们不向 API 发送客户专有数据——仅发送代码模式和通用实现。

Claude Code 生成不正确的代码时会发生什么? 这发生在大约 15-20% 的任务中。我们的工作流通过对每个 PR 进行强制人工代码审查来解释这一点。常见的失败模式:不正确的 TypeScript 泛型、来自训练数据的过时 API 模式,以及缺失的边界情况错误处理。我们在每个估计中预算审查时间。