上个月我交付了三个客户MVP。两年前,这样的工作需要一个由六人组成的团队和每个项目约十二周的时间。现在只需要我、一位我签约合作的资深设计师,以及Claude Code——我能描述的最高效的工程工作流,虽然有时会令人恼火。

这不是一篇关于AI将取代所有开发者的夸大宣传。我读过那些文章。其中有些提出了不错的观点。但大多数都略过了事情崩溃的部分。我想讲讲当你把Claude Code接入真实的代理工作流时实际上什么有效,什么仍然需要人脑,以及为什么这个模式的经济学在我十五年的软件开发经验中是真正独一无二的。

目录

一人代理机构的炒作 vs 现实

让我们先讨论房间里的大象。有一波关于"一人十亿美元公司"的讨论——即单个创始人配备AI工具可以以传统公司规模运营的概念。Evartology的Substack文章《如何在2026年独自运营一家公司》列出了涵盖工程、营销、销售和运营的逐步清单,全部由一个人和一套AI工具处理。结构很完善,工具推荐也很靠谱。但框架过度销售了自主权。

经过十八个月的这种运营方式,我发现的是:你不会成为一人公司。你会成为一个坐在AI系统和一小群人类专家之上的一人协调层。这个区别很重要,因为它改变了你需要擅长的东西。

Henry Shi在Substack上的文章——《一个独立创始人如何克隆了自己》——更接近真相。他描述构建AI代理来处理特定函数,本质上创建数字员工。我更同意他的框架而不是"十亿美元独立创始人"的叙述,因为它承认创始人的工作转变为编排而不是执行一切。你是一位指挥家,不是一个人的乐队。

Nate的《独立创始人趋势执行简报》引用Carta数据显示独立创始的初创公司作为新注册公司的百分比显著增长。这与我看到的相符。但Carta数据没有区分完全独立运营的独立创始人和像我这样精益运营但仍依赖承包商和专家的人。标题数字令人兴奋。现实更为微妙。

诚实的版本:我以大约2.5 FTE的产出运营Social Animal,同时支付大约0.3 FTE的人类承包商加AI成本。这是真正的结构性优势。只是不等同于"一个人做所有事"。

我们的Claude Code工作流,逐步详解

让我讲讲一个典型的客户项目实际上如何通过我们的工作室流动。我将使用最近一个Next.js电商重建作为示例——从签订合同到生产部署用了十一天的项目。

第1阶段:发现和架构(第1-2天)

这部分仍然几乎完全由人类处理。我和客户通话,理解他们的业务约束,草绘数据模型,决定技术栈。对于我们大多数项目,这意味着Next.jsAstro前端,像Sanity或Payload这样的无头CMS,以及任何适合使用场景的后端服务。

Claude Code在这里的作用:我会粘贴客户现有代码库(或他们当前网站的HTML),要求进行架构审计。Claude在识别模式、反模式和潜在迁移问题方面确实很擅长。它为我每个项目节省了大约三小时的手动代码审查。

# Claude Code中的典型开始提示
claude "分析/client-repo中的代码库。识别:
1. 组件架构模式
2. 状态管理方法
3. API集成点
4. 性能瓶颈
5. 迁移到Next.js App Router的风险
以markdown报告形式输出。"

第2阶段:脚手架和组件生成(第2-4天)

这是Claude Code大显身手的地方。我写一份详细的CLAUDE.md文件——可以把它看作项目宪法——指定我们的编码惯例、组件模式和架构决定。然后我开始构建。

我的工作流看起来像这样:

  1. 我用纯语言和验收标准定义一个组件或功能
  2. Claude Code生成初始实现
  3. 我审查、完善和测试
  4. Claude Code根据我的反馈编写测试
  5. 重复

相对于手动编写一切,速度增加大约3-4倍。对于具有数据获取、表单处理和响应式布局的典型页面组件,过去需要2-3小时的工作现在大约需要我40分钟的活跃时间。

// 示例:Claude Code生成产品列表组件
// 在我指定之后:"服务器组件,从Sanity获取,
// 显示在响应式网格中,支持按类别过滤,
// 使用我们tailwind配置中的设计令牌"

import { sanityFetch } from '@/lib/sanity'
import { ProductCard } from '@/components/product-card'
import { CategoryFilter } from '@/components/category-filter'
import type { Product } from '@/types/product'

interface ProductListingProps {
  initialCategory?: string
}

export async function ProductListing({ initialCategory }: ProductListingProps) {
  const products = await sanityFetch<Product[]>({
    query: `*[_type == "product" && (!defined($category) || category->slug.current == $category)] | order(publishedAt desc)`,
    params: { category: initialCategory ?? null },
  })

  return (
    <section className="container-wide py-16">
      <CategoryFilter activeCategory={initialCategory} />
      <div className="grid grid-cols-1 gap-6 sm:grid-cols-2 lg:grid-cols-3">
        {products.map((product) => (
          <ProductCard key={product._id} product={product} />
        ))}
      </div>
    </section>
  )
}

这是一个简化版本,但你能明白想法。Claude在几秒内生成这个。真正的工作在审查中——确保它遵循我们的模式,处理边界情况,不会幻觉API形状。

第3阶段:集成和精磨(第5-8天)

这是工作流变得有趣的地方。Claude Code处理大量集成工作——连接CMS模式到前端组件、设置API路由、配置认证流。但它也开始在细微差别中苦恼。更多关于这一点见"不起作用的事项"部分。

第4阶段:测试、QA和部署(第9-11天)

Claude Code编写我们大约80%的测试套件。我指定要测试什么,它编写测试。对于使用Playwright的端到端测试,它特别强大——它可以查看一个组件并生成有意义的用户流测试,几乎不需要指导。

部署通过我们标准的CI/CD管道处理。没有什么特别的——Next.js项目用Vercel,Astro构建用Netlify或Cloudflare。

AI处理什么 vs 人类仍然拥有什么

这是我希望更多"AI代理"文章会写的部分。以下是Claude Code和其他AI工具在我们工作流中处理的内容与仍需人类处理的内容的诚实分解。

任务 谁处理 AI贡献 备注
代码生成 Claude Code (70%) + 我 (30%) 我审查和完善所有内容
架构决定 我 (100%) Claude能建议,但我决定
代码审计/审查 Claude Code (80%) + 我 (20%) 捕捉我会遗漏的问题
测试编写 Claude Code (80%) + 我 (20%) 在Playwright上优秀,在单元测试上不错
CMS模式设计 我 (60%) + Claude Code (40%) 擅长生成模式,不擅长信息架构
设计/UI 人类设计师 (90%) + Claude (10%) AI生成的UI看起来仍然很通用
品牌战略 人类承包商 (100%) 根本无法自动化
文案方向 人类承包商 (100%) AI能起草,但方向需要战略家
内容草稿 Claude / GPT (70%) + 人类 (30%) 初稿,然后进行大量人工编辑
RFP回应 Claude (60%) + 我 (40%) 结构好,需要我的具体内容
合同生成 Claude (50%) + 我 (50%) 模板起作用,自定义条款需要审查
客户通话/销售 我 (100%) 人们雇佣人,不是AI
DevOps/基础设施 Claude Code (40%) + 我 (60%) 擅长配置,不擅长调试部署问题
可访问性审计 Claude Code (60%) + 我 (40%) 捕捉大多数WCAG问题,遗漏上下文问题
性能优化 我 (60%) + Claude Code (40%) 擅长识别问题,有时解决方案错误

模式很清楚:Claude Code擅长代码生成和分析。它在需要业务背景判断的任何事情上都很平庸。在运营代理的人类关系部分上基本上没用——销售电话、战略对话、客户需要感到被倾听的时刻。

我仍定期与三个人签约:

  • 一位资深设计师(约15小时/月)用于看起来真正独特的UI/UX工作
  • 一位品牌/文案战略家(约8小时/月)用于定位、信息传递和内容方向
  • 一位簿记员(约4小时/月)因为我拒绝让AI接近我的财务记录

真实数字:成本、时间和产出

让我分享过去六个月的实际数字。这些是真实数字,不是预测。

每个MVP的成本

模式 平均成本 平均时间线 典型范围
传统代理(我们2023年的模式) $45,000 - $75,000 8-14周 营销网站 + CMS + 集成
我们当前的AI增强模式 $12,000 - $28,000 1-3周 相同范围,有时更多
独立开发者(无AI) $15,000 - $30,000 6-10周 范围略有减少

成本削减来自两个地方:我每个项目需要更少的可计费人类小时,这些小时速度更快,因为Claude Code消除了枯燥部分。

周时间分配

我在2026年的平均一周看起来像这样:

  • 与Claude Code编码:15-20小时
  • 客户沟通:6-8小时
  • 架构和规划:4-6小时
  • 业务运营:3-4小时
  • 内容和营销:2-3小时

总计:大约32-40小时。比较2023年我工作55-60小时周来交付更少的情况。

AI工具成本

我的月AI支出分解为:

  • Claude Pro / API使用:~$200/月
  • Cursor Pro:$20/月(我根据任务在Cursor和Claude Code之间切换)
  • 各种其他AI工具(用于会议笔记的Granola、AI辅助设计工具):~$80/月

总AI成本:大约$300/月。作为参考,单个初级开发者最少需要$5,000-7,000/月。数学是荒谬的。

尚未有效的事项

这是反炒作部分。这些是我经常遇到的真实问题。

复杂状态管理

Claude Code可以很好地单独编写Redux切片和Zustand存储。但当你有一个具有相互依赖状态的复杂应用——比如电商结账流,其中库存、价格、折扣代码和运费都相互作用时——它开始犯错。不是明显的错。微妙的竞态条件和边界情况,只在特定用户路径下出现。

我学会了自己编写复杂状态逻辑,并为更简单、更隔离的部分使用Claude Code。

带上下文的多文件重构

Claude Code在理解项目上下文方面得到了显著改善,但跨许多文件的大规模重构仍会产生不一致。它将更新一个文件中的类型定义,但遗漏依赖它的另外三个文件。CLAUDE.md项目文件有帮助,但不是灵丹妙药。

设计实现保真度

当我给Claude Code一个Figma设计(通过截图或描述)时,它可以到达75%的地方。布局通常是对的,间距接近。但微妙的东西——特定的动画时序、悬停状态应该感觉的方式、使设计感到精致的微交互——这些仍然需要手动精磨。每一次。

调试生产问题

Claude Code在你能给它一个清晰的错误消息和相关代码时很擅长调试。在问题是环境的时候它表现不佳——一个在预览中有效但在生产中失败的Vercel部署、只发生在特定CDN配置的神秘CORS问题、在特定负载模式下耗尽的数据库连接池。这些需要AI不可靠拥有的实验知识。

理解业务背景

最大的差距:Claude Code不理解为什么你在构建某些东西。它不能告诉你客户要求的功能实际上会伤害他们的转换率。它不能反对糟糕的产品决定。它构建你告诉它构建的东西,高效且无判断。那个判断是资深开发者带给项目的最有价值的东西。

为代理工作设置Claude Code

如果你运营一个小工作室并想将Claude Code集成到你的工作流中,这是我学到的关于设置的东西。

CLAUDE.md文件是一切

你的CLAUDE.md文件是这个工作流中最重要的单一工件。我们的包括:

# 项目:[客户名称]

## 技术栈
- Next.js 15 (App Router)
- TypeScript (严格模式)
- Tailwind CSS v4
- Sanity v3
- Vercel部署

## 编码惯例
- 默认使用服务器组件。仅在必要时添加'use client'。
- 优先命名导出而不是默认导出。
- 为条件类使用cn()实用程序(从@/lib/utils导入)。
- 所有API调用通过服务器操作或路由处理程序。不进行客户端获取。
- 错误处理:使用错误边界,不在组件中使用try/catch。

## 组件模式
- 原子设计:原子 → 分子 → 生物体 → 模板
- 每个组件获得自己的目录:ComponentName/index.tsx + ComponentName.test.tsx
- Props接口在组件文件中定义,不在单独的类型文件中。

## 不要
- 使用任何CSS-in-JS库
- 创建桶导出文件
- 使用'any'类型
- 在明确批准前安装新依赖项

这个文件防止了大约60%的"Claude做错了"时刻。没有它,你花费更多时间纠正而不是节省。

对大功能使用子代理

对于更大的功能,我已开始使用Claude Code生成子代理的能力。我会让主代理规划功能、将其分解为任务,然后为每个任务生成有焦点的代理。不是真正的并行——我仍然按顺序审查——但它保持每个代理的上下文窗口集中,并减少长对话中发生的漂移。

版本控制纪律

Claude Code经常提交,这很好。但其提交消息通常太通用。我给CLAUDE.md添加了一条规则:

## Git惯例
- 提交消息遵循常规提交:feat:、fix:、refactor:、test:、docs:
- 每个提交应代表一个逻辑改变
- 如果适用,始终包括票号/问题号
- 写提交消息,就好像六个月后的开发者需要理解为什么

这有帮助,尽管我仍重写大约三分之一的提交消息。

这如何改变客户关系

这个工作流最意外的影响不是速度或成本节省——而是它如何改变客户关系。

当你能在两天内而不是两周内交付一个工作原型时,整个对话转变。客户停止辩论线框图,开始对真实、功能性软件做出反应。反馈循环从双周冲刺审查压缩到日常迭代。曾经需要三次会议的决定现在在一个Loom视频和一个Slack线程中发生。

这对客户来说确实更好。他们用更少的钱获得更多,而且速度更快。如果你对这个模式如何在实践中起作用感到好奇,请查看我们的定价页面直接联系——我很乐意讲解具体项目示例。

但这里也有紧张。当事情快速且廉价时,一些客户开始像开发是免费的那样对待它。"你能再加一件东西吗?"当他们知道只需要几小时时,变成一个持续的口头禅。范围管理在AI增强的工作流中变得更加重要,而不是更少。

另一个转变:客户越来越不关心你如何构建东西。他们不问你的技术栈或团队规模。他们关心结果——速度、质量、可靠性。Claude Code是否编写了70%的代码库与他们无关。应该就是这样。

常见问题

Claude Code是否真的编写生产质量的代码? 根据我的经验,Claude Code生成的代码大约70%在进行小调整后是生产就绪的。另外20%需要有意义的重构。约10%需要被抛弃并重写。关键是在你的CLAUDE.md文件中有强大的约定,并在推送前审查所有内容。我从不在没有审查的情况下将AI生成的代码推送到生产——那是技术债的最快途径。

Claude Code与GitHub Copilot或Cursor在代理工作中的比较如何? 它们服务于不同目的。Copilot和Cursor对于内联代码完成很有好处——它们加速编写代码的行为。Claude Code在更高级别运行:它可以规划功能、生成整个文件、跨项目重构和推理架构。我在日常编码中使用Cursor,对于更大的任务如构建新功能、编写测试套件或审计代码库使用Claude Code。它们是互补的,不是竞争的。

在2026年运营AI增强代理的真实成本是多少? 我的全部月成本:AI工具约$300、人类承包商$3,500-5,000(设计师、文案战略家、簿记员)和标准业务开销(软件订阅、保险、会计)。总运营成本约$5,000-7,000/月。月均收入$25,000-40,000,利润率显著好于传统代理模式,其中仅工资就会吃掉60-70%的收入。

一个独立创始人真的能仅用AI工具运营代理吗? 是也不是。你可以处理小代理的技术产出。但你无法同时处理销售、战略、设计和开发,不需要一些人类支持。"一人十亿美元公司"叙述,如Evartology的Substack清单中所描述的,是有志的。现实更像一个一人协调层,有AI和一些承包商。仍然极其强大——只是不是魔法。

什么类型的项目最适合Claude Code工作流? 内容驱动的网站、电商前端、SaaS仪表板和营销网站是我们的最佳位置。这些项目有Claude Code优秀处理的成熟模式。更难的项目:任何涉及新算法、复杂实时系统或重硬件集成的东西。问题越独特,AI生成的代码越没用。我们专注于Next.js开发无头CMS构建因为模式库很深。

当使用AI工具时,你如何处理客户保密性? 这是一个合理的关切。我们不将客户秘密、API密钥或敏感业务数据粘贴到AI工具中。我们的CLAUDE.md文件包含架构决定和编码约定——不是专有业务逻辑。对于代码库,Claude Code在本地运行并在你的机器上处理代码,带有Anthropic的隐私承诺。我们在合同中包括AI使用披露,到目前为止没有客户反对。

当AI处理大多数编码时,什么技能变得更重要? 架构思考、代码审查和客户沟通。当Claude Code编写代码时,你的工作转变为评估代码质量、进行它不能做的设计决定,以及在客户需求和技术解决方案之间翻译。在这个模型中蓬勃发展的开发者是能够发现微妙错误、理解性能含义和反对糟糕需求的资深级别思想家。依赖AI而不理解它生成什么的初级开发者将生成脆弱、有错误的软件。

这个模型会让传统dev代理过时吗? 不过时,但会强制重组。根据工作小时数收费的代理会苦恼,因为AI戏剧性地减少小时。根据交付价值——业务结果、上市速度、最终产品质量收费的代理会蓬勃发展。幸存下来的代理将更小、更快、更专业化。那些不适应的将在价格和速度上输给像我们这样深度集成AI到工作流中的工作室。