上個月我交付了三個客戶 MVP。兩年前,那需要一個六人團隊,每個項目約十二週。現在是我、一位我簽約的資深設計師,以及 Claude Code,運行著我所能描述的最富生產力——有時也最令人惱火——的工程工作流程。

這不是關於 AI 如何取代所有開發者的夸大言論。我讀過那些文章。其中一些提出了很好的觀點。大多數都略過了事情出錯的部分。我想談談將 Claude Code 接入真實代理工作流程時實際有效的方法、仍需要人類大腦的部分,以及為什麼這種模式的經濟學在我十五年的軟體構建生涯中確實與我見過的任何東西都不同。

目錄

單人代理機構的炒作與現實

讓我們解決房間裡的大象。關於「單人十億美元公司」有過一波言論——一個單一創始人配備 AI 工具可以以傳統公司的規模運營的想法。Evartology 的 Substack 文章《How to Run a Company Alone in 2026》提供了涵蓋工程、市場行銷、銷售和運營的逐步指南,全部由一個人用 AI 堆棧處理。這結構良好,工具建議也是實心的。但框架過度宣傳了自主權。

經過十八個月的這樣運營,我發現的是:你不會成為一個單人公司。你成為坐在 AI 系統和一小批人類專家之上的單人協調層。這個區別很重要,因為它改變了你需要擅長的東西。

Henry Shi 的 Substack 文章——《How a Solo Founder Cloned Himself》——更接近真相。他描述構建 AI 代理來處理特定功能,本質上創建數字員工。我同意他的框架多於「十億美元單人創始人」敘述,因為它承認創始人的工作轉變為編排,而不是執行一切。你是指揮家,不是一人樂隊。

Nate 的關於單人創始人趨勢的執行簡報參考了 Carta 數據,顯示單人創始的初創公司作為新公司登記的百分比明顯增長。這與我看到的一致。但 Carta 數據不區分真正獨自運營的單人創始人和那些——像我一樣——精益運營但仍依賴承包商和專家的人。頭條數字很令人興奮。現實更加微妙。

誠實的版本:我以大約 2.5 FTE 的產出來運營 Social Animal,同時為大約 0.3 FTE 的人類承包商加 AI 成本付費。那是真正的結構優勢。這只是不同於「一個人做所有事情」。

我們的 Claude Code 工作流程,逐步進行

讓我走過一個典型的客戶項目實際如何流經我們的商店。我將使用最近的 Next.js 電子商務重建作為例子——一個從簽署合同到生產部署花費十一天的項目。

第一階段:發現和架構(第 1-2 天)

這部分仍然幾乎完全是人類完成。我與客戶通話,了解他們的業務限制,勾勒數據模型,並決定堆棧。對於我們大多數項目,這意味著前端使用 Next.jsAstro,使用 Sanity 或 Payload 之類的 headless CMS,以及任何適合用例的後端服務。

Claude Code 在這裡做什麼:我會粘貼客戶的現有程式碼庫(或他們當前網站的 HTML)並要求架構審計。Claude 在識別模式、反模式和潛在遷移問題方面真正很好。它為我每個項目節省了約三小時的手動代碼審查。

# Claude Code 中的典型起始提示
claude "Analyze the codebase in /client-repo. Identify: 
1. Component architecture patterns
2. State management approach
3. API integration points
4. Performance bottlenecks
5. Migration risks if moving to Next.js App Router
Output as a markdown report."

第二階段:腳手架和元件生成(第 2-4 天)

這是 Claude Code 大放異彩的地方。我寫一個詳細的 CLAUDE.md 文件——把它看作一個項目憲法——指定我們的編碼慣例、元件模式和架構決策。然後我開始構建。

我的工作流程看起來像這樣:

  1. 我用純語言定義元件或功能以及接受標準
  2. Claude Code 生成初始實現
  3. 我審查、精化和測試
  4. Claude Code 根據我的回饋編寫測試
  5. 重複

速度提升大約是手寫所有內容的 3-4 倍。對於典型的頁面元件,包含數據提取、表單處理和響應式佈局,過去需要 2-3 小時的工作現在需要大約 40 分鐘的我的活躍時間。

// 示例:Claude Code 生成產品列表元件
// 在我指定後:"Server component, fetches from Sanity, 
// displays in responsive grid, supports filtering by category,
// uses our design tokens from tailwind config"

import { sanityFetch } from '@/lib/sanity'
import { ProductCard } from '@/components/product-card'
import { CategoryFilter } from '@/components/category-filter'
import type { Product } from '@/types/product'

interface ProductListingProps {
  initialCategory?: string
}

export async function ProductListing({ initialCategory }: ProductListingProps) {
  const products = await sanityFetch<Product[]>({
    query: `*[_type == "product" && (!defined($category) || category->slug.current == $category)] | order(publishedAt desc)`,
    params: { category: initialCategory ?? null },
  })

  return (
    <section className="container-wide py-16">
      <CategoryFilter activeCategory={initialCategory} />
      <div className="grid grid-cols-1 gap-6 sm:grid-cols-2 lg:grid-cols-3">
        {products.map((product) => (
          <ProductCard key={product._id} product={product} />
        ))}
      </div>
    </section>
  )
}

那是一個簡化版本,但你能理解。Claude 在幾秒鐘內生成了這個。真正的工作在於審查——確保它遵循我們的模式、處理邊界情況,並且不會臆想 API 形狀。

第三階段:集成和潤飾(第 5-8 天)

這是工作流程變得有趣的地方。Claude Code 處理了大量集成工作——將 CMS 模式連接到前端元件、設置 API 路由、配置認證流程。但它也開始在細微之處遇到困難。更多關於「不起作用的東西」部分。

第四階段:測試、QA 和部署(第 9-11 天)

Claude Code 編寫我們約 80% 的測試套件。我指定要測試什麼,它編寫測試。對於使用 Playwright 的端到端測試,它特別強大——它可以查看元件並生成有意義的用戶流程測試,無需太多指導。

部署通過我們標準的 CI/CD 管道處理。沒有什麼特別的——Next.js 項目使用 Vercel,Astro 構建使用 Netlify 或 Cloudflare。

AI 處理的內容與人類仍然擁有的內容

這是我希望更多「AI 代理」文章會寫的部分。以下是 Claude Code 和其他 AI 工具在我們工作流程中處理的內容與仍需要人類的內容的誠實分解。

任務 誰處理 AI 貢獻 備註
代碼生成 Claude Code (70%) + 我 (30%) 我審查和精化所有內容
架構決策 我 (100%) Claude 可以建議,但我決定
代碼審計/審查 Claude Code (80%) + 我 (20%) 捕捉我會錯過的問題
測試編寫 Claude Code (80%) + 我 (20%) 擅長 Playwright,善於單元測試
CMS 模式設計 我 (60%) + Claude Code (40%) 善於生成模式,不善於信息架構
設計 / UI 人類設計師 (90%) + Claude (10%) AI 生成的 UI 看起來仍然很普通
品牌策略 人類承包商 (100%) 甚至不接近可自動化
文案方向 人類承包商 (100%) AI 可以起草,但方向需要策略家
內容草稿 Claude / GPT (70%) + 人類 (30%) 首稿,然後進行大量人類編輯
RFP 回覆 Claude (60%) + 我 (40%) 結構良好,需要我的具體信息
合同生成 Claude (50%) + 我 (50%) 模板有效,自訂條款需要審查
客戶通話/銷售 我 (100%) 人們雇用人,不是 AI
DevOps / 基礎設施 Claude Code (40%) + 我 (60%) 善於配置,不善於調試部署問題
無障礙審計 Claude Code (60%) + 我 (40%) 捕捉大多數 WCAG 問題,錯過上下文相關的
性能優化 我 (60%) + Claude Code (40%) 善於識別問題,有時對解決方案錯誤

模式很清楚:Claude Code 在代碼生成和分析中表現出色。它在需要業務背景判斷的任何事情上平庸。而且它對運營代理機構中的人類關係部分基本沒有用——銷售通話、策略對話、客戶需要被聽到的時刻。

我仍然定期與三個人簽約:

  • 資深設計師(約每月 15 小時)用於實際看起來與眾不同的 UI/UX 工作
  • 品牌/文案策略家(約每月 8 小時)用於定位、訊息傳遞和內容方向
  • 簿記員(約每月 4 小時)因為我拒絕讓 AI 接近我的財務記錄

實際數字:成本、時間和產出

讓我分享過去六個月的實際數字。這些是真實的數字,不是預測。

每個 MVP 的成本

模式 平均成本 平均時間線 典型範圍
傳統代理機構(我們的 2023 模式) $45,000 - $75,000 8-14 週 市場營銷網站 + CMS + 集成
我們當前的 AI 增強模式 $12,000 - $28,000 1-3 週 相同範圍,有時更多
單獨開發者(無 AI) $15,000 - $30,000 6-10 週 稍微減少的範圍

成本削減來自兩個地方:每個項目我需要更少的可計費人類小時,這些小時發生得更快,因為 Claude Code 消除了無聊的部分。

每週時間分配

我在 2026 年的平均週看起來像這樣:

  • 使用 Claude Code 編碼:15-20 小時
  • 客戶溝通:6-8 小時
  • 架構和計畫:4-6 小時
  • 業務運營:3-4 小時
  • 內容和市場行銷:2-3 小時

總計:約 32-40 小時。與 2023 年相比,當時我每週工作 55-60 小時以交付更少。

AI 工具成本

我的月度 AI 開支分解為:

  • Claude Pro / API 使用:約 $200/月
  • Cursor Pro:$20/月(我根據任務在 Cursor 和 Claude Code 之間切換)
  • 各種其他 AI 工具(用於會議記錄的 Granola、AI 輔助設計工具):約 $80/月

總 AI 成本:大約 $300/月。為了背景,單個初級開發者最少成本 $5,000-7,000/月。數學很荒謬。

目前還不起作用的事情

這是反炒作部分。這些是我定期遇到的真正問題。

複雜狀態管理

Claude Code 可以很好地單獨編寫 Redux 切片和 Zustand 存儲。但是當你有複雜的應用程式具有相互依賴的狀態時——比如,一個電子商務結帳流程,其中庫存、定價、折扣代碼和運費都相互作用——它開始出錯。不是明顯的錯誤。微妙的競態條件和邊界情況只在特定用戶路徑下浮現。

我學會了自己編寫複雜狀態邏輯,並使用 Claude Code 處理更簡單、更隔離的部分。

多文件重構與上下文

Claude Code 在理解項目背景方面已經明顯改進,但跨許多文件的大規模重構仍會產生不一致。它會更新一個文件中的類型定義並錯過依賴它的其他三個文件。CLAUDE.md 項目文件有幫助,但它不是銀彈。

設計實現保真度

當我用 Figma 設計給 Claude Code(通過截圖或描述),它會走 75% 的路。佈局通常是正確的,間距很接近。但微妙的東西——特定的動畫時序、懸停狀態應該如何感受、使設計感到精拋光的微交互——那些仍然需要手動精化。每一次都是。

調試生產問題

當你給 Claude Code 清晰的錯誤訊息和相關代碼時,Claude Code 擅長調試。它在問題是環境問題時調試不好——一個在預覽版中有效但在生產中失敗的 Vercel 部署、一個只在某些 CDN 配置下發生的神秘 CORS 問題、一個在特定負載模式下耗盡的數據庫連接池。這些需要 AI 不可靠地具有的經驗知識。

理解業務背景

最大的差距:Claude Code 不理解你為什麼要構建某物。它不能告訴你客戶要求的功能實際上會傷害他們的轉換率。它不能對不好的產品決策提出反對。它高效且無判斷地構建你告訴它構建的東西。這種判斷是資深開發者帶來的最有價值的東西。

為代理工作設置 Claude Code

如果你正在運營一個小商店並想將 Claude Code 集成到你的工作流程中,這就是我對設置所學到的。

CLAUDE.md 文件是一切

你的 CLAUDE.md 文件是這個工作流程中最重要的單個工件。我們的包括:

# Project: [Client Name]

## Stack
- Next.js 15 (App Router)
- TypeScript (strict mode)
- Tailwind CSS v4
- Sanity v3
- Vercel deployment

## Coding Conventions
- Use server components by default. Only add 'use client' when necessary.
- Prefer named exports over default exports.
- Use the cn() utility for conditional classes (imported from @/lib/utils).
- All API calls go through server actions or route handlers. No client-side fetching.
- Error handling: use error boundaries, not try/catch in components.

## Component Patterns
- Atomic design: atoms → molecules → organisms → templates
- Each component gets its own directory: ComponentName/index.tsx + ComponentName.test.tsx
- Props interfaces are defined in the component file, not in a separate types file.

## Do NOT
- Use any CSS-in-JS libraries
- Create barrel export files
- Use the 'any' type
- Install new dependencies without explicit approval

這個文件防止了約 60% 的「Claude 做錯了」時刻。沒有它,你花更多時間改正而不是節省。

對大功能使用子代理

對於更大的功能,我開始使用 Claude Code 產生子代理的能力。我讓主代理計畫功能、將其分解為任務,然後為每個任務啟動專注的代理。這不是真正的並行性——我仍然按順序審查——但它使每個代理的上下文窗口保持專注,並減少了在長對話中發生的漂移。

版本控制紀律

Claude Code 頻繁提交,這很好。但它的提交訊息通常太通用。我在 CLAUDE.md 中添加了一個規則:

## Git Conventions
- Commit messages follow Conventional Commits: feat:, fix:, refactor:, test:, docs:
- Each commit should represent ONE logical change
- Always include the ticket/issue number if applicable
- Write commit messages as if a developer six months from now needs to understand WHY

這有幫助,雖然我仍然重寫約三分之一的提交訊息。

這如何改變客戶關係

這個工作流程最意外的影響不是速度或成本節省——它是如何改變客戶關係。

當你能在兩天內發布工作原型而不是兩週時,整個對話都會轉變。客戶停止辯論線框並開始對真實、功能性的軟體作出反應。回饋循環從雙週衝刺審查壓縮為每日迭代。過去需要三次會議的決策現在發生在 Loom 視頻和 Slack 帖子中。

這對客戶來說確實更好。他們用更少的錢得到更多,更快速地得到它。如果你對這個模式的實際運作方式很好奇,請查看我們的 pricing pagereach out directly ——我很樂意逐步解決具體的項目示例。

但這裡也有一個張力。當事情快速且便宜時,一些客戶開始將開發視為免費。「你能再加一個東西嗎?」當他們知道這對你只需要幾個小時時,就成為了一個不斷的低聲。在 AI 增強工作流程中,範圍管理變得更重要,不是更少。

另一個轉變:客戶日益不關心你如何構建東西。他們不問你的技術堆棧或你的團隊規模。他們關心結果——速度、質量、可靠性。Claude Code 編寫了 70% 的代碼庫是否與他們無關。正如應該的那樣。

常見問題

Claude Code 真的編寫生產質量的代碼嗎? 根據我的經驗,Claude Code 生成的約 70% 是略有調整的生產就緒。另外 20% 需要有意義的重構。約 10% 需要被拋棄並重寫。關鍵是在 CLAUDE.md 文件中有強大的慣例,並在推送前審查所有內容。我從不在沒有審查的情況下將 AI 生成的代碼推送到生產——那是走向技術債務的最快路徑。

Claude Code 與 GitHub Copilot 或 Cursor 對代理工作有何比較? 他們有不同的目的。Copilot 和 Cursor 很適合內聯代碼完成——他們加快了打字代碼的行為。Claude Code 在更高層次上運行:它可以計畫功能、生成整個文件、在整個項目中重構並對架構進行推理。我使用 Cursor 處理日常編碼,Claude Code 處理更大的任務,如構建新功能、編寫測試套件或審計代碼庫。它們是補充的,不是競爭的。

在 2026 年運營 AI 增強代理機構的真實成本是多少? 我的月度全部成本:約 $300 用於 AI 工具,$3,500-5,000 用於人類承包商(設計師、文案策略家、簿記員),以及標準業務開銷(軟體訂閱、保險、會計)。總運營成本約為每月 $5,000-7,000。月度平均收入為 $25,000-40,000,相比於傳統代理機構模式(薪資單獨會吃掉 60-70% 的收入),利潤要高得多。

單人創始人真的可以只用 AI 工具運營代理機構嗎? 是和否。你可以處理小型代理機構的技術產出。但你不能在沒有一些人類支持的情況下同時處理銷售、策略、設計和開發。「單人十億美元公司」敘述,如 Evartology 的 Substack 指南中描述的那樣,是有志的。現實更像是一個單人協調層,配有 AI 和一些承包商。仍然不可思議地強大——只是不是魔法。

什麼類型的項目最適合 Claude Code 工作流程? 內容驅動的網站、電子商務前端、SaaS 儀表板和市場營銷網站是我們的最佳位置。這些項目具有 Claude Code 出色處理的良好理解模式。更難的項目:任何具有新穎演算法、複雜實時系統或重硬體集成的東西。問題越獨特,AI 生成的代碼就越沒有用。我們專注於 Next.js 開發headless CMS 構建,因為模式庫很深。

在使用 AI 工具時,如何處理客戶保密性? 這是一個合理的關注。我們不將客戶機密、API 密鑰或敏感業務數據粘貼到 AI 工具中。我們的 CLAUDE.md 文件包含架構決策和編碼慣例——不是專有業務邏輯。對於代碼庫,Claude Code 在本地運行並使用 Anthropic 的隱私承諾在你的機器上處理代碼。我們在合同中包含 AI 使用披露,到目前為止還沒有客戶反對。

當 AI 處理大多數編碼時,什麼技能變得更重要? 架構思維、代碼審查和客戶溝通。當 Claude Code 編寫代碼時,你的工作轉變為評估代碼質量、做 AI 無法做的設計決策,以及在客戶需求和技術解決方案之間進行翻譯。在這個模式中蓬勃發展的開發者是資深級思想家,他們可以發現細微的錯誤、理解性能影響,並對不好的需求提出反對。依賴 AI 而不理解它生成內容的初級開發者會產生脆弱、有缺陷的軟體。

這個模式會使傳統開發代理機構過時嗎? 不是過時,但它會強制進行重組。基於工作小時收費的代理機構將因為 AI 大幅減少小時而遇到困難。根據交付的價值——業務成果、上市速度、最終產品質量——收費的代理機構將蓬勃發展。倖存的代理機構將更小、更快、更專業化。不適應的將在價格和速度上輸給像我們這樣深入將 AI 集成到工作流程中的商店。