摘要

我們經營一家無頭網站代理公司,Claude Code 處理 60-70% 的實施工作,這些工作過去需要整個團隊來完成。我們的每個 MVP 成本從 $35,000-$50,000 下降到 $8,000-$15,000。首次部署時間從 6-8 週縮短至 10-18 天。但 AI 並未替代一切──它替代了特定、範圍明確的任務。以下是哪些有效、哪些無效,以及我們仍然為哪些工作聘請人類。

目錄

為什麼我們圍繞 Claude Code 重建代理公司

我們沒有計畫這樣做。到 2024 年底,我們是一個 4 人無頭開發工作室,按 $150/小時的費率進行 Next.js 和無頭 CMS 工作。到 2025 年 3 月,在將 Claude Code──最初是 Claude 3.5 Sonnet,現在是 Claude 4 Sonnet──整合到每個項目後,其中兩個角色已從根本上改變。不是被消除。是改變。一位資深開發者成為全職 AI 導向工程師。另一位完全轉向代碼審查和架構設計。

催化劑:一個 Sanity + Next.js 14 項目,我們使用 Claude Code 搭建整個 schema 層、生成 GROQ 查詢、構建 14 個頁面範本,並編寫部署管道。本應需要 120 個可計費小時的工作在 34 小時內完成。我們互相看了一眼,說:「我們需要重新構建一切。」

這是誠實的起源。不是宏大戰略。只是一個完成速度過快的項目。

Claude Code 代理公司工作流實際上是什麼樣的?

以下是一個活躍客戶構建的典型一週:

週一:架構 + 啟動

  • 我:2 小時定義組件架構、數據模型、API 契約
  • 我:1 小時編寫 CLAUDE.md 項目說明(下面詳細介紹)
  • Claude Code:生成初始項目腳手架、安裝依賴、配置 TypeScript 嚴格模式、設置 linting

週二至週四:構建衝刺

  • 我:每天 1-2 小時審查 Claude Code 輸出、發現錯誤、重定向
  • Claude Code:每天 6-8 個任務──頁面組件、API 路由、CMS schema 定義、實用函數、測試文件
  • 我:架構樞紐、複雜狀態管理決策、客戶 Slack 消息

週五:整合 + 品質保證

  • 我:3-4 小時的手動品質保證、可訪問性審計、性能測試
  • Claude Code:修復品質保證中發現的錯誤、編寫缺失的測試、生成文檔
  • 我:客戶演示準備、部署到 staging

每週活躍構建的總人工小時數:18-24。比我們構建 AI 前的工作流減少 35-45。

AI 在我們項目中處理的內容

以下是特定的任務清單──Claude Code 每週在真實客戶項目上做的事情:

代碼生成(70-80% 自動化)

  • React/Next.js 組件:頁面佈局、根據 Figma 規格描述的 UI 組件、表單處理程序
  • CMS schemas:Sanity schema 類型、Contentful 內容模型作為遷移腳本、Payload CMS 集合配置
  • API 路由:Next.js Route Handlers、tRPC 程序、webhook 端點
  • 數據庫操作:Prisma schema 變更、遷移文件、seed 腳本
  • TypeScript 類型:從 API 響應生成類型、Zod 驗證 schemas、共享類型包

代碼審計(每週節省 4-6 小時)

  • 在重構項目之前審查現有代碼庫
  • 識別未使用的依賴、死代碼、類型不一致
  • 生成具有特定 file:line 引用的審計報告

內容草稿(每週節省 3-5 小時)

  • RFP 回复和技術提案
  • 項目文檔和 README 文件
  • 面向客戶的技術說明
  • SOW 初稿(總是經過人工審查和重寫)

測試(每週節省 5-8 小時)

  • Vitest 實用函數的單元測試
  • Playwright e2e 測試腳手架
  • 測試數據生成和 fixtures
  • 我們可能會遺漏的邊界情況識別

我們仍然為其聘請人類的工作

任務 AI 為什麼無法做到(目前) 我們聘請誰 典型成本
品牌策略 需要理解客戶的市場地位、競爭對手、客戶心理,AI 在這個級別會產生幻覺 合約品牌策略師 $3,000-$8,000/項目
文案方向 語調、聲音和說服力架構需要人類判斷 自由職業文案撰寫者 $2,000-$5,000/項目
銷售電話 客戶希望與了解他們業務的人交談 我們自己做 我們的時間
視覺設計 Figma 工作、藝術方向、設計系統 合約設計師 $4,000-$12,000/項目
複雜 DevOps Kubernetes 配置、多區域部署、受監管行業的 CI/CD 合約 DevOps 工程師 $150-$200/小時
法律審查 合同、MSA、IP 條款 律師 $350-$500/小時
可訪問性審計 自動化工具捕捉 30-40% 的問題;真實屏幕閱讀器測試需要人類 A11y 專家 $1,500-$3,000/審計
用戶研究 與實際用戶交談、綜合反饋 UX 研究員 $100-$150/小時

這是 8 個人類不可或缺的類別。

真實數字:每個 MVP 的成本和部署時間

以下是我們最後 6 個客戶項目(2025 年第一季度至第二季度)的實際數字,已匿名:

項目 技術棧 舊版估計 AI 輔助實際 部署時間
SaaS 營銷網站 Next.js 15 + Sanity v3 $38,000 $11,500 12 天
電子商務店面 Next.js 15 + Shopify Storefront API $52,000 $18,200 18 天
創意代理的作品集/CMS Astro 5 + Payload CMS 3.0 $28,000 $8,400 10 天
SaaS 儀表板 MVP Next.js 15 + Supabase + Prisma $45,000 $14,800 16 天
非營利組織網站重新設計 Next.js 14 + Contentful $32,000 $9,200 11 天
開發者文檔網站 Astro 5 + MDX + Algolia $22,000 $7,600 8 天

「舊版估計」是我們在 2023 年用舊團隊結構會報價的金額。「AI 輔助實際」是客戶在 2025 年支付的金額。

成本縮減:62%。首次部署時間:12.5 天

這些都是我們擅長的項目──無頭 CMS 網站和 Next.js 應用程序。涉及複雜 RBAC 系統、實時協作應用或任何涉及複雜分佈式系統的應用會有不同的情況。

我們的 Claude Code 項目設置

每個項目都以 repo 根目錄中的 CLAUDE.md 文件開始。這是我們為提高 AI 輸出質量所做的最具影響力的事情。以下是我們的範本結構:

# 項目:[客戶名稱]

## 技術棧
- 框架:Next.js 15.1 (App Router)
- CMS:Sanity v3.72
- 樣式:Tailwind CSS v4.0
- 語言:TypeScript 5.7 (strict mode)
- 包管理器:pnpm 9.x
- Node:22 LTS

## 架構決策
- 所有數據擷取都在 Server Components 中
- 客戶端組件僅用於互動
- GROQ 查詢與頁面組件共置
- 無 barrel exports
- 偏好命名 exports

## 代碼約定
- 對條件類使用 `cn()` 實用程序(已在 lib/utils.ts 中)
- 在路由段級別進行錯誤邊界
- 所有圖像通過 next/image 並指定明確尺寸
- 表單使用 react-hook-form + zod

## 文件結構
[src/ 目錄的樹狀輸出]

## 已知約束
- 客戶要求 WCAG 2.2 AA
- 必須支持 IE-- 開玩笑。Chrome 120+、Safari 17+、Firefox 121+
- 部署目標:Vercel (Pro 計畫,us-east-1)

## 不要
- 未經詢問就安裝新依賴
- 在 src/ 外創建文件
- 使用默認 exports(除了 Next.js pages/layouts)
- 在 Tailwind 類外編寫 CSS

此文件消除了大約 40% 的「Claude 偏離軌道」事件。沒有它,你會得到不符合項目模式的通用代碼。有了它,Claude Code 生成的組件看起來就像你的團隊寫的。

我們在腳手架階段也使用 claude --dangerously-skip-permissions(生產分支上絕不使用),一旦超過初始設置就切換到互動審批模式。按照 Claude 4 Sonnet 運行,每個項目的 API 使用成本:通常是一個完整構建的 $40-$120。

一人十億美元公司是真實的嗎?

不是。但這是一個思想實驗,揭示了一些關於我們所處位置的真實情況。

Evartology 在 Substack 上的文章──「How to Run a Company Alone in 2026」──列出了一個令人印象深刻的堆棧:工程、營銷、銷售、運營,甚至招聘的 AI。這是一個組織良好的劇本,我同意其中大約 60%。關於將 AI 用於內容草稿、代碼生成和運營文檔的部分與我們的經驗相符。但該文章低估了信任的不可化約性。客戶不購買代碼。他們購買對某人理解他們問題的信心。那是人類的事。

Henry 在 Substack 上的文章(henrythe9th)關於一位獨立創始人如何「克隆自己」使用 AI 代理更接近現實。使用 AI 處理客戶支持分類和第一稿回复的具體示例引起了共鳴──我們對技術提案草稿做過類似的事情。但「克隆」的框架過度銷售它。實際發生的是任務委派給 AI。你沒有克隆你的判斷力。你卸載了你的打字。

Nate 關於一人業務的執行摘要涉及 Carta 數據,顯示獨立創始人初創公司的增長百分比。那是真實的。Carta 在 2025 年初的數據顯示獨立註冊在上升。但 Carta 上獨立註冊的公司與獨立運營的公司不同。大多數這些創始人聘請承包商、代理公司(如我們)和部分角色。他們在股權表上是獨立的,但實踐上並非如此。

我們的看法:這個概念的現實版本不是一個人做十億美元。這是一個人(或一個非常小的團隊)以 70-80% 的利潤率做 $1M-$5M 的收入,處理曾經需要 8-12 人的工作。這不是幻想。我們看著它發生。但它需要 AI 能力、領域專業知識和現有的專業網絡。不只是 ChatGPT 訂閱。

目前還不起作用的事情

1. 複雜的多文件重構

Claude Code 可以完美地重構單個文件。但當你需要協調的變更跨越 15+ 個文件時──比如說,改變一個觸及 API 路由、組件、類型、測試和 CMS schemas 的數據模型──它在第 8-10 個文件周圍失去連貫性。我們已經看到它引入破壞性循環依賴、忘記更新它在會話早期觸及的文件中的導入,並無聲地跳過文件。我們的解決方法:將重構分成 3-4 個文件批次,並在每個批次之間驗證。

2. 設計到 Figma 代碼

儘管受到炒作,但從 Figma 設計生成生產質量的組件仍然是最多 60% 準確的任務。Claude Code(或任何 LLM)無法直接查看你的 Figma 文件。你在用詞描述佈局或粘貼截圖。輸出大致正確的結構,但錯過間距、響應式斷點和交互狀態。我們仍然有人類將設計轉換為組件,然後使用 Claude Code 來充實變體和狀態。

3. 性能優化

Claude Code 會告訴你添加 React.memo(),然後就這樣稱完成了。真實的性能工作──通過 React DevTools 分析識別不必要的重新渲染、通過分析 Sanity 的執行計畫來優化 GROQ 查詢、通過審計第三方腳本來減少 CLS──需要人類觀察運行時行為。AI 無法分析你的應用。

4. 調試生產問題

當某個東西在凌晨 2 點破裂,錯誤是一個神祕的 Vercel Edge Runtime 超時時,Claude Code 可以建議可能性。但它無法查看你的 Datadog 儀表板、將時間與部署相關聯、檢查 CDN 緩存是否被清除,或意識到該問題實際上是來自 48 小時前發生的域名轉移的 DNS 傳播延遲。生產調試是上下文密集的,AI 上下文窗口仍然太窄。

5. 需要視覺判斷的任何事物

這個動畫太快了嗎?這個色彩組合對奢侈品牌來說感覺合適嗎?空白平衡是否平衡?Claude Code 在這裡沒有觀點。不要問。

6. 長時間會話連貫性

在單個 Claude Code 會話中連續工作約 45-60 分鐘後,我們注意到質量下降。它開始重複會話早期的模式,即使上下文已改變。它忘記了 CLAUDE.md 中的約束。我們以每 45 分鐘重新啟動會話為規則。這是真實的生產力稅──可能是每天 20-30 分鐘的重新適應時間。

我們現在如何確定客戶項目範圍

我們的確定範圍過程從根本上改變了。以下是前後:

之前(2023)

  1. 發現電話(1 小時)
  2. 內部架構討論(2 小時)
  3. 詳細 SOW,每個功能的小時估計(4-6 小時)
  4. 客戶審查週期(1-2 週)
  5. 簽署合同 → 啟動

之後(2025)

  1. 發現電話(45 分鐘)
  2. Claude Code 從通話筆記生成 SOW 初稿(15 分鐘提示)
  3. 我審查和重寫 SOW(1 小時)
  4. 我們使用 Claude Code 構建最難技術挑戰的一次性概念驗證(2-3 小時)
  5. 範圍現在基於實際實施數據,而非猜測
  6. 客戶審查(3-5 天)
  7. 簽署合同 → 啟動

第 4 步是關鍵區別。我們過去基於經驗估計「Shopify Storefront API 整合:40 小時」。現在我們實際上在 2-3 小時內構建粗略版本,知道它是 22 小時,帶 AI 協助。我們的估計在實際值的 15% 以內。他們過去在 30-40% 以內。

這每個項目花費我們 3-4 小時的未計費售前工作。但我們的成交率從 ~35% 上升到 ~55%,因為客戶在簽署之前看到一個工作原型。

創始人數學:每週工時明細

以下是作為使用 Claude Code 的代理公司創始人,我的一週實際如何分配:

活動 小時/週 AI 輔助?
客戶電話和 Slack 6
架構和技術決策 5 部分(Claude Code 用於研究)
AI 輸出代碼審查 8
指導 Claude Code 會話 6 N/A(這就是 AI 工作)
商業運營(發票、合同、計畫) 3 部分(草稿)
銷售和提案 3 部分(初稿)
手動品質保證和測試 3
學習和保持最新 2
總計 36

每週 36 小時。不是 80。不是 20。這是經營一個代理公司,每月做 $60K-$80K 收入,同時有 2 個活躍客戶項目。

構建 AI 之前,同樣的輸出需要 3.5 個 FTE 和我的 50 小時週。數學是真實的。但注意:其中 22 個小時仍然完全是人類工作。AI 沒有消除工作。它改變了思考與打字的比例。

常見問題

Claude Code 每月對代理工作的成本是多少? 我們在所有項目的 Claude API 使用上花費大約 $180-$300/月。這是在 Claude 4 Sonnet 模型上。單個項目成本範圍從 $40-$120,取決於範圍和會話計數。

Claude Code 可以替代初級開發者嗎? 它替代初級開發者的輸出,但不替代角色。仍然需要有人來指導、審查和更正 AI 的工作。這個人需要資深級別的判斷力。沒有專家審查的 AI 生成代碼更快地運輸錯誤。

最適合與 Claude Code 工作流配對的 CMS 是什麼? Sanity v3,因為它的 schema 定義是 TypeScript 文件,Claude Code 生成得異常好。Payload CMS 3.0 是接近的第二位。Contentful 可以工作,但它的管理 API 對 AI 來說更複雜。

Claude Code 是否適用於移動應用開發? 我們已經用它進行了 React Native(Expo SDK 52)項目,對組件生成和導航設置有不錯的結果。它在原生模組配置和特定平台調試方面的表現更差。與網路項目的 60-70% 相比,大約 40-50% 的生產力提升。

你如何處理客戶對 AI 生成代碼的知識產權擔憂? 我們的 MSA 包含一個條款,規定無論使用何種工具,所有可交付成果都是原始工作產品。Anthropic 的條款(截至 2025 年 6 月)向用戶授予輸出權利。我們不會將客戶專有數據發送到 API──僅發送代碼模式和通用實施。

當 Claude Code 生成不正確的代碼時會發生什麼? 它發生在大約 15-20% 的任務上。我們的工作流通過對每個 PR 的強制人工代碼審查來應對這一點。常見的失敗模式:不正確的 TypeScript 泛型、來自訓練數據的過時 API 模式和缺失的邊界情況錯誤處理。我們在每個估計中預算審查時間。