Claude Code Agency Workflow

摘要

我們經營一家無頭網站代理公司，Claude Code 處理 60-70% 的實施工作，這些工作過去需要整個團隊來完成。我們的每個 MVP 成本從 $35,000-$50,000 下降到 $8,000-$15,000。首次部署時間從 6-8 週縮短至 10-18 天。但 AI 並未替代一切──它替代了特定、範圍明確的任務。以下是哪些有效、哪些無效，以及我們仍然為哪些工作聘請人類。

為什麼我們圍繞 Claude Code 重建代理公司
Claude Code 代理公司工作流實際上是什麼樣的？
AI 在我們項目中處理的內容
我們仍然為其聘請人類的工作
真實數字：每個 MVP 的成本和部署時間
我們的 Claude Code 項目設置
一人十億美元公司是真實的嗎？
目前還不起作用的事情
我們現在如何確定客戶項目範圍
創始人數學：每週工時明細
常見問題

為什麼我們圍繞 Claude Code 重建代理公司

我們沒有計畫這樣做。到 2024 年底，我們是一個 4 人無頭開發工作室，按 $150/小時的費率進行 Next.js 和無頭 CMS 工作。到 2025 年 3 月，在將 Claude Code──最初是 Claude 3.5 Sonnet，現在是 Claude 4 Sonnet──整合到每個項目後，其中兩個角色已從根本上改變。不是被消除。是改變。一位資深開發者成為全職 AI 導向工程師。另一位完全轉向代碼審查和架構設計。

催化劑：一個 Sanity + Next.js 14 項目，我們使用 Claude Code 搭建整個 schema 層、生成 GROQ 查詢、構建 14 個頁面範本，並編寫部署管道。本應需要 120 個可計費小時的工作在 34 小時內完成。我們互相看了一眼，說：「我們需要重新構建一切。」

這是誠實的起源。不是宏大戰略。只是一個完成速度過快的項目。

Claude Code 代理公司工作流實際上是什麼樣的？

以下是一個活躍客戶構建的典型一週：

週一：架構 + 啟動

我：2 小時定義組件架構、數據模型、API 契約
我：1 小時編寫 CLAUDE.md 項目說明（下面詳細介紹）
Claude Code：生成初始項目腳手架、安裝依賴、配置 TypeScript 嚴格模式、設置 linting

週二至週四：構建衝刺

我：每天 1-2 小時審查 Claude Code 輸出、發現錯誤、重定向
Claude Code：每天 6-8 個任務──頁面組件、API 路由、CMS schema 定義、實用函數、測試文件
我：架構樞紐、複雜狀態管理決策、客戶 Slack 消息

週五：整合 + 品質保證

我：3-4 小時的手動品質保證、可訪問性審計、性能測試
Claude Code：修復品質保證中發現的錯誤、編寫缺失的測試、生成文檔
我：客戶演示準備、部署到 staging

每週活躍構建的總人工小時數：18-24。比我們構建 AI 前的工作流減少 35-45。

AI 在我們項目中處理的內容

以下是特定的任務清單──Claude Code 每週在真實客戶項目上做的事情：

代碼生成（70-80% 自動化）

React/Next.js 組件：頁面佈局、根據 Figma 規格描述的 UI 組件、表單處理程序
CMS schemas：Sanity schema 類型、Contentful 內容模型作為遷移腳本、Payload CMS 集合配置
API 路由：Next.js Route Handlers、tRPC 程序、webhook 端點
數據庫操作：Prisma schema 變更、遷移文件、seed 腳本
TypeScript 類型：從 API 響應生成類型、Zod 驗證 schemas、共享類型包

代碼審計（每週節省 4-6 小時）

在重構項目之前審查現有代碼庫
識別未使用的依賴、死代碼、類型不一致
生成具有特定 file:line 引用的審計報告

內容草稿（每週節省 3-5 小時）

RFP 回复和技術提案
項目文檔和 README 文件
面向客戶的技術說明
SOW 初稿（總是經過人工審查和重寫）

測試（每週節省 5-8 小時）

Vitest 實用函數的單元測試
Playwright e2e 測試腳手架
測試數據生成和 fixtures
我們可能會遺漏的邊界情況識別

我們仍然為其聘請人類的工作

任務	AI 為什麼無法做到（目前）	我們聘請誰	典型成本
品牌策略	需要理解客戶的市場地位、競爭對手、客戶心理，AI 在這個級別會產生幻覺	合約品牌策略師	$3,000-$8,000/項目
文案方向	語調、聲音和說服力架構需要人類判斷	自由職業文案撰寫者	$2,000-$5,000/項目
銷售電話	客戶希望與了解他們業務的人交談	我們自己做	我們的時間
視覺設計	Figma 工作、藝術方向、設計系統	合約設計師	$4,000-$12,000/項目
複雜 DevOps	Kubernetes 配置、多區域部署、受監管行業的 CI/CD	合約 DevOps 工程師	$150-$200/小時
法律審查	合同、MSA、IP 條款	律師	$350-$500/小時
可訪問性審計	自動化工具捕捉 30-40% 的問題；真實屏幕閱讀器測試需要人類	A11y 專家	$1,500-$3,000/審計
用戶研究	與實際用戶交談、綜合反饋	UX 研究員	$100-$150/小時

這是 8 個人類不可或缺的類別。

真實數字：每個 MVP 的成本和部署時間

以下是我們最後 6 個客戶項目（2025 年第一季度至第二季度）的實際數字，已匿名：

項目	技術棧	舊版估計	AI 輔助實際	部署時間
SaaS 營銷網站	Next.js 15 + Sanity v3	$38,000	$11,500	12 天
電子商務店面	Next.js 15 + Shopify Storefront API	$52,000	$18,200	18 天
創意代理的作品集/CMS	Astro 5 + Payload CMS 3.0	$28,000	$8,400	10 天
SaaS 儀表板 MVP	Next.js 15 + Supabase + Prisma	$45,000	$14,800	16 天
非營利組織網站重新設計	Next.js 14 + Contentful	$32,000	$9,200	11 天
開發者文檔網站	Astro 5 + MDX + Algolia	$22,000	$7,600	8 天

「舊版估計」是我們在 2023 年用舊團隊結構會報價的金額。「AI 輔助實際」是客戶在 2025 年支付的金額。

成本縮減：62%。首次部署時間：12.5 天。

這些都是我們擅長的項目──無頭 CMS 網站和 Next.js 應用程序。涉及複雜 RBAC 系統、實時協作應用或任何涉及複雜分佈式系統的應用會有不同的情況。

我們的 Claude Code 項目設置

每個項目都以 repo 根目錄中的 CLAUDE.md 文件開始。這是我們為提高 AI 輸出質量所做的最具影響力的事情。以下是我們的範本結構：

# 項目：[客戶名稱]

## 技術棧
- 框架：Next.js 15.1 (App Router)
- CMS：Sanity v3.72
- 樣式：Tailwind CSS v4.0
- 語言：TypeScript 5.7 (strict mode)
- 包管理器：pnpm 9.x
- Node：22 LTS

## 架構決策
- 所有數據擷取都在 Server Components 中
- 客戶端組件僅用於互動
- GROQ 查詢與頁面組件共置
- 無 barrel exports
- 偏好命名 exports

## 代碼約定
- 對條件類使用 `cn()` 實用程序（已在 lib/utils.ts 中）
- 在路由段級別進行錯誤邊界
- 所有圖像通過 next/image 並指定明確尺寸
- 表單使用 react-hook-form + zod

## 文件結構
[src/ 目錄的樹狀輸出]

## 已知約束
- 客戶要求 WCAG 2.2 AA
- 必須支持 IE-- 開玩笑。Chrome 120+、Safari 17+、Firefox 121+
- 部署目標：Vercel (Pro 計畫，us-east-1)

## 不要
- 未經詢問就安裝新依賴
- 在 src/ 外創建文件
- 使用默認 exports（除了 Next.js pages/layouts）
- 在 Tailwind 類外編寫 CSS

此文件消除了大約 40% 的「Claude 偏離軌道」事件。沒有它，你會得到不符合項目模式的通用代碼。有了它，Claude Code 生成的組件看起來就像你的團隊寫的。

我們在腳手架階段也使用 claude --dangerously-skip-permissions（生產分支上絕不使用），一旦超過初始設置就切換到互動審批模式。按照 Claude 4 Sonnet 運行，每個項目的 API 使用成本：通常是一個完整構建的 $40-$120。

一人十億美元公司是真實的嗎？

不是。但這是一個思想實驗，揭示了一些關於我們所處位置的真實情況。

Evartology 在 Substack 上的文章──「How to Run a Company Alone in 2026」──列出了一個令人印象深刻的堆棧：工程、營銷、銷售、運營，甚至招聘的 AI。這是一個組織良好的劇本，我同意其中大約 60%。關於將 AI 用於內容草稿、代碼生成和運營文檔的部分與我們的經驗相符。但該文章低估了信任的不可化約性。客戶不購買代碼。他們購買對某人理解他們問題的信心。那是人類的事。

Henry 在 Substack 上的文章（henrythe9th）關於一位獨立創始人如何「克隆自己」使用 AI 代理更接近現實。使用 AI 處理客戶支持分類和第一稿回复的具體示例引起了共鳴──我們對技術提案草稿做過類似的事情。但「克隆」的框架過度銷售它。實際發生的是任務委派給 AI。你沒有克隆你的判斷力。你卸載了你的打字。

Nate 關於一人業務的執行摘要涉及 Carta 數據，顯示獨立創始人初創公司的增長百分比。那是真實的。Carta 在 2025 年初的數據顯示獨立註冊在上升。但 Carta 上獨立註冊的公司與獨立運營的公司不同。大多數這些創始人聘請承包商、代理公司（如我們）和部分角色。他們在股權表上是獨立的，但實踐上並非如此。

我們的看法：這個概念的現實版本不是一個人做十億美元。這是一個人（或一個非常小的團隊）以 70-80% 的利潤率做 $1M-$5M 的收入，處理曾經需要 8-12 人的工作。這不是幻想。我們看著它發生。但它需要 AI 能力、領域專業知識和現有的專業網絡。不只是 ChatGPT 訂閱。

目前還不起作用的事情

1. 複雜的多文件重構

Claude Code 可以完美地重構單個文件。但當你需要協調的變更跨越 15+ 個文件時──比如說，改變一個觸及 API 路由、組件、類型、測試和 CMS schemas 的數據模型──它在第 8-10 個文件周圍失去連貫性。我們已經看到它引入破壞性循環依賴、忘記更新它在會話早期觸及的文件中的導入，並無聲地跳過文件。我們的解決方法：將重構分成 3-4 個文件批次，並在每個批次之間驗證。

2. 設計到 Figma 代碼

儘管受到炒作，但從 Figma 設計生成生產質量的組件仍然是最多 60% 準確的任務。Claude Code（或任何 LLM）無法直接查看你的 Figma 文件。你在用詞描述佈局或粘貼截圖。輸出大致正確的結構，但錯過間距、響應式斷點和交互狀態。我們仍然有人類將設計轉換為組件，然後使用 Claude Code 來充實變體和狀態。

3. 性能優化

Claude Code 會告訴你添加 React.memo()，然後就這樣稱完成了。真實的性能工作──通過 React DevTools 分析識別不必要的重新渲染、通過分析 Sanity 的執行計畫來優化 GROQ 查詢、通過審計第三方腳本來減少 CLS──需要人類觀察運行時行為。AI 無法分析你的應用。

4. 調試生產問題

當某個東西在凌晨 2 點破裂，錯誤是一個神祕的 Vercel Edge Runtime 超時時，Claude Code 可以建議可能性。但它無法查看你的 Datadog 儀表板、將時間與部署相關聯、檢查 CDN 緩存是否被清除，或意識到該問題實際上是來自 48 小時前發生的域名轉移的 DNS 傳播延遲。生產調試是上下文密集的，AI 上下文窗口仍然太窄。

5. 需要視覺判斷的任何事物

這個動畫太快了嗎？這個色彩組合對奢侈品牌來說感覺合適嗎？空白平衡是否平衡？Claude Code 在這裡沒有觀點。不要問。

6. 長時間會話連貫性

在單個 Claude Code 會話中連續工作約 45-60 分鐘後，我們注意到質量下降。它開始重複會話早期的模式，即使上下文已改變。它忘記了 CLAUDE.md 中的約束。我們以每 45 分鐘重新啟動會話為規則。這是真實的生產力稅──可能是每天 20-30 分鐘的重新適應時間。

我們現在如何確定客戶項目範圍

我們的確定範圍過程從根本上改變了。以下是前後：

之前（2023）

發現電話（1 小時）
內部架構討論（2 小時）
詳細 SOW，每個功能的小時估計（4-6 小時）
客戶審查週期（1-2 週）
簽署合同 → 啟動

之後（2025）

發現電話（45 分鐘）
Claude Code 從通話筆記生成 SOW 初稿（15 分鐘提示）
我審查和重寫 SOW（1 小時）
我們使用 Claude Code 構建最難技術挑戰的一次性概念驗證（2-3 小時）
範圍現在基於實際實施數據，而非猜測
客戶審查（3-5 天）
簽署合同 → 啟動

第 4 步是關鍵區別。我們過去基於經驗估計「Shopify Storefront API 整合：40 小時」。現在我們實際上在 2-3 小時內構建粗略版本，知道它是 22 小時，帶 AI 協助。我們的估計在實際值的 15% 以內。他們過去在 30-40% 以內。

這每個項目花費我們 3-4 小時的未計費售前工作。但我們的成交率從 ~35% 上升到 ~55%，因為客戶在簽署之前看到一個工作原型。

創始人數學：每週工時明細

以下是作為使用 Claude Code 的代理公司創始人，我的一週實際如何分配：

活動	小時/週	AI 輔助？
客戶電話和 Slack	6	否
架構和技術決策	5	部分（Claude Code 用於研究）
AI 輸出代碼審查	8	否
指導 Claude Code 會話	6	N/A（這就是 AI 工作）
商業運營（發票、合同、計畫）	3	部分（草稿）
銷售和提案	3	部分（初稿）
手動品質保證和測試	3	否
學習和保持最新	2	否
總計	36

每週 36 小時。不是 80。不是 20。這是經營一個代理公司，每月做 $60K-$80K 收入，同時有 2 個活躍客戶項目。

構建 AI 之前，同樣的輸出需要 3.5 個 FTE 和我的 50 小時週。數學是真實的。但注意：其中 22 個小時仍然完全是人類工作。AI 沒有消除工作。它改變了思考與打字的比例。

常見問題

Claude Code 每月對代理工作的成本是多少？ 我們在所有項目的 Claude API 使用上花費大約 $180-$300/月。這是在 Claude 4 Sonnet 模型上。單個項目成本範圍從 $40-$120，取決於範圍和會話計數。

Claude Code 可以替代初級開發者嗎？ 它替代初級開發者的輸出，但不替代角色。仍然需要有人來指導、審查和更正 AI 的工作。這個人需要資深級別的判斷力。沒有專家審查的 AI 生成代碼更快地運輸錯誤。

最適合與 Claude Code 工作流配對的 CMS 是什麼？ Sanity v3，因為它的 schema 定義是 TypeScript 文件，Claude Code 生成得異常好。Payload CMS 3.0 是接近的第二位。Contentful 可以工作，但它的管理 API 對 AI 來說更複雜。

Claude Code 是否適用於移動應用開發？ 我們已經用它進行了 React Native（Expo SDK 52）項目，對組件生成和導航設置有不錯的結果。它在原生模組配置和特定平台調試方面的表現更差。與網路項目的 60-70% 相比，大約 40-50% 的生產力提升。

你如何處理客戶對 AI 生成代碼的知識產權擔憂？ 我們的 MSA 包含一個條款，規定無論使用何種工具，所有可交付成果都是原始工作產品。Anthropic 的條款（截至 2025 年 6 月）向用戶授予輸出權利。我們不會將客戶專有數據發送到 API──僅發送代碼模式和通用實施。

當 Claude Code 生成不正確的代碼時會發生什麼？ 它發生在大約 15-20% 的任務上。我們的工作流通過對每個 PR 的強制人工代碼審查來應對這一點。常見的失敗模式：不正確的 TypeScript 泛型、來自訓練數據的過時 API 模式和缺失的邊界情況錯誤處理。我們在每個估計中預算審查時間。

Claude Code Agency Workflow：我們如何在2025年運行項目

摘要

目錄

為什麼我們圍繞 Claude Code 重建代理公司

Claude Code 代理公司工作流實際上是什麼樣的？

週一：架構 + 啟動

週二至週四：構建衝刺

週五：整合 + 品質保證

AI 在我們項目中處理的內容

代碼生成（70-80% 自動化）

代碼審計（每週節省 4-6 小時）

內容草稿（每週節省 3-5 小時）

測試（每週節省 5-8 小時）

我們仍然為其聘請人類的工作

真實數字：每個 MVP 的成本和部署時間

我們的 Claude Code 項目設置

一人十億美元公司是真實的嗎？

目前還不起作用的事情

1. 複雜的多文件重構

2. 設計到 Figma 代碼

3. 性能優化

4. 調試生產問題

5. 需要視覺判斷的任何事物

6. 長時間會話連貫性

我們現在如何確定客戶項目範圍

之前（2023）

之後（2025）

創始人數學：每週工時明細

常見問題

Let's build
something together.

摘要

目錄

為什麼我們圍繞 Claude Code 重建代理公司

Claude Code 代理公司工作流實際上是什麼樣的？

週一：架構 + 啟動

週二至週四：構建衝刺

週五：整合 + 品質保證

AI 在我們項目中處理的內容

代碼生成（70-80% 自動化）

代碼審計（每週節省 4-6 小時）

內容草稿（每週節省 3-5 小時）

測試（每週節省 5-8 小時）

我們仍然為其聘請人類的工作

真實數字：每個 MVP 的成本和部署時間

我們的 Claude Code 項目設置

一人十億美元公司是真實的嗎？

目前還不起作用的事情

1. 複雜的多文件重構

2. 設計到 Figma 代碼

3. 性能優化

4. 調試生產問題

5. 需要視覺判斷的任何事物

6. 長時間會話連貫性

我們現在如何確定客戶項目範圍

之前（2023）

之後（2025）

創始人數學：每週工時明細

常見問題

Let's build something together.

Let's build
something together.