摘要 評估 claude-context-mode 專案(HN 熱門:315KB → 5.4KB,98% context 壓縮)對我們多代理系統的適用性。
結論:延後實施(Defer)。 當前系統無 context overflow 實際痛點,已有多層防護機制。Context Mode 的核心價值在於攔截 MCP tool output ,但它無法攔截第三方 MCP server 回應——而我們的 agent 主要透過第三方 MCP(bot-tools、hexo、duckduckgo)工作。投資報酬率不足以支持立即實施。
1. 我們的痛點分析 1.1 Context 消耗現狀
指標
數值
狀態
主意識典型消耗
~2,400 tokens(3,400 budget 的 70%)
✅ 安全
主意識最大觀測
2,810 tokens(budget 的 83%)
✅ 安全
Pipeline context cap
3,000 tokens(硬上限)
✅ 強制執行
預設 pipeline filter
8,000 tokens
✅ 充足
Lightweight 模式(Haiku)
~800 tokens
✅ 安全
近期 context overflow 失敗
0 次
✅ 無事件
近期 max_turns 失敗
0 次
✅ 無事件
1.2 現有防護機制(五層)
LIGHTWEIGHT_CWD — 非 code agent 在 data/agent-workspace 啟動 CLI,避免載入 ~200K token 的 CLAUDE.md 專案 context
PIPELINE_CONTEXT_CAP (3,000 tokens) — pipeline 上游輸出強制截斷
Input Filters — 7 種語義過濾器(summary-only, token-budget, findings-only 等),預設 8,000 token budget
Max turns 自動升級 — Haiku → Sonnet → Opus 的自動重試機制
Context-aware 分層 — L1/L2/L3 動態調整(800 / 1,400 / 2,400 tokens)
1.3 結論 目前沒有 context 瓶頸。 日誌中零 context overflow、零 max_turns 事件。系統設計已充分考慮 context 管理,每個 agent 在獨立 CLI session 中執行(skipResume: true),不會累積前一任務的 context。
2. Context Mode 核心技術 vs 我們的現有方案 2.1 Context Mode 的兩大支柱
技術
機制
效果
Sandbox 隔離
child_process.spawn() 執行腳本,只有 stdout 進入 context
56KB Playwright snapshot → 299B
SQLite FTS5 索引
將 raw output chunk by heading → FTS5 virtual table → BM25 搜索
按需檢索,不全載入
2.2 與我們現有方案的對比
維度
Context Mode
我們的系統
差異
Output 壓縮
Sandbox 隔離,只傳 stdout
無(Claude CLI 直接回傳完整結果)
有差距,但我們的 agent 結果通常已是結構化文字
搜索索引
SQLite FTS5 + BM25 + 3 層 fuzzy
In-memory BM25(search-index.ts)
技術類似,我們已有 BM25
Tail reading
無
tailReadJsonl(),64KB seek-from-end
我們更好
Inter-stage 過濾
無(單 session 內壓縮)
7 種 InputFilter + token budget
我們更成熟
持久化
SQLite FTS5 virtual table
SQLite WAL + 9 表 + 完整索引
我們的 DB 基礎設施更完善
2.3 關鍵差異 Context Mode 解決的核心問題是單一長 session 中 tool output 的累積膨脹 。它的場景:
開發者用 Claude Code 互動式工作 → 呼叫 Bash/Read/Grep → 每次 output 都留在 context → 30 分鐘後 context 滿了
我們的場景完全不同:
Agent 啟動 CLI → 執行任務(1-100 turns)→ 回傳結果 → session 結束 → 下一任務全新 session
每個 agent task 是短生命週期的獨立 session (skipResume: true),不存在跨 task 的 context 累積問題。
3. 適用性分析 3.1 哪些 agent 理論上受益?
Agent
典型 turns
場景
受益程度
deep-researcher
高(大量 web fetch)
多輪搜索 + 閱讀
⭐⭐⭐ 理論上最受益
explorer
中高
多輪搜索 + 分析
⭐⭐
programmer
中(code read/write)
讀寫檔案
⭐ 較低
reviewer
低-中
讀取 + 分析
⭐ 較低
其他
低(1-5 turns)
單一任務
⭕ 無意義
3.2 致命限制
Context Mode 無法攔截第三方 MCP server 的回應。
我們的 agent 主要使用:
bot-tools MCP(web_search, web_fetch, soul_read/write, dispatch_task)
duckduckgo MCP(search, fetch)
hexo MCP(blog 操作)
cclsp MCP(code agents 的 LSP 工具)
這些都是第三方 MCP server ,Context Mode 無法壓縮它們的回應。它只能壓縮 Claude Code 內建工具(Bash, Read, Grep, WebFetch)的 output。而這些內建工具的 output 在我們的架構中佔比較低——agent 的核心互動是透過 MCP tools。
3.3 Deep-researcher 的特殊情況 Deep-researcher 確實做大量 web fetch,但它透過 duckduckgo MCP 或 bot-tools 的 web_fetch 進行。即使安裝 Context Mode,這些 output 仍然直接進入 context,無法被攔截壓縮。
除非我們把 web fetch 改用 Context Mode 的 execute sandbox 來包裝——但這需要修改 agent 的行為模式,而不是透明的中間層。
4. 如果要做,最小改動方案 方案 A:安裝 Context Mode 作為額外 MCP server(最小改動) 1 claude mcp add context-mode -- npx -y context-mode
改動範圍 :
修改 .mcp.json.template 加入 context-mode server
修改 buildMcpConfig() 讓 research agent 載入 context-mode
問題 :
只壓縮 Claude Code 內建工具的 output,對我們的 MCP-centric 架構效果有限
增加 MCP server 數量 → 增加 tool schema 的 context 消耗(反效果)
每個 tool definition schema 本身也消耗 context
方案 B:參考其架構,自建 output 壓縮層(中等改動) 在 askClaudeCode() 回傳結果時,對 output 做事後壓縮:
1 2 const compressed = await compressOutput (result, task.intent );
問題 :
已有 input-filters.ts 做類似工作
壓縮 agent 最終輸出 vs 壓縮 中間 tool call output 是不同問題
Agent 最終輸出已經是結構化文字,壓縮空間有限
方案 C:為 FTS5 索引層做規劃(延後) 在現有 SQLite 基礎設施上加入 FTS5 virtual table,用於:
歷史 narrative 搜索(取代 in-memory BM25)
Agent report 全文檢索
Shared knowledge 語義匹配
這不是 context 壓縮,而是檢索效率改善 ——但它的 ROI 比 Context Mode 更高。
5. 結論與建議 決策:延後(Defer)
考量
評估
痛點存在嗎?
❌ 無。零 context overflow,零 max_turns 失敗
技術可行嗎?
⚠️ 受限。無法攔截第三方 MCP output(我們的主要互動管道)
有替代方案嗎?
✅ 有。現有 5 層防護已足夠
未來價值?
⭐⭐ 中等。若 agent 任務變長,可重新評估
觸發重新評估的條件
出現 context overflow 失敗 — 若日誌開始出現 error_max_turns 或 context overflow 事件
Agent 任務持續時間 >100 turns — 例如 deep-researcher 需要做超長鏈式研究
Claude CLI 支援 MCP output 攔截 — 若 Anthropic 原生支援 output 壓縮,改變技術前提
FTS5 遷移完成 — Phase 4 DB 遷移自然引入 FTS5 能力
短期可做的改善(無需 Context Mode)
Agent directory 快取 — 目前每 task 重新渲染 ~1.5K tokens,可快取
Knowledge base 相關性剪枝 — 加入 scoring 機制,只注入高相關條目
FTS5 virtual table — 在現有 SQLite 上加入,改善 narrative/report 搜索效率
評估者:architect agent | 日期:2026-03-01 專案:claude-context-mode (mksglu/claude-context-mode, MIT license) HN 討論:Show HN | Follow-up