AMD 的 AI 總監拿了 7,000 個 session 的數據分析,結論是 thinking depth 暴跌 67%,讀 code 的次數少了 3 倍,直接改整個檔案的頻率翻倍。
但 Anthropic 的回應不是道歉,而是推了一個叫 Advisor Strategy 的使用教學,教你怎麼選對模型,省錢同時不犧牲品質。
什麼是 Advisor Strategy?
說白了就是一句話:不是每件事都要用最貴的模型。
Claude 有三個等級,價差很大:
- Opus(最強)— input $5 / output $25(每百萬 token)
- Sonnet(中間)— input $3 / output $15
- Haiku(最快最便宜)— input $1 / output $5
以前你用 Claude Code,預設就是 Opus 或 Sonnet 做所有事。寫 code、debug、查資料、讀文件,全部同一個模型。
Advisor Strategy 改變了這個邏輯:讓便宜的 Sonnet 或 Haiku 當「執行者」,只有遇到搞不定的問題,才去問 Opus 這個「顧問」。
就好像你請了個助理處理日常的事,碰到棘手的法律或財務問題才叫外部顧問進來。重點是:助理自己判斷什麼時候需要升級,不用你每次都指定。
Anthropic 的人自己形容叫「phone a friend」— Sonnet 遇到搞不定的才打電話問 Opus。
數據說話:省多少?品質怎樣?
Anthropic 官方測試結果:
程式碼能力(SWE-bench)比純 Sonnet 高 2.7%
每個任務的成本降了 11.9%
搜尋能力(BrowseComp)從 19.7% 翻到 41.2%,超過翻倍
成本比純 Sonnet 低 85%
全部用 Opus 做,品質最好但最貴,session 燒得快
Sonnet 做大部分事,關鍵時刻 Opus 出手指導
結果品質接近甚至更好,因為 Opus 只在需要的時候介入,不是什麼都做,而是在關鍵決策點給方向。
你讓 Opus 幫你查資料,說難聽一點就是請律師幫你影印文件。資源要用在刀刃上。
Claude Code 裡怎麼用?
如果你用的是 Claude Code(不是 API 開發者),已經有現成的方法:
打 /model opusplan
就這樣,一行指令。
設好之後會自動切換:
- Plan mode — 用 Opus 想清楚方向、架構、策略
- Execution mode — 切回 Sonnet 去寫 code、改 bug、跑任務
等於 Opus 出主意,Sonnet 去幹活。你在 status bar 上可以看到現在用的是哪個模型。
plan 完了打 /compact 壓縮上下文再執行,token 省更多。避開尖峰時段(美東早上 8 點到下午 2 點)額度消耗會更慢。
但說真的,這到底是誰贏?
Anthropic 教你「不要一直用 Opus」,到底是真心幫你省錢,還是因為 Opus 算力太貴,他們不想你用那麼多?
想想看:你付的月費不會少一分,但他們的 GPU 負擔可以輕很多。
而且如果模型自己判斷「這個任務不需要 Opus」但其實需要呢?品質偷偷變差,你未必察覺得到。
到 2028 年,70% 的 AI 企業會採用多模型架構。「用對的模型做對的事」這個大方向是確定的。但 Anthropic 的動機到底是什麼?這個就留給你自己判斷了。
結論:從「暴力升級」到「智慧分配」
所有事情用最強的 Opus,品質第一,錢不是問題
讓對的模型做對的事,在關鍵時刻才用最強的
不管 Anthropic 的動機是什麼,這個思路本身就是對的。你不需要每個問題都找最貴的專家,你需要的是一個會判斷什麼時候該找專家的系統。
花 5 分鐘打 /model opusplan 試一下,讓結果說話。