訂閱服務的「無限」承諾,從來就不是真的無限。當你付了 $100 訂閱費,真的以為可以用盡那個限額嗎?

最近,HackerNews 上出現了一個熱門議題:Anthropic 宣布不再允許 Claude Code 訂閱使用者使用 OpenClaw。這個決定引發了大量的討論,有超過 600 則留言,熱度達到 2282。

表面上,這是一個關於 OpenClaw 的技術限制。但深層來看,這反映了整個訂閱服務行業的長期困境:如何在提供「無限」使用承諾的同時,控制成本和資源使用。

訂閱服務的真相:超賣是常態

訂閱服務的核心商業模式是什麼?簡單來說,就是超賣。

「似乎很多人不理解訂閱服務是如何運作的。每一個這類服務都會超賣容量。重度使用者是由那些使用量較少的使用者來補貼的,而後者通常是使用者基數的絕大多數。」

這段話來自 HackerNews 上的討論,道出了訂閱服務的本質。無論是健身房的會員、網路服務、還是 AI 訂閱,這些服務都建立在「大多數使用者不會用完配額」的假設上。

想想看,健身房為什麼可以提供月費制?因為他們知道,大多數會員不會每天都去,就算去了也不會待上 18 小時。如果他們的會員真的每天都去,而且每次待上 18 小時,健身房很快就會被迫改變收費模式。

同樣的道理適用於 AI 訂閱服務。Anthropic 的 Claude Code 訂閱提供每 5 小時一個視窗的使用限制,以及每週的總限額。他們假設的是:大多數使用者偶爾會用,但不會 24/7 全天候使用。

OpenClaw 的特殊性:沒有人類的限制

OpenClaw 是什麼?它是一個 AI agent 系統,可以自動化執行各種開發任務。它的特點在於:它可以全天候 24/7 運作,不需要休息,不需要睡覺。

「OpenClaw 是一個自主的重度使用者。這個日益擴散的『移動攻擊面』要麼會導致 Claude 的成本上升,要麼會被封禁以保護真實使用者的服務價格。」

這段話指出了問題的癥結。OpenClaw 不是人類,它沒有生物節律,不需要睡眠,可以每 30 秒就執行一次任務。這意味著它可以在 Anthropic 設定的限制下,最大化使用每一個 token。

在討論中,有人提到:「一個 OpenClaw 使用者可以使用 6、7、8 倍於人類訂閱者的用量。」

為什麼?因為人類有自然的限制。你有工作、有生活、需要睡覺。就算你是最重度的使用者,你也不可能 24 小時都在用 AI。但 OpenClaw 可以。

這就是問題所在。Anthropic 的訂閱服務設計是基於「人類使用模式」的假設,但 OpenClaw 完全打破這個假設。

Anthropic 的決定:不是完全封殺

需要澄清的是,Anthropic 並不是完全禁止 OpenClaw。他們在 email 中說明:OpenClaw 仍然可以使用 Anthropic 的服務,但只能透過付費 API,而不是訂閱方案。

「他們沒有全面封禁。Email 明確告訴你如何使用 OpenClaw 連接 Anthropic。」

這個決定的邏輯是什麼?從經濟角度來看,訂閱服務是補貼的。訂閱使用者付費 $20、$100 或 $200,可以獲得遠高於 API 價格的 token 配額。這是為了吸引大量使用者加入平台。

但對於 24/7 運作的 OpenClaw 來說,這種補貼模式就變成了問題。如果 OpenClaw 使用者最大化使用訂閱配額,Anthropic 在他們身上是虧損的。

「理論上你可以最大化每一個 5 小時視窗,但他們在這樣的使用上是虧損的。」

這就是為什麼 Anthropic 選擇將 OpenClaw 導向付費 API。在 API 模式下,使用者按實際使用量付費,Anthropic 可以確保成本和收入平衡。

社區的分歧:合理與否

對於 Anthropic 的這個決定,社區的反應分歧很大。

支持者認為這是合理的。「他們沒有全面封禁。Email 明確告訴你如何使用 OpenClaw 連接 Anthropic。在他們自己的平台上使用自己的工具,我覺得沒什麼問題。」

他們認為,訂閱服務的本質就是假設使用者不會用完所有配額。如果有一群使用者(比如 OpenClaw)開始打破這個假設,提供商有權調整規則。

批評者則認為,這是違背訂閱服務承諾的行為。「我付費是要在那個時間段使用那個限額。有 5 小時視窗是你睡覺的時候不能用。有週末限制。」

有人指出,這個問題不是 OpenClaw 特有的。Claude Code 本身就提供了可以自動化運作的工具。「你可以用 Claude Code 內建的所有東西最大化限制。OpenClaw 只是一個好用的掩蓋故事。」

更進一步來說,有人認為這是 Anthropic 在補貼自己的工具。「如果最大化你的配額是錯的,那為什麼 Anthropic 要補貼自己的工具讓人們留在他們的平台上?」

更深層的問題:訂閱服務的設計缺陷

這個事件暴露了一個更深層的問題:訂閱服務的設計在 AI 時代需要重新思考。

傳統的訂閱服務(健身會員、串流服務等)有自然的限制。人類不可能一天看 24 小時的 Netflix,也不可能一天在健身房待 18 小時。這些自然的行為模式提供了某種「保護」,讓提供商可以安全地超賣。

但 AI 服務不同。AI 可以自動化,可以 24/7 運作,沒有人類的生理限制。這打破了傳統訂閱服務的假設。

在討論中,有人提出了替代方案:「如果那些使用量異常激增的使用者,不會被停權,而是收到稍微高一點的帳單,或許被升級到下一個等級,這不就很好嗎?」

這是一個合理的建議。電力收費就是這樣運作的:固定的基本費用加上變動的用量費用。這種模式既提供了可預測性,也反映了實際使用。

對開發社群的啟示

對於台灣的開發社群來說,這個事件有幾個重要的啟示。

首先,如果你依賴某個 AI 服務的訂閱來執行關鍵的自動化任務,你需要意識到:這個服務可能隨時會改變規則。訂閱服務的「無限」承諾,從來就不是絕對的。

其次,如果你正在開發類似 OpenClaw 的自動化工具,你需要考慮如何設計使用者體驗。是要鼓勵最大化使用訂閱配額,還是要提供更靈活的付費選項?

最後,如果你是 AI 服務的提供商,你需要思考如何設計訂閱模式。傳統的「固定費率加假設的低使用率」模式,在 AI 時代可能不再適用。

實際操作:如何在繁中環境中使用 Claude

雖然這個事件聚焦在 OpenClaw 上,但對於台灣的使用者來說,Claude 本身的實際使用方式也很重要。

根據討論串中的經驗分享,有幾個實用的技巧可以幫助你更有效地使用 Claude Code:

  1. 保持 cache 溫熱:預設的 cache 存活時間是 5 分鐘。當你短暫離開鍵盤時,保持一個 heartbeat 運作,可以讓 cache 保持溫熱,下次使用時不需要從頭啟動。

  2. 在關閉前 compact:結束工作前,執行 compact 操作可以減少 cache 大小,這樣下次啟動時需要加載的內容更少。

  3. 分離高消耗任務:像是 web research 這類大量消耗 context 的任務,應該分開處理,並要求生成包含關鍵發現的 md 報告,再餵給主要任務。

  4. 注意冷啟動成本:每天第一次啟動會消耗大量 token,因為 cache 是冷的。這是正常的,不是 bug。

在繁中環境中,台灣的使用者還需要考慮語言和文化的特殊需求。Claude 在繁體中文的處理能力已經相當成熟,但在某些情況下,可能需要明確指定使用繁體中文,或者調整輸出的語氣和風格。

實際操作中,一個典型的開發工作流程可能是這樣的:

早上啟動 Claude Code 後,先讓它總結一堆資訊,建議需要審閱的 PR、需要回覆的 email、剛 clone 的新 repo、拉取其他 repo,並且提供你今天 PR 的建議方法,給你一份看起來比較緊急的 slack mention 清單。這只是早上的任務,就已經節省了大量的時間,不用在工具之間點來點去,騰出時間來思考和做決策。

在繁中環境中,這種工作流程特別有價值。因為台灣的開發者經常需要處理中英混合的文件、在 GitHub 和內部系統之間切換、同時管理多個專案。Claude Code 的整合能力,可以幫助開發者更專注於核心的開發任務,而不是在行政工作和資訊整理上浪費時間。

本地模型的競爭

在這個事件的背景下,有一個更廣泛的趨勢值得注意:本地 AI 模型的快速發展。

在討論中,有人提到:「特別是隨著本地 LLM 繼續快速發展。我從我的 $200 降級到 $20 計畫,並且經常碰到限制。我嘗試使用我單獨購買的 API 存取權,但它不適用於 Claude Code…現在我的激勵是盡快減少對 Claude 的依賴。」

本地模型的進步是顯著的。有人分享:「我在 PC 上測試 Gemma 4(32GB RAM 和 4070 Ti 12GB VRAM),它可以正常運行,效果達到 12-16 個月前 SOTA 雲端模型的水平。」

另一位使用者提到:「你可以非常緩慢地通過從快速 PCIe 5 SSD 流式傳輸權重來運行 SOTA 本地 MoE 模型。Kimi 2.5(通常被認為接近目前 Sonnet,當然不是 Opus)在 Apple M5 硬體上的測量速度為 2 tok/s。」

對於台灣的硬體愛好者和開發者來說,本地模型提供了一個有趣的替代選擇。雖然本地模型還沒有達到 Opus 或最新 Sonnet 的水準,但它們正在快速接近。這意味著,未來使用者會有更多選擇,不僅僅是依賴雲端的訂閱服務。

然而,本地模型也有其限制。有人指出:「我對是否有任何接近 Sonnet,更不用說 Opus 的東西可以在 4080 或 64GB RAM 上運行表示懷疑。」

這個評估是準確的。要運行接近最新 SOTA 的模型,需要相當強大的硬體配置。對於大多數台灣的開發者來說,雲端服務仍然是最實際的選擇。

AI Agent 的崛起與挑戰

OpenClaw 本身並不是一個孤立的存在。它是整個 AI Agent 服務浪潮的一個代表。

在討論中,有人提到:「它到處都在被討論。如果你管理開發者或產品人員,你是否允許他們在你沒有監督的情況下工作?所有開發者現在都可以成為管理者/團隊負責人。你計劃、你授權、你審閱。」

這種 AI Agent 的工作模式,正在改變開發工作的本質。開發者不再只是寫代碼,而是更像一個管理者,規劃任務、授權給 AI 執行、審閱結果。

對於新創公司來說,這種模式特別有吸引力。「對於新創公司來說,如果品質可以為了找到市場適合性而有所犧牲,這是巨大的幫助。」

但這種模式的成本是顯著的。24/7 運作的 AI Agent 會大量消耗 token。如果所有開發者都開始使用這種模式,整個系統的使用量會激增。

這就是為什麼 Anthropic 需要做出決定:是繼續允許 AI Agent 使用補貼的訂閱服務,還是將它們導向付費 API?從商業角度來看,後者似乎是更合理的選擇。

成本與效益的平衡

從成本和效益的角度來看,這個決定的邏輯是清晰的。

在討論中,有人指出:「如果我們透過訂閱和 API 做同樣的工作,訂閱要便宜得多。所以如果我們比較它們,是的,他們會虧錢。」

訂閱服務之所以能提供比 API 更便宜的 token,是因為它假設大多數使用者不會用完所有配額。這是一種經典的超賣策略。

但當 OpenClaw 這種工具出現後,這個假設被打破了。OpenClaw 可以全天候運作,最大化使用每一個 token。從 Anthropic 的角度來看,這些使用者在訂閱服務上是虧損的。

解決方案是什么?一個選擇是將這些重度使用者導向付費 API。另一個選擇是設計更細緻的訂閱層級,針對不同的使用模式提供不同的價格。

目前的訂閱層級($20、$100、$200)相對粗糙。它們主要區分在配額上,但沒有考慮使用模式的不同。一個偶爾大量使用的使用者,和一個 24/7 輕度使用的自動化工具,可能會消耗相同的配額,但它們對服務的壓力是完全不同的。

對台灣產業環境的啟示

對於台灣的企業和新創公司來說,這個事件有幾個重要的啟示。

首先,如果你正在評估是否導入 AI Agent 工具(無論是 OpenClaw、Claude Code、還是其他類似服務),你需要考慮長期的成本結構。訂閱服務的優惠價格可能不會永久持續,特別是當你的使用模式不符合提供商的預期時。

其次,如果你正在開發相關的產品或服務,你需要思考如何設計定價模式。傳統的訂閱模式可能不適合 AI 時代,你需要考慮使用量、使用模式、和使用價值之間的關係。

最後,對於台灣的開發社群來說,持續關注本地模型的發展是重要的。雖然雲端服務仍然是最方便的選擇,但本地模型的進步速度可能比預期的更快。將一些關鍵的工作負載移到本地,可能是一個值得考慮的備選方案。

結尾

訂閱服務的「無限」承諾,就像自助餐的「吃到飽」承諾一樣:你可以吃,但不應該試著把餐廳搬回家。這是一個不成文的規則,基於某種共同的默契和信任。

但當有人開始用打包盒把自助餐的食物帶回家時,餐廳會怎麼做?他們會修改規則,會明確禁止打包,或者會提高價格。

Anthropic 對 OpenClaw 的限制,本質上是類似的情況。這不是針對某個特定工具,而是對整個使用模式的一個調整。

對於台灣的開發者和 AI 使用者來說,這個事件的啟示很簡單:理解你所依賴的服務的商業模型,做好應對變化的準備,並持續評估替代選項。訂閱服務的「無限」承諾,從來就不是絕對的;真正的無限,或許只能在自己掌控的基礎設施上找到。


參考資料:
– HackerNews 討論串:https://news.ycombinator.com/item?id=47633396
– Anthropic Claude Code 訂閱服務條款
– 本地模型進展:Gemma 4、Qwen 3.5 等開源模型