Amazon 在週一宣布,將向 Anthropic 再投資 50 億美元,使得 Amazon 對該公司的總投資額達到 130 億美元。作為交換,Anthropic 承諾未來 10 年在 AWS 上花費超過 1000 億美元,並獲得高達 5 GW 的新運算能力來訓練和運行 Claude。
這筆交易聽起來像是另一個「雲端換現金」的典型案例,但背後藏著更深的算盤。
不是第一次了
這筆交易並不孤單。就在兩個月前,Amazon 也和 OpenAI 達成了類似的協議:在 OpenAI 那筆 1100 億美元的融資輪中,Amazon 貢獻了 500 億美元,讓 ChatGPT 製造商的估值達到 7300 億美元。那筆交易,同樣有部分結構是雲端基礎設施服務,而非直接的現金。
模式很清楚:Amazon 用現金投資 AI 公司,換來的是長期的雲端支出承諾和實際的算力使用。這不是慈善,這是生意的另一種寫法。
5 GW 的運算能力是什麼概念?
Anthropic 在這筆交易中獲得的 5 GW 運算能力,是一個值得注意的數字。作為對比,整個台灣的尖峰用電需求大約在 38 GW 左右——換句話說,Anthropic 單單為了訓練和運行 Claude,就能用掉將近台灣七分之一的尖峰電力。
當然,這 5 GW 不會同時全部開啟,它更像是一個「潛在容量上限」——Anthropic 有空間在需要時擴充到這個規模。但即使如此,這個數字仍然令人震撼。
交易的核心不是現金,而是 Amazon 的自訂晶片:Graviton(低功耗 CPU)和 Trainium(Nvidia 競爭對手,AI 加速晶片)。Trainium 專門為機器學習工作負載設計,與通用 GPU 相比,在相同功耗下能提供更高的 AI 計算效率。
Trainium 的戰略布局
這筆交易特別之處在於,它涵蓋了 Trainium2 到 Trainium4 晶片——哪怕 Trainium4 目前還沒有推出。最新的 Trainium3 晶片是在去年 12 月才發布的。
Amazon 在 Trainium 上的投資已經持續了數年。Trainium1 在 2023 年推出,主要針對推理工作負載;Trainium2 則在 2024 年發布,開始支持更大規模的訓練任務;而 Trainium3 作為最新一代,據稱在浮點運算能力和記憶體頻寬上都有顯著提升。
換句話說,Anthropic 不僅在購買現在的算力,還在預購未來的算力。這種「提前訂購未來」的策略,讓 Anthropic 能夠搶先獲得 Amazon 最新晶片的優先使用權,甚至有選擇權購買未來 Amazon 晶片的容量。
這對 Anthropic 的意義重大。當其他 AI 公司還在排隊等待 Nvidia 的 GPU 時,Anthropic 已經有了自己的晶片供應鏈——一條由 Amazon 直接打造的供應鏈。
為什麼是 Amazon?
Amazon 的算盤很明顯:它不只是想做雲端服務提供商,它想在 AI 的基礎設施層面建立自己的生態。
Nvidia 目前在 GPU 領域的統治地位,讓 Amazon 這種雲端巨頭感到不安。雖然 AWS 仍在銷售 Nvidia 的 GPU,但同時也在大力投資自家的 Trainium 晶片。如果能讓 Anthropic 這樣的頂級 AI 公司全面採用 Trainium,Amazon 就能證明自己的晶片技術真正可用,進而吸引更多客戶。
同時,那 1000 億美元的 AWS 承諾,意味著未來 10 年的穩定收入。這不是一次性買賣,這是長期綁定的合約。
Anthropic 的計算
Anthropic 為什麼接受這樣的交易?表面上看,這是「用未來的錢換今天的錢」——承諾花 1000 億美元,但現在拿到 50 億美元。但數字背後有更深層的考量。
首先,這 1000 億美元的承諾是「未來 10 年」,分攤到每年大約是 100 億美元。而 Anthropic 目前每年的雲端支出可能已經在這個數量級附近。換句話說,這筆交易更像是一個「長期供應合約」——Anthropic 本來就要花這麼多錢在雲端上,現在只是把錢花在 Amazon 這裡,同時換來今天的現金。
其次,算力的保證對 AI 公司來說比現金更重要。當你訓練一個新模型時,你需要確定你有足夠的 GPU(或這裡的 Trainium)可以完成訓練。這不是「有錢就能解決」的問題——有時候就算你願意付更多錢,也買不到足夠的 GPU。與 Amazon 綁定,意味著 Anthropic 有了一個可靠的算力供應來源。
VCs 的態度
有趣的是,當 Amazon 在和 Anthropic 簽署這筆交易時,風險投資人們也在排隊想要投資 Anthropic。根據報導,VCs 曾經提供過一筆讓 Anthropic 估值達到 8000 億美元或更高的資金——但 Anthropic 選擇了暫時拒絕。
這個選擇很有意思。8000 億美元的估值意味著 Anthropic 能夠融到更多現金,但這也意味著更多的股權稀釋、更多的投資人參與、更多的壓力。風險投資人雖然提供資金,但他們也追求回報——這通常意味著更激進的商業化策略、更快的擴張速度、更短時間內實現盈利。對於 Anthropic 這樣的公司來說,這可能會與其「打造安全、可靠的 AI」的產品哲學產生衝突。
而和 Amazon 的交易,雖然金額較小,但提供的是「實際的資源」——不只是現金,還有算力、晶片技術、長期合作的穩定性。從 Anthropic 的角度看,這更像是一種戰略合作,而不僅僅是融資。Amazon 需要一個頂級的 AI 模型來展示 Trainium 晶片的能力,Anthropic 需要穩定的算力供應來訓練模型——這是一種互惠互利的關係。
這看起來像是 Anthropic 在做一個「寧願要實際資源,也不要更多現金」的選擇。但更深層的意義可能是,Anthropic 意識到在當前的 AI 戰場上,現金已經不是唯一的關鍵資源。算力供應的穩定性、晶片技術的優先使用權、雲端生態系統的深度整合——這些無形的資源,可能比純粹的現金更有價值。
特別是考慮到 AI 產業的特殊性。與傳統軟體公司不同,AI 公司的核心成本是算力,而不是人力成本。如果沒有足夠的算力,再多的現金也無法訓練出更強的模型。在這種背景下,與 Amazon 這樣的算力供應商建立戰略合作關係,可能比單純融資更符合 Anthropic 的長期利益。
對開發社群的意義
對於使用 Claude 的開發者來說,這筆交易有什麼意義?
從技術層面來看,Anthropic 採用 Trainium 晶片,可能意味著未來 Claude 的訓練成本會降低——如果 Trainium 的性能和成本能夠達到預期的話。根據 Amazon 的公開資料,Trainium 相比同類型的 GPU,在單位成本上的性能優勢可以達到 30% 以上。如果 Anthropic 能夠實現這種成本優勢,它可能會將節省下來的資源投入到模型能力的改進上。對開發者來說,這可能意味著未來 Claude 的能力會更快地提升,或者在相同價格下提供更強大的服務。
從穩定性層面來看,Anthropic 和 Amazon 的長期綁定,意味著 Claude 的未來相對穩定。不是所有 AI 公司都能說「我們有未來 10 年的算力保證」,這是一種相當強的競爭優勢。對於企業客戶來說,這種穩定性特別重要——沒有人願意把核心業務建立在一個明天可能消失的 AI 服務上。
但同時,這也意味著 Anthropic 更深地綁在了 Amazon 的生態系統中。Amazon 更傾向於將客戶綁定在自己的平台上,這意味著如果開發者大量使用 Claude,並通過 AWS 進行部署,未來要遷移到其他平台可能會相當困難。這種「廠商鎖定」的風險,是開發者在選擇技術棧時需要考慮的重要因素。
產業格局的變化
這筆交易反映的是 AI 產業格局的一個大趨勢:算力正在成為新的「石油」,而掌握算力的不只是 Nvidia,還有 Amazon 這樣的雲端巨頭。
Nvidia 的 GPU 固然重要,但當雲端巨頭開始推出自己的 AI 加速晶片,並能夠和 AI 公司簽訂長期供應合約時,整個產業的權力結構就在悄悄改變。Amazon 不是唯一在做這件事的雲端提供商——Google 有 TPU,微軟也在投資自己的晶片。
Google 的 TPU(Tensor Processing Unit)是最早的雲端自研 AI 晶片之一,自 2016 年推出以來,已經發展到第四代。Google 的 AlphaGo、BERT、以及最新的 Gemini 模型,都大量使用 TPU 進行訓練。但由於專利和技術封閉,TPU 主要供 Google 內部和雲端客戶使用。
微軟雖然起步較晚,但在 2023 年開始加速自研晶片的計畫。微軟推出的 Azure Maia 和 Cobalt 晶片,分別針對 AI 訓練和通用運算進行優化。與 Google 不同,微軟的策略是「雙路並行」——一方面投資自研晶片,另一方面維持與 Nvidia 的合作。
相比之下,Amazon 的 Trainium 走的是「開放合作」的路線。雖然 Trainium 是 Amazon 自主研發的,但 Amazon 更願意讓 AI 公司像 Anthropic 這樣深度參與,甚至在技術路線上給予一定影響力。
未來的 AI 競爭,可能不只是「誰的模型更好」,還有「誰的算力基礎設施更穩定」。而 Anthropic 和 Amazon 的交易,正是在這個方向上的一步棋。
未來的問題
這筆交易也留下了一些未解的問題。
首先,Trainium 晶片真的能夠取代 Nvidia 嗎?雖然 Trainium 已經發展到第三代,Trainium4 也在規劃中,但在實際應用中,它的性能、穩定性、生態系統成熟度,都還需要時間驗證。Nvidia 的 CUDA 生態已經發展了十多年,從深度學習框架如 PyTorch、TensorFlow,到各種工具和庫,幾乎都已經與 CUDA 深度整合。開發者要遷移到 Trainium,不僅需要重新編譯代碼,還可能需要調整模型架構和訓練參數。這種遷移成本,對於大規模的模型訓練項目來說,可能相當高昂。
其次,1000 億美元的承諾是否過於龐大?10 年是一個很長的時間,AI 產業的變化也極快。在 2016 年,沒有人能預測到 2022 年 ChatGPT 的爆發;同樣地,現在也沒人能預測 2030 年的 AI 技術會是什麼樣子。如果未來幾年出現了新的技術突破,或者 AI 模型的訓練方式發生根本性改變,這筆承諾可能變成負擔而不是優勢。
最後,Anthropic 和 Amazon 的綁定,是否會限制它的靈活性?如果未來有其他雲端提供商提供了更好的條件,或者出現了新的技術路線,Anthropic 能夠自由轉向嗎?雖然交易中可能包含解約條款,但解約的成本——無論是經濟上的還是技術上的——都可能相當高昂。特別是如果 Anthropic 的模型已經深度優化於 Trainium 架構,要遷移到其他晶片平台,可能需要重新訓練整個模型,這是一個天文數字級別的成本。
觀察家視角
站在 2026 年的角度看,這筆交易既像是一次大膽的押注,也像是一種必要的妥協。AI 公司需要算力,雲端巨頭需要 AI 應用來支撐它們的基礎設施投資——這雙方的需求剛好對上了。
但這種「大規模雲端換現金」的模式,是否會成為未來的標準?如果是的話,那未來的 AI 競爭場景可能會變成:幾個雲端巨頭各自綁定一兩個頂級 AI 公司,形成「AI-雲端」的生態系統,而小公司則很難獲得足夠的算力來競爭。
這聽起來像是新的「科技巨頭壟斷」——只是這次不是操作系統或瀏覽器,而是算力本身。Anthropic 選擇了和 Amazon 綁定,可能是為了在這場算力戰爭中生存下來。但這條路是否正確,只有時間能告訴我們。