谷歌TPU正以驚人的速度崛起,向英偉達在AI硬件領域的統治地位發起挑戰。隨著谷歌Gemini 3的發布,其背后的TPU技術再次成為全球科技界關注的焦點。資本市場迅速做出反應,谷歌股價上漲,引發了關于TPU能否與英偉達GPU抗衡的熱烈討論。
SemiAnalysis,這家在半導體和人工智能領域頗具影響力的研究機構,發布了一篇由12位作者共同撰寫的深度分析文章。文章指出,TPUv7首次對英偉達發起了實質性挑戰,并深入探討了谷歌TPU如何改變AI硬件的競爭格局。核心問題在于:英偉達的CUDA護城河能否被打破?TPUv8與英偉達下一代AI新品Vera Rubin誰將更勝一籌?
目前,全球最頂尖的兩個AI模型——Anthropic的Claude 4.5 Opus和谷歌的Gemini 3,其訓練和推理基礎設施主要依賴于谷歌的TPU和亞馬遜的Trainium。尤其是Gemini系列模型,完全基于TPU進行訓練。谷歌不僅在內部大規模使用TPU,還開始向多家公司出售商用TPU硬件,這標志著英偉達在AI硬件領域的王座迎來了新的挑戰者。
谷歌的TPU發展歷程可追溯至2006年,當時公司就有了建立AI專用基礎設施的想法。然而,直到2013年,谷歌才開始為TPU芯片奠定基礎,并于2016年將其投入生產。同年,亞馬遜也啟動了Nitro計劃,專注于開發芯片以優化通用CPU計算和存儲。如今,谷歌通過推進TPU商業化,已成為英偉達最具威脅的競爭對手。
Gemini 3的發布引發了市場的強烈反響。英偉達為此發布了一條官方推文,祝賀谷歌在AI領域的進展,同時強調自己依然遙遙領先。英偉達表示,其GPU在性能、通用性和可替代性上優于專用芯片(ASIC),并強調自己仍是唯一能夠運行所有AI模型、適用于各種計算場景的平臺。
在過去的幾個月里,谷歌DeepMind的Gemini 3、谷歌云以及TPU綜合體成為焦點,推動了谷歌母公司Alphabet的市值接近4萬億美元。TPU產量的大幅上調,以及Anthropic、meta、SSI、xAI、OAI等公司的加入,擴大了TPU的客戶名單。這不僅推動了谷歌和TPU供應鏈的重新評級,也對以英偉達GPU為重點的供應鏈構成了壓力。
英偉達不僅面臨TPU的壓力,還因通過“循環經濟”造成AI泡沫的質疑而陷入爭議。許多批評者認為,英偉達通過資助燒錢的AI初創公司,本質上是將資金從一個口袋轉移到另一個口袋。對此,SemiAnalysis分析認為,英偉達旨在通過股權投資保護其在基礎實驗室的主導地位,而非通過降價,因為降價將拉低毛利率并引發投資者恐慌。
TPUv7 Ironwood被視為一個優秀系統內的強大芯片。盡管在參數上可能落后于英偉達,但谷歌的系統級工程使得TPU堆棧在性能和成本效率方面能夠與英偉達相匹配。這種組合為Anthropic提供了引人注目的性能和總擁有成本(TCO),因此贏得了其大規模訂單。谷歌自2017年TPUv2以來,一直在機架內和跨機架擴展TPU,其ICI擴展網絡也成為英偉達NVLink的競爭對手。
在芯片設計理念上,谷歌相對于英偉達更為保守。歷史上,TPU的峰值理論FLOPs和內存規格低于相應的英偉達GPU。然而,進入大模型時代后,谷歌的設計理念發生了明顯轉變。TPUv6 Trillium和TPUv7 Ironwood的推出,標志著谷歌在FLOPs、內存和帶寬方面幾乎完全縮小了與英偉達旗艦GPU的差距。
對于谷歌來說,在最具挑戰性的硬件問題之一中悄悄建立性能領先地位,確實是一個令人印象深刻的壯舉。盡管谷歌通過Broadcom采購TPU并支付高額利潤,但這明顯低于英偉達在整個系統上賺取的利潤。從谷歌的角度來看,每顆芯片在全規模部署下的TCO比英偉達GB200服務器低44%,這足以彌補峰值FLOPs和峰值內存帶寬約10%的不足。















