谷歌TPU正以驚人的速度崛起,向英偉達在AI硬件領域的霸主地位發起強力挑戰。隨著谷歌Gemini 3的發布,TPU再次成為全球科技界關注的焦點,資本市場也隨之震動,谷歌股價的攀升讓一個話題再度被熱議:谷歌TPU是否真能與英偉達GPU一較高下?
SemiAnalysis,這家在半導體和人工智能領域極具影響力的研究與咨詢公司,近期發布了一篇由12位作者共同撰寫的深度分析文章,明確指出TPUv7已向英偉達發起沖鋒。文章深入剖析了谷歌TPUv7如何對英偉達的AI硬件霸權構成實質性威脅,其核心在于谷歌打破了長期以來的內部自用慣例,開始大規模向Anthropic等外部客戶出售TPU硬件及算力。據悉,Anthropic已部署超過1GW的TPU集群,這一舉動無疑為谷歌TPU的商業化進程注入了強大動力。
盡管在單芯片理論參數上,TPU未必能全面碾壓英偉達GPU,但谷歌憑借卓越的系統級工程能力,如ICI互聯和光路交換技術,實現了極高的實際模型算力利用率(MFU)。同時,谷歌TPU的總體擁有成本(TCO)比英偉達GB200系統低約30%-40%,這一優勢使得谷歌在性價比方面更具競爭力。谷歌正積極修補軟件短板,通過支持PyTorch原生環境和vLLM等開源生態,試圖從根基上瓦解CUDA的護城河。
目前,世界上最頂尖的兩個模型——Anthropic的Claude 4.5 Opus和谷歌的Gemini 3,其絕大部分訓練和推理基礎設施都運行在谷歌的TPU和亞馬遜的Trainium上。尤其是Gemini 3及其所有早期版本,均完全在TPU上進行訓練。這一事實不僅證明了TPU的強大性能,也彰顯了谷歌在AI領域的深厚積累。不僅如此,谷歌還在向多家公司出售商用TPU硬件,進一步擴大了其市場份額。英偉達的王座因此迎來了新的挑戰者,其霸主地位開始出現裂痕。
回顧谷歌TPU的發展歷程,其起源可追溯至2006年谷歌建立AI專用基礎設施的想法。然而,直到2013年,谷歌才開始為TPU芯片奠定基礎,并于2016年將其投入生產。同年,亞馬遜也啟動了Nitro計劃,專注于開發芯片以優化通用CPU計算和存儲。如今,通過推進TPU商業化,谷歌已成為英偉達最新且最具威脅的挑戰者。Gemini 3的發布引發了市場的強烈反響,英偉達甚至專門發布推文恭喜谷歌在AI領域的進展,同時不忘強調自己依然遙遙領先。
在推文中,英偉達強調自己仍在持續向谷歌供應硬件,并表示自己依然領先行業一代,是唯一能夠運行所有AI模型、并能在各種計算場景中使用的平臺。同時,英偉達還指出GPU比專用芯片(ASIC)在性能、通用性和可替代性上更強,這明顯是對谷歌TPU、AWS Trainium等專用芯片的回應。然而,面對TPU的崛起,英偉達也不得不面對來自市場的質疑,尤其是關于其通過“循環經濟”造成AI泡沫的指責。許多質疑者認為,英偉達通過資助燒錢的AI初創公司,本質上是將錢從一個口袋轉移到另一個口袋。
SemiAnalysis認為,英偉達旨在通過股權投資而非降價來保護其在基礎實驗室的主導地位。降價將拉低毛利率并引發投資者普遍恐慌,因此英偉達選擇通過其他方式來維持其市場地位。與此同時,前沿實驗室如OpenAI和Anthropic正通過采購(或威脅采購)TPU來降低GPU的總體擁有成本(TCO)。盡管OpenAI目前尚未部署TPU,但僅憑“轉向TPU”這一可能,就已在其英偉達集群成本上節省約30%。OpenAI將“我隨時可能改用TPU”作為一個巨大的談判籌碼,迫使英偉達為了留住這個大客戶而變相給予巨額優惠。
谷歌TPU的大規模外部化是其崛起的關鍵一步。長期以來,TPU堆棧一直與英偉達AI硬件相抗衡,但主要是為了支持谷歌的內部工作負載。即使在2018年向谷歌云平臺客戶提供TPU之后,谷歌仍未將其完全商業化。如今,這種情況正在改變。谷歌已經動員了整個堆棧的努力,通過谷歌云平臺或作為商用供應商銷售完整的TPU系統,開啟了TPU大規模商用的步伐。這一舉措也使谷歌成為一個真正差異化的云提供商,吸引了如Anthropic等頂級客戶的青睞。
Anthropic和其他客戶之所以選擇谷歌的TPU,原因在于TPUv7 Ironwood是一個優秀系統內的強大芯片。即使芯片在參數上落后于英偉達,谷歌的系統級工程也使得TPU堆棧在性能和成本效率方面都能與英偉達相匹配。這種組合為Anthropic提供了引人注目的性能和TCO,因此贏得了其大規模的訂單。與英偉達通過GB200擴展其GPU生態一樣,谷歌自2017年TPUv2以來也一直在機架內和跨機架擴展TPU。谷歌的ICI擴展網絡也成為與英偉達NVLink匹敵的競爭對手。
在大模型時代,預訓練前沿模型仍然是AI硬件中最困難和資源最密集的挑戰。自2024年5月GPT-4o以來,OpenAI的頂尖研究人員尚未完成廣泛用于新前沿模型的成功全規模預訓練運行,而TPU平臺則通過了這一測試。對于谷歌來說,在最具挑戰性的硬件問題之一中悄悄擠入并建立性能領先地位,確實是一個令人印象深刻的壯舉。盡管谷歌在芯片設計理念上相對于英偉達更為保守,但進入大模型時代后,其設計理念發生了明顯轉變。從最近兩代為大模型設計的TPU:TPUv6 Trillium(Ghostlite)和TPUv7 Ironwood(Ghostfish)就可以看出這種變化。














