AI需求兩年暴增逾330倍 Zettabyte倡議優質算力、投資台灣主權AI未來
AI需求兩年暴增逾330倍 Zettabyte倡議優質算力、投資台灣主權AI未來。(Zettabyte提供)
AI 需求在兩年內暴增逾330倍。根據Google I/O主題演講(Sundar Pichai主講)公布的數據,每月AI token生成量從約9.7兆,增至逾3.2千兆(quadrillion)。在全球 AI 算力需求以前所未見的速度攀升之際,全球AI基礎設施公司 Zettabyte(智百特)主張,算力應以其交付「有用工作」的品質衡量,而非僅看硬體規格與每小時單價。
Zettabyte於工研院主辦、台大醫院國際會議中心(NTUH)舉行的「AI 伺服器市場及技術趨勢研討會」中提出此一優質算力主張,並由資深產品經理林子揚(Eric Lin)發表專題演講。
Zettabyte指出,AI產業長期以兩項指標衡量基礎設施:GPU數量與每小時租金,但兩者都未回答客戶最在意的核心問題,也就是這些 GPU究竟產出多少「有用」的AI Token,以及能否被可靠地衡量。近期的相關爭議,凸顯了消費者期待與提供AI推論的實際成本之間長期存在的落差。
隨著AI訓練任務,在尖端AI產業擴展至數百萬張GPU、推論工作負載達數兆 token,基礎設施的表現已不再僅由硬體規格決定。可靠性、即用性、可觀測性、成本透明、彈性與韌性與能源效率,日益決定理論上的算力能否轉化為真實世界的AI產出。這一觀點獲得獨立研究支持。
Zettabyte採用一家業界公認的產業研究機構的 GPU叢集總持有成本(TCO)框架:兩座每小時GPU單價相同的叢集,一旦計入建置時間、利用率與停機,實際完成的有用工作可能差異甚大,此即該機構所稱的「有效產出(goodput)」,也就是原始吞吐量中真正完成有用工作的比例。
Zettabyte的方法即建立在此一發現之上,算力的真實價值遠超過硬體採購成本。部署延遲、利用率不足、營運故障與叢集停機,都會實質影響AI基礎設施的有效產出與經濟價值;在超大規模下,單一故障事件即可能造成可觀的生產力損失。
Zettabyte的zSUITE平台可直接衡量上述因素,並將這些核心衡量落地與視覺化。其五大品質面向正是這些成本背後的營運槓桿:可靠性與就緒度降低故障與恢復時間,可觀測性縮短偵測,成本透明度揭露完整的TCO而非僅是檯面上的GPU單價,能源效率則決定每度電的有用產出。
透過zSUITE,基礎設施營運者得以掌握算力資源在生產環境中的表現,以及其轉化為可用AI產出的實際效率;任一面向出現弱點,都會推高每單位有用工作的真實成本。作為此一倡議的一環,Zettabyte正積極推動zSUITE平台的軟體授權,即將與工研院及台灣多所設有AI課程與研究實驗室的頂尖大學陸續展開合作。
Zettabyte將此計畫視為對下一代AI基礎設施人才的投資,也是對台灣持續在全球AI生態系保持領先的貢獻。藉由將其在生產環境中所使用的同一套工具,交到台灣研究機構與大學手中,Zettabyte期望厚植主權AI基礎設施所仰賴的在地專業能力。
台灣在建構全球 AI 基礎設施上已扮演核心角色。從半導體、先進封裝到AI伺服器與系統整合,台灣是全球 AI 供應鏈的基石。Zettabyte認為,台灣不僅有條件建造 AI 基礎設施,更有條件協助衡量 AI 基礎設施的優質算力標準。「世界將持續仰賴台灣製造AI系統,」
林子揚表示,「我們相信台灣也能協助界定何謂高品質AI基礎設施的標準,定義『優質算力』。下一階段的AI領導地位,不會僅由誰建置最多算力決定,而是由誰能衡量、優化並證明其效能來決定。」隨著全球AI投資持續加速,Zettabyte認為產業將逐漸從採購算力容量,轉向採購算力成果;屆時,可被衡量的品質,將成為AI基礎設施最重要的競爭優勢之一。
