基於DeepSeek近期連續發表DeepSeek-V3、DeepSeek-R1等AI模型以來,促成美中AI基建需求浮現,不僅將促使終端客戶未來更審慎評估投入AI基礎設施的合理性,採用更具效率的軟體運算模型,以降低對GPU等硬體的依賴;CSP也可能擴大採用自家ASIC基礎設施,以降低建置成本。
|
基於DeepSeek近期連續發表DeepSeek-V3、DeepSeek-R1等AI模型以來,促成美中AI基建需求浮現。 |
其中依TrendForce預估,2025年以後產業對GPU AI晶片或半導體實際需求可能出現變化。包含全球AI server市場自2023年起快速成長,預期2025年占整體server出貨比例將逾15%,至2028年有望接近20%。
加上近年來大型CSP業者應AI訓練需求積極擴建,自2025年起將擴展重心至邊緣AI推理,除了採用NVIDIA Blackwell等新一代GPU平台,如AWS等也加大開發自家ASIC力道,以提升成本效益、滿足特定AI應用需求。
至於中國大陸CSP和DeepSeek等相關AI業者面對美國晶片出口禁令,則著重開發更高效的AI晶片或演算法,以促進AI需求和應用的多元發展。為克服AI行業過去依賴擴大模型、增加數據和提升硬體效能來發展,但成本與效率成為挑戰。
例如大陸業者新推出的DeepSeek採用蒸餾模型(Model Distillation)技術,將壓縮大模型以提升推理速度並降低硬體需求,同時充分發揮 NVIDIA Hopper 降規版晶片的效益,最大化運算資源利用。其成本優勢來自高效能硬體選擇、新型蒸餾技術及 API 開源策略,不僅優化技術與商業應用的平衡,也展現AI產業向高效發展的趨勢。
TrendForce進一步指出,在美國晶片禁令持續的情況下,預期大陸AI市場將朝兩個重點方向發展。首先,AI相關業者將加速投入自主AI晶片或供應鏈發展,包含陸系大型CSP業者等除盡量採購目前尚可取得的H20外,未來將加速擴大發展自有ASIC,應用於自家資料中心;其次,將利用既有的互聯網基礎優勢,以軟體補足硬體缺陷,如DeepSeek打破常規,改採蒸餾技術強化AI應用機會即是一例。
整體而言,TrendForce預期未來美國政府可能對大陸相關AI或半導體禁令趨嚴下,迫使欲投入AI發展的當地業者加速發展自有AI晶片或HBM等硬體。儘管其效能不及NVIDIA等GPU方案,但為了滿足大陸市場自用資料中心基礎建設,單位晶片效能已非唯一考量;此外,DeepSeek等業者近期朝AI多模態模型發展,力求在更低的訓練成本下,於特定應用領域達到類似效能,以加速實現商用化。