基於DeepSeek近期连续发表DeepSeek-V3、DeepSeek-R1等AI模型以来,促成美中AI基建需求浮现,不仅将促使终端客户未来更审慎评估投入AI基础设施的合理性,采用更具效率的软体运算模型,以降低对GPU等硬体的依赖;CSP也可能扩大采用自家ASIC基础设施,以降低建置成本。
|
基於DeepSeek近期连续发表DeepSeek-V3、DeepSeek-R1等AI模型以来,促成美中AI基建需求浮现。 |
其中依TrendForce预估,2025年以後产业对GPU AI晶片或半导体实际需求可能出现变化。包含全球AI server市场自2023年起快速成长,预期2025年占整体server出货比例将逾15%,至2028年有??接近20%。
加上近年来大型CSP业者应AI训练需求积极扩建,自2025年起将扩展重心至边缘AI推理,除了采用NVIDIA Blackwell等新一代GPU平台,如AWS等也加大开发自家ASIC力道,以提升成本效益、满足特定AI应用需求。
至於中国大陆CSP和DeepSeek等相关AI业者面对美国晶片出囗禁令,则着重开发更高效的AI晶片或演算法,以促进AI需求和应用的多元发展。为克服AI行业过去依赖扩大模型、增加数据和提升硬体效能来发展,但成本与效率成为挑战。
例如大陆业者新推出的DeepSeek采用蒸馏模型(Model Distillation)技术,将压缩大模型以提升推理速度并降低硬体需求,同时充分发挥 NVIDIA Hopper 降规版晶片的效益,最大化运算资源利用。其成本优势来自高效能硬体选择、新型蒸馏技术及 API 开源策略,不仅优化技术与商业应用的平衡,也展现AI产业向高效发展的趋势。
TrendForce进一步指出,在美国晶片禁令持续的情况下,预期大陆AI市场将朝两个重点方向发展。首先,AI相关业者将加速投入自主AI晶片或供应链发展,包含陆系大型CSP业者等除尽量采购目前尚可取得的H20外,未来将加速扩大发展自有ASIC,应用於自家资料中心;其次,将利用既有的互联网基础优势,以软体补足硬体缺陷,如DeepSeek打破常规,改采蒸馏技术强化AI应用机会即是一例。
整体而言,TrendForce预期未来美国政府可能对大陆相关AI或半导体禁令趋严下,迫使欲投入AI发展的当地业者加速发展自有AI晶片或HBM等硬体。尽管其效能不及NVIDIA等GPU方案,但为了满足大陆市场自用资料中心基础建设,单位晶片效能已非唯一考量;此外,DeepSeek等业者近期朝AI多模态模型发展,力求在更低的训练成本下,於特定应用领域达到类似效能,以加速实现商用化。