CTIMES/SmartAuto - NVIDIA Tesla P100为高效能运算应用挹注超过30倍效能:GPU,加速器,PCIe介面,伺服器,NVIDIA,Huida

│新东西市集│东西讲座│影音频道│出版中心│

元件次系统自动控制

最新动态

产业快讯

4/16-18 Touch系列展:智慧显示x制造x电子设备

立即预登叁观! 360o MOBILITY 移动产业专业展

整合创新X智造未来TIMTOS 2025 聚焦AI新商机

CTIMES/SmartAuto / 新闻 /

NVIDIA Tesla P100为高效能运算应用挹注超过30倍效能

【CTIMES / SMARTAUTO ABC_1 报导】 2016年06月22日星期三

浏览人次：【4889】

NVIDIA (辉达)针对 PCIe 介面的伺服器推出NVIDIA Tesla P100 GPU加速器以因应各界对现今资料中心前所未有的运算需求，其效能与价值均远远超越仅搭载CPU的系统。

Pascal架构打造的Tesla P100大幅跃升资料中心处理量。

美国国家科学基金会 (National Science Foundation) 报告指出，超级电脑运算资源需求超越以往，极大比例的科学家反应利用超级电脑运算进行研究计画1的时间不敷使用。此外，各种高效能运算 (HPC) 技术越来越需要执行各种密集运算的深度学习应用，而许多研究人员正运用各类人工智慧技术以驱动各个传统科学领域的进展。

Tesla P100 GPU 加速器 PCIe 版藉由 NVIDIA Pascal GPU 架构发挥效能与效率，成功满足这些运算要求。此外，用户得以建构出「超级节点」，其吞吐量甚至超越 32 部仅搭载 CPU 的市售节点，并能降低资金与营运成本达70%2。

NVIDIA 公司加速运算部门副总裁Ian Buck表示：「想要跟上研究人员对HPC 与AI 超级运算效能永无止境的渴求，唯一的途径就是加速运算技术。若部署仅搭载CPU 的系统来满足这方面的需求必须动用数量可观的市售型运算节点，这将耗费大幅攀升的成本但效能提升幅度却不成比例。运用数量较少但效能强大的Tesla P100 节点不仅能大幅扩充效能，用户所投入的的资金绝大部分都是花在运算资源上，而不是虚掷在庞大的基础建设上。」

Tesla P100 PCIe 版推出标准 PCIe 板卡规格，能相容于现今透过 GPU 加速的伺服器。全新产品经过优化设计，能运行各种运算最密集的人工智慧与 HPC 资料中心应用。单台搭载Tesla P100 的伺服器在执行AMBER 分子动力学模拟程式时，达到的效能甚至超越50 个仅搭载CPU 的伺服器节点，而在执行VASP 材料科学程式时，速度亦超越32 个仅搭载CPU的节点4。

位于瑞士卢加诺的瑞士国家超级运算中心的欧洲现今最快超级电脑 Piz Daint将于今年稍后进行升级，换装的新核心正是 PCIe 介面的 Tesla P100 加速器。

苏黎士联邦理工学院运算物理系教授，同时也是瑞士国家超级运算中心主任的Thomas Schulthess 表示：「Tesla P100 加速器将效能与效率提升至全新境界，成功克服当代许多最重要的运算挑战。Piz Daint 超级电脑升级成4,500 个GPU 加速器节点至Tesla P100 GPU 后，整部系统效能将加倍，将协助研究人员在宇宙学、材料科学、地震学、以及气象等领域获得众多研究突破。」

Tesla P100 PCIe 版是 NVIDIA Tesla 加速运算平台的最新成员。 PCIe 介面系统专属 NVIDIA Tesla P100 GPU 加速器预计在 2016 年第 4 季开始供货，届时将透过NVIDIA 零售商伙伴以及伺服器制造商销售，包括 Cray、戴尔、惠普、IBM 以及 SGI。（编辑部陈复霞整理）

产品规格

*透过 NVIDIA GPU Boost技术，双精度运算效能达到 4.7 teraflops，单精度运算效能达到 9.3 teraflops，半精度运算效能达到 18.7 teraflops

*支援 PCIe Gen 3互连技术 (每秒 32GB 的双向传输频宽)

*藉由 Page Migration Engine 与统合记忆体提升可编程性

*ECC 校正码机制提高资料的可靠度

*伺服器优化的目标以达到最高的资料中心吞吐量与可靠度

*推出两种组态版本:

-16GB的CoWoS封装HBM2堆叠式记忆体，记忆体频宽达到每秒720GB

-12GB的CoWoS封装HBM2堆叠式记忆体，记忆体频宽达到每秒540GB

产品特色

*为混合HPC 运算作业发挥前所未有的应用效能：双精度与单精度尖峰效能分别达到4.7 teraflops 与9.3 teraflops，光是一个Pascal 架构的Tesla P100 节点，其运算效能就足以媲美超过32 部仅搭载CPU 的市售伺服器。

*CoWoS 封装的 HBM2 记忆体发挥高效率：Tesla P100 将处理器与资料元件嵌入在一个封包内以发挥前所未有的运算效率。创新的记忆体设计CoWoS (chip on wafer on substrate) 结合 HBM2 记忆体，使记忆体频宽效能比NVIDIA Maxwell架构高出3倍，达到每秒720GB。

*Page Migration Engine 简化平行运算程式开发流程：程式开发者能专心进行调校工作，以提升运作效能，减少在资料搬移所花费的时间，并藉由支援虚拟记忆体分页配置，让程式的定址空间扩展至超越GPU 实体记忆体容量以外的范围。统合记忆体技术能大幅改进生产力，开发者看到的是整个节点一体化的连续记忆体空间。

*应用支援能力：拥有 410 个 GPU 加速的应用，在全球十大 HPC 应用排行榜中囊括九个席位，Tesla平台足堪担当全球HPC运算平台。

關鍵字： GPU 加速器 PCIe介面伺服器 NVIDIA Huida