显卡 已评论

英伟达正式发布安培架构Tesla A100核心

2020-5-15 15:29

  【天极网DIY硬件频道】在老黄亲手曝光安培架构新一代DGX A100超算真身后,NVIDIA终于在5月14日正式公布这款产品。英伟达CEO黄仁勋在GTC 2020上的演讲核心是HPC计算、AI人工智能等方面,安培架构的A100就是针对相关领域的产品,但会与RTX系列游戏不一样。 

英伟达正式发布安培架构Tesla A100核心

  英伟达Tesla A100核心采用台积电7N工艺,826mm2核心面积塞入542亿个晶体管。108组SXM4架构的SM单元拥有6912个CUDA核心;核心Tensor Core虽然减少到432个,但性能大幅增强,支持全新的TF32运算。

  英伟达Tesla A100核心频率从V100的1530MHz降低到1.41GHz左右,400W的热设计功耗比V100的300/350W功耗高不少。英伟达还将NVLink技术升级到3.0版,带宽从300GB/s提升到600GB/s,适合服务器领域多卡互联。

  英伟达Tesla A100搭配容量40GB HBM2显存,频率从1.75Gbps提升到2.4Gbps、5120bit位宽,带宽达到1536GB/s。但核心图上看到了6颗HBM显存,而40GB理论只需要5颗即可,难道老黄隐藏了一组显存,等待后续发布增强版?

  英伟达A100的双精度浮点性能达156TFLOPS、FP16单精度性能312TFLOPS、INT8半精度浮点性能624TOPS。常规的FP32、FP64性能提升并不明显,从V100核心的15.7、7.8TFLOPS提升到19.5、9.7TFLOPS。 

  Multi-instance GPU多实例GPU简称MIG,这项创新技术可以将一个GPU划分为七个独立的GPU,针对不同的目标提供不同的运算,最大化提高计算效率。技术的创新使得Tesla A100加速卡成为苛刻工作负载的理想选择,不仅可以用于AI推理、AI训练,还可用于科学仿真、AI对话、基因组、高性能数据分析、地震建模及财务计算等等。 

  英伟达会上发布的两款边缘AI平台新品,能够在边缘提供安全、高性能的AI处理能力,适用于较大型商业通用服务器 。两款边缘计算平台基于Tesla A100的DGX A100超算,8路Tesla A100加速卡性能可达5PFLOPS。

  英伟达EGX A100是首个基于NVIDIA安培架构的边缘AI产品,第8代GPU架构能够为边缘运行AI推理、5G应用等各类计算密集型工作上,提供更出色的性能支持。EGX A100可实时处理来自摄像头和其他物联网传感器的大量流式数据,从而更快地获得洞见并提高业务效率。

  EGX Jetson Xavier NX是体积最小、性能最强大的AI超级计算机,适用于微型服务器和边缘智能物联网盒。与被业界广泛采用的前代Jetson TX2相比,Jetson Xavier NX模块性能提高10倍以上。通过运用云原生技术,开发人员可利用这块信用卡大小的高AI功能与高计算性能模块。运行EGX云原生软件堆栈的EGX Jetson Xavier NX可以快速处理来自多个高分辨率传感器的流式数据。

  具备云原生功能的Jetson Xavier NX已获得嵌入式生态系统的大力支持,开发者套件和Jetson Xavier NX模块现正通过NVIDIA分销渠道发售,售价399美元。

  DGX A100发布后立即上市,美国、德国的多个实验室及超算中心已经开始使用Tesla A100作为超算解决方案。阿里云、AWS云、谷歌云、微软Azure、甲骨文及腾讯云都将推出基于DGX A100的云服务。 

  NVIDIA与宝马集团共同宣布,宝马集团已采用全新NVIDIA Isaac机器人平台对其车厂进行优化,利用AI计算与可视化技术为其打造物流机器人。宝马集团希望借此合作优化物流工厂的流程,以更快捷、更高效地生产定制化配置的汽车。

  NVIDIA与宝马集团合作重点围绕实施基于NVIDIA技术的端到端系统展开,采用基于软件架构开发、运行于NVIDIA开放式Isaac机器人软件平台的机器人,完成从训练、测试到部署的全过程。开发完成后,系统将在宝马集团全球范围内的工厂进行部署。

英伟达正式发布安培架构Tesla A100核心

  编辑点评:英伟达新一代安培GPU性能大幅提升,虽然英伟达没有公布售价,但可以预见价格不会便宜。另外,NVIDIA安培架构不仅出现在Tesla上,GeForce游戏卡和Quadro专业卡同样会采用相同架构。在Tesla发布之后,游戏卡最快会在9月到来。

查看更多内容
#+1你赞过了
人已赞
#
分享

取消

©2019 天极网旗下网站

#
第三方账号登录
X
发布