首页 人工智能

英伟达联合Arm CPU打造人工智能超算 百万兆级性能

AI超算怎么搞?老黄祭出联谊招。

在国际超算大会上,英伟达宣布正式支持Arm CPU,为高性能计算行业开辟了一条全新途径,以构建具有极高能效水平的百万兆级AI超级计算机。

具体方面,英伟达将在年内为Arm态系统提供全堆栈的AI和HPC软件。

该堆栈为600多个HPC应用程序和所有AI框架提供加速。

其中包括了所有英伟达CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具,如支持OpenACC的PGI编译器和性能分析器。

堆栈优化完成后,英伟达将为所有主要CPU架构提供加速,包括x86、POWER和ARM。

英伟达创始人黄仁勋说,英伟达CUDA加速和ARM的高效能CPU架构结合,一定可以推动超算的大幅提升,目标是百万兆级。

据称英伟达和ARM CPU联手的超算,将率先在预测气候变化和核武器系统建模等领域展开试水。

英伟达官方还专门提到了节能,Arm CPU的开放性之外,节能也是这次联手的题中之义。

在最新发布的Green500排行榜,全球最节能的25款超级计算机中,有22款都得益于英伟达的支持。

需要说明的是,这也不是英伟达和Arm首次联手。

之前英伟达用于便携式游戏、自动驾驶汽车、机器人和嵌入式AI计算的系统级芯片产品,其实都采用了ARM。

One more thing

最后,也还是在法兰克福超算大会。

英伟达还发布了一款专为自动驾驶汽车打造的超算:DGX SuperPOD。

全球最新排名第22.

整个系统搭建只需要3星期,采用96台NVIDIA DGX-2H超级计算机与Mellanox互联技术。其处理能力高达9.4 petaflops,能够用于训练安全自动驾驶汽车所需要的海量深度神经网络。

DGX SuperPOD内含1,536颗NVIDIA V100 Tensor Core GPU。

英伟达方面称,该套系统能够不间断运行,优化自动驾驶软件,并以前所未有的周转时间(turnaround time)反复训练神经网络。

例如,DGX SuperPOD软硬件平台能够在不到2分钟的时间之内完成ResNet-50训练。

此外,具备同等性能的其他TOP500超级计算机系统都由数千台服务器构建而成,而DGX SuperPOD占地面积更少,其体积比这些同等系统小400倍左右。

— 完 —

官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

↑扫描二维码

想在手机上看科技资讯和科技八卦吗?

想第一时间看独家爆料和深度报道吗?

请关注TechWeb官方微信公众帐号:

1.用手机扫左侧二维码;

2.在添加朋友里,搜索关注TechWeb。

手机游戏更多