英伟达打破实时对话AI的训练和推理用时记录
8月14日消息,据国外媒体报道,Nvidia用于开发和运行可理解和响应请求的对话式AI的GPU强化平台,已经达成了一些重要的里程碑,并打破了一些记录。
这对任何基于其技术进行开发的人来说意义重大——当中包括大大小小的公司,因为英伟达将很多用于实现这些进步的代码开源。那些代码用PyTorch编写,易于运行。
英伟达今天宣布的最大成果包括:BERT训练用时打破记录,进入1小时关口。BERT是世界上最先进的人工智能语言模型之一,也被广泛认为是自然语言处理(NLP)标杆的先进模型。Nvidia的AI平台仅仅需要53分钟就能够完成模型训练,经过训练的模型在短短2毫秒多一点的时间里(10毫秒在业内被认为是高水平线)就能够成功地做出推理(即利用通过训练学习到的能力得出结果)——又一个记录。
英伟达的这些突破不仅仅是吹嘘的资本——这些进步可为任何使用NLP对话式人工智能和GPU硬件的人提供切实的好处。Nvidia在它的其中一个SuperPOD系统上打破了训练时间记录,该SuperPOD系统由运行1472个V100 GPU的92个Nvidia DGX-2H系统组成;在运行Nvidia TensorRT的Nvidia T4 GPU上完成推理过程。Nvidia TensorRT在性能上超出高度优化的CPU许多个量级。不过,该公司将公开BERT训练代码和经过TensorRT优化的BERT样本,让所有人都可以通过GitHub利用。
除了这些里程碑以外,英伟达的研究部门还建立并训练了有史以来最大的一个基于“Transformer”的语言模型。这也是BERT的技术基础。该定制模型包含的参数多达83亿个,规模是当前最大的核心BERT模型BERT-Large的24倍。英伟达将这个模型命名为“Megatron”,它也对外提供了用于训练这个模型的PyTorch代码,因而其他人能够自行训练出类似的基于“Transformer”的大型语言模型。(乐邦)
您可能也感兴趣:
官方微博/微信
每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。
想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
5499元起!华为Pura70系列先锋计划开售
iPhone 16 Pro影像规格曝光:超广角将升级至4800万像素
一季度全球智能手机出货近2.9亿部 小米传音出货量同比均有大增
花旗预计“每卖一台SU7亏6800元” 小米高管回应:信息偏差较大
苹果将允许用户和第三方维修商使用二手正品零部件维修iPhone
苹果市值一夜暴涨8113亿元 据称拟升级整个Mac产品线
余承东调侃小米SU7原装手机支架设计?雷军发文回应
OpenAI超蚂蚁集团 胡润榜单上的“中国VS美国”
智己汽车因标注错误发致歉函 但致歉函中也有错误
更多
- 从5nm制程工艺来看 台积电3nm工艺或要明年才能成为最大营收来源
- 台积电一季度营收188.7亿美元 预计二季度会更高
- 分析师称iPhone 17 Plus屏幕将略小于iPhone 15 Plus和iPhone 16 Plus
- 苹果有意代工商在印尼建厂 CEO库克称将评估可行性
- SK海力士Q1营收有望超过12万亿韩元 营业利润重回万亿韩元之上
- 消息称苹果有意在印度生产iPhone摄像头部件 同当地厂商有过接触
- 自裁员消息出现以来 特斯拉市值已蒸发超过3000亿元
- 坐实裁员?马斯克透露正精简特斯拉销售与交付体系
- 一季度全球智能手机出货近2.9亿部 小米传音出货量同比均有大增
- 特斯拉一季度在美国新销售电动汽车中占比过半 仅Model Y就占35.4%