首页 人工智能

百度再发4个大规模开放数据集 全部基于真实场景

7月4日,在百度AI开发者大会(Baidu Create 2018)上,百度大脑宣布升级至3.0版本。同时,王海峰正式公布PaddlePaddle3.0,包括完整的核心框架,以及AI Studio、AutoDL、EasyDL等可以让开发者平等便捷获取顶尖AI能力的组件。在下午的百度大脑论坛上,百度AI技术生态部总经理喻友平详细解读了PaddlePaddle3.0的全新升级。

近年来,人工智能发展如同坐上加速器,从应用到理论全面更新,而这一进步离不开来自算法层面的深度学习技术加持。深度学习技术的重大飞跃,将为人工智能发展带来全新高度。百度自主研发的深度学习框架PaddlePaddle自2016年开源以来,已经成为全球发展热度(Github Pull Request数量)增速最高的开源深度学习平台。去年,为满足开发者的灵活性需求,百度发布更细粒度的新一代深度学习框架——PaddlePaddle Fluid,其灵活、易用的特点,深受中国开发者青睐。

全新亮相的PaddlePaddle 3.0由核心框架PaddlePaddle Fluid、PaddlePaddle Serving、PaddlePaddle Mobile,以及零门槛的快速应用平台EasyDL、AutoDL网络平台自动化设计以及AI Studio在线实训平台组成。

PaddlePaddle Fluid包括训练与预测两部分。在训练部分,PaddlePaddle Fluid可以通过支持提供丰富的满足常见主流模型搭建需求的API,支持广泛的模型搭建,并开放了部分训练好的常用模型。训练Runtime可以满足各类型的模型训练需求,支持CPU/GPU多种硬件、多卡、多线程训练、分布式同步、异步训练Kubernetes等集群。

在预测部分,PaddlePaddle Serving可灵活适配多种预测引擎,具有原生引擎,快速可用的特点,并能兼容业内主流预测引擎TensorRT等特点。PaddlePaddle Serving可分为三大层次,顶层为预测API,中层可支撑原生引擎、TensorRT 、Anakin以及其他引擎,底层则兼容Nvidia、Intel。值得一提的是,Anakin是百度完全自主研发的深度学习预测引擎,基于百度与各家服务器、芯片厂家深度合作得出的预测加速经验打造而成,性能强大。

PaddlePaddle Mobile集成百度移动端预测的实践经验,提供多平台支持,在工程实现支持及底层算法模型压缩的基础上,通过CPU、mall GPU等硬件加速,作用于DuerOS、百度APP、百度网盘APP等移动端场景。PaddlePaddle Mobile现已支持CPU、Mali GPU等平台,以及图像、人脸、OCR等模型。值得一提的是,它的体积极小,最小仅300K。

除了核心框架的升级,PaddlePaddle3.0还包括三大组件:EasyDL、AutoDL以及AI Studio。EasyDL可以帮助开发者零算法基础训练业务定制模型,操作可视化,无需懂深度学习,即便是零AI基础也可以在10分钟内训练出深度学习模型。

百度大数据(北京)实验室主任浣军介绍,此次发布的AutoDL,让开发者可以用深度学习设计深度学习算法。AutoDL能更高效自动搜索神经网络结构,开发者无需特殊硬件设备可以快速得到高质量模型。AutoDL提供多种能力,支持设计全新深度学习网络结构,以及优化现有深度学习网络结构及参数,同时能够适配特定任务场景。

AI studio是集成“数据、算法、算力”的PaddlePaddle实训平台,具有云端集成、简单易用、运行高效和资源免费的特点,可一站式满足使用者学习、技术进阶、学术研究需求,帮助深度学习开发者快速掌握技术能力,覆盖从入门到进阶,不同水平阶段的开发者。

在数据开放方面,百度去年推出“BROAD”百度AI公开数据集计划,首批开放室外场景理解、视频精彩片段、阅读理解3个数据集,本次又新增4个基于真实场景的大规模开放数据集:信息抽取、知识抽取、交通预测、实体标注,将为人工智能技术的突破升级提供强大的驱动力。

技术为应用服务,PaddlePaddle在实际应用上也进行了全新升级。根据团队能力和问题复杂程度,PaddlePaddle应用方案可分为快速应用方案、开源框架方案、商业解决方案。快速应用方案适应于问题清晰、数据规模较小的需求,比如利用EasyDL;开源框架方案适合问题复杂,且有算法工程师团队的情况,比如通过PaddlePaddle及开源社区;商业解决方案适合问题复杂,需要完整商业解决方案的情况,可通过百度云-Infinite(PaddlePaddle Cloud)、一体机等解决。

为了更好的帮助开发者学习深度学习,PaddlePaddle建立了覆盖线上、线下的全套课程及培训。PaddlePaddle公开课拥有10大系列、400节课程、累计学习时间3000分钟的在线课程体系,可以覆盖开发者的学习全阶段。线下有面向高校教师的新工科产学研联盟深度学习师资培训班,以及面向有一定基础的深度学习爱好者、开发者的百度AI开发者实战营-PaddlePaddle训练营。现场,喻友平还展示了全新PaddlePaddle教材,为开发者学习之路“领航”。

自2018年3月以来,百度PaddlePaddle积极举办相关赛事,吸引众多年轻开发者、开发团队“一试身手”,并通过比赛发掘了不少人工智能领域的“明日之星”。分论坛上,喻友平正式宣布百度之星开发者大赛将如期回归。此外还有基于PaddlePaddle的中国高校计算机大赛人工智能创意赛、KG-知识抽取赛、交通预测赛、无人车系列大赛,以及商家招牌的分类与检测、人工智能加速器应用与设计等大数据比赛也在火热进行中。

从架构上看,PaddlePaddle 3.0的易用性和实用性更为突出,降低入门难度以及对开发者的培养计划也为PaddlePaddle 3.0赢得众多好评。对于处于需求缺口大、人才成长快的国内深度学习行业来说,PaddlePaddle植根于中国国情,也是最符合中国开发者需要的深度学习框架,将为开发者学习和应用深度学习提供有力支持。

标签: 百度 AI

官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

↑扫描二维码

想在手机上看科技资讯和科技八卦吗?

想第一时间看独家爆料和深度报道吗?

请关注TechWeb官方微信公众帐号:

1.用手机扫左侧二维码;

2.在添加朋友里,搜索关注TechWeb。

手机游戏更多