首页 人工智能

AI独角兽旷视内核Brain++浮出水面 自研PK开源

引言:关于人工智能、深度学习框架、开源、自主可控

【TechWeb】10月25日,2019年乌镇世界互联网大会宣布了最新的15项“世界互联网领先科技成果”,其中,旷视科技的Brain++就位列其中。

一家主打人工智能的年轻公司他们在做什么,对于大众而言本身是比较陌生的。我们不妨从旷视这项被认为是世界互联网领先的Brain++技术入手,来了解其背后的业务和运营。

从旷视官方给出的说明来看,Brain++是一项从旷视2014年成立之初就开始研发的深度学习框架,目前仅限于内部使用,并未对外开放。

据介绍,Brain++能为研发人员提供一站式AI工程解决方案。具体包括:从数据生成、清洗、预处理、标注、存储,到研究人员设计算法架构、设计实验环节、搭建训练环境、训练、加速、调参、模型效果评估和产生模型,再到模型分发和部署应用,最后再到不同端如云端、边缘端、移动端上的部署。

旷视本质上是一家以人工智能算法为核心的技术型产品公司。借助Brain++,旷视的研发人员能够减少重复开发,高效的将人工智能技术应用于更广泛的业务场景。

深度学习框架之一

人工智能算法从研发到部署是一套庞大的系统工程,深度学习框架作为通用性的底层支持平台,可实现算法训练和模型部署的高效流程化和深度神经网络模型设计自动化。在减少人员参与而不牺牲训练质量的条件下,大幅提高算法生产效率。

深度学习框架可以理解为一种AI时代的“操作系统”,能为算法训练、模型改进提供支持,之于人工智能技术及应用研发人员的重要性不言而喻。

和PC拥有多个操作系统流派一样,深度学习框架在全球也有不少“种类”。

比如早先一代曾经使用非常广泛的著名框架Caffe,这是一款加州大学伯克利分校的学生开发出来的深度学习框架。

还有诞生于蒙特利尔大学 LISA 实验室的Theano,于2008年开始开发,一度也是非常有影响力的Python深度学习框架,不过遗憾的是Thean已经停止继续开发了。

目前流行的深度学习框架转向以计算图(Computation Graph)为核心的设计方向。

包括2015年11月10日Google推出全新的机器学习开源工具TensorFlow。这款产品已经成为目前最流行的深度学习框架。

2016年11月,被AWS选为云计算官方深度学习平台的MXNet。这款深度学习框架在2017年进入Apache基金会,成为旗下孵化器项目。

2017年1月,Facebook人工智能研究院(FAIR)团队在GitHub上开源了深度学习框架PyTorch;

还有,国内百度公司推出的Paddle Paddle(飞桨)深度学习框架,它也是2019世界互联网领先科技成果之一。

(主流的开源深度学习框架和旷视自有的Brain++)

在没有深度学习框架支持、或者深度学习框架不足够智能的情况下,开发者甚至需要手动敲出C++代码来完成计算过程,训练一个AI模型至少需要一两个月。

有了深度学习框架,程序员不需要从复杂的神经网络开始编代码,直接依据需要,使用已有的模型进行参数训练,可以大幅提高算法生产效率。

深度学习框架广受开发者依赖,各大厂们也超级重视推广自家深度学习框架,以期抢占人工智能时代操作系统高地、打造类似手机时代的安卓式辉煌。

值得注意的是,上述这几款深度学习框架都是开源的。目前国内大多AI技术的产品应用开发人员都采用的是:选择一种大厂推出的开源深度学习框架,在此基础上进行开发这种模式。

当然也有例外的,不用开源框架的,自己写框架的。

Brain++就是旷视始于2014年就开始开发的深度学习框架,不是开源框架,仅限于旷视内部使用。在旷视,上千名研发人员全部都在使用Brain++进行技术研发。

(图片来自旷视官网)

旷视创始人印奇在提交给港交所的招股书、“给投资人”信函的开始位置中就谈到:“深度学习是旷视的核心竞争力,也是支撑人工智能革命的关键。我们是全球少数拥有自主研发的深度学习框架的企业之一。旷视的Brain++让规模化算法训练成为可能。生成一种具体的算法并不难,但要创建几乎能自动生成众多算法的引擎绝非易事。”

印奇也对Brain++进行了着重介绍:“深度学习框架Brain++作为一个统一的底层架构,为旷视的算法训练及模型改进过程提供重要支持。Brain++使我们得以构建一条不断自我改进、不断更加自动化的算法生产线。Brain++使我们能够针对不同垂直领域的碎片化需求定制丰富且不断增长的算法组合,包括很多长尾需求。此外,我们能以更少的人力和更短的时间开发出各种新算法。”

正如其名,Brain++可以说就是旷视的大脑中枢和基石。基于此,现在旷视可以向其客户提供包括算法、软件及人工智能赋能物联网设备的全栈式解决方案。

Brain++其技

作为企业级的人工智能算法制造工厂,Brain++包含人工智能基础架构 (Brain++ Infrastructure)、人工智能计算与数据平台(Brain++ Platform),与核心的人工智能训练与推理引擎(Brain++ Engine)。

旷视Brain++在一开始就确立了以计算图的方式来进行框架搭建的思路,是符合目前国际开源深度学习框架潮流的。

旷视Brain++架构图

深度学习训练与推理引擎Brain++ Engine,为旷视研究院整体的研究生产工作和旷视核心产品的工程化建设提供了强力支撑。基于Brain++,旷视实现了在云、端、芯等不同平台的深度神经网络算法创新。同时,Brain++ 还纳入了最新研发的 Brain++ AutoML 技术,推动机器学习模型从“手工”时代步入“自动化”时代。

具体而言:

‧ 针对视觉任务定制化优化。Brain++针对视觉任务做出了定制化的优化,使处理图像与影像更高效。经过优化的Brain++特别适合大量图像及视频训练及完成复杂的视觉任务,如图像分类、物体检测、物体场景分割、影像分析等。

‧ 配备AutoML技术。Brain++将深度神经网络设计、参数调整及设备适配等过程自动化,可显著降低人力成本并大幅提高开发效率,帮助AI企业构建出一条不断自我改进、不断变得更加高效的半自动的算法研发产线。

‧ 多任务及多用户调度能力。Brain++可智能地调度平台硬件基础设施的计算能力,可以支持数百名研究人员同时在数万个GPU芯片上执行从数百到数千个训练任务,从而显著提高算法训练效率。

Brain++帮助旷视构建了一条不断自我改进、不断更加自动化的算法生产线,实现以更少的人力和更短的时间开发出各种新算法,并能够针对不同垂直领域的碎片化需求定制丰富且不断增长的算法组合。以Brain++作为基础设施,旷视开发了可部署于云端、移动端及边缘端全计算平台的先进深度神经网络。

科创企业的经营逻辑决定了其必须以核心技术为“根基”,再衍生拓展应用场景商业模式。

(旷视人工智能技术商业化路径 来自招股书)

旷视的商业化也的确如此。其于2012年开始经营Face++开放平台,2015年通过提供FaceID解决方案实现人工智能技术商业化落地;2015年底旷视将业务扩展至城市物联网垂直领域;2018年再次扩展至供应链物联网垂直领域。并在各个商业化场景领域快速取得成绩。

根据灼识谘询报告,按2018年收入计算,旷视是中国最大的云端人脸识别身份验证解决方案供应商,占据逾60%的市场份额;旷视城市物联网解决方案被应用于中国100多个城市。

“Brain++”们 为什么重要?

中美都已经将人工智能提高到国家战略高度,其重要性不言而喻。同时,人工智能技术已经开始加速与行业进行深度融合,可以预见的是未来,人工智能对生产、生活各个层面的影响只会日益深入。

在此背景下,“自主可控”就是不得不说的一个话题。

今年5月,美国商务部正式将华为列入“实体清单”,禁止美企向华为出售相关技术和产品。此举对华为造成诸多影响。其中一项就有,华为终端产品将无法获取更新的美国谷歌公司的Android操作系统版本。

这种不让你用我的“操作系统”的操作手段,其遏制力体现在操作系统迁移成本高,短时间生态重建困难。

这一禁令带来的影响效果,给国内如火如荼的人工智能技术研发应用厂商好好上了一课。

试想,一旦大多数人工智能开发者都习惯了在某套框架下的人工智能应用开发方式,势必形成巨大的迁移成本,一旦平台方出于某些目的限制开放、限制专利应用,基于框架进行开发的开发者将无法玩转。

事实上这种可能性也完全存在。

今年5月,GitHub,这家去年刚刚被微软收购的全球最大代码开源社区就在其更新的最新用户协议规范中强调:GitHub上的使用与相关活动必须遵守美国出口管制规范。目前被限制出售、出口或者再出口的国家主要是古巴、伊朗、朝鲜、苏丹与叙利亚,暂时还没有中国。一旦中国被列入,那么对使用Github托管代码的公司来说就会有影响。

(5月GitHub更新的用户协议)

照此逻辑来看,目前被广泛使用的开源深度学习框架如Google 的 TensorFlow、Facebook的PyTorch等,一旦也受到美国出口管制的规范,哪些基于这些框架开发的应用项目也将同样受限。

基于全球技术开发共生体系所运行的开源合作项目,正在被更多不确定性冲击。比如随时可能因为美国或其他国家的一纸禁令,就让部分企业开发的产品陷入开发源码技术升级断供的境地,更有甚者有遭控侵权的风险。多年积累一遭清零。

就在本月8日,美国政府宣布,将包括旷视在内的28家中国企业实体加入“实体管制清单,禁止这些企业购买美国产品。

没人知道风险和突破哪一项来得更早。

人工智能技术仍处于初步发展阶段,且仍在不断进化。站在新的起跑线上,人工智能技术企业需要避免重蹈在PC时代、移动时代遭遇的“卡脖子”危机,技术自主可控成为眼光远大的企业努力追求的目标。

Brain++就是旷视自研的深度学习框架,目前已经迭代到8.0版本,旷视表示,对Brain++是一套复杂系统,需要不断迭代变得更优,会持续性投入研发。

当然,也不是所有企业都有技术(稀缺的人才)和资源(足够的金钱)能独立开发出深度学习框架这种“基础设施”。

目前也有更多的企业开始采用国内开源深度学习框架Paddle Paddle(飞桨)。数据显示,百度开源深度学习平台飞桨的开发者下载量在2019年第二季度环比增加45%。

人工智能技术对人类生产生活的改造才刚刚起步,不论是人工智能技术本身,还是应用场景广度和深度的探索,都还任重道远。在这里只想说一句:当自强!(i智说)

官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

↑扫描二维码

想在手机上看科技资讯和科技八卦吗?

想第一时间看独家爆料和深度报道吗?

请关注TechWeb官方微信公众帐号:

1.用手机扫左侧二维码;

2.在添加朋友里,搜索关注TechWeb。

手机游戏更多