百度双赢战略与创业者共同勾勒AI生态体系蓝图

2017.12.08 10:07:59来源: TechWeb.com.cn 作者:诚实可靠小郎君

【TechWeb报道】12月8日消息，百度这两年在AI领域迈的步子很大，从城市规划到连接每一位开发者，成果一一开始落地。在开发者这一块，百度AI开放平台提供涵盖（语音、图像、自然语言处理、视频、AR、知识图谱、智能数据）7大方向，超过80项技术能力通过开放多层次的服务体系赋能每家企业。

在提供支持的同时，百度也在打造着自己的AI生态战略计划，包含提供基础计算和存储能力的智能云，以及构建在其之上的百度大脑，承载着百度所有AI开放能力，最上层就是百度主打的两个生态——DuerOS和Appllo，最终形成一套从云到端完整布局。

百度大脑结构

百度大脑整体技术架构自下而上来看分为如下几层：

最底层技术是AI必不可少的三要素大数据、机器学习深度学习算法与模型、承载复杂数据计算能力；

基础层之上构建的感知层，提供AI语音、图像、视觉、AR等相关能力；

认知层包括自然语言处理、知识图谱、用户画像三种能力；

获取上述三层能力的关键，则是四层平台层的职责——百度AI开放平台，通过平台分享着自家与合作伙伴间的技术成果；

平台层之上，是百度AI技术生态，利用平台能力结合生态伙伴进行落地；

处于顶端的应用层很好理解，就是已经落地的解决方案和产品。

这里着重要说的事百度AI开放平台，在这一平台上又分为三层结构，底层是结合了现今深度学习模型和框架的深度学习平台PaddlePaddle。基于这之上，就是上面提到的80多种技术能力。最上层则是贴近用户使用场景的解决方案。

从上图来看，有几点是十分值得注意的：长语音识别、远场语音识别等全新上线的产品。其中长语音识别在年中时就被提出，年底如约而至。在昨日召开的百度AI开发者大会上，宣布“AI加速器”一期正式开营，并面向开发者展现了最新成果。

远场语音识别

虽然百度在近场语音识别（1m以内）方面已经做到了靠前的位置，但远场（3-5m以上）面临的声学模型难题要比近场复杂的多，声源的识别与噪音上的处理影响着远场语音识别的精准性。

百度通过大量声学数据进行深度学习，从而形成远场声学模型，结合麦克风阵列处理算法，按照阵列的空间选择性来降噪并增强生源，形成一套集软硬于一身的解决方案。即日起，远场语音识别将会永久免费提供给开发者，支持市面上主流平台及开发语言。

百度副总裁、AI技术平台体系（AIG）总负责人王海峰在发布会上表示，百度AI将提供更全面的支持帮助更多开发者和企业从中受益。首批AI加速器有22家企业，享有顶级导师定制课程、生态伙伴三星权益、百度投资入股、技术支持伙伴项目等资源。AI加速器还将全年滚动招募（每年3-4期）。

在大会外面的展区里，我们发现了在这一生态体系下合作伙伴带来的布丁豆豆儿童启蒙机器人，交谈中得知，其语音方面的API就是调用的百度平台层的技术，当然也涵盖自己独创的技术，最终打造出了这样一款产品。

对于创业者而言，百度平台的利好政策，将会帮其缩短研发周期与成本。都说AI不是一般创业企业该碰的，其原因就在于底层架构的搭建，以及相关技术的研发成本实在高的吓人。而对于百度来说，在AI赛道上，大家都处在同一起跑线，虽然多年的投入换来了成果，但在某些技术领域中依旧存在很大的上升空间。这样的打法，丰富自家生态的同时亦能快速完善技术，最终实现双赢的目的。