“吃瓜群众”不会挑瓜？百度EasyDL新功能帮你“听声辨瓜”

2018.08.21 15:30:15来源: 中华网作者:中华网

近日，在AI圈非常“吃得开”的EasyDL又有新动作。据了解，百度EasyDL定制化训练和服务平台除图像识别外，现已全新开放定制化声音识别功能，无需深度学习基础，每个人都可以简单快速地定制模型以识别出不同种类的声音，或者是什么状态/场景的声音。换言之，不论是人声、猫叫还是狗吠，EasyDL定制化声音识别功能都可以轻松分辨。

炎炎夏季的烦心事，挑西瓜可算是一件。有了EasyDL定制化声音识别，难题或能由此解决。用户只需新建一个模型，录下一定数量敲击西瓜的声音，依照其成熟度进行标注，并把音频数据集打包上传至EasyDL，经过训练后，即可获得“挑西瓜”的模型。用户还可以在训练校验完毕后，一键发布API，与更多人一起分享夏天的“甜蜜”。只需简单四步，无需任何代码，即可训练出为“挑西瓜”定制的深度学习模型。

EasyDL定制化声音识别功能为何能轻松满足“吃瓜群众”？这完全得益于它可即用、更轻快、高精度、强安全、响应快五大特征，对新入门的AI开发者极其友好。首先，EasyDL声音识别的业务流程极简，无需深度学习基础即可上手。其次，依托算法与工程的优化，1000个音频可在1个小时左右训练完毕。在精度方面，超过三分之二的模型准确率高于90%。在安全性上，EasyDL通过数据加密与隔离，能够实现完善的服务调用鉴权。在响应层面，专业服务团队将快速响应您的需求和问题反馈。

当然，EasyDL定制化声音识别能做到的绝不仅仅是能帮你挑个好瓜，它有着广泛的应用场景。在安防监控领域，可定制识别不同的异常或正常的声音，进而用于突发状况预警；而在科学研究领域，可定制识别同一物种的不同个体的声音、或者不同物种的声音，协助野外作业研究。除此之外，还有更多的可能亟待开发者探索。

EasyDL是一个定制化训练和服务平台，它的底层算法完全基于百度深度学习开源平台PaddlePaddle，能帮助个人和企业开发者零算法基础训练业务定制模型。此外，EasyDL的多业务可扩展性也依靠于PaddlePaddle代码设计的简洁性和封装能力。

EasyDL目前已经开放图像分类、物体检测及声音分类三大功能，且图像分类、物体检测两类模型已经支持输出离线SDK，支持部署在手机、摄像头等终端离线计算，未来EasyDL还将进一步引入第三方数据服务等能力，更好地为开发者和终端企业用户服务。

随着开放进程的持续推进，百度AI正在逐步渗透进社会的毛细血管中，为生产和生活带来全新的变革。截止到2018年7月，已有超过6000个合作伙伴和开发者使用EasyDL，累计创建定制模型超过1万个，落地应用于互联网、零售、医药、制造业、交通、仓储物流、安防监控等众多行业，仍在不断地满足各行各业的AI定制化需求。