首页 人工智能

“吃瓜群众”不会挑瓜?百度EasyDL新功能帮你“听声辨瓜”

近日,在AI圈非常“吃得开”的EasyDL又有新动作。据了解,百度EasyDL定制化训练和服务平台除图像识别外,现已全新开放定制化声音识别功能,无需深度学习基础,每个人都可以简单快速地定制模型以识别出不同种类的声音,或者是什么状态/场景的声音。换言之,不论是人声、猫叫还是狗吠,EasyDL定制化声音识别功能都可以轻松分辨。

image.png

炎炎夏季的烦心事,挑西瓜可算是一件。有了EasyDL定制化声音识别,难题或能由此解决。用户只需新建一个模型,录下一定数量敲击西瓜的声音,依照其成熟度进行标注,并把音频数据集打包上传至EasyDL,经过训练后,即可获得“挑西瓜”的模型。用户还可以在训练校验完毕后,一键发布API,与更多人一起分享夏天的“甜蜜”。只需简单四步,无需任何代码,即可训练出为“挑西瓜”定制的深度学习模型。

image.png

EasyDL定制化声音识别功能为何能轻松满足“吃瓜群众”?这完全得益于它可即用、更轻快、高精度、强安全、响应快五大特征,对新入门的AI开发者极其友好。首先,EasyDL声音识别的业务流程极简,无需深度学习基础即可上手。其次,依托算法与工程的优化,1000个音频可在1个小时左右训练完毕。在精度方面,超过三分之二的模型准确率高于90%。在安全性上,EasyDL通过数据加密与隔离,能够实现完善的服务调用鉴权。在响应层面,专业服务团队将快速响应您的需求和问题反馈。

当然,EasyDL定制化声音识别能做到的绝不仅仅是能帮你挑个好瓜,它有着广泛的应用场景。在安防监控领域,可定制识别不同的异常或正常的声音,进而用于突发状况预警;而在科学研究领域,可定制识别同一物种的不同个体的声音、或者不同物种的声音,协助野外作业研究。除此之外,还有更多的可能亟待开发者探索。

EasyDL是一个定制化训练和服务平台,它的底层算法完全基于百度深度学习开源平台PaddlePaddle,能帮助个人和企业开发者零算法基础训练业务定制模型。此外,EasyDL的多业务可扩展性也依靠于PaddlePaddle代码设计的简洁性和封装能力。

EasyDL目前已经开放图像分类、物体检测及声音分类三大功能,且图像分类、物体检测两类模型已经支持输出离线SDK,支持部署在手机、摄像头等终端离线计算,未来EasyDL还将进一步引入第三方数据服务等能力,更好地为开发者和终端企业用户服务。

随着开放进程的持续推进,百度AI正在逐步渗透进社会的毛细血管中,为生产和生活带来全新的变革。截止到2018年7月,已有超过6000个合作伙伴和开发者使用EasyDL,累计创建定制模型超过1万个,落地应用于互联网、零售、医药、制造业、交通、仓储物流、安防监控等众多行业,仍在不断地满足各行各业的AI定制化需求。

官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

↑扫描二维码

想在手机上看科技资讯和科技八卦吗?

想第一时间看独家爆料和深度报道吗?

请关注TechWeb官方微信公众帐号:

1.用手机扫左侧二维码;

2.在添加朋友里,搜索关注TechWeb。

手机游戏更多