首页 人工智能

百度视觉团队获谷歌AI目标检测竞赛冠军

近日,百度视觉团队在最大规模目标检测竞赛Google AI Open Images-Object Detection Track中获得冠军,并受邀在顶级视觉学术会议ECCV2018上做分享。

Google AI Open Images-Object Detection Track是大规模图像检测任务的权威挑战赛事,由Google AI Research举办,赛事遵循 PASCAL VOC、ImageNet和COCO等赛事传统,但数据规模远大于这些赛事。

百度视觉团队获谷歌AI目标检测竞赛冠军

据介绍,大赛采用Google今年5月份发布的Open Images V4数据集作为训练数据集,其中包含超过170万的图片数据,500个类别以及超过1200万物体框。据了解,Open Images V4数据集的类别分布广泛且不均匀,这意味着参加竞赛的团队不能统一对所有类别做处理,而是需要考虑到类别分布的实际情况,这一点也更加贴近现实世界中的场景。

与传统的检测数据集合相比,该赛事除了数据规模大、更真实之外,还存在一系列的挑战。具体来说,主要集中在数据分布不均衡、漏标框和尺度变化大三个方面。

由于Open Images V4数据集的规模相当庞大,百度视觉团队在训练过程中分别进行了全集数据训练、固定框选子集训练、动态采样模型训练三种策略进行。其中,动态采样通过样本数量的变化增减采样的概率,从而有效缩短模型训练时间。此外,为了更好地实现图像检测效果,百度视觉团队在训练过程中还通过动态采样、FPN、模型融合等不同策略有效解决了各种技术问题。

在实际应用中,不论是在学术圈还是工业界,大规模目标检测都是计算机视觉极为重要的基础技术。通过这一技术,软硬件应用产品可以深度定位图片中的物体位置以及类别,并用于新零售、通用多物品识别等场景。

官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

↑扫描二维码

想在手机上看科技资讯和科技八卦吗?

想第一时间看独家爆料和深度报道吗?

请关注TechWeb官方微信公众帐号:

1.用手机扫左侧二维码;

2.在添加朋友里,搜索关注TechWeb。