百度视觉团队获谷歌AI目标检测竞赛冠军
近日,百度视觉团队在最大规模目标检测竞赛Google AI Open Images-Object Detection Track中获得冠军,并受邀在顶级视觉学术会议ECCV2018上做分享。
Google AI Open Images-Object Detection Track是大规模图像检测任务的权威挑战赛事,由Google AI Research举办,赛事遵循 PASCAL VOC、ImageNet和COCO等赛事传统,但数据规模远大于这些赛事。
据介绍,大赛采用Google今年5月份发布的Open Images V4数据集作为训练数据集,其中包含超过170万的图片数据,500个类别以及超过1200万物体框。据了解,Open Images V4数据集的类别分布广泛且不均匀,这意味着参加竞赛的团队不能统一对所有类别做处理,而是需要考虑到类别分布的实际情况,这一点也更加贴近现实世界中的场景。
与传统的检测数据集合相比,该赛事除了数据规模大、更真实之外,还存在一系列的挑战。具体来说,主要集中在数据分布不均衡、漏标框和尺度变化大三个方面。
由于Open Images V4数据集的规模相当庞大,百度视觉团队在训练过程中分别进行了全集数据训练、固定框选子集训练、动态采样模型训练三种策略进行。其中,动态采样通过样本数量的变化增减采样的概率,从而有效缩短模型训练时间。此外,为了更好地实现图像检测效果,百度视觉团队在训练过程中还通过动态采样、FPN、模型融合等不同策略有效解决了各种技术问题。
在实际应用中,不论是在学术圈还是工业界,大规模目标检测都是计算机视觉极为重要的基础技术。通过这一技术,软硬件应用产品可以深度定位图片中的物体位置以及类别,并用于新零售、通用多物品识别等场景。
您可能也感兴趣:
官方微博/微信
每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。
想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
恒大汽车 2023 年净亏损 119.95 亿元,努力改善经营状况
日赚0.82亿 比亚迪2023年净利润300.41亿元,同比大涨80.72%
苹果WWDC 2024将于6月10日举行,或将推出生成式AI技术
苹果A18 Pro芯片细节曝光:采用更大尺寸 以提升AI性能
阿里撤回菜鸟上市申请 拟37.5亿美元收购菜鸟少数股东股权
AI造富能力一流
飞书开启裁员 全员信称会提供补偿方案或转岗机会
消息称小红书2023年首次实现盈利 但IPO前景仍不明朗
更多
- 全球生成式人工智能领域去年或有近700笔投资交易 总额291亿美元
- 华尔街预计特斯拉Q1交付47.1万辆电动汽车 但也有分析师预计低于43万辆
- 苹果WWDC24还有望推出Mac Studio 但Mac Pro可能要下半年
- 亚马逊再向AI初创公司Anthropic投资27.5亿美元 兑现40亿美元投资承诺
- 消息称苹果在测试一款新Apple Pencil 有望用于Vision Pro
- 现代汽车计划到2030年将电动汽车增至31款 韩国年产能增至151万辆
- 消息称苹果没有在iOS 18等新一代系统中引入自研AI聊天机器人计划
- 被美国司法部起诉垄断后 苹果在美国又面临至少3起集体反垄断诉讼
- 航拍显示特斯拉上海储能工厂准备动工 厂区内已有施工设备
- 消息称苹果不会在今晚宣布新iPad Air和iPad Pro 还得再等等