百度AI获得WebVision和ActivityNet竞赛双料冠军
近日,百度视觉技术团队凭借领先的图像识别和视频理解技术在全球两大视觉竞赛WebVision和ActivityNet中分别击败100多家参赛单位和队伍,获得多项世界第一,并受邀在全球视觉技术领域顶级学术会议CVPR(IEEE国际计算机视觉与模式识别会议)上做报告分享。继百度人脸检测深度学习算法PyramidBox在世界最权威人脸检测公开评测集WIDER FACE中刷新业内最好成绩后,百度视觉技术团队又在国际知名奖项中折桂。
WebVision是2017年以来新的大规模图像识别任务权威挑战赛事,其数据量超过ImageNet。相较于ImageNet竞赛数据,WebVision竞赛的数据集直接从互联网爬取,未经人工标注或筛选,识别难度大,但同时也更贴近实际场景。
本次竞赛中,主办方将数据集合由1000类扩大到5000类,训练数据量由240万张图片扩大到1600万张图片,数据量更庞大,识别难度大幅提高。WebVision今年共吸引了全球100多支团队参加,涵盖众多顶尖科技公司和知名高校,百度以领先第二名3.95个绝对百分点的优异成绩获得WebVision竞赛冠军。
图像识别是计算机视觉重要的基础问题之一。据悉,百度视觉团队从2013年起开始构建超大规模的图像分类系统,其中大部分训练数据均通过互联网搜索引擎获取,目前已构建起包含10万类Tag(标签),近亿图片的训练系统。据悉,该系统已经为百度Feed流等众多百度核心产品线赋能,并为华为、小米等国内一流手机厂商提供精准的物体识别。
在视频理解领域,百度视觉技术团队在ActivityNet 2018中击败众多参赛单位和队伍,获两项任务冠军,相关技术论文已发表于CVPR、AAAI等顶级学术会议。
ActivityNet是目前视频理解领域影响力最大的赛事,与每年的顶级学术会议CVPR一起召开,今年共举办6项比赛。其中,Kinetics视频动作识别任务是业界最权威的视频分类数据集,百度连续两年斩获该项任务冠军,并将平均错误率由12.4%降至10.9%。Kinetics数据集包含40万训练短视频语料,400个类别,今年主办方将数据集由400类扩大到600类,训练数据从40万增加到50万,包含的标签均为人类日常行为,更贴近实际。此外,百度在动作片段判断Proposal任务中获第一名,AUC领先第二名1.6个绝对百分点。
视频理解技术作为重要的计算机视觉技术之一,可以深度解析视频语义内容,进而输出视频相应元素,辅助人工审核编辑,提升精准用户推荐,丰富视频内容生产。百度此次获奖的技术已应用于百度线上Feed视频自动分类系统,提供视频语义化解析,在视频打标签、视频比对和视频推荐等业务上均发挥了重要作用。
去年,百度OCR(文字识别)技术在ICDAR竞赛数据集最具挑战的竞赛任务“Incidental Scene Text(自然场景随拍文字识别)”中,检测、识别和端到端三个核心技术领域近两年来多次排名世界第一,具备明显领先优势。
据悉,百度视觉识别技术不仅为百度内部产品带来颠覆性的改变,也持续对外输出技术实力。百度计算机视觉技术也已全线开放,包括人脸识别、文字识别(OCR)、图像审核、图像识别&图像搜索5大类别、58项基础能力,已服务于几十万开发者,它将持续为各行各业赋能,推动百度人工智能技术产品的快速落地。
您可能也感兴趣:
官方微博/微信
每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。
想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
雷军:小米SU7定价时最纠结的是盈亏点
最终悬念,小米SU7卖多少钱合适?
恒大汽车 2023 年净亏损 119.95 亿元,努力改善经营状况
日赚0.82亿 比亚迪2023年净利润300.41亿元,同比大涨80.72%
苹果WWDC 2024将于6月10日举行,或将推出生成式AI技术
苹果A18 Pro芯片细节曝光:采用更大尺寸 以提升AI性能
阿里撤回菜鸟上市申请 拟37.5亿美元收购菜鸟少数股东股权
AI造富能力一流
飞书开启裁员 全员信称会提供补偿方案或转岗机会
更多
- 京东推AI换新加速计划全力扶持AI PC 以旧换新可补贴2000元
- 宁畅发布2024年全新战略,“全局智算”力夺AI计算头筹
- 网心科技马婷:边缘计算,是碎银几两还是诗和远方?
- 华为2023年实现全球销售收入7042亿元 净利润870亿元
- 快狗打车2023年来自中国内地市场收入下滑17.8%
- 小米回应无法退定金问题:消费者若主动锁单 定金也不可退
- 周鸿祎:开源能处理50万字长文本的大模型给大家玩玩
- 刘强东:今天起,京东的使命升级为“技术为本,让生活更美好”
- 伊克罗德信息与向量数据库创企墨奇科技达成战略合作 共创生成式AI应用解决方案
- 天猫拟新增《数码配件、电脑周边类目规范》 部分存储设备容量虚标可获三倍赔偿
更多
- 投行分析师预计特斯拉Q1交付42.5万辆到47.5万辆电动汽车
- 消息称苹果可折叠屏iPhone遇到技术挑战 将推迟到2027年一季度发布
- 苹果新一代iPad Pro和iPad Air下月或无望 消息称要到5月初
- 全球生成式人工智能领域去年或有近700笔投资交易 总额291亿美元
- 华尔街预计特斯拉Q1交付47.1万辆电动汽车 但也有分析师预计低于43万辆
- 苹果WWDC24还有望推出Mac Studio 但Mac Pro可能要下半年
- 亚马逊再向AI初创公司Anthropic投资27.5亿美元 兑现40亿美元投资承诺
- 消息称苹果在测试一款新Apple Pencil 有望用于Vision Pro
- 现代汽车计划到2030年将电动汽车增至31款 韩国年产能增至151万辆
- 消息称苹果没有在iOS 18等新一代系统中引入自研AI聊天机器人计划