首页 人工智能

ICDAR 2019国际竞赛召开在即 百度联合学界重奖破局者

文档图像识别领域有“世界杯”之称的ICDAR 2019国际权威竞赛于3月1日即将正式开赛。作为ICDAR 2019 Robust Reading Competition竞赛主要组织者之一,百度联合马来亚大学、华南理工大学、西班牙计算机视觉中心、中国图形图像学会共同发布了两项极具挑战的竞赛任务,ICDAR 2019-LSVT(Large-scale Street View Text with ...

赛事介绍

文档图像识别领域有“世界杯”之称的ICDAR 2019国际权威竞赛于3月1日即将正式开赛。作为ICDAR 2019 Robust Reading Competition竞赛主要组织者之一,百度联合马来亚大学、华南理工大学、西班牙计算机视觉中心、中国图象图形学学会共同发布了两项极具挑战的竞赛任务,ICDAR 2019-LSVT(Large-scale Street View Text with Partial Labeling, 弱标注大规模街景文字识别竞赛)、ICDAR 2019-ArT(Arbitrary-Shaped Text, 任意形状场景文字识别竞赛),并提供丰厚奖金(总计$17,400),待国内外学术界、工业界各大机构华山论剑一较高下。

IEEE ICDAR(International conference on Document Analysis and Recognition)是全球文档图像分析识别领域公认的权威学术会议,从1991年起每两年召开一次。自 2003 年ICDAR设立“Robust Reading Competitions”以来,该竞赛就成了评测和检验自然场景/网络图片文本自动提取与智能识别最新技术研究进展的重要国际赛事及标准,竞赛中的诸多方法对 OCR 技术发展具有强大推动力。高技术难度、高实际应用性,也使该盛会受到科研院校、科技公司等关注,至今已有 89 个国家的 3500 多支队伍参与。

2015-2018期间百度多次在ICDAR 2013、 ICDAR 2015权威竞赛集合获得检测、识别、端到端各项任务榜单第一,位居业内领先水平。百度将OCR深度学习技术应用于多个业务场景,打造文档、翻译、网图、街景等多场景通用文字识别能力,支持中、英、日、韩、葡、德、法、意、西、俄等十国语言。针对金融、保险、交通等重点场景构建OCR产品矩阵和AI开放平台,打造领先的证照、票据识别解决方案。针对终端计算场景,百度OCR模型压缩用于多种嵌入式智能设备,OCR终端SDK与多家手机厂商合作,打造领先的视觉终端计算能力。

ICDAR 2019-LSVT大规模弱标注街景文字识别竞赛

聚焦探索大规模数据场景下深度学习模型算法能力极限,推动大规模弱标注数据下文字识别新方法创新。

ICDAR2019-LSVT数据集源于百度真实应用场景,作为首个提出弱标注数据的场景文字数据集,包括5万张精标注街景图像,40万张弱标注街景图像,总计45万,数据量是现有公开数据集(ICDAR 2017、ICPR 2018等)的14倍以上。

室外场景文字识别具有广泛应用场景,例如:拍照翻译、图像检索、街景地标识别、室外场景理解等。

图1. 精标注数据示例

图2. 弱标注数据示例

深度学习算法通常需要大量训练数据才能在真实应用中取得良好效果,满足实际场景的应用需求。由于合成数据与真实数据仍存在明显差异,同时大规模精确数据标注成本高,探索利用大规模弱标注数据提升深度学习算法性能具有重要研究意义和实用价值,同时对探索场景文本识别技术能力边界具有显著推动作用。

·数据集

5万精标注+40万张弱标注街景随拍图像,大规模数据源于实际应用,包含多种复杂场景

·两项竞赛任务

文字检测、端到端文字识别,奖金 $8,700

ICDAR 2019-ArT任意形状文字识别竞赛

数据集由Total-Text、SCUT-CTW1500和百度非规则文字数据集组成,累计新增7千张任意形状数据,总计10176张,是目前业界最大的任意形状场景文字集合。

现有ICDAR文字数据集(ICDAR 2013、ICDAR 2015、ICDAR 2017-MLT,COCO-Text等)只包含水平、四边形文字框等规则文字标注,如图3所示,ICDAR2019-ArT数据集中每张图像至少含有一个非规则形状文字(irregular text instances),并采用多边形多点对任意形状文字包围框进行精确标注。

图3. 任意形状文字示例

真实场景文字识别应用中,相比规则文字识别,现有算法非规则形状文字识别检测、识别更具挑战,因此ICDAR 2019-ArT竞赛旨在进一步推动自然场景下任意形状文字识别算法与技术突破。

·数据集

1万张任意形状文字图像标注,中英混合,最大非规则场景文字集合

·三项竞赛任务

文字检测、文字识别、端到端识别,奖金 $8,700

百度愿与AI各界同行一起,推动基础算法、关键技术、应用效果新突破。竞赛颁奖将在ICDAR 2019国际会议期间(2019年9月)举行。还在等什么?快来参与这场盛会,赢取大奖吧!

赛事组织单位

百度

马来亚大学

华南理工大学

西班牙计算机视觉中心

中国图象图形学学会

赛事时间

2019年2月21日 - 3月31日:注册通道开放

2019年3月1日:训练集开放下载

2019年4月9日:提交开始时间

2019年4月30日:提交截止时间

联系信息

ICDAR-2019@baidu.com

官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

↑扫描二维码

想在手机上看科技资讯和科技八卦吗?

想第一时间看独家爆料和深度报道吗?

请关注TechWeb官方微信公众帐号:

1.用手机扫左侧二维码;

2.在添加朋友里,搜索关注TechWeb。

手机游戏更多