ICDAR 2021首届文档图像与语言研讨会闭幕 百度联合国内外机构共助多模态文档分析技术发展
目前,国际文档分析与识别会议 ICDAR 2021(International Conference on Document Analysis and Recognition)正在进行中。作为国际模式识别学会(IAPR)组织的文档图像分析识别领域公认的权威学术会议,ICDAR专注于文档领域的识别与应用。
在今年的ICDAR 2021上,由百度联合中科院自动化所、德国人工智能研究中心、纽约州立大学布法罗分校举办的第一届文档图像与语言研讨会DIL 2021(Workshop on Document Images and Language)成功举办。作为文档图像分析识别领域内首个专注于计算机视觉和自然语言处理融合应用的研讨会,DIL 2021吸引了来自多个国家和地区的百余名专家学者,就图像与语言多模态学习的课题进行了热烈的探讨与交流。
文档图像分析涉及文字检测、识别、信息抽取、布局分析等多项跨模态技术,近年来随着多模态、预训练和Transformer技术的兴起,综合利用图像和文本信息以获得更好的文档分析结果成为学术上的新趋势,在实际的行业应用中也对文档数字化和结构化起到了至关重要的作用。
百度此次联合国内外知名机构与高校,邀请了来自华南理工大学金连文教授、微软亚洲研究院崔磊研究员和德国人工智能研究中心技术负责人Heiko Maus等领域专家学者进行主题报告演讲,并有多篇收录论文进行口头报告。专家学者就结合语义的文字识别、多模态预训练模型、文档信息抽取、智能文档与知识图谱等领域的研究进展、面临挑战以及未来趋势进行了分享与讨论。
多年来,百度持续深耕文字识别、文档分析和语言多模态学习等领域,在技术研究与落地应用上具备深厚的积累。百度构建了业内规模最大的弱标注场景文字数据集LSVT,提出了文档结构化分析的自监督预训练模型StrucText,通过百度AI平台对外开放了几十项文字识别与文档分析能力,服务百万量级的AI开发者。此外,百度还提出了语言与视觉一体的统一模态预训练UNIMO,实现跨模态的语言与视觉统一表示,并通过基于语言描述(prompt)的方式支持零样本的开放抽取,打造了面向纯文本、结构化文档、图像等多种数据格式的开放域文档信息抽取能力,实现在医疗、金融、政务等行业中落地应用。
与ICDAR大力推动国际各高校及企业同行之间的学术交流一样,首届文档图像与语言研讨会DIL 2021也致力于搭建各领域专家学者的交流平台,共同促进图像和语言多模态技术、产业发展。未来,百度将继续坚持前沿技术的创新与探索,紧密联结计算机视觉和自然语言处理两大技术领域学者,为实现具备人类认知水平的文档分析能力做出更大的贡献。
您可能也感兴趣:
官方微博/微信
每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。
想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
雷军:小米SU7定价时最纠结的是盈亏点
最终悬念,小米SU7卖多少钱合适?
恒大汽车 2023 年净亏损 119.95 亿元,努力改善经营状况
日赚0.82亿 比亚迪2023年净利润300.41亿元,同比大涨80.72%
苹果WWDC 2024将于6月10日举行,或将推出生成式AI技术
苹果A18 Pro芯片细节曝光:采用更大尺寸 以提升AI性能
阿里撤回菜鸟上市申请 拟37.5亿美元收购菜鸟少数股东股权
AI造富能力一流
飞书开启裁员 全员信称会提供补偿方案或转岗机会
更多
- 消息称苹果可折叠屏iPhone遇到技术挑战 将推迟到2027年一季度发布
- 苹果新一代iPad Pro和iPad Air下月或无望 消息称要到5月初
- 全球生成式人工智能领域去年或有近700笔投资交易 总额291亿美元
- 华尔街预计特斯拉Q1交付47.1万辆电动汽车 但也有分析师预计低于43万辆
- 苹果WWDC24还有望推出Mac Studio 但Mac Pro可能要下半年
- 亚马逊再向AI初创公司Anthropic投资27.5亿美元 兑现40亿美元投资承诺
- 消息称苹果在测试一款新Apple Pencil 有望用于Vision Pro
- 现代汽车计划到2030年将电动汽车增至31款 韩国年产能增至151万辆
- 消息称苹果没有在iOS 18等新一代系统中引入自研AI聊天机器人计划
- 被美国司法部起诉垄断后 苹果在美国又面临至少3起集体反垄断诉讼