达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

达观OCR文字识别赋能公积金中心实现业务办理再提速

 

随着智慧政务理念的提出,利用先进的AI技术和手段提高政府部门在办公、监管、服务和决策等多方面的智能化水平已经成为大家的共识。而OCR作为成熟且落地应用多的AI技术,是众多智慧政务业务系统的重要底层支撑组件。只有应用识别精度高、速度快的OCR平台才能让智慧政务系统的业务审批再提速,从而使人民群众办理自助办理审批业务时更加便捷化和无感化。

公积金1

以某一线城市公积金中心业务为例,在申办和审批业务中的贷款、归集和处罚业务流程中需要识别身份证、结婚证、银行卡、公积金提取申请表、贷款合同、规划许可证等多类文档的多种关键信息。前端业务人员接收到的申请资料五花八门,且不同类型文档的样本质量参差不齐,对识别模型的准确率影响很大。

达观智能OCR平台可从同类文档不同样本中分析共性、提取特征,从而获得高精度的识别模型。独创的多模态信息识别可从文本布局、文字语义、字体形式、周边特征词等因素去识别提取样本中的关键信息,实现了OCR+CV+NLP的完美结合。

以不动产登记证明为例:

1、 通过版面分析,将一张图片自动切分为两页,预处理使得识别效果大幅上升;

2、 通过文字语义分析,将切分好的内容归入“不动产登记证明”类型的文档,自动选择相应的识别模型进行识别抽取,抽取;

3、 通过字体形式、表格识别,“理解”文本、分辨出标题、落款、盖章、编号以及表格内的重要信息。

公积金

对于证照中的印章,达观自研有强大的印章文字识别技术,可快速找到文档中的所有印章并精准识别其中的文字,对文档中是否有印章、印章是否正确作双重验证。目前可处理的包括红章、黑章、圆章、方章、椭圆章、三角章等。

公积金3

图:印章识别技术示例

目前达观在某一线城市公积金中心已完成18类文档、100多个关键信息的智能识别和提取,有效减少前端业务人员的录入工作、加快了业务办理速度。此外,文档识别与抽取优化了业务流转方式,实现了无纸化、智能化、线上化的业务办理,市民群众办理公积金业务时已不再必须跑线下网点取号排队办理、加快了全市的公积金业务的审批速度。