达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

达观文档智能方案助力打造审计业智能函证中心

据悉,外部审计在执行审计程序时,会涉及到大量的文本处理工作,如合同内容抽取、流水信息核验、询证函比对与追踪、发票信息抽取与金额合理性分析等。审计员需要在海量的文本信息中筛选关键信息,进而从完整性、真实性、截止性等角度发现相关风险,以完成审计目的。如今,各类文本信息展示的方式多样、收集方法众多, 舞弊信息的藏匿也愈发隐蔽,审计员人工收集、挖掘与分析信息的难度与工作量越来越大,转而留给分析与复核的时间则愈发紧张。在AI技术迅猛发展的今天,采用智能化的算法与技术,为审计人员提供更为便捷的文本处理与智能分析工具是科技发展与审计行业发展的需求所驱,同时也是AI技术与业务深度融合,实现人工智能技术落地与发展的重要举措。

审计

审计行业可应用的智能文本处理技术

智能文本处理领域常提及的技术包括自然语言处理(NLP)、光学字符识别(OCR)、智能流程化机器人(RPA),它们可以将票据、流水、报表、合同等散乱无固定格式的文件中的关键信息梳理,并输出成统一的基础格式,以便于后期信息采用、分析与人员复核等。

如果将整个智能文本处理流程比作一个虚拟的人,那么NLP技术为大脑,以类人脑的方式满足文本与语义学习的需求;OCR技术是眼睛,通过独特的字符识别技术对扫描件、图片等载体中不可选中、不可编辑的文字及数字等信息转换为可编辑、可提取的信息,以满足用户对票据、流水、报表、合同扫描件或图片等信息的提取与再加工;RPA技术则是四肢,以高于人类实际手工操作千倍速度的方式实现被识别与抽取的数据的搬运与传输工作。

与此同时,在审计行业中,我们不仅将这三大人工智能技术组合应用,还结合财会审计业务中常用的语料信息、业务思维特征、审计基础原理,并与业务场景深度融合,在纯算法的体系上增加统计学原理及既定规则定制(如对中国会计准则的应用等),方能实现技术场景落地与业务实用性的双赢。

适合采用AI智能文本处理技术的场景

由于计算机与人脑天然的不同,以目前AI的发展情况来看,人工智能技术尚不能全部覆盖审计工作的全部场景,特别是无文本数据提供,需要人工进行信息交互与判断的工作场景。

从NLP、OCR、RPA技术的实现原理来看,适合采用AI智能文本处理技术的场景应包括如下特征:

1. 文本信息可获得

2. 处理规则可梳理

3. 处理数量相对大

基于如上三个特征,我们在审计前期、审计过程中、审计结论及审计报告管理等审计流程中均选取出适用工作场景以智能文本处理技术,为协助审计人员进行深度多向分析,以提高审计效率及审计效果。

基于如上原则,我们挑选了智能函证流程这个代表性场景。

智能函证流程简介

发函是必执行的审计程序,通常审计员在发函时需要历经如下几个程序:

1. 编写询证函(银行函证、往来函证、关联方函证、存货函证等)

2. 客户信息确认并盖章

3. 函证件拷贝留底

4. 发函快递信息填写

5. 发函快递追踪

6. 回函信息追踪

7. 回函信息比对

8. 相关结论得出

基于“文本信息可获得、处理规则可梳理、处理数量相对大”三大原则,如上流程可采用的人工智能技术优化方案如下表:

函证 表

在智能函证方案中,我们应用到的人工智能技术如下:

印章识别

审计工作中常用到带印章的基础文档。本例中,我们常做的是印章定位与印章提取功能。

在印章定位中,我们使用OCR技术中的目标检测(OD)技术,对日期章、客户章、回函章进行定位,以得出相关结论,如:

1. 日期章、客户章是否在函证指定位置加盖;

2. 回函章是否在“相符”或“不符”区域加盖;

在印章识别中,我们使用达观自研的印章识别技术,可识别菱形章、方章、圆形章、椭圆章等印章形状,并可提取印章中的文字,进行相关信息的整合。

如下图所示,系统左侧是印章原文形态,右侧是文字识别结果,系统在对印章进行目标检测后进行信息识别。

函证1

因此,在此项技术下,我们可以实现函证信息中发函件与回函件的印章位置正确与否的判定,以及发函件与回函件的一致性比对。

函证的印章识别与比对作为发函程序中的必经程序,本项技术的实现无论在执行程序的必要性还是在审核的准确性方面都具有解放人脑的意义,且此项方案不仅可应用于会计师事务所,还可用于投行在IPO过程中的发函程序。

文本智能比对

在函证程序中,为了减少回函被篡改的风险,审计员通常对回函与发函前的拷贝件进行肉眼比较。在此流程中,我们可以应用智能文本比对功能,快速准确完成回函与发函件的异同比对工作。

文档比对功能通过使用NLP与OCR技术,可对目标文件进行语义级别的比对,同时适用于扫描件、电子版PDF、图片及word文档之间的比对,以保证具有更高的文本适用性和格式灵活性。

我们以服务协议合同为例介绍比对模块的具体功能及样式:

函证2

如上图,系统可一目了然地对全文比对结果进行展示,并对比对结果以辅助线连接、比对详情等方式展示,清晰可见。

在函证程序中,用户只需上传发函拷贝件与回函,即可开箱即用,发现两份文档的异同。此举采用地毯式语义理解的方式进行比对,因此与人眼观察相比效率和准确率更高。

RPA抓取函证信息

RPA适用于大量重复的操作,在书写快递单、函证及回函信息物流追踪的过程中,RPA技术可较好地实现快递单信息打印、函证控制表生成、物流信息实时追踪,并定期生成物流报告,以实现审计员的函证发收过程中的控制。

在以往手工操作过程中,快递单的书写与打印、函证收发过程与物流控制占据了审计员较多的时间,一些大型会计师事务所不得不建立函证中心来控制成本。

若使用RPA进行控制,无论对于审计员还是函证中心来说,都具有极大的成本效益性,且由于RPA极高的准确率,在减少人工失误及人工疲乏等都具有不可比拟的优点。

其他场景及应用

在审计流程中,合同信息抽取、银行流水识别与分析、财务数据横向纵向分析、费用全量合理化分析等场景都有较多的应用及可落地方案。我们希望智能抽取、智能审核、智能比对、RPA等AI技术能够在细化的场景中实现轻定制的方案应用,以最大可能发挥计算机的优势,并在不断的场景化训练中更新迭代模型,以实现类人脑智能的不断发展与技术落地。