财报识别与核查机器人基于深度学习、光学字符识别和计算机视觉技术,对基于中国会计准则编制的各类财务报表、财务报告及审计报告、年报等进行财务主表信息提取、试算结果校验,并可结构化输出成统一格式,便于银行信贷、投资审查、供应商准入审核、尽职调查等多个场景
智能财报识别与核查系统是一款将财务报表、审计报告、年报等中的财务主表数据进行结构化抽取后填列至系统内置的固定模板中,并根据既定会计准则规定的财务报表逻辑进行试算平衡校验,最后输出成统一 excel 格式的财务主表的开箱即用的智能化系统
达观采用特有自研算法实现财务报表主表区分、口径区分等功能,并依据内嵌公式进行试算平衡校验,以减少文档质量参差不齐导致的识别误差
财务主表自动抓取
可自动区分并抓取各类财务报表、财务报告,审计报告、年报等中资产负债表、利润表和现金流量表
口径自动区分
可根据用户需求区分合并口径、单体口径或全部口径的财务报表
合并口径
单体口径
全部口径
模板自动匹配
内嵌财政部最新报表格式,支持对企业会计制度、已执行新会计准则、新收入准则和新租赁准则的企业的一般企业新会计准则,及对保险类、担保类、金融控股集团公司、金融资产管理公司、证券类、银行类等企业报表模板的手动和自动匹配
试算详情
内嵌财务逻辑校验公式,支持对所有上传的财报内容进行试算平衡校验,以减少由文档质量造成的识别误差影响
合并
单体
全部
达观财报系统将实现最大限度的财务数据智能结构化解析,并依据内嵌的公式与模型,实现智能抽取、智能分析、准则转换等,以冲破人脑局限,扩大分析样本,深入预测风险,抢占市场先机
财务数据智能分析
可依据用户设定的重要性金额提示用户对重要科目变动金额进行分析,并实现横向行业异常数据分析及纵向历史数据分析,提示报表异常风险,减少财务舞弊现象
财务指标智能生成
智能生成相关财务指标,智能分析企业偿债能力、盈利能力和营运能力等,便于用户便捷分析
财务数据智能抽取
支持上传的各类财务报表、审计报告中资产负债表、利润表和现金流量表中财务数据抽取
会计准则智能转换
可根据用户选择进行合并口径、单体口径或全部口径报表的智能抽取
在表格识别,尤其是金融领域财务信息披露的表格识别中,除常见的图像旋转、倾斜、透视、褶皱等影响 OCR 效果的客观情况外,还有印章污损、签字等对 OCR 效果的干扰。达观自研OCR技术内嵌降噪、除印章、图像平整化算法模型,将外界影响降至最低,极大程度提升 OCR 的识别准确率
矫正算法
增添矫正算法,以减少变形表格的识别误差
批量训练极端样本
加强极端样本训练,以增强过密表格的识别效果
文字检测算法
增添文字检测算法,以快速准确找出文字所在区域
文字识别算法
增添文字识别算法,以提升识别准确率
语义修正算法
增添语义修正算法,以利用 BERT、Bi-LSTM 和 CNN 等算法模型的实现来加强对输出结果的语义层级纠正
去印章算法
增添去印章算法,尽可能减少印章对图像识别的干扰
污损与图像变形
图像揉捏与颠倒
表格过密与阴影
印章遮盖与倾斜
经统计,披露不规范、准则混淆、科目混淆等报表所占比例为60%以上,且扫描件或图片质量等也将影响正常的科目识别,达观自创财务科目匹配及纠正算法,结合NLP技术及财务专业规范,尽可能提升科目匹配准确率
财务科目智能匹配
财务数据后处理
试算平衡自动纠错
计算符号自动识别
独特的算法模型
自研 OCR 算法,更贴近财务报表特点独创财务数据自动纠错算法,更高识别准确率独特的财务科目AI语义泛化,科目匹配率更高
较高的准确率
报表识别率高于 98%,财报整体通过率较高
较高的报表兼容性
适用 excel、pdf、图片等多种报表格式适用新、旧、资管、证券、担保、银行等多种类型报表
高度贴近用户使用习惯
交互友好,高度还原用户操作系统