达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

避免公告文件笔误,达观智能文档质控系统来帮忙

 

近日,一份法律意见书首页的截图引起大家的热议。截图为某律所为某上市公司临时股东大会出具的法律意见书。标题中的“临时股东大会”错误写成了“临死股东大会”,虽然随后该上市公司及时修改了标题重新披露,但是该截图还是在各大社交媒体中继续传播,当日该上市公司的股价产生一定幅度的下跌。

 

据了解,此笔误并不属于偶发情况,笔者筛选了过往已经公开发表的上市公司文件,将“临时会议”写成“临死会议”,“临时报告”写成“临死报告”,“公募基金”写成“公墓基金”、“超短期融资券”写成“超短裙融资券”、某高管“xx年出生”写成“xx年畜生”等笔误现象并不少见。去年3月,b站的招股书中公司名字处的“哔哩哔哩”被误写成“百度集团”,造成不小的社会影响。

 
公司上市需要面对所有公众投资人挑剔的目光,申报材料和上市后的披露报告是呈现拟上市公司和上市公司秩序性、合规性的重要内容,也是衡量一家公司企业形象和股价的关键因素之一。披露信息的真实、准确与完整不仅仅有利于维护良好的企业形象、保持股价稳定,也更是维护资本市场秩序和保护投资者合法权益的关键。

 
这份“临死股东大会”的法律意见书发表后,很多律所、券商、会计师事务所等中介机构的从业人员在讨论事件本身之外,更多的表达了对出现笔误的中介机构从业人员的同情,很多人直言在工作中最紧张的并不一定是做案子和下现场本身,更多的是对每次提交报告的一遍又一遍的复核。虽然在提交前浏览了一遍又一遍,但还是会陷入对自己编写的文字和报告的思维定势中,无法快速找到哪怕是很明显的错误,更不用说找出报告中成千上万的名词、副词、标点,乃至财务数据的勾稽关系错误。

 
人脑阅读和纠错具有一定的盲区,也会因为长期的思维定势而产生疲劳,繁琐又重复的检查工作不仅占据了从业人员的大量时间与精力,也存在一定的漏查率,造成精力和脑力资源的浪费。

 
达观数据智能文档质控系统
实际上,在人工智能技术快速发展的今天,这项工作可以交由计算机代劳。借用可模拟人脑阅读与理解的中文自然语言处理技术,搭载适用于法律意见书、招股说明书、债券募集说明书、上市公司公告等披露文档的语料信息,让计算机代替人类实现这类披露报告的复核也并不是难事。

 
达观数据智能文档质控系统使用最新的自然语言处理技术中的Bert模型,内嵌适用于债权投资、股权投资、财务会计、行业和法律专用语料信息,让计算机像人脑一样可以学习、阅读复杂的文本语义信息,并进行适合现代汉语规范和监管机构要求的结果审核,可大大提高文本审核与其他复杂信息审核的效率和准确率
这套系统可对披露文档中的文本内容,包括错别字、标点、数字格式、文本语义、序号披露等合规性进行纠错,也可对全文中披露的数据的上下文一致性、表内合计、占比、财务指标、数据的变化值与变化率等进行审核,一键上传即可完成审核操作,可将人眼翻来覆去的如大海捞针般数小时的纠错过程缩短至几分钟,并可呈现比人眼纠错更准确的纠错效果。

 
以下图为例,我们上传了这份法律意见书,轻松地找出如下两个错误,其中第二张图中文章结尾中的句号重复错误在最新更正的法律意见书中尚未修改。

 


除此之外,本系统还可以找出披露文档中肉眼不易觉察的文字重复、数字格式披露错误、序号披露错误等,如下图所示:

针对于债券募集说明书、招股说明书、年报等大量披露财务数据的文档,本系统也可对文档中的财务数据进行全方位、地毯式的审核,包括但不限于表格内计算结果的校验、财务数据上下文一致性校验、占比校验、财务指标校验、变化值和变化率的校验等,如下图所示:

此外,由于披露文档中的文字和数据大多援引自其他文档,本系统也可支持跨文档信息的交叉核验,如债券募集说明书与法律意见书的交叉核验、招股说明书与审计报告信息的交叉核验等,可直击用户痛点,实现快速准确的审核。我们坚信,技术的发展不仅仅在于提升个别劳动力的效率,更在于全方位的社会生产力革新。百年前,计算机逐步取代了算盘,实现了社会经济发展的飞跃。在人工智能技术飞速发展的今天,我们期待着新的技术可以将更多的人力解放出来,让从业人员更专注地泼洒专业和智慧,以企盼一个更省力、更高效的未来