达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

达观智能文本分析系统,赋能企业大数据加工处理

企业面临的痛点和挑战

lQLPDhsXL4e3CvnNAczNBDiwsl5U-9O1UlcB9qkb_QBmAA_1080_460
标签是用来标志产品目标和分类或内容的关键字词,是便于自己和他人查找和定位目标的便捷工具。

下面我们通过几段业务调研,了解一下目前标签应用的现状

lQLPDhsXL2Uk8PDNAorNAmawI8ap_j2jOuUB9qjj0kByAA_614_650

综上反馈,我们得知:面对大量资讯数据,用户亟需一套“智能化”平台,来帮助实现信息的自动分类、打标。只有拥有数据的智能化处理能力,“大数据”才能真正地解放人力,体现它的价值。

达观产品助力企业解决具体问题

打标、分类是达观智能文本分析系统的一个小小应用,目前已经在金融资讯标签、政策分析标签、资讯舆情标签、运营商工单分析标签、生产制造业舆情标签、研报分析标签、论坛/评论舆情分析等场景有非常丰富的项目案例,更有智能文档抽取、文档纠错、文本审核、智能搜索、智能推荐、智能舆情、知识图谱以及RPA等丰富的产品组合,为企业文本智能化办公保驾护航。
达观智能文本分析系统,能根据各行业用户特点,构建多行业专属语义模型,对海量数据进行规模化的采集/对接、有效清洗、融合;自研的融合型NLP算法,更是能对复杂的行业信息和用户行为数据进行字词级、句法级、篇章级的文本分析处理,有效得到相关事件标签、情感标签、产业标签、行业分类标签、地域标签等等。在信息发现、分析、挖掘过程中,保证高准确度的前提下,极大地降低人工成本,文本分析效率相对于人工提升近百倍!
那么,如何从0-1助力企业构建自己的智能标签系统呢?
1、制定科学的标签体系
达观团队会根据用户的需求,在熟悉产业划分体系的背景下,利用以往项目经验结合聚类算法,帮助客户从庞大的一级宏观指标拆分到一级、二级标签直至具体全面的末级细颗粒度标签,从而制定出一套科学的符合客户需求的个性化标签体系,流程效果如:
lQLPDhsXL4e3Ct3NAfPNBDiwdNeOSrXU5EAB9qkb_QCpAQ_1080_499

图 标题体系构建流程

2、PDCA标签优化机制
在NLP领域,没有百分百精确的模型,只有制定专业、合理的标签规划,在执行期间详细记录已发生的badcase,通过分析问题,找到优化标签体系和算法模型的方法,一般三轮优化之后,标签效果就能有非常明显的提升。
lQLPDhsXL4cedGfNAdzNA2CwoCKjZ59bPVQB9qkbrIByAA_864_476

图 PDCA标签优化机制

3、专业智能标签工具
达观智能文本分析系统一站搞定:构建标签体系→标注标签样本→模型训练→模型调优→模型评估→模型上线。下面我们通过几张产品页面截图简单了解一下:
lQLPDhsXL4e3CtHNAY7NBDiwxPdjhTaUCbUB9qkb_QBmAg_1080_398

图 智能标签系统流程

lQLPDhsXL4e3Cl3NAf_NBDiwrd-ZHLTR8q4B9qkb_QCpAg_1080_511

图 预置多套成熟行业标签模型

lQLPDhsXL4e3CIzNAaXNBDiwqbkkqEPEP8sB9qkbwkByAA_1080_421

图 丰富、可配的标签抽取方案

lQLPDhsXL4e3CuLNAgnNBDiwY1jRxNoTl5UB9qkb_QBmAQ_1080_521

图 便捷的在线标注、抽取、审核界面

lQLPDhsXL4e3CcTNAgzNBDiwpWPTWZZeIjcB9qkb_QCpAA_1080_524

图 一键自学习机制,模型不断迭代

在以往的落地项目中,标签的查全率、准确率都达到了90%以上。