达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

达观企业级智能搜索中台能看懂图片、读懂文字

 

在人工智能技术应用日益丰富及成熟的今天,搜索依然有着举足轻重的地位。信息化的快速普及与覆盖,海量信息扑面而来,聊天、邮件、发文、流程、人力、招投标、网盘等不同业务系统,不断创建、分发、共享知识,极大地提高了企业内部的工作效率,增长企业效益。但是,随着业务系统的不断丰富,海量经验知识散落在不同的系统及存储介质上。如何快速找到、找准知识是企业如何有效应用数据的关键问题。

达观数据结合自身在人工智能领域的技术优势及多年耕耘企业搜索的实践积累,以文本语义向量、图片表征向量为基础、联合传统关键词倒排引擎,串联语义搜索、以图搜索、专家经验语义问答,形成表意搜索矩阵,推出强大的能读懂图片、看懂文字的企业级智能知识搜索中台

 

01要准、还要美出圈的图文语义混排

语义搜索,是利用自然语言处理技术分析用户的搜索Query,准确地捕捉到用户所输入语句后面的真正意图,从而更准确地向用户返回最符合其需求的搜索结果。随着Bert及其衍生Pre-Trained的模型的持续发展,向量一定程度上能很好的表征语义,但单纯的向量搜索,在长文本领域鲜有成功案例;达观企业智能搜索中台基于Elasticsearch,结合传统倒排索引和语义向量优势,使用Faiss加速,保证海量数据在加入语义向量后搜索性能的同时,优化搜索排序效果。

同时,降低向量加入搜索的使用门槛,提供向量索引配置界面,自动协调兼容倒排索引与向量搜索,并合理融合召回结果,保证用户在使用系统时完全感受不到到语义向量的复杂之处,就可以享受由此带来的更好的搜索体验。

 

图文混排索引配置效果展示

文档搜索场景中,结合向量搜索,将文本、图片和表格这三种不同类型的知识聚合展示,提升文档搜索体验的同时,大大提高了搜索的精准度及效率。

 

图文混排效果展示

 

02懂图片,以图搜图

借助自研的高性能、高精度OCR系统平台,图片中文字内容的搜索,是达观智能搜索系统优势之一。但图片内容,岂止文字内容而已,其丰富的色彩、线条表征的含义是搜索者需要查找的重要信息之一。达观企业智能搜索系统结合领先深度学习技术,结合精炼捶打的向量搜索方案,提供达观以图搜图功能。企业用户可以上传海量图片知识,系统将分析图片数据的图片含义向量并存储。当企业员工在需要根据图片直接搜索图片时,所有与该图片相似的图片结果将会以瀑布流布局展示。图片结果支持预览及下载,满足用户的搜图业务。

以图搜图效果展示

03读懂文字,专家知识语义问答

技术的发展,带来的是搜索境界的提升,图谱对知识的高效整合及深度学习向量语义表征,起到了至关重要的作用。知识图谱以期改变的是搜索不再是字符串的匹配,而是根据图谱脉络,让引擎知道一次搜索背后的本质,对应于现实世界的事与物;FAQ,整合的是专家知识,助力的是高频经验的有效共享;阅读理解,从海量的碎片、无结构的知识中,像人一样动态地针对问题,提取碎片信息,汇聚总结为答案。三者相辅相成,组建知识搜索闭环。

达观数据搜索中台,基于真实项目问答需求,结合图谱、FAQ及阅读理解特性,以图谱精准搜索,确保阅读理解的输入精准。在此基础上,辅以FAQ,快速覆盖高频知识需求,打造达观智能知识问答助手。企业可以以海量的经验知识为素材,快速构建成熟的专家知识问答体系,为每个员工配备知识小秘书,协助企业知识高效共享,提升运营效率。

专家知识语义问答效果展示

04产品价值驱动

市场上的人工智能产品琳琅满目,我们希望产品的使用价值高于技术噱头,达观智能搜索平台从积累的无数客户场景和需求中打磨成熟,以产生使用价值为驱动,助力企业搭建繁杂知识获取桥梁的同时,确保知识数据合理安全管控。

目前达观智能搜索中台已经服务新华财经、大华、京东云、碧桂园、OPPO、华为、中兴、联通、佳能、新蓝网、震坤行、上海城建集团、中国科协、顺丰海淘等多个行业领军企业。