达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

岂止Bigbang onestep,达观数据带你领略文本挖掘 oneglance

锤子手机Big Bang的“炸肉”让人眼前一亮,妙在化整为零,即其所谓的语义智能拆分,而后随心所欲。看则科技满分,人性无限,实则换汤不换药,要看的文字一个少不了。即便复制关键词语较之以前,方便很多,但是挑选核心词语仍然是用户不可避免的环节。

image_1avjrvphe1m7t4mhe3u1bfjfcs9.png-203.7kB

真正的智能分词不是简单的割词断句,而是将心比心,减少大片文字负重感,提升用户阅读效率,将核心文本快速生成重要标签,按重要性依次递减,用户重视的关键词语永远排于前列,一眼看到他们想转发的词语。

36kr与达观智能分词的完美融合

36kr作为媒体网站的翘楚,使用达观数据文本标签提取功能后,将大段文本智能分词,完美提取文本精要内容,一目了然。从以下动图可见一斑,在“选中一大片肉”之后,长按出现文本标签,如“锤子科技”、“发布会”、“洗礼”这些关键性的字眼一个没落地提取出来,省去用户长读之苦。

2a89793.gif-1580kB

文本标签提取,达观机器阅读的先遣部队

快消时代,精读无比好,速读长久远。对一个普通的网站用户而言,文本性内容一目十行、囫囵吞枣实为常态,即便如此,仍耗时耗力,此时提取文本标签形成要点供用户使用则事半功倍。

而对媒体、文学、政府等网站而言,管理网站拥有的海量文本资源是一项细碎繁琐且劳心劳力的工作。网站文章一大堆,满屏文字犹如直播弹幕,无法快速了解具体内容,更遑论鉴别其是否涉黄涉政。达观数据贴心满分,为网站管理人员提供文本标签提取服务,提取文本核心词语以生成文章标签,轻松解决内容管理的首要障碍。

达观文本标签提取,无论是to B还是to C,都可以让用户极大提高阅读效率,完成目标内容的阅读与审核。用户想要的效率达观都可以满足。

image_1avilj9ggkkn5r81hqo1159acim.png-34.9kB

文本标签提取与达观文本分类搭配使用,干活不累

达观文本分类,顾名思义,替用户将文本进行自动归类。作为达观机器阅读的主力部队,文本分类可以将海量文本“诸神归位”,并以客观专业的视角分门别类,避免人为主观因素引起的倾向性误差。但客观不代表死板,权重指数以量化的方式告知您此篇文章的类别,有理有据。

image_1avisufg3mv11mdr1p87p8m5oq13.png-21.8kB

通过达观文本标签提取,快速知晓文本大意,做到心中有数;依靠达观文本分类,自动高效完成文章归类,一站式解决内容管理的所有难题。

标签先行,达观搜索引擎助你扫清疑问标签

网站用户阅读已提取的文章标签时,对于某些标签可能想了解更多相关内容,达观搜索引擎可助力网站为用户提供标签相关内容时时搜索,并允许用户为搜索结果进行排序和筛选,精准搜索结果点击范围,快速看到自己想看的。

image_1avj4r1r5rfr227j6kkais751t.png-16.1kB

达观数据专业的技术保证一流的智能分词

达观文本挖掘融合了全套自然语言处理技术和机器学习技术,基础文字处理集成了文本分词、词性标注、句法分析、命名实体识别、文本标签提取等功能模块,基于此再结合SVM、GBRT、logistic regression等机器学习算法,实现认知层次上的文本自动分类,文本标签提取。

image_1avj4tmhh1ce1pt693k1cqoq182a.png-93.4kB