词性分析

词性图例

词性说明

词性标注为分词结果中的每个单词标注一个正确的词性,确定每个词是名词、动词、形容词或其他词性。

词性构成比例

词性图例
词性构成比例说明
词性比例构成对已标注的词性进行汇总,统计了各个词性在文本中的所占比例。

实体识别

实体图例
实体识别说明
实体识别是识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。

自动摘要

20%摘要
30%摘要
40%摘要
50%摘要
达观数据自动摘要文本

摘要提取说明

自动摘要是计算机自动从原始文本中提取简单连贯的短文以反映中心内容。

观点提取

观点提取说明

观点提取常用于对网络评论的概括与描述,能发现评论的主流观点并选取最有代表性的若干关键词和典型评论对该观点进行描述

词云

信息提取词云说明

信息提取是把文本中包含的信息进行结构化处理。并将抽取的信息以统一形式集成在一起。
现以词云的形式进行展示,依词语显示大小来体现其重要程度。

文本分类

文本分类说明

文本分类是利用计算机对文本内容按照一定的标准进行分类,不同企业对于分类的标准不尽相同。

权重说明

  • 少量相关(0-0.5)
  • 一般相关(0.5-0.85)
  • 非常相关(0.85-1.0)

情感识别

情感识别说明

情感识别即文本倾向性分析,就是计算机判断人们的看法或评论是属于对事物的积极或消极意见。

情感指数

  • 情感微弱:0 - 0.2
  • 情感一般:0.2 - 0.4
  • 情感强烈:0.4 - 0.8
  • 非常强烈:0.8 - 1

语义联想

语义联想说明

语义联想是对从文本中提取出来的实体进行逻辑关联,并从全网获取该实体的相关信息构建整体关系。

文本审核

文本审核说明

文本审核是利用智能算法对文本内容进行整体分析,判断其是否含有涉政、涉黄、反动、广告等敏感内容并给出违规权重。

权重说明

  • 反动:正常(0-0.5) 反动(0.5-0.75) 严重反动(0.75-1.0)
  • 涉黄:正常(0-0.5) 涉黄(0.5-0.75) 严重涉黄(0.75-1.0)
  • 涉政:正常(0-0.5) 涉政(0.5-0.75) 严重涉政(0.75-1.0)
  • 广告:非广告(0-0.5) 广告(0.5-1)
  • 文本质量:正常(0-0.5) 低质量(0.5-1.0)
返回顶部