词性分析

词性图例

词性说明

词性标注为分词结果中的每个单词标注一个正确的词性,确定每个词是名词、动词、形容词或其他词性。

词性构成比例

词性图例

词性构成比例说明

词性比例构成对已标注的词性进行汇总,统计了各个词性在文本中的所占比例。

实体识别

实体图例

实体识别说明

实体识别是识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。

依存句法

属性图例

依存句法说明

依存句法通过分析语言单位内词语之间的搭配与驱动关系,揭示其句法结构。

语义分布

语义图例

  • 名词
  • 人名
  • 地名
  • 组织机构名

语义分布说明

语义分布是指通过对海量文本进行分词后,使用表示学习生成词汇在高维空间的分布。为了更好的展示词汇间关系,此处将高维空间降维到二维空间进行词汇表示。

语言模型

语言概率: 0.015
2017年4月1日中共中央、国务院决定设立河北雄安新区。因为涉及集中承接北京非首都功能,雄安新区的筹备工作备受关注。近日,央视记者对雄安新区筹备委员会进行了探访。

语言模型说明

语言模型通过计算单词序列的概率分布来评估上下文连接的相对可能性。

语言模型技术广泛使用在信息检索、机器翻译、语音识别等领域。

Demo使用三元语言模型,通过计算从词语距离为3以内的上下文中词语之间的分布概率,来评估文本序列的合理性。

主题模型

主题编号 主题词 概率值

主题模型说明

主题模型是一种在文档中发现抽象主题集合的统计模型,可以挖掘出广泛文本内隐藏的语义结构,帮助用户理解大量非结构化文本。

主题编号:由于文本内隐含的主题是抽象的,其语义内涵不能直接简单的定义,因此不对主题命名,而用编号来表示。

主题词:虽然文本的语义内涵没有明确的定义,但可以通过主题词来进行组织,主题词对抽象的主题进行具象的描述。

概率值:即一段文本属于某个主题的概率值,概率值越高,文本的内容越倾向于某个主题。

语义网络

语义图例

文本中提取的实体
与文本中实体相关的其他实体

语义网络说明

语义网络是指通过对海量文本进行语义分析提取出相互关联的实体关系,进而整体构建语义网络,并使用构建的网络对关键词进行联想,获取和查询概念相关的扩展概念。

自动摘要

20% 摘要
30% 摘要
40% 摘要
50% 摘要
达观数据自动摘要文本

摘要提取说明

自动摘要是指计算机自动从原始文本中提取简单连贯的短文以反映中心内容。

用户可以选择不同的百分比档次,决定摘要信息的长度。

自动摘要功能已经广泛应用在新闻领域,用于解决新闻信息过载给用户造成的困扰,帮助用户提高信息吸收效率,同时降低新闻媒体的人工摘要成本。

观点提取

分析结果:

观点提取说明

观点提取是指使用自然语言处理技术分析一段文本中的主流观点,并选取最有代表性的若干关键词和典型评论对该观点进行描述。

观点提取常用于对网络评论或电商评价的概括与描述,帮助用户快速从海量评论中获取最有价值的观点。

观点提取标签说明

观点
正面指数 负面指数

语义标签

标签 词频

    语义标签说明

    语义标签是指将文本中包含的实体、关系、事件等事实信息进行结构化处理,并将抽取的信息以结构化数据输出的形式集成在一起进行展示,以表现信息的重要程度。

    文本分类

    类别 概率值

      文本分类说明

      文本分类是利用计算机对文本内容按照一定的标准进行分类,不同企业对于分类的标准不尽相同。

      权重说明

      • 少量相关(0-0.5)
      • 一般相关(0.5-0.85)
      • 非常相关(0.85-1.0)

      情感识别

      情感识别说明

      情感识别即文本倾向性分析,就是计算机判断人们的看法或评论是属于对事物的积极或消极意见。

      情感指数

      • 情感微弱:0 - 0.2
      • 情感一般:0.2 - 0.4
      • 情感强烈:0.4 - 0.8
      • 非常强烈:0.8 - 1

      文本审核

      文本审核说明

      文本审核是利用智能算法对文本内容进行整体分析,判断其是否含有涉政、涉黄、反动、广告等敏感内容并给出违规权重。

      权重说明

      • 反动:正常(0-0.5) 反动(0.5-0.75) 严重反动(0.75-1.0)
      • 涉黄:正常(0-0.5) 涉黄(0.5-0.75) 严重涉黄(0.75-1.0)
      • 涉政:正常(0-0.5) 涉政(0.5-0.75) 严重涉政(0.75-1.0)
      • 广告:非广告(0-0.5) 广告(0.5-1)
      • 文本质量:正常(0-0.5) 低质量(0.5-1.0)

      智能作诗

      请输入2~4个字

      智能作诗说明

      使用深度学习和自然语言处理技术开发的智能写诗机器人,能够根据从文本中选取的关键字快速写作五言、七言古诗。

      智能对联

      请输入4~9个字

      智能对联说明

      使用深度学习和自然语言处理技术开发的智能对联机器人,能够从对联语料中学习到对联的各种语境和要求,根据用户的输入给出对应对联。

      文章改写说明

      使用深度学习和自然语言处理技术开发的智能文章改写机器人,能够对文章进行不同风格和不同程度的改写。

      实体关系图谱
      • 金庸小说
      • 三体

      实体关系图谱

      实体关系图谱是一种将抽象化的实体之间的关系转化为具体的可视化的关系,并以将其的形象化展示出来。用小说人物的关系来示例,在实际使用中替换为客户文档中的专业术语、概念、物品名称后,可以用于知识搜索、关系挖掘等功能
      返回顶部