达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

中文语法纠错任务旨在对文本中存在的拼写、语法等错误进行自动检测和纠正,是自然语言处理领域一项重要的任务。同时该任务在公文、新闻和教育等领域都有着落地的应用价值。但由于中文具有的文法和句法规则比较复杂,基于深度学习的中文文本纠错在实际落地的……

在大数据时代,通过对目标人物的轨迹、通信、社交、出行、网络等多模态行为进行挖掘并建立人物画像模型,并依托人物基础特征和高层特征,实例化人物画像,支撑有关部门分析人员全方位了解目标人物的行为、活动、状态、基本属性等信息,同时能够基于人物画……

多模态算法兴起的背景 办公文档是各行各业最基础也是最重要的信息载体,不管是金融、政务、制造业、零售行业等等,各种类型的文档都是业务流转过程中必不可少的数字资料。以银行信贷为例,一笔信贷业务在贷前贷中到贷后全流程中,需要涉及财报、银行流水、……

达观数据与同济大学联合共建的“知识图谱与语义计算联合实验室”,近期发布了围绕新冠肺炎的多跳问答数据集和智能问答系统,该数据集基于COVID-19的七个方面(即百科、防控、物资、诊疗、健康、流行病、英雄)进行数据集梳理并进一步生成1跳(1-hop)、2跳(……

信息技术服务机构是证券期货业金融科技生态的重要组成部分,是支撑证券期货业数字化转型的中坚力量。近期,在中国证监会科技监管局的指导下,中证技术公司组织了15家领先的行业信息技术服务机构,以“证科谈·数字化转型”为主题,分享数字化实践经验和体会,……

什么是RPA?RPA(Robotic Process Automation,机器人流程自动化)是通过特定的、可模拟人类在计算机界面上进行操作的技术,它可以按规则自动执行相应的流程任务,代替或辅助人类完成相关的计算机操作,从而节约人力成本,提高生产效率。 从RPA的定义就可……

导读:中国工程院院士王恩东曾表示:“人工智能如何发展出像人类具备逻辑、意识和推理的认知能力,是人工智能研究一直探索的方向。目前来看,通过大规模数据训练超大参数量的巨量模型,被认为是非常有希望实现通用人工智能的一个重要方向。”随着巨量模型的兴……

在自然语言处理和知识图谱中,实体抽取、NER是一个基本任务,也是产业化应用NLP 和知识图谱的关键技术之一。BERT是一个大规模预训练模型,它通过精心设计的掩码语言模型(Masked Language Model,MLM)来模拟人类对语言的认知,并对数十亿个词所组成的语料……

  导读:NLP领域著名学者,斯坦福大学教授克里斯托弗 · 曼宁(Christopher Manning)在美国人文与科学学院(AAAS)期刊的 AI & Society 特刊上发表了题为《Human Language Understanding & Reasoning》的文章。从NLP学界、业界的现实出发,回……

随着互联网技术的迅速发展,尤其是移动互联网的兴起,新产生的信息呈现爆炸式的增长。为了更好地解决信息获取中的信息过载(Information Overload)和长尾问题(Long Tail),推荐系统应运而生,目前基本上已经成为了各种产品的标配功能。推荐系统是信息过……