达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

互联网时代,信息纷繁海量,人们通过搜索引擎直达“心中所想”已是常态。那么搜索引擎到底是如何高效查找目标内容呢?本文主要介绍搜索引擎里一个比较重要的结构——倒排索引。 1 倒排索引简介 倒排索引(英文:Inverted Index),是一种索引方法,常被用于全……

人工智能(Artificial Intelligence,简称AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。既然是期望让计算机智能系统来代替人的脑力劳动,自动化的从事的各项工作,那么如何来衡量人工智能的实际水平呢……

  1. 前言 互联网技术和大数据技术的迅猛发展正在时刻改变我们的生活,视频网站、资讯app、电商网站等每天都有大量的活跃用户在不断的产生海量的用户行为,同时,每天又都产生大量的新增PGC或者UGC内容(如小说、资讯文章、短视频等)。 从推荐系统的角度来……

互联网的出现和普及给用户带来了大量的信息,满足了用户在信息时代对信息的需求,但随着网络的迅速发展而带来的网上信息量的大幅增长,使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了,形成了信息过载(in……

选自《智能Web算法》(第二版) 达观数据编译 机器学习是人工智能研究领域的重要方向,在大数据时代里,对数据采集、挖掘、应用的技术越来越受到瞩目,并越来越创造出巨大的价值。 那么在人工智能和大数据的开发过程中,有哪些特别需要注意的要……

在机器人围棋大胜李世石、柯洁之后,人工智能越来越火。作为一项新兴技术,智能问答也是人工智能中必不可少的一环。智能问答一般用于解决企业客服、智能资讯等应用场景,实现的方式多种多样,包括简单的规则实现,也可以基于检索实现,还可以通过encoder-d……

移动互联网的兴起让我们能够更加简单和方便地获取信息,但更多的选择也带来更多的困扰——面对这些层出不穷的信息和服务带来的困扰,个性化推荐技术迅速崛起。达观数据在这方面做了很多提升推荐质量、推荐效率和系统可靠性的工作,并为企业客户提供了包括私……

在日前举行的2017 CSDI 中国软件研发管理行业峰会上,包括摩拜单车创始人及CTO夏一平、华为首席系统工程专家徐琦海、京东云、携程等一线互联网企业大数据平台负责人等在内一线技术大咖齐聚一堂,分享了各自领域的顶尖技术实践。在峰会大数据专场上,达观数……

1 NER简介 NER(Named Entity Recognition,命名实体识别)又称作专名识别,是自然语言处理中常见的一项任务,使用的范围非常广。命名实体通常指的是文本中具有特别意义或者指代性非常强的实体,通常包括人名、地名、机构名、时间、专有名词等。NER系统就……

人类自诞生以来就伴随着各种信息的生产和获取,如今这个信息爆炸的 DT 时代,人们更是被各种信息所包围。我们知道,人获取信息的方式主要有被动获取和主动获取两种,其中被动获取就是推荐的方式、主动获取就是搜索的方式。 获取信息是人类认知世界、生存发……