达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

【作者简介】 刘光敏: 达观数据搜索组研发技术人员,负责搜索引擎架构的设计和研发,搜索集群健康状况监控模块的开发及维护等。   前言 Lucene是一个高性能、可伸缩的信息搜索(IR)库。它可以为你的应用程序添加索引和搜索能力。Lucene是用java实现的……

推荐系统需要根据用户的历史行为和兴趣预测用户未来的行为和兴趣。但对于新用户而言,没有任何的用户行为,如何进行最有效的推荐呢?这就衍生了用户冷启动问题。 在当下,企业拉新成本越来越高,用户的选择面也越来越多,当新用户到达之后,如果不能很快捕……

互联网时代,信息纷繁海量,人们通过搜索引擎直达“心中所想”已是常态。那么搜索引擎到底是如何高效查找目标内容呢?本文主要介绍搜索引擎里一个比较重要的结构——倒排索引。 1 倒排索引简介 倒排索引(英文:Inverted Index),是一种索引方法,常被用于全……

人工智能(Artificial Intelligence,简称AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。既然是期望让计算机智能系统来代替人的脑力劳动,自动化的从事的各项工作,那么如何来衡量人工智能的实际水平呢……

  1. 前言 互联网技术和大数据技术的迅猛发展正在时刻改变我们的生活,视频网站、资讯app、电商网站等每天都有大量的活跃用户在不断的产生海量的用户行为,同时,每天又都产生大量的新增PGC或者UGC内容(如小说、资讯文章、短视频等)。 从推荐系统的角度来……

互联网的出现和普及给用户带来了大量的信息,满足了用户在信息时代对信息的需求,但随着网络的迅速发展而带来的网上信息量的大幅增长,使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了,形成了信息过载(in……

选自《智能Web算法》(第二版) 达观数据编译 机器学习是人工智能研究领域的重要方向,在大数据时代里,对数据采集、挖掘、应用的技术越来越受到瞩目,并越来越创造出巨大的价值。 那么在人工智能和大数据的开发过程中,有哪些特别需要注意的要……

在机器人围棋大胜李世石、柯洁之后,人工智能越来越火。作为一项新兴技术,智能问答也是人工智能中必不可少的一环。智能问答一般用于解决企业客服、智能资讯等应用场景,实现的方式多种多样,包括简单的规则实现,也可以基于检索实现,还可以通过encoder-d……

移动互联网的兴起让我们能够更加简单和方便地获取信息,但更多的选择也带来更多的困扰——面对这些层出不穷的信息和服务带来的困扰,个性化推荐技术迅速崛起。达观数据在这方面做了很多提升推荐质量、推荐效率和系统可靠性的工作,并为企业客户提供了包括私……

在日前举行的2017 CSDI 中国软件研发管理行业峰会上,包括摩拜单车创始人及CTO夏一平、华为首席系统工程专家徐琦海、京东云、携程等一线互联网企业大数据平台负责人等在内一线技术大咖齐聚一堂,分享了各自领域的顶尖技术实践。在峰会大数据专场上,达观数……