达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本数据又是数量最大的一类。文本分类是指在给定分类体系下,根据文本内容自动确定文本类别的过程。文本分类有着广泛...

8月30日,2016年“创青春”上海青年创新创业大赛暨“创业浦东”第五届全球青年科技创新大赛圆满落幕,揭晓优秀项目获奖名单,达观数据获得大赛青芽组季军。 图1 达观数据CEO陈运文带领创始团队参加决赛 “创青春”上海青年创新创业大赛暨“创业浦东”第五届全球青...

近十年来,随着Hadoop生态系统的不断完善,Hadoop早已成为大数据事实上的行业标准之一。面对当今互联网产生的巨大的TB甚至PB级原始数据,利用基于Hadoop的数据仓库解决方案Hive早已是Hadoop的热点应用之一。达观数据团队长期致力于研究和积累Hadoop系统的...

  前言 熟悉web前端开发的人都知道,浏览器在请求不同域的资源时,会受到浏览器的同源策略影响,请求资源有可能不成功,这也就是我们前端常常提到的跨域问题。这类问题往往会拖延项目推进,困扰着前端开发者。本文将从技术层面全面解析跨域问题的由...

号称“推荐系统之王”的电子商务网站亚马逊曾宣称,亚马逊有20%~30%的销售来自于推荐系统。其最大优势就在于个性化推荐系统,该系统让每个用户都能有一个属于自己的在线商店,并且在商店中能招到自己最感兴趣的商品。美国著名视频网站Netflix曾举办推荐系...

本文曾在infoq大数据微信群和数据猿直播平台上进行过分享,是对分享内容最直观的表达,同时对推荐结构和算法解释的也很详尽。 随着移动互联网技术的迅猛发展、互联网信息的爆炸式增长和种类的纷繁复杂,导致用户常常在面临信息选择时感到无所适从。这种选...

在搜索、推荐、广告引擎中,系统会通过复杂算法生成一个最终的结果列表。用户在看到这个结果列表时,未必都会对排序满意,比如有时觉得排序的顺序有问题,或者发现一些不符合喜好的item。如果从算法层面来调优,总会有按住葫芦起了瓢的感觉,优化了某些ba...

达观数据是为企业提供大数据处理、个性化推荐系统服务的知名公司,在应对海量数据处理时,积累了大量实战经验。其中达观数据在面对大量的数据交互和消息处理时,使用了称为DPIO的设计思路进行快速、稳定、可靠的消息数据传递机制,本文分享了达观数据在应...

1深度学习背景 深度学习是近十年来人工智能领域取得的最重要的突破之一,通过建立类似于人脑的分层模型结构对输入数据逐级提取从底层到高层的特征从而能很好地建立从底层信号到高层语义的映射关系。 近年来谷歌微软IBM百度等拥有大数据的高科技公司相继投...

1、引言 从人类文明诞生的那一刻起,数据就伴随我们而生——人类交流信息所用的文字和语言,计量距离或数量使用的记号和图案,观察自然所积累和传承的经验等,都是数据构成的。这些数据在百万年历史长河里,为人类文明的发展进化带来了难以估量的巨大价值。 ...