达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

高斯混合模型(Gaussian Mixture Model)通常简称GMM,是一种业界广泛使用的聚类算法,该方法使用了高斯分布作为参数模型,并使用了期望最大(Expectation Maximization,简称EM)算法进行训练。本文对该方法的原理进行了通俗易懂的讲解,期望读者能够更...

2017年无论是科技领域,还是新闻媒体,都将这一年称为中国的人工智能元年。从学术界、市场的需求、资本的投入还是政府政策的支持都能看出,这也是各行各业开始发力入局 AI 的一年。 这一年国家政策中,“人工智能”首次被写入了全国政府工作报告中,在业界...

近日,达观数据与神策数据达成战略合作。双方本着携手发展、合作共赢宗旨,围绕大数据产业领域展开深度合作,充分发挥双方优势,共同开拓大数据服务市场。 这次战略合作,可谓强强联合,双方都是大数据企业服务领域的佼佼者。前不久,达观数据刚刚获得软...

电商网站物品纷繁海量,搜索是直达用户心中所想最快的途径。 搜索技术薄弱,忽视数据价值 目前,大多数电商网站的搜索扔停留在“呆板化”的阶段,用户必须准确无误输入所要寻找的商品名称,错输、错拼会导致不断重复搜索。在这个过程中,普通电商搜索引擎无...

在这个人工智能备受推崇的时代,即便如华为这样的大型科技企业也无法忽视人工智能的正向作用,因为时代在召唤,科技的助推只会帮助企业更好地释放价值。 企业堆积海量信息,合理利用才是解决之道 科技企业充斥着大量有复用价值的数据、资料和内容...

随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本数据又是数量最大的一类。文本分类是指在给定分类体系下,根据文本内容自动确定文本类别的过程。文本分类有着广泛...

8月30日,2016年“创青春”上海青年创新创业大赛暨“创业浦东”第五届全球青年科技创新大赛圆满落幕,揭晓优秀项目获奖名单,达观数据获得大赛青芽组季军。 图1 达观数据CEO陈运文带领创始团队参加决赛 “创青春”上海青年创新创业大赛暨“创业浦东”第五届全球青...

近十年来,随着Hadoop生态系统的不断完善,Hadoop早已成为大数据事实上的行业标准之一。面对当今互联网产生的巨大的TB甚至PB级原始数据,利用基于Hadoop的数据仓库解决方案Hive早已是Hadoop的热点应用之一。达观数据团队长期致力于研究和积累Hadoop系统的...

  前言 熟悉web前端开发的人都知道,浏览器在请求不同域的资源时,会受到浏览器的同源策略影响,请求资源有可能不成功,这也就是我们前端常常提到的跨域问题。这类问题往往会拖延项目推进,困扰着前端开发者。本文将从技术层面全面解析跨域问题的由...

号称“推荐系统之王”的电子商务网站亚马逊曾宣称,亚马逊有20%~30%的销售来自于推荐系统。其最大优势就在于个性化推荐系统,该系统让每个用户都能有一个属于自己的在线商店,并且在商店中能招到自己最感兴趣的商品。美国著名视频网站Netflix曾举办推荐系...