在人工智能的浪潮中,企业如何借势 AI 进入发展的快车道?2018年1月12日,由达观数据主办的达观开放日在深圳思微SimplyWork如约举行,现场聚集了通信、金融、制造等行业的创始人、商务、产品相关的管理者。 来自微软、达观数据、神策数据、图...
作者简介 夏琦,达观数据NLP组实习生,就读于东南大学和 Monash University,自然语言处理方向二年级研究生,师从知识图谱专家漆桂林教授。曾获第五届“蓝桥杯”江苏省一等奖、国家二等奖。 本篇博文将详细讲解LDA主题模型,从最底层数学推导...
高斯混合模型(Gaussian Mixture Model)通常简称GMM,是一种业界广泛使用的聚类算法,该方法使用了高斯分布作为参数模型,并使用了期望最大(Expectation Maximization,简称EM)算法进行训练。本文对该方法的原理进行了通俗易懂的讲解,期望读者能够更...
2017年无论是科技领域,还是新闻媒体,都将这一年称为中国的人工智能元年。从学术界、市场的需求、资本的投入还是政府政策的支持都能看出,这也是各行各业开始发力入局 AI 的一年。 这一年国家政策中,“人工智能”首次被写入了全国政府工作报告中,在业界...
近日,达观数据与神策数据达成战略合作。双方本着携手发展、合作共赢宗旨,围绕大数据产业领域展开深度合作,充分发挥双方优势,共同开拓大数据服务市场。 这次战略合作,可谓强强联合,双方都是大数据企业服务领域的佼佼者。前不久,达观数据刚刚获得软...
电商网站物品纷繁海量,搜索是直达用户心中所想最快的途径。 搜索技术薄弱,忽视数据价值 目前,大多数电商网站的搜索扔停留在“呆板化”的阶段,用户必须准确无误输入所要寻找的商品名称,错输、错拼会导致不断重复搜索。在这个过程中,普通电商搜索引擎无...
在这个人工智能备受推崇的时代,即便如华为这样的大型科技企业也无法忽视人工智能的正向作用,因为时代在召唤,科技的助推只会帮助企业更好地释放价值。 企业堆积海量信息,合理利用才是解决之道 科技企业充斥着大量有复用价值的数据、资料和内容...
随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本数据又是数量最大的一类。文本分类是指在给定分类体系下,根据文本内容自动确定文本类别的过程。文本分类有着广泛...
8月30日,2016年“创青春”上海青年创新创业大赛暨“创业浦东”第五届全球青年科技创新大赛圆满落幕,揭晓优秀项目获奖名单,达观数据获得大赛青芽组季军。 图1 达观数据CEO陈运文带领创始团队参加决赛 “创青春”上海青年创新创业大赛暨“创业浦东”第五届全球青...
近十年来,随着Hadoop生态系统的不断完善,Hadoop早已成为大数据事实上的行业标准之一。面对当今互联网产生的巨大的TB甚至PB级原始数据,利用基于Hadoop的数据仓库解决方案Hive早已是Hadoop的热点应用之一。达观数据团队长期致力于研究和积累Hadoop系统的...