达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

第三届“达观杯”算法大赛颁奖典礼圆满落幕,激发信息抽取创新思路

9月 21 日,2019 “达观杯”文本智能信息抽取挑战赛在北京长峰假日酒店顺利举行。经过两个月的激烈角逐,实力卓群的 10 强决赛队伍从近3000名参赛选手中脱颖而出并在颁奖典礼上进行了方案汇报,最终由tonyxu战队来自南京的算法工程师徐恒,赢得冠军,获得三万元现金大奖等丰厚奖励。

 

3

大赛背景

自2017年以来,由达观数据主办的“达观杯”系列算法大赛至今已经举办了三届,在全国范围内引起极大关注的同时也陪伴和见证了中国NLP爱好者们的成长。第一届的赛题为“个性化推荐”,第二届的赛题为“文本分类”;今年的“达观杯”文本智能信息抽取挑战赛以“信息抽取”为题,赛题同样来源于达观的真实业务数据。比赛给定一定数量的标注语料以及海量的未标注语料,评估选手在预测集上识别三个字段的能力。

 

信息抽取是目前人工智能领域许多应用的基石,对产业界有着重要的实用意义。达观数据作为中文自然语言处理的领军企业,已经将信息抽取技术应用于金融、制造、通信、法律、审计、媒体、政府等多种文字密集型行业。

 

通过提供业务场景、真实数据、专家指导,达观数据秉承初衷,期待能通过每年一届的“达观杯”算法大赛带动产学研融合,为业界选拔和培养更多卓越人才,见证更多的前沿研究成果落地。

 

大赛自6月28日在Biendata平台上线以来,共吸引选手近3000人,组成1258支队伍参赛。参赛选手来自国内外各大高校、科研机构及企业,其中来自985、211的选手占报名人数的40%,BAT等多个知名企业均有代表参与。

 

颁奖现场

一等奖

【tonyxu】  来自南京的徐恒以单人身份参赛,凭借出色的技术和106次提交的毅力斩获冠军荣誉。

二等奖

【xlx_444444】  以单人身份参赛的徐晓亮是湖南大学硕士研究生,目前主要从事文本分类、机器翻译、实体识别等nlp相关工作。

【sixcluster】  这是一只来自浙江大学的战队,由在读及已毕业的五位博士及硕士研究生组成,他们是:姜兴华、黄颖骅、严雨姗、钱炜、诸凯丽。

三等奖

【whaido】  目前就职于太平洋保险集团的卢凌云,致力于NLP相关技术的研究及创新项目的孵化工作。

【poorman】  团队成员马文翔、王慧、付斌斌分别来自山东大学、中山大学和华南理工大学。“达观杯”是这支团队第一次参加算法竞赛。

【西南交大一枝花】  是来自于西南交通大学信息科学与技术学院,计算机科学与技术专业的一支研究生团队,成员有:刘赟、别勇、罗友恒、曾嵛、马敏博五人。

优胜奖

【Arrow】  罗怀芍是一名西南交通大学研究生。他的研究方向是情感分析,机器阅读理解。

大白】  团队由梁少强、田佳来、魏强、王煦中四名队员组成,在许多竞赛中都有出色表现,这是本支队伍第二次参加“达观杯”并获奖。

【sk2】  刘伟棠在日常工作中主要从事文本、警情、笔录等公安行业文本挖掘工作。

【deja vu】  团队的主要成员来自微软,从事人工智能领域的相关工作,成员三人:黎彬、刘淑雯、崔庆才。

 大咖对话

达观数据创始人兼CEO陈运文博士,达观数据联合创始人、本届“达观杯”文本信息智能抽取挑战赛命题人高翔,达观数据华北区总经理徐红大赛合作伙伴浦软孵化器、浦软创投项目部负责人易欢,以及在自然语言处理领域享有盛誉的学术界权威——清华大学长聘教授、博士生导师、中国中文信息学会语言与知识计算专委会主任李涓子应邀作为颁奖嘉宾并出席了本次活动。

9

 

达观数据创始人陈运文发表开场致辞时表示,希望通过达观杯比赛让年轻朋友增长见识、积累经验,在未来的职业发展当中取得越来越好的成绩。未来NLP是大有可为的,达观数据作为行业的领军者,希望能够聚拢大家、发挥智慧、共同攻克难题,相信未来会有越来越多的智能化系统发挥作用,改变人们的工作方式和生活方式。

 

10

 

本次活动同样是一场学术界与产业界思想交流的盛宴,会上清华大学李涓子教授发表了题为《知识图谱与表示学习》的演讲,从第三代人工智能和知识图谱的关系出发,为现场来宾和参赛选手分享了团队研究领域的前沿成果。并介绍了在”数据-信息-知识-智能”的时期,知识图谱作为实现智能系统的一个基础设施,如何通过知识引擎,去构建从数据到知识的转化,实现机器智能的研究进展。

 

11

 

达观数据技术带头人之一,本届“达观杯”出题人高翔带来了《自然语言处理的应用和实践》主题演讲,与现场众多的年轻参赛者进行了交流。在分享中,高翔对赛题和智能文本信息抽取技术进行了深入解读,总结并点评了获奖选手的方案选用策略。最后,他结合实际工作场景分享了算法选择建议。他强调,技术的价值在于服务客户,无论小业务还是大场景,无论是底层还是上层,信息抽取技术都是无法绕开的重要环节,对产业界有重要的意义。

 

下一届达观杯,明年我们再见!

现场回顾

在达观数据微信后台输入关键字“2019达观杯”,获取颁奖典礼PPT下载链接