游客

创新工场、搜狗、今日头条联手打造中国最大AI科研数据集与世界级竞赛平台

游客 2017-08-15 10:55:54    201509 次浏览

8月14日,创新工场、搜狗和今日头条联合宣布三方携手发起 “AI Challenger全球AI挑战赛”。 本次竞赛三方联合旨在打造中国最大的科研数据集与世界级AI竞赛平台,推动中国人工智能领域科研创新。据悉,大赛第一年启动将开放超过1000万条中英文翻译数据、70万个人体动作分析标注数据、30万张图片场景标注和语义描述数据,是国内迄今公开的规模最大的科研数据集。基于此次开放的数据集,AI Challenger全球挑战赛面向全球AI科研人才广发英雄帖,致力于促进人工智能行业向更为开放、融合以及国际化的方向发展。

在人工智能领域,数据的质和量是科学研究与产品技术研发的核心。高质量训练数据对机器学习模型的建立和优化有关键性的作用。建立大规模、高水准的标注数据集,是推动AI科研和技术前进的驱动力。此次创新工场、搜狗、今日头条三方联手,在发布会上共同宣布 "AI Challenger 全球AI挑战赛" 的社会责任宣言:“数据、算法、计算能力是人工智能的三大基石,其中,数据更是人工智能科研的最宝贵资产。没有足够好的数据,就无法取得世界顶级的科研成果。在此方面,学术界和创业团队所能获得的数据资源通常远少于产业界中的顶级企业。因此,将高质量的数据集建设与科学研究、技术产品研发、人才培养有效结合,对人工智能发展具有重大意义,也是身为产业先驱应尽的一份社会责任。”

创新工场,搜狗与今日头条是国内最专注于人工智能领域的三家公司,创新工场作为业内最早在人工智能领域布局的投资机构之一,自2016年下旬成立人工智能工程院,积极推动AI的研究与技术朝向产业实践转化。搜狗是最先将人工智能技术应用落地的互联网公司,语音、图像识别,自然语言理解,机器翻译等技术均已应用于搜狗相关产品当中,包括搜狗搜索,输入法,机器同传等产品,在产业实践中积累了大量语音、文本、图像、视频等数据集,同时沉淀了深厚的计算机视觉、自然语言理解、数据挖掘等方面的技术能量。今日头条同样是最早一批将人工智能技术应用于产品的公司,也是把算法、工程、产品、运营在人工智能应用层面结合得最好的一家公司,在产业实践中积累了大量文本、图像、视频等数据集,并沉淀了深厚的计算机视觉、自然语言理解、数据挖掘等方面的技术能量。AI Challenger全球AI挑战赛的诞生,也是三方拿出实际行动推动人工智能行业发展一次意义重大的集体宣誓。

对于发起本次合作,创新工场董事长暨CEO、创新工场人工智能工程院院长李开复表示:“在30多年前自己作为AI科研人员的时代,能接触到真实世界的海量数据是个遥不可及的梦想。如今,伴随互联网和移动互联网而来的大数据、高效的计算机运算能力等条件都齐备的环境下,有了AI Challenger这样的开放数据集和竞赛平台对于AI科研与开发人员是个难得的契机。AI Challenger致力于解决数据集缺失的问题,为人工智能科研免费提供海量数据,辅以强大的学术界和产业界专家指导,全力支持国内外的高校、研究机构、产业界科研人才一起来挑战人工智能的未来可能性。”

搜狗CEO王小川表示:“人工智能本质是建立在大数据和机器学习的基础之上。目前,搜狗以语言为核心的人工智能技术,已经通过问答、语音和翻译等形态应用于搜狗搜索和输入法等诸多产品中,并积累的大量的用户与数据规模。其中搜狗的语音输入日频次已达2.6亿次;搜狗的实时机器翻译技术也在包括乌镇世界互联网大会等数百场会议上进行了落地应用。我们希望能够利用搜狗的优质数据和应用场景助力AI Challenger全球AI挑战赛,让全球科研工作者取得更大的成就与突破,一起推动人工智能行业更快、更好地发展。”

今日头条顾问、技术战略研究院院长张宏江表示:“依托大数据和人工智能技术,今日头条希望实现更高效的信息流动。身处人工智能行业,我们深知,人才和数据是整个行业的未来。这次头条与搜狗、创新工场联合举办AI Challenger挑战赛的初衷,就是希望通过开放数据,吸引更多优秀人才参与到算法模型的开发、设计中来。比赛结束后,所有数据集会向社会全面开放,我们希望尽一些微薄的力量,为学术界、学术人才提供帮助,加强产学研结合,共同推动中国人工智能行业的发展。”

此次三方联合开放的AI Challenger数据集涵盖多个领域,包括最大规模的人体骨骼关键点数据集(用于无人驾驶、安防、体感游戏等场景)、最大规模的图像中文描述数据集(用于图像和视频内容理解、图像标题自动生成等各类应用)、最大规模的口语领域英中翻译数据集(用于同声传译等自然语言处理的各类应用)等。2017年竞赛将区分为五个竞赛任务供参赛者组队报名,设有共计200万元人民币的奖金池。自9月5日起开放参赛队伍线上进行数据集下载,三个月竞赛持续直到12月。参赛的优秀选手还可获得进入三家主办方工作、实习或获得投资的机会,并有机会在国际顶级学术会议上分享获奖心得,得到如上海科技大学教授马毅、旷视科技首席科学家孙剑、前Google研究院高级管理科学家林德康等十余位人工智能领域顶级专家评委的指导和评价。未来,“AI Challenger?全球AI挑战赛”将持续投入,建设和发布更大规模的AI前沿领域高质量数据集,扩大涵盖自动驾驶、智慧医疗、智慧金融、机器人等行业应用中的核心AI需求。

上月,举办了八届的ImageNet挑战赛由创始人之一李飞飞博士正式宣布退出历史舞台。国际上,ImageNet挑战赛曾是每年企业和研究者都极为看重的活动。另一机器学习竞赛平台Kaggle着眼于真实数据和真实问题的解决方案,同样吸引了全球将近百万数据科学家和研究者进行挑战和探索其多元化的公开数据集。创新工场、搜狗、今日头条三方计划在未来三年间投入数千万规模的资金,不断完善平台的建设、扩大数据集的规模,期许AI Challenger在三年内打造来自中国的世界级AI开放数据和竞赛平台,成为推进全球人工智能研究和产业前进的新引擎。 

内容加载中