首页 体育 教育 财经 社会 娱乐 军事 国内 科技 互联网 房产 国际 女人 汽车 游戏

国内接收论文占四成,图神经网络大火,ACM

2019-12-17

ACM CIKM 全称为,是国际计算机学会主办的数据库、常识办理、信息检索范畴的重要学术会议。自 1992 年初次举办以来,它现已在全球的 8 个国家举办过 27 次会议,本年的大会是 CIKM 第2次来到我国。

在 11 月 3 日到 7 日举办的大会中,Steve Maybank、韩家炜、裴健和石建萍等闻名学者都将宣布主题讲演。此外大会还有十余场职业讲演,以及谈论会议等活动。

本届大会招引了超越 700 人前来参会,热度颇高。一起,许多华人学者和研讨也成为了大会上的亮点。

本年的 CIKM 收到 1676 篇提交论文,经过同行评定,共有 202 篇长论文、107 篇短论文和 37 篇运用研评论文被接纳。总承受率约为 21%。

为了促进人工智能、大数据等方向的业界研讨,本年的大会论文也新增了运用论文 Track,与学界 Track 并排。一切的接纳论文都有口头宣和解海报展示。

「在学术研讨取得必定开展之后,咱们有必要评论怎么把这些新技能转换到实践的问题中,」本届大会主席、澳大利亚科学院院士、悉尼大学教授陶大程标明。「这可以处理工业界此前无法处理的问题。在工业界,咱们也可以重新的视点发现问题。」

在1700余篇提交论文中,来自我国的学术组织和公司占有了其间的 700 余篇,份额超越四成,成为了本届大会上提交论文数量最多的国家。

CIKM 2019 大会程序委员会主席、清华大学计算机科学与技能系副教授崔鹏说道:「近年来,国内学者在人工智能等范畴的学术会议上正扮演着越来越重要的人物。在数据发掘范畴,近三年我国也呈兴起的态势。最近研讨水平的前进,需求感谢方针环境的支撑,以及相关工业开展的推进。」

把目光放到更远,其实华人在数据发掘范畴中一直以来都有着很大奉献。其间最为闻名的当属 IEEE、ACM 院士,伊利诺伊大学香槟分校教授韩家炜,他被以为是数据发掘的「开山鼻祖」,论文被引用量超越 17 万次,H-index 高达 171。数据发掘尖端会议 KDD,便是在在韩家炜等人的推进下成为了重要的学术会议。本年,韩教授也作为程序委员会资深成员来到了大会现场。

「在数据发掘范畴里有许多闻名的华人学者,包含韩家炜,俞士纶、Wang Ke、吴信东等等,」陶大程介绍道。「他们对推进数据发掘的开展作出了出色的奉献。纵观前史,华人在数据发掘范畴里起着非常重要的方位。」

CIKM 2019 论文奖项分为三个:最佳研评论文、最佳运用论文与最佳 Demo。

最佳研评论文由来自以色列内盖夫本-古里安大学的 Noy Cohen 等人取得。

论文链接:http://www.cikm2019.net/attachments/papers/p821-cohen-shapiraA.pdf

摘要:近来,非机器学习人士也期望可以运用相关的算法进行运用。其间一个首要的应战是,他们需求挑选算法并用它来处理问题。假如可以挑选正确的算法,在给定数据集、使命和点评办法的状况下可以使算法得到很好的作用。

本文中,研讨者提出了一个名为 AutoGRD 的算法,这是一种新颖的元学习算法,用于算法引荐。AutoGRD 首先将数据标明为图,并将其隐式标明提取出来。提取出来的标明会被用来练习一个排序元模型,这个模型可以精确地对未见数据集供给体现最好的算法。研讨者将这一算法在 250 个数据集进步行了测验,在分类和回归使命上都体现出了很高的功能,而且 AutoGRD 比现有的元学习 SOTA 模型和贝叶斯算法体现得都要好。

最佳研评论文第二名由北大、微软研讨院和阿里巴巴的研讨者取得。

论文链接:http://www.cikm2019.net/attachments/papers/p409-longA.pdf

摘要:为了描绘实际国际无处不在的联系数据,网络数据现已广泛运用于复杂联系的建模中。因而,将极点映射到低维空间适用于各式各样的猜测使命。许多的研讨运用了成对挨近性,这是实在网络具有的特性。聚类性,即极点倾向于构成各种规划的社区——由此构成一个包含不同社区的层级结构,则是另一种特点。这类研讨却没有引起研讨者的重视。

在本文中,研讨者提出了一种子空间网络嵌入结构,该结构保留了社区经过子空间构成的层级结构,并具有灵敏的维数以及固有的层次结构,而且本质上是层次结构。此外,他们提出子空间可以处理表征层级社区的更多问题,包含稀少性和空间歪曲。

最终,研讨者提出了要降噪的子空间维数的约束条件,这些约束条件经过可微分函数进一步迫临,从而使联合优化成为可能。与此一起,他们还采用了逐层计划来削减由参数过度引起的开支。研讨者进行了各种试验,成果证明了 SpaceNE 模型在处理社区层级结构方面是有用的。

最佳运用论文作者来自阿里巴巴。

论文链接:https://arxiv.org/pdf/1908.10679.pdf

摘要:购物网站上的谈论会影响到用户的购买决议,一起还会招引到大批致力于误导买家的废物谈论。二手商品交易网站闲鱼就饱尝废物谈论困扰。闲鱼的反废物谈论体系面对两大应战:数据的可扩展性以及废物谈论者的敌对行为。

在这篇论文中,阿里的研讨者提出了这些应战的应对计划。他们提出了一个根据图卷积网络的大规划反废物谈论办法——GAS,用于检测闲鱼上的废物广告。这个模型结合了异构图和同构图来捕获内容的本地上下文和大局上下文。离线试验标明,他们提出的办法优于运用谈论信息、用户特征和被阅读商品信息的基线办法。此外,他们还将模型布置在了闲鱼上,每天处理上百万的数据。在线功能也证明了模型的有用性。

最佳 Demo 奖项颁给了 IBM 的研讨者。

论文链接:https://arxiv.org/abs/1909.01606

摘要:深度学习模型正变得无处不在,但大多数软件开发者并非深度学习专家,因而很难用上蓬勃开展的 DL 模型。TensorFlow、pyTorch 等各种不兼容的 DL 编程结构的遍及运用使得这一状况变得愈加糟糕。

为了处理这一问题,IBM 的研讨者提出了一种名为 Model Asset Exchange的体系,使得开发人员可以方便地运用当时最新的 DL 模型。不管底层的 DL 编程结构是什么,该模型都能供给一个开源的 Python 库,该库封装 DL 模型,并运用标准化的 RESTful API 一致编程接口。这些 RESTful API 使得开发者可以在推理使命中运用封装的 DL 模型,无需彻底了解不同的 DL 编程结构。运用 MAX,研讨者封装并开源了来自不同研讨范畴的 30 多个 SOTA DL 模型,包含计算机视觉、自然语言处理和信号处理等。

图神经网络成为最大趋势

这届 CIKM 的主题是「赋能未来日子的人工智能」,可见以深度学习为首要动力的人工智能技能在信息提取、数据发掘范畴中现已成为了干流技能。

「当时,全国际各个国家都在拟定自己的人工智能战略。不仅仅是我国,美国、英国、欧盟、澳大利亚都在拟定自己的战略,」陶大程标明。「咱们以为,未来它会渗透到日子的各个方面。人工智能其间首要是机器学习和深度学习,本届大会期望谈论深度学习和传统的计算学习在未来会有什么样的开展趋势。」

在大会上,许多学者都以为图神经网络方面的研讨成为了最近一段时刻以来,信息提取、数据发掘中的热门,不过在这一方面,人们还有许多可以开展的方向。

「在图卷积神经网络上咱们运用的界说仍是前史性的,还有许多工作要去做,」陶大程说道。「相较于传统算法,人们在图网络的理论剖析上还有所短缺,真实的开展还需求一些时刻。现在,想要让图网络取得很好的作用,往往需求依赖于在参数和模型上的不断调整测验。」

陶大程也标明,即便如此,图网络相对于传统算法仍是展示出了许多优势,并在许多研讨中现已取得了比较好的作用。

崔鹏教授则指出了图神经网络的局限性:「咱们以为问题的中心在于处理拓扑结构,现在咱们遍及的观念是 GCN 现已可以很好地处理其间的一部分了。但另一方面,咱们也发现 GCN 拿手处理的是特征驱动——比方节点的标签是由节点自身的特征决议的,这方面 GCN 做得比较好,可以很好地按捺噪声;假如标签的发生并不是由特征驱动的,而是由拓扑结构决议的,则图卷积神经网络就不能处理问题。」

在常识检索使命中,树立常识网络是处理用户检索需求的重要环节。面向未来,深度学习等技能还有许多应战需求处理。「从学术研讨的视点来看,AI 也到了十字路口,」崔鹏标明。「现在的人工智能热潮毋庸置疑是深度学习推进起来的。但到今天为止,咱们也看到了许多问题,包含鲁棒性、可解释性、公平性等等。」

现在,ACM CIKM 2019 大会正在北京举办中。今明两天,大会首要环绕机器学习、深度学习方面的理论和运用,以及工业界在相关范畴的研讨进行研讨。机器之心也会重视后续内容,并为读者带来新的音讯。

热门文章

随机推荐

推荐文章