服务热线: 010-62926988
新闻资讯 News
联系我们
  • 客服服务电话:010-62926988
  • Q Q:2115724070
    地址:北京市海淀区西二旗智学苑配套商业用房B座二层202室

  •  
  •  
  •  
  •  

用人工智能工具来评价科学家的影响力

日期: 2016-06-20
浏览次数: 105

来源:Science 2016-06-18 14:06

谁是计算机科学领域的迈克尔·乔丹?这个搜索引擎可以告诉你。

去年秋天,位于华盛顿州西雅图的艾伦人工智能研究所(Allen Institute for Artificial Intelligence)启动了一项名为 Semantic Scholar(语义学术)的服务,向 Google Scholar、PubMed 等在线搜索引擎发起挑战。该程序最初经由 200 万篇计算机科学领域的文献训练,旨在提供一个能在一定程度上理解文献内容的人工智能搜索引擎。它的语料库已增长到 400 万篇文献。现在,研究所正在为 Semantic Scholar 制定另一个同样远大的目标:衡量科学家或科研组织对后续研究的影响力。

该工具能够通过一项专门的“影响力分数”,对文献、作者和研究机构进行排序,目前它仅涉及计算机科学领域,但会在2016年秋季扩展到神经科学领域,并进而扩展到其他学科。例如,该工具发现,计算机科学领域最具影响力的研究机构是麻省理工学院。这当然不出所料。那么,最具影响力的计算机科学家呢?是在圈外鲜为人知的人工智能先驱、加州大学伯克利分校的迈克尔·乔丹。“大家都叫他机器学习领域的迈克尔·乔丹,”西雅图艾伦人工智能研究所的负责人,Semantic Scholar 的创造者奥伦·埃齐奥尼(Oren Etzioni)如此打趣。

如果圈外人发现 Semantic Scholar 的排名可靠,该排名就可能对招聘与教职评估委员会有所帮助,这是因为学术影响力本身就难以量化。过去的方法是统计引用次数,这已经成为学术出版行业的基本衡量标准。汤森路透(Thomson Reuters)、爱思维尔(Elsevier)等机构通过出售文献数据库的使用权,让用户获取被引用次数。

但并非所有的引用次数都具有同等价值。例如,为整篇论文提供灵感的引用,与仅仅在方法论部分简单提及的引用截然不同。因此,粗暴地统计引用次数会对衡量科学家的影响力产生误导。同时,研究者也抱怨道,基于引用次数的传统衡量标准助长了“要么发论文要么被淘汰”的心态,迫使他们不管研究是否重要,都用最快的速度发表论文,以积攒更多的引用次数。

有些人说,需要更直接地衡量文献对将来研究的实际影响。因此,埃齐奥尼的团队在 Semantic Scholar 上搭建了一个新工具,用于生成“影响图”。Semantic Scholar 数据库中的大部分文献是 PDF 格式的,人类可以轻松阅读,但在计算机看来就是一堆毫无章法的文本。要想使计算机阅读起来更像人类,需要借助机器学习,这项技术帮助计算机做出更精确的猜测。例如,计算机不仅要识别论文中的不同部分(引言、方法、结果),还要弄清作者对所引用文献的态度。因此,艾伦研究所的团队通过机器学习,训练一项能够发现这些特征的统计模型。随后,计算机通过对比自己的猜测和人类专家的理解,逐步优化该模型。

埃齐奥尼称,目前系统仅能测量被直接引用的文献的“直接影响力”,但未来的版本会将被引用文献引用的文献的“间接影响力”考虑在内。

试运行

Semantic Scholar (16 June 2016)

这项工具于2016年4 月20 日在 www.semanticscholar.org 首次亮相。《科学》请怀俄明大学(University of Wyoming)的计算机科学家杰夫·克卢恩(Jeff Clune)来试运行。

克卢恩首先查看了“影响图”内他本人的近邻。“非常有趣,”他说,“我能看到我的职业生涯受哪些科学家影响最大、我启发了哪些科学家,以及关于任何其他科学家的这类信息。”大多数结果正如克卢恩所料,他受自己导师的影响,他影响了自己的研究生和博士后,但也有一些出乎意料的结果。比如,有一个他不熟悉名字的人,受他论文启发,做了大量的后续研究。

克卢恩相信,除了娱乐价值外,这项工具可能在学术招聘和晋升过程中有一定价值。负责做决定的委员会不仅要按工作成果为候选人排名,同时也肩负预测候选人未来影响力的重任。Semantic Scholar 试图通过测算工作成果的“速度”和“加速度”,衡量人们引用某些研究的速度以及将来的趋势,来揭秘研究领域内的热点。克卢恩说,部门委员会“已经在粗略地计算这些信息了”,因此他预测 Semantic Scholar 的数据会被投入使用。

但 Semantic Scholar 的某些特点也令他担忧。在某种程度上,Semantic Scholar 是一个“黑箱”,克卢恩说。“人们能够理解这些结果是怎么来的吗?”

埃齐奥尼承认,算法生成结果的过程有些隐晦。“在机器学习的过程中,总是需要一些权衡,”他说道,“当鼠标移到数字上时,显示一个关于数据来源的范例,这或许有所帮助。”

与此同时,机器学习界的迈克尔·乔丹坦然接受了自己排名第一的消息,却归功于别处。“尽管在历史上有各种关于某些科学家或数学家的传说,我个人相信研究人员所处的圈子才最能够预测他们的成功,”他说道,“我自己的圈子里有许多优秀的人,他们有很多卓越的想法。”

埃齐奥尼的团队目前在让 Semantic Scholar 消化大量有关大脑的研究文献。这项工具以及大脑研究者的影响力排名,将于11 月12 日在加州圣地亚哥召开的神经科学学会会议上首次展示。

Hot News / 相关推荐
  • 2021 - 11 - 19
    点击次数: 49
    听说您还在用实验离心时间长,提取效率低的提取试剂盒,不仅白白浪费时间,而且效果也差。您试试京泽血液基因组DNA吧,不仅离心快,而且可以更高效提取产品。本试剂盒适用于各种新鲜及抗凝剂(柠檬酸钠、EDTA等)处理过的全血基因组DNA提取。无需去除红细胞,直接裂解血细胞,DNA特异吸附到硅胶膜上,通过简单漂洗去除杂质,可快速纯化得到基因组DNA。使用本试剂盒得到的血液基因组无蛋白、核酸酶污染,可直接进行...
  • 2019 - 04 - 24
    点击次数: 171
    科学家们已经揭示了大脑中和学习、记忆、行为和心情有关的关键受体的结构。这项新研究发表在《Science》上,研究人员第一次揭示了AMPA受体处于天然状态下的结构。这项发现将为揭开一系列神经系统障碍和疾病背后的机制带来新思路。图片来源:Science“大脑中有一些基本的电学开关。”该研究通讯作者、俄勒冈健康与科学大学(Oregon Health and Science University,OHSU...
  • 2019 - 04 - 10
    点击次数: 184
    免疫系统是每个人的盔甲,免疫系统一旦出问题,人体便会全面性地出问题。免疫系统出问题,可能是它失去工作能力,还有一种更可怕的情况,便是免疫系统对人体“叛变”乃至“倒戈一击”,对自己的身体进行攻击——这种可怕的疾病就是红斑狼疮。美国的知名演员和歌手赛琳娜·戈麦斯(Selena Gomez),就是红斑狼疮的受害者:她的病情最终影响到了肾脏,还因此接受了好友捐赠的一颗肾脏进行了肾移植:2019年...
  • 2019 - 04 - 03
    点击次数: 131
    一项发表在《eLife》上的新研究发现了一种蛋白质是一种特殊的癌细胞生存所必需的。这项研究最早发表在bioRxiv上,发现了一个叫做沃纳综合症解旋酶(Werner syndrome helicase,WRN)的蛋白质是治疗一类高微卫星不稳定性(microsatellite instability-high,MSI-H)的肿瘤病人的新靶点。图片来源:eLifeMSI是癌细胞的一个特点,其DNA错配修...
  • 地址:北京海淀区西二旗西路热力公司院内泰禾文化园二层
    电话:010-62926988
     
    邮编:330520
    Copyright ©2005 - 2013 北京逸优科技有限公司
    犀牛云提供企业云服务
    友情链接: