
新智元报说念好利来 丝袜
剪辑:桃子
【新智元导读】21世纪最具影响力的25篇论文中,AI论文居然独占鳌头!从席卷民众的ResNet到奠定ChatGPT基础的Transformer架构,Nature独家揭秘民众高被引论文。
21世纪第一个25年,AI边界被引最高25篇论文齐有哪些?
近日,Nature头版独家著作,揭秘了不同科学边界最具影响力的论文。

然则,令东说念主巧合的是,那些广为东说念主知的科学发现:从mRNA疫苗和CRISPR基因剪辑时刻,到希格斯玻色子的发现和引力波的初度测量,并莫得出现时这些入选的论文中。
色狼他们得出论断,被引最高的论文,正是描摹科学要领、软件器用或系统性综述的「幕后骁雄」。
那么,齐有哪些论文上榜了呢?

援用:科学影响力的估量圭臬
援用是学术界估量论文影响力的伏击标的,作家通过援用来请安前东说念主的责任。
Nature的分析基于五个学术(涵盖了21世纪数千万篇论文),通过取中位数名次,筛选出本世纪最受援用的25篇论文。
遵守败露,东说念主工智能、培植磋磨质料培植、统计、磋磨软件关系的论文占据了榜单前方。
独一例外是一篇2004年对于执行的创始性论文,这项责任为作家取得了2010年的诺贝尔物理学奖。
AI崛起,ResNet登顶
东说念主工智能论文,在本世纪援用榜单中独领风致。
位居榜首的是,微软团队2016年发表的一篇论文——Deep Residual Learning for Image Recognition。
这恰正是统统东说念主熟知的「深度残差学习」神经集结——ResNets的开山之作,由AI大牛孙剑带队等东说念主完成。

论文地址:https://arxiv.org/abs/1512.03385
ResNets惩处了信号在多层集结合传播时衰减的问题,让磋磨东说念主员省略窥探约150层神经集结。
这大致是当时成例神经集结层数的5倍。

该论文初度看成预印本发布于2015年末,微软团队凭借其在图像识别竞赛中夺冠。
ResNets的冲破为AI迅速发展铺平了说念路,催生了AlphaGo、AlphaFold、ChatGPT等模子出身。
现履新于麻省理工学院的何恺昭示意,「在ResNets之前,深度学习并不那么『深』」。
据统计,这篇论文的援用量在10万-25.4万次之间。在五个数据库中有两个将其列为第一,两个列为第二,一个列为第三,空洞中位数名步骤一。

Google Scholar这篇论文被引数已超25万
此外,2017年谷歌发表的Attention is all you need排位列七,论文中提倡了驰名的Transformer架构,成为ChatGPT等大模子的中枢。

论文地址:https://arxiv.org/pdf/1706.03762
AI论文的高援用量,主淌若因为其等闲的诓骗边界和快速的磋磨进展。
一样,AI教父Geoff Hinton指出,「AI论文自然具有援用上风」。
2012年,Hinton指导学生Ilya、Alex Krizhevsky发表的AlexNet论文名步骤八。
这篇巨作展示了神经集结在图像识别竞赛中的压倒性上风,掀翻了其后的深度学习创新。

论文地址:https://proceedings.neurips.cc/paper_files/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf

此外,开源也助推了AI论文的援用。
比如名步骤六的Random Forests论文先容了一种开源、易用的机器学习算法,等闲诓骗于多个边界。

论文地址:https://link.springer.com/article/10.1023/A:1010933404324
需要评释的是,很多AI论文以预印本表情发布,加多了援用统计的复杂性。
OpenAlex数据库尝试合并预印本与最终出书物的援用,而Google Scholar则竭力将吞并作品的统统版块归类并汇总援用。
磋磨软件:科学家的「器用箱」
除了AI边界,磋磨软件关系论文在本世纪援用榜单中进展亮眼。
名步骤二的论文由Thomas Schmittgen等东说念主于2000年发表,先容了一种用于定量PCR(团员酶链式响应)数据分析的要领。
这篇论文应审稿东说念主条目而生,因其提供了测度基因活性变化的简便公式,被引量最初16.2万次,踏进历史前十。

论文地址:https://www.sciencedirect.com/science/article/abs/pii/S1046202301912629
名步骤五的论文,是由英国化学家George Sheldrick撰写,先容SHELX要津套件,用于分析X射线散射模式以揭示分子结构。
这篇2008年的综述论文建议使用SHELX时援用,援用量在7万至9万次之间。

论文地址:https://journals.iucr.org/a/issues/2008/01/00/sc5010/index.html
其他软件论文,如名步骤十五的scikit-learn(Python机器学习库)和名步骤十八的DESeq2(RNA测序分析),因其开源和易用性,成为科学家不行或缺的器用。
统计软件:数据分析的利器
统计软件关系论文,也在榜单中名列三甲。
举例,名步骤15的scikit-learn论文和名步骤22的lme4论文离别为Python和R言语用户提供了弘大的数据分析器用。
名步骤23的G*Power软件论文则匡助生物学家测度执行所需的样本量,以确保统计显耀性。
值得看守的是,R编程言语自身未出现时榜单中,尽管OpenAlex纪录其援用量最初30万次。
这是因为R的斥地者建议用户援用其网站而非学术论文,导致数据库纪录不一致。
这也领导磋磨者:若斥地了有影响力的要津,发表一篇关系论文至关伏击。
癌症与健康:数据初始的洞见
癌症磋磨边界的三篇论文在榜单中占据伏击位置。
名步骤四的Diagnostic and Statistical Manual of Mental Disorders(DSM-5)是神经病学边界的泰斗指南,2013年出书后等闲用于磋磨和临床,界说了精神退却的会诊圭臬。
名步骤九和第十的是天下卫生组织GLOBOCAN格式于2018年和2020年发布的民众癌症统计敷陈,为磋磨者和战术制定者提供了枢纽数据。
名步骤十九的综述论文归来了癌症的「象征性特征」,引发了大量学生投身癌症磋磨。
培植磋磨质料
培植磋磨质料的论文在本世纪援用榜单中熠熠生辉。名步骤三的论文Using thematic analysis in psychology,由心理学家Virginia Braun和Victoria Hannah Clarke于2006年发表,先容了「主题分析」——一种分析定性数据的系统要领。
这篇为学生野心的指南巧合成为本世纪第三高援用论文,透澈篡改了两位作家的办事轨迹。
名步骤11的PRISMA声明(2009年)为系统综述和集合分析提供了27项敷陈模范,援用量在5.3万至13.8万次之间。
2020年更新的PRISMA(名步骤23)一样上榜。名步骤17的论文(2003年)盘考了行径磋磨中的要领偏差,匡助磋磨者提高磋磨严谨性。
参考贵寓:
https://www.nature.com/articles/d41586-025-01125-9