中国AI大模型论文数量全球第一，清华力压麻省理工、斯坦福

添加书签

AIGC开放社区
2024-07-08

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！

论文是研究新技术、开发新产品获取“图纸”的重要途径之一，OpenAI的研究人员正是借鉴了Transformer的论文（被引用超过9万次），才开发出了对全球各行业影响巨大的产品ChatGPT。

而论文的数量、通过率和被引用次数是衡量一个国家科技人才素质，以及技术创新能力的重要标准之一。

根据美国最古老大学之一乔治城大学的数据分析平台ETO，在今年5月发布的最新调查报告显示：2017—2022年期间，全球一共发布了125.5万篇与AI相关的论文。

其中，中国发布了24.3万篇AI论文，占到了总数的25%，成为发布论文最多的国家；

美国发布了17.1万篇论文，占总数的18%，排名第二；剩下的论文由欧洲、亚太地区国家贡献。

需要注意的是，ETO只统计了英文技术论文，如果算上中文论文，那么中国发布的论文数量将会更多。

在AI论文研究领域方面，中国对计算机视觉模型、机器人技术成为发布、研究最多的领域总计14万篇左右；在自然语言处理为1.9万篇左右、AI安全方面为2557篇。

从每年被引用次数最多的10%论文来看，美国达到34036篇，中国是29229篇。

如果细分到学术、研究机构，中国AI论文的被引用次数是领先美国的，中国科学院排名第一、谷歌排名第二，清华大学排名第三超过了麻省理工、斯坦福、卡内基梅隆等著名大学。

北京大学、中国科学院大学、上海交通大学和浙江大学在AI论文的发表和被引用方面也很出色。

从企业角度来看的话，谷歌排名第一，发布了6529篇论文，平均每篇被引用次数达到183.8；微软排名第二发布了5558篇，平均引用82.8；腾讯排名第三，发布了2760篇，平均引用54.2；

阿里巴巴排名第四，发布了2518篇，平均被引用42.3；Meta排名第五，发布了2280篇，平均引用181；亚马逊排名第六，发布了2026篇，平均引用43.5；IBM排名第七，发布了1574，平均引用52.5；

三星排名第八，发布了1530篇，平均引用29.3；华为排名第九，发布了1485，平均引用36；百度排名第十，发布了1355篇，平均引用61。

本次报告的其他主要发现：

从2017—2022年，全球AI研究增长了一倍多，这在很大程度上得益于自然语言处理和计算机视觉模型研究的快速增长。机器人研究进展缓慢，但仍然比较明显。

AI安全研究进展很快，但基础比较薄弱。ETO估计，AI安全研究仅占整个AI研究的2%。

中国在AI研究产出方面处于领先地位；但如果仅计算高频率被引用论文数量，美国略高排名第一。

中国科学院的AI研究总量以及高频率引用研究论文，均位居世界榜首。

此外，在2017—2022年期间，大约有40万篇论文是关于AI视觉模型的，整体增长了121%,成为AI增长最快的子领域。典型代表产品有Midjourney、Stable Difusion、DALL·E 3、Sora、Gen-3等。

在2017—2022年期间，大约有13.5万篇论文是关于自然语言处理的，整体增长了104%。典型产品有ChatGPT、文心一言、Kimi、讯飞星火、通义千问等。

其实关于论文数量这个问题，「AIGC开放社区」是深有体会。如果你经常看arxiv、SSRN、《自然》、acm、IEEE等顶级论文平台，以及Huggingface、Github的开源项目就能发现，国内出现频率相当高，而且多数项目创新性都不错，评价也很高。

即便是国外科技巨头谷歌、微软、OpenAI、Meta、苹果等AI论文、项目，华人的贡献也占据了重要地位。

例如，OpenAI的最初ChatGPT研发团队华人有9位，有5位本科是在中国念完的，其中3位毕业于清华大学、1位毕业北京大学、1位毕业华中科技大学。

此外，在上周United Nations在官网发布的最新调查显示，中国在生成式AI（AIGC）申请的专利数量为38210个，美国只有6276个，是其6倍。就算别的国家全都加在一起连中国的一半都不到。

这也充分证明了，中国对生成式AI、大模型的重视程度、技术环境以及拥有庞大的AI人才库。

本文素材来源ETO调查报告，如有侵权请联系删除

END

本篇文章来源于微信公众号: AIGC开放社区

即将举行的活动