arXiv脱离康奈尔,正式单飞
来源:互联网
时间:2026-07-03 14:29:06
靴子终于落地了。arXiv官方博客在6月30日正式发布公告,宣布平台已于7月1日脱离康奈尔大学,以**独立非营利组织**的身份开启了全新篇章。
新组织正式命名为arXiv, Inc.,已依据特拉华州法律注册为非营利、无股票公司,并且拿到了美国国税局的501(c)(3)免税资格。换句话说,那个陪伴了用户二十多年、一直印在页眉上的“康奈尔大学”标识,就此成为历史。
不仅如此,大家熟悉的那个arXiv红,也已经变成了黑色。
当然,功能上没有任何变化。论文还在,搜索还能用,提交入口也照常开放。arXiv团队在公告中特别说明:“未来数月内,arXiv的作者、读者以及依赖我们的社区,几乎不会感受到任何变化。”这话显然是写给那些担心平台突然收费或大变样的用户看的。常见的担心无非是:以后还能不能白嫖?答案暂时是——可以。
新的组织架构:从大学下属机构到自主治理
在康奈尔体制内,arXiv由Cornell Tech院长Greg Morrisett负责督管,执行层面则由计算机科学教授Ramin Zabih担任执行总监。独立后,这套结构被正式的公司治理框架取代。 根据arXiv发布的FAQ文件,新组织将由一个**最多12人组成的董事会**负责治理。西蒙斯基金会与康奈尔大学作为两个“创始成员”,共同主导了前期的建制工作,包括任命初始董事会、建立免税资格,以及签署一系列法律协议。这两家机构将履行“成员”职责长达五年,其代表也可在此之后继续在董事会任职。
至于CEO一职:康奈尔计算机科学教授Ramin Zabih将在过渡期担任**临时CEO**,并协助未来的正式CEO完成交接。
目前招聘流程已接近尾声。此前引发广泛讨论的约30万美元年薪方案,依然有效。值得注意的是,arXiv总部地址暂时不变,纽约市的员工仍将在Cornell Tech的Tata创新中心办公。全体26名员工均已随组织一同转入新公司。
什么是arXiv?它凭什么值得这么多关注
如果你从事物理、数学或计算机研究,arXiv几乎是每天打开的网页。如果你在AI领域工作,那它更是默认的论文平台。 简单来说,arXiv是一个“预印本”服务器:学者在论文正式经过同行评审、发表于期刊之前,可以先把稿件免费上传到这里,让全球同行第一时间看到。这种模式从根本上改变了学术知识的传播速度。传统学术期刊从投稿到发表往往需要数月乃至数年,而arXiv让这个时间缩短到了数天甚至数小时。 arXiv诞生于1991年,创始人是洛斯阿拉莫斯国家实验室的物理学家Paul Ginsparg。
起初,它只是一个用来替代混乱邮件列表的自动化脚本,预计每年接收约100篇论文。但首月就涌入了近百篇投稿,弦理论大师Ed Witten的早期加入让它迅速获得学术圈的认可。2001年,Ginsparg回归母校康奈尔大学任教,arXiv也随之落户该校图书馆,开启了长达25年的康奈尔时代。
它对AI社区的价值,尤其难以替代。
几乎所有塑造了当代AI格局的重要论文,都最先在arXiv上亮相。注意力机制(Attention)、Transformer架构、BERT、GPT系列、扩散模型……这些名字代表的不只是论文,更是整个行业的地基。让全球AI圈震动的DeepSeek系列论文,同样是首发arXiv。**与传统学术出版动辄数月甚至数年的审稿周期相比,arXiv的快速周转机制让这些快速迭代的领域得以大幅提速。**
更重要的是,arXiv对所有人免费,不需要机构订阅,不需要翻越付费墙。那些在东欧、东南亚、非洲从事研究的科学家,某种程度上与麻省理工的学者站在同一条起跑线上。
截至2026年6月,arXiv累计收录论文数已超过309万篇,涵盖物理、数学、计算机科学、定量生物学、定量金融、统计学、电气工程与系统科学,以及经济学在内的8个学科门类。平台迄今已提供超37亿次下载。这些数字背后,是一个服务于全球超过上千万月活用户的基础设施。
(自1991年8月以来的论文提交数量统计)
(论文下载数量统计)
为什么现在独立?财务与AI的双重压力
独立的决定并非一时冲动。多年来,arXiv的内部讨论一直在进行,但真正形成合力是在最近两年。
首先是**财务问题**。
arXiv在2025财年的支出约为670万美元,当年出现了29.7万美元的赤字。康奈尔大学在面临联邦拨款削减和预算收紧的压力下,已经无法持续为这个赤字兜底。
独立运营意味着更宽阔的融资渠道。一些位于欧洲和亚洲的机构,对于将支票开给康奈尔大学本不情愿,但如果受款方是一家直接服务于科学社区的独立非营利组织,态度就会截然不同。
其次是**体制灵活性**。大学的人事体系有其固有节奏(薪资上限、招聘周期、采购流程),这些对于需要快速响应技术浪潮的arXiv来说,有时是肉眼可见的阻力。Morrisett曾直言:“我们需要比大学允许的更灵活地雇人、更有竞争力地开工资。”
然后是**AI带来的新变量**。
2023年以来,AI生成的内容大量涌入学术平台。arXiv也不例外,大量低质量或完全由AI写成的论文提交大幅增加。平台依赖数百名专业志愿者审核员处理提交,但面对每月几万篇的论文规模,这套体系正在承压。
2026年2月,arXiv推出了“仅接受含有英文版本的论文”新政,以减轻多语言审核的难度。而在创始人Ginsparg看来,这个问题更为根本:“如果LLM生成的计算机科学论文,质量已经超过普通研究生的水平,那么三个月后的世界该如何应对?”