斯坦福华人研究火了:45分钟让你的论文变身AI智能体!
新智元报道
编辑:元宇
【新智元导读】斯坦福大学研究人员提出了Paper2Agent,将静态论文转化为可交互的福华分钟AI智能体,让学术成果可以直接被「调用」,人研让为科研知识传播开辟了新模式,究火并为构建AI共研生态奠定基础。论文
把论文,变身变成会动的斯坦智能体?
这样论文就不再是静态的PDF文件,研究成果不仅可以「开口说话」,福华分钟还能主动帮你把事做了。人研让
传统科研论文的究火阅读门槛很高,往往需要读者投入大量精力去理解论文内容。论文
为了解决这一难题,变身斯坦福大学研究人员提出了Paper2Agent,斯坦让论文一键变身AI智能体。福华分钟
这样一来,人研让学术成果可以直接被「调用」,而不用再经历从阅读、理解再到最终应用的漫长转化过程。
https://arxiv.org/abs/2509.06917
Paper2Agent是一个可将科研论文转化为「研究助手型」AI智能体的自动化框架。
而且,它还可以实现多智能体协同作业。
研究人员利用Paper2Agent成功构建了AlphaGenome智能体,用于解释基因组变异,还做了Scanpy与TISSUE智能体,用于开展单细胞和空间转录组分析。
结果显示,Paper2Agent不仅能复现原论文结果,也能准确处理新的用户请求。
Paper2Agent提供了将科研论文转化为智能体的自动化工作流。
它的核心思路,是把论文封装成一个MCP服务器。
转化流程共分为三步:
识别论文的关键贡献(数据集、方法、模型或工作流)。
将这些关键贡献封装为MCP服务器,并明确其输入、输出与使用说明。
将MCP服务器连接至LLM驱动的智能体,实现自然语言查询与自主执行。
Paper2Agent概述
Paper2Agent生成的论文智能体具有以下特点:
交互便捷:用户可用自然语言执行复杂科学分析,无需编程基础;
可靠易复现:每个论文智能体所使用的工具均会通过示例数据集,与论文代码库中报告的结果与图表进行验证,并锁定配置确保可复现性。
Paper2Agent基于MCP生态系统,构建了两个关键组件:
Paper2MCP:从论文及其代码库中提取信息,用以构建远程MCP服务器;
智能体层:将每个MCP服务器封装为上下文提供者,从而生成针对特定论文的AI智能体(见图1A)。
每个MCP服务器包括三个核心组件:
MCP工具:可执行函数,封装了论文中的方法学创新。这些工具运行在预配置环境中,确保无缝执行。
MCP资源:静态资源仓库,包含论文文本、关联代码库及补充材料,如数据集、表格、图像等。
MCP提示词:精炼的指令模板,引导AI智能体完成从论文文本或代码库中提取的多步骤科学工作流。
研究人员借助Claude Code完成了对Paper2Agent的对接与调用。
整个流程,从识别论文相关的代码库开始(图1B)。
随后,调用两个专用智能体和一个测试智能体。
环境智能体,用于配置所需的软件环境;
提取智能体,用于将核心方法转化为可执行工具。
测试智能体,通过自动测试不断优化代码与环境,直到结果与参考输出一致。
完成验证后,工具与环境将被打包为MCP Python文件,可部署至Hugging Face等远程服务器。
最后,通过将MCP服务器与AI智能体连接,生成一个功能完整的论文智能体,用户就可以通过自然语言访问该论文的方法。
研究人员通过三个案例,来展示Paper2Agent如何将不同类型的科研论文转化为可靠的交互式AI智能体。
AlphaGenome Agent
基因组数据解读
AlphaGenome是一款AI模型,用于预测人类DNA中单核苷酸变异(SNV)或突变对多种基因调控过程的影响。
Paper2Agent将AlphaGenome论文转化为可交互的智能体,使用户能够自动解读基因组数据。
在无人干预的情况下,Paper2Agent在一台普通笔记本上,仅用约3小时便生成了22个AlphaGenome MCP工具,全面覆盖论文中的方法创新。
这些MCP工具可复用于未来应用,它们涵盖了单变异与批量变异评分、序列级预测、组织本体探索以及丰富的可视化功能。
研究人员进一步对AlphaGenome智能体进行了基准测试,评估其在数值与图表输出上的表现,是否可以媲美人类专家手动配置与运行代码的结果(图2C)。
结果显示AlphaGenome智能体在这些查询中均实现100%准确率,所有结果与原报告完全一致。
研究人员还演示了AlphaGenome智能体在GWAS位点解读中的应用能力,并验证了其是否能复现原论文的分析过程。
以使用AlphaGenome来解释「chr1:109274968:G>T与低密度脂蛋白胆固醇(LDL-C)相关的原因」为例(图2D),智能体构建了解决此任务的详细计划,并最终输出一份综合解读报告。
在这一过程中,研究人员还发现了Paper2Agent的重要优势:
只需一个提示词,用户即可基于独立的模型证据重新评估已发表的研究结论。
TISSUE智能体
不确定性感知的单细胞空间转录组分析
TISSUE是一篇近期发表的研究论文,提出了一种用于不确定性感知的单细胞空间转录组分析的新方法(见图3A)。
研究人员通过Paper2Agent自动生成了TISSUE智能体。
这一案例,适用于这样一个常见科研场景:
研究人员希望将新方法应用于自己的数据,但由于时间有限,很难深入理解代码库、配置运行环境,或掌握方法的特性与输入要求。
TISSUE智能体可以提供问答支持,帮助用户准备输入数据、理解方法功能,从而解决了这一难题。
对于TISSUE MCP服务器,Paper2Agent共生成了6个工具,涵盖空间基因表达预测、预测区间构建,以及面向不确定性的下游分析等(见图3A)。
值得注意的是,TISSUE智能体还可作为交互式指南使用(见图3B)。
研究人员评估了TISSUE智能体在构建空间转录组预测的预测区间方面的能力,发现智能体无需用户额外干预,便自动执行了整个TISSUE流程(见图3C)。
这说明智能体不仅能使用单个工具,还能独立完成从数据加载、预处理、插补到不确定性估计的整套分析流程。
最后,研究人员还展示了如何通过将TISSUE论文中的「数据可用性」部分转化为结构化注册表,来进一步利用MCP资源(见图3D)。
用户可以通过查询筛选出特定物种的数据集,而无需手动浏览多个数据仓库。
Scanpy智能体
用于单细胞数据预处理
Scanpy是一个广泛使用、功能强大的单细胞转录组分析工具包。
在实际应用中,研究者往往只用到Scanpy功能的一部分。
Paper2Agent不仅支持将完整方法转化为工具,也能抽取其中的关键部分,以构建更针对性的智能体,聚焦于某一特定分析任务。
研究人员聚焦于Scanpy最常见的使用场景:单细胞数据的预处理与聚类。
Paper2Agent用了约45分钟,便在一台笔记本电脑上生成了7个工具(见图4A)。
通过这些工具,用户可以通过自然语言提示让Scanpy智能体对其单细胞数据进行质控处理。
许多用户偏好从头到尾的预处理与聚类流程,即工具按既定顺序依次执行。
这类分析流程不仅常见于单细胞研究,也普遍存在于科学领域的其他复杂数据处理中。
然而,执行这些流程通常很具挑战性:AI智能体要么必须「预先知道」正确的执行顺序,要么依赖用户输入结构化良好的提示词明确指定步骤。
为解决这个问题,研究人员使用MCP提示词来规范流程。
MCP提示词提供了一种标准化方法,这些提示词由Paper2Agent直接从论文和代码库中自动推理得出,无需人工整理。
这种机制显著提高了复杂分析任务的可复现性与易用性。
例如,Scanpy智能体的MCP提示词就完整编码了一套标准的预处理与聚类流程,包括质控、标准化、特征选择、降维、图构建、聚类和细胞类型注释,并确保其按正确顺序执行(见图4B)。
研究人员使用三个公开单细胞数据集对Scanpy智能体的性能进行了评估,结果显示智能体输出的结果与人类研究者处理同样数据时的结果一致(图4C)。
这表明基于MCP提示词驱动的Scanpy智能体,能够流畅运行完整流程,使先进的单细胞分析更加易用和可复现。
作者简介
Jiacheng Miao
Jiacheng Miao现为斯坦福大学博士后,与Jonathan Pritchard和James Zou合作。在这份工作中,Jiacheng Miao与其他研究者共同提出了Paper2Agent。
2025年,Jiacheng Miao在威斯康星大学麦迪逊分校获得博士学位,导师是Qiongshi Lu和Lauren Schmitz。2019年,Jiacheng Miao在南京大学数学系完成了本科学业。
Jiacheng Miao的研究方向是构建可靠的AI co-scientists以加速科学发现,并使用Perturb-seq解释与疾病相关的基因。
2025年,Jiacheng Miao获得了NOMIS & Science青年探索者奖。
参考资料:
https://arxiv.org/abs/2509.06917
(责任编辑:知识)
-
新京报讯记者张静姝)近期,爬山迷路、受伤警情高发。新京报记者从北京市消防救援总队怀柔支队获悉,10月2日晚间到10月3日的24小时内,仅怀柔区消防救援支队桥梓消防站就接到3起救援警情,救援人员连夜搜救 ...[详细]
-
瞄准建链强链补链目标,精挑细选招好商南安20个项目苗子 计划引资118.9亿元本报讯 记者王宇静 通讯员陈鑫炜 吴泉瑜)泉州市近日启动2020年泉州市产业链招商季行动,各地纷纷响应。为进一步引入&ld ...[详细]
-
10年体检无异常,确诊癌症晚期!漏检频发,体检机构还能信么?
连续十年体检报告上显示“一切正常”,转眼却确诊癌症晚期,这样的故事听起来像医疗剧里的极端桥段,却真实发生在我们的生活中。近日,家住北京的执业律师张晓玲向记者投诉,她于2013-2023年连续在爱康国宾 ...[详细]
-
浦西万达影院做好复映前的准备工作电影院终于可以开业了,你会去看吗?7月16日,根据国家电影局官网通知,低风险地区在电影院各项防控措施有效落实到位的前提下,7月20日起有序恢复开放营业。昨日,记者探访中 ...[详细]
-
中考考生参加首场考试时 须提供核酸检测阴性报告6月11日起至考试结束,考生及共同居住人不离开中考报名所在地9日下午,福建省教育考试院发布重要提示:今年福建省所有中考考生在参加首场考试时,须提供考前48 ...[详细]
-
近期,杭州一位52岁女性在空地散步时,误踩到废弃氢氟酸,送医后经抢救无效不幸身亡。公安机关已介入调查,生态环境部门已完成现场无害化处置。一个寻常的散步,一次不经意的踩踏,竟造成52岁的涂女士与家人永别 ...[详细]
-
本报讯 记者 游怡冰 通讯员 欧阳育玲 李丽芬)日前,泉台人力资源服务产业园项目运营合作签约仪式在泉州台商投资区举行。泉台人力资源服务产业园位于台商区湖东花苑,规划建设面积约4200平方米,预计今年1 ...[详细]
-
晋江国际会展中心项目进入全面收尾阶段 林劲峰 陈凯 摄)本报讯 记者 许雅玲)记者近日从晋江国际会展中心项目部了解到,泉州市重点项目——晋江国际会展中心项目已进入全面收尾阶段, ...[详细]
-
非机动车道被围起来准备改造津淮街与坪山路交叉路口渠化岛将拆除近日,经过泉州市区津淮街东段的市民发现,部分人行道被封闭起来,两侧的一些行道树被修剪得只剩下树杈,一些树池也被挖开,不知道在做什么?对此,记 ...[详细]
-
最近,“美国爆发接吻虫病疫情”的话题冲上热搜。据美国疾控中心通报,由“接吻虫”传播的“恰加斯病”在部分州蔓延,全美32个州已发现接吻虫踪迹,部分地区感染率超55%,约28万美国人可能已携带这种“隐形杀 ...[详细]