当下,AI智能体赛道越来越热,似乎“人人都在养龙虾”。4月28日,上海创智学院打出了一张颇为不一样的牌,发布了从底层算力到顶层科学应用的全栈科研基础设施与运行体系——“创奇·智能新引擎”,不只是“养龙虾”,而是从饲料做到了厨房。

目前很多AI科研平台聚焦智能体调用工具这一层级——相当于搭建“驾驶舱”。而上海创智学院此次发布的“新引擎”,涵盖了算力底座、数据工厂、训练服务、科研“驾驶舱”、领域应用和安全保障六个层级。

如果把科研比作造车,“新引擎”提供的不是某一个零件,而是一整套可以量产的“造车平台”。在这个平台上,科学家不必再为“发动机用什么芯片”这些底层问题头疼,只需专注于“我要造一辆什么样的车”的科学问题本身。这意味着一种新的可能——科研正在从以人和经验为中心的“手工模式”,迈向以模型、系统和自动化为核心的“智能化模式”,从而重塑科学问题提出、知识生成与成果转化的全过程。

据悉,目前全球范围内,除了美国的“创世纪计划”,如此体量化的全栈体系布局并不多见。

【让科学家不再被算力和训练“劝退”】

“新引擎”首先解决的是科学家最头疼的两件事:算力怎么用好,模型怎么训练。

很多高校和科研机构不缺显卡,但不同国产芯片架构互不兼容,设备多了还容易“罢工”。“新引擎”好比给这些五花八门的算力装了一个“万能插座”——不管底层是什么芯片,插上就能用。团队还开发了一套智能运维系统,能在“分钟级”自动定位万卡集群中的隐性故障,不用再靠人工排查。

模型训练中有一个现实痛点:市面上开源的大模型是“通才”,要把它变成能用在某个科研领域的“专才”,得经过“后训练”——这就像把一个医学院毕业生培养成心脏外科专家。但后训练的门槛极高,很多科研团队直接被劝退。如今,“新引擎”推出了“训练即服务”平台,科学家只需说清楚“我要训练什么”“训练到什么标准”,剩下的则由平台自动完成。至于数据是怎么在几百张显卡之间同步的,统统不用管。

这两层加在一起相当于“水电煤”,构成了“新引擎”的动力底座。

【把“沉睡的稀土矿”炼成燃料】

有了底座,还需要燃料。这就是“数据工厂”要解决的问题。

“很多人以为把数据丢给大模型,它就能自己学会,其实完全不是这样。”上海创智学院党委书记、常务副院长丁晓东打了一个比方:数据就像沉睡的稀土矿,要把宝贵的稀土从矿石里提炼出来,否则机器根本学不会。

那“稀土”藏在哪里?上海创智学院全时导师刘鹏飞举例说,数学论文里常见的“同理可证”四个字,背后隐藏了大量推理过程。“我们要做的,就是把这些潜台词补全,提炼成机器可以学习的思维链。”为此,团队提出了一套“数据进化达尔文主义”理论,将数据加工划分为十个进化层级——从简单的网页文本提取,到复刻一个科研团队几个月的讨论协作过程。

“好的数据加工工艺,是宝贵的战略资产。”刘鹏飞透露,研究团队的工作已经受到Meta、腾讯等AI团队的关注。

【助力可回收运载火箭研发】

当有了算力、数据、训练这些底层能力,还需要一个“中枢”来调度它们,这就是科研驾驶舱。当AI不仅“会想”,还能“动手做实验”,参与科研全过程,会发生什么?

在化学领域,答案开始浮现。上海创智学院全时导师朱通介绍,在“新引擎”的NEXChem平台,这个闭环已经跑通:当AI接到一个目标,比如“找到一种高能量、不易结冰的空间燃料”,它会自己设计候选分子、模拟性质、驱动无人实验室里的机械臂24小时不间断合成,最后自动做表征分析、判断下一轮迭代方向。

目前团队利用该平台已找到数个优异的空间燃料候选分子,正与中石化和国能集团合作推动落地应用。值得关注的是,该平台构建了3.4亿个完备的基元化学反应数据库,助力我国新一代重型可回收运载火箭的研发,显著缩短了燃烧反应机理的研究周期。

在生命科学方向,同样跑出了加速度。首次公开的AURORA自动化高通量实验助手,打通了从基因到蛋白再到功能的一体化实验链条,日均产生超过5000条真实有效的实验数据,是全球最高通量。这意味着过去好几个博士生忙几周的工作量,现在AI实验助理一天就能高标准完成。同时,团队还构建了目前世界上规模最大的免疫数据库。

上海创智学院全时导师应天雷介绍,团队近期针对一款复杂的“雾化吸入式广谱抗流感抗体”药物,从分子优化到成药验证再到专利转化,只用了一个月。

【嵌入每个环节的安全基座】

当AI智能体从对话窗口走进实验室,能够影响物理世界时,安全问题也就愈加凸显。

为此,“新引擎”搭建了“前沿AI风险发现平台”。研究人员只需用一句话描述一个风险场景,系统就能自动生成可执行的测试沙盒,让智能体在虚拟环境中“试跑”,观察它是否会做出危险行为。这套系统已在国际上引发关注,相关研究被OpenAI联合创始人正面评价,并受到联合国秘书长科学顾问委员会邀请,在联合国AI欺骗风险线上圆桌会议分享成果。

研究团队还发布了模块化安全工具箱和国内首个智能体动态安全测试风洞,显著提升了阿里、字节跳动等商用系统的安全表现,达到国际领先水平。

“我们不是等出事了再去补救,而是在研发阶段就把安全嵌入了‘新引擎’全栈体系的每个环节。”上海创智学院全时导师潘旭东说。

截至目前,历时4个多月研制的“新引擎”已对接近20个科学家团队,覆盖凝聚态物理、新能源、生物医药、空天遥感等六大方向,多位院士团队的年轻成员已入驻学院开展联合研究。中国科学院院士张万斌评价,这是“真正面向科研痛点、面向产业需求的系统性创新”。

原标题:《不只是“养龙虾”而是从饲料做到厨房,上海创智学院发布全栈科研智能基础设施》

题图来源:上海创智学院。黄海华 摄

来源:作者:解放日报 黄海华