2024年高能新闻
您当前的位置:首页 > 新闻动态 > 高能新闻 > 要闻 > 2024年高能新闻
高能物理首个人工智能系统"赛博士"上线
文章来源:实验物理中心  2024-07-08
】 【】 【

近日,面向高能物理的人工智能系统——“赛博士“(Dr. Sai)——正式上线,这是国际高能物理领域的首个大型人工智能系统,入口为https://drsai.ihep.ac.cn

20237月以来,在中国科学院高能物理研究所“从01”项目的支持下,计算中心和实验物理中心联手打造了"赛博士"Dr. SaiAI智能体,旨在使其高度智能化和自动化地完成文献调研、程序编写、事例产生、事例分析、结果解释和文章撰写等任务,将科学家从创新性要求较低的例行工作中解放出来。项目第一阶段聚焦我国首个科学装置——北京正负电子学对撞机上的北京谱仪IIIBESIII)——的数据分析。

经过一年的攻坚,在74日下午的BESIII合作组会上,研究团队面向BESIII合作组正式发布了第一版“赛博士”并进行了现场教学,受到了大家的热烈欢迎。"赛博士"v1.0版本已上线HepAI平台(https://ai.ihep.ac.cn),为进一步改进系统、早日实现既定目标打下了坚实的基础。此外,团队还将从底层模型开始为高能物理实验研发可总结理解物理规律的科学大模型等工作。

赛博士”是一个基于大模型的多智能体协同系统,其核心组件包括:基于开源基座模型(目前为LLaMA3)的领域增强大语言模型——“高能·溪悟”,利用高能物理和BESIII实验数据进行二次预训练和微调从而实现专业性能提升;基于矢量数据库和知识图谱的记忆器,通过检索增强生成(RAG)和自我反思缓解幻觉现象;基于自研HepAI分布式部署框架的执行器,实现BESIII代码的远端执行和结果读取;基于多个AI工具的“数据飞轮系统”,实现模型的持续迭代升级;基于提示工程和知识库的多个智能体,针对不同任务实现具体优化。经过一系列测试,“赛博士”在高能物理领域的知识问答、任务规划、代码生成等方面性能超过世界上主流的大语言模型,研究人员们可以借助这一先进工具,更加高效地开展实验数据的分析和研究,例如可在输入清晰指令后由”赛博士“将整个分析工作自动完成。


1: “赛博士”智能体总体概览

高能物理经过数十年的发展,逐步演变为依赖高度精密、复杂的大科学装置获取海量实验数据,并通过分析挖掘数据发现与验证物理规律的学科,高能物理实验收集的数据也是国际上最大的数据集之一,而如何充分有效地挖掘海量科学数据产出科学成果是该领域面临的重要挑战之一。近年来,以大模型为代表的人工智能技术取得重大突破,相较于人类,其在记忆力、高维复杂、全局视野、推理深度和猜想等方面具有较大优势,为促进科学发现提供了新的思路。

2BESIII合作组会中“赛博士”分会场



3"赛博士"小组主要成员(按姓氏排序)

项目成员主要来自高能所计算中心和实验物理中心,并有中国科学院大学、兰州大学、吉林大学和南京大学的研究生参与。本项目研究过程中还得到了“从01”指导小组、机器学习创新组和BESIII合作组多位专家的指导和建议。


附件下载:

地址:北京市918信箱 邮编:100049 电话:86-10-88235008 Email:ihep@ihep.ac.cn
中国科学院高能物理研究所 备案序号:京ICP备05002790号-1 文保网安备案号: 110402500050