近日,面向高能同步辐射光源(HEPS)海量衍散射图像降噪、实验数据在线解析的迫切研究需求,HEPS光束线软件系统张一团队与高能所赵丽娜AI研究团队密切合作,取得对应的AI for Science研究阶段性进展,研究成果在领域重要学术期刊《IUCrJ》与《npj Computational Materials》上在线发表。
X射线衍散射技术朝着高通量多维度进阶,使其成为同步辐射领域数据挑战最大的方法学之一。研究人员聚焦其传统物理解析方法复杂性高、时效性差的科学问题,利用全连接神经网络,高效准确地提取了二维衍射图像中隐藏的三维纤维取向分布信息(图1)。该方法以衍散射数据解析为切入点,建立了同步辐射机器学习在线数据解析的统一流程框架,并实现解析效率的万倍提速,为未来海量数据的在线处理奠定底层基础。该工作日前在国际晶体学TOP期刊《IUCrJ》在线发表[1](赵丽娜研究员、张一副研究员为通讯作者,博士生孙明辉、博士后董政为共同第一作者),中科院高能所是本工作的唯一通讯单位。
在高通量多维度海量数据的快速解析研究中,充分意识到高效数据采集、样品辐射损伤降噪的方法学研究重要性。因此,基于卷积神经网络,研究人员构建了一套专用于衍射与散射图像降噪的深度学习网络SEDCNN (Small Encoder-Decoder Convolutional Neural Networks),实现了低曝光时间衍射与散射图像的降噪(图2)。基于研究人员提出的方位角积分计算的降噪指标,该模型成功做到了训练速度与降噪结果稳定性远超现有SOTA模型。该工作日前在《npj Computational Materials》在线发表[2](董宇辉研究员为通讯作者,博士生周中正、博士后李纯为共同第一作者),中科院高能所是本文唯一通讯单位。
上述研究工作是在我所先后部署的“基于虚拟束线的自动化与智能化同步辐射实验数据采集软件研究(E25455U210,负责人:张一)”与“物理嵌入机器学习驱动高能同步辐射物质解析新发现(E35457U210,负责人:赵丽娜)”科技创新项目支持下开展完成,已初步形成人工智能在HEPS实验过程控制与数据采集、海量数据分析与信息挖掘应用研究的新模式。未来,在董宇辉研究员发表于Nature Reviews Physics期刊的“大型科学软件框架 + AI for Science”先进科研理念[3]指导下,HEPS光束线软件系统还将联合计算与网络通讯系统,进一步加强与线站科学家、人工智能领域专家的科研合作,共同解决HEPS的科学大数据挑战,推动科学大发现。
图1: 机器学习用于海量衍射图像高效分析
图2: SEDCNN网络架构与降噪效果
论文链接:
[1] Fast extraction of three-dimensional nanofiber orientation from WAXD patterns using machine learning. IUCrJ, 10, 3 (2023). https://doi.org/10.1107/S205225252300204X
[2] A machine learning model for textured X-ray scattering and diffraction image denoising. npj Comput. Mater., 9, 58 (2023). https://doi.org/10.1038/s41524-023-01011-w
[3] Exascale image processing for next-generation beamlines in advanced light sources. Nat. Rev. Phys., 4:427–428 (2022). https://doi.org/10.1038/s42254-022-00465-z
附件下载: