【02.18】“青年科技工作者园地”第146次活动:数据挖掘与高能衍射实验的云数据分析平台
“青年科技工作者园地”第146次活动
报告题目:数据挖掘与高能衍射实验的云数据分析平台(Data Mining and High-Energy Diffraction Data Analysis in the Cloud)
报告人:杨龙 博士
时间:2022年2月18日(周五)下午14:00
地点:计算中心二楼会议室(东莞同事和同学通过视频)
腾讯会议:964-408-083
摘要:
材料的原子结构与其所表现出的性质之间存在构效关系,即结构决定了材料的性质。因此,为了更好地调控性质,对材料的原子结构进行定量分析及三维建模是研究的关键。人们常用的传统X射线粉末衍射XRD技术可研究晶体材料的周期性结构。近年来,基于同步辐射光源等高能衍射的原子对分布函数(atomic pair distribution function, PDF)技术是一种新型局域原子结构建模技术,不受限于晶体周期性边界条件,可用于研究晶态及非晶态材料的局域结构,如低维纳米态、非定形态、合金、液态等,分辨率可达0.01纳米量级。
此次报告将首先介绍 PDF衍射实验的理论背景及其相关数据处理过程,包括同步辐射X射线衍射和散裂源中子衍射。此外,将介绍一种新型的部署在云端服务器的PDF数据分析处理平台(https://pdfitc.org),该平台可以帮助科研工作者快速地实时分析新型材料的衍射数据。在目前版本中,提供了四种不同数据分析算法软件。以其中的结构挖掘算法为例,将详细介绍该云计算平台的使用步骤。在实验采集获得PDF衍射数据后,由于PDF结构建模过程中对初始模型的精度要求高, 结构筛选长期以来是由人工完成的,往往需要耗时数天甚至数周。该算法利用数据挖掘方法,结合开源材料结构数据库,进行自动筛选和回归拟合,获得最佳材料结构模型。将过去耗时数天的PDF结构建模工作缩短为数分钟至数小时。该平台有望成为今后开展高通量原位衍射实验及材料基因学等方向提供数据分析支持。
报告人简介:
杨龙博士,2011至2015年本科就读于复旦大学信息科学与工程学院光信息科学与工程专业。2015至2021年在美国哥伦比亚大学应用物理与应用数学系的材料科学与工程专业硕博连读。同时在2017至2020年期间为美国橡树岭国家实验室散裂中子源衍射科学组的联合培养博士生。他在博士研究阶段,师从于在哥伦比亚大学及美国布鲁克海文国家实验室任职的Simon Billinge教授,发展基于同步辐射X射线和散裂中子源的高能衍射原子对分布函数(atomic pair distribution function, PDF)这一新型材料表征技术。着重研究数据挖掘等新型数据科学方法来解决PDF分析中的筛选最佳材料结构模型等方法论问题。同时为了更进一步地推广PDF技术,开发建立了PDF数据分析云服务平台(https://pdfitc.org)及其相应的衍射实验数据库,为用户提供在线数据分析及可视化。 该云数据分析平台可服务全球科学家来研究各类晶态,非晶态,及纳米态新型材料的微观原子局域结构与其宏观物理性质之间的构效关系,加速衍射学科的发展。相关的方法论研究及其应用成果写入了学术专著部分章节1部,由国际知名学术出版商爱思唯尔出版。以第一作者及合作身份发表十余篇国际学术论文,如Physical Review B, Advanced Materials, Chemistry of Materials等期刊。先后获得中国国家奖学金、复旦大学望道学者等荣誉,并担任ACS Applied Nano Materials等国际学术期刊审稿人。
附件下载: