【6.18】“青年科技工作者园地”第118次活动_基于LSTM循环神经网络的高能物理数据热度预测
讲座内容: 基于LSTM循环神经网络的高能物理数据热度预测
主讲人:程振京
时间:6月18日(周二)下午15:00
地点:计算中心二楼会议室
报告简介:
高能物理计算是典型的数据密集型计算,每年需要分析PB级的海量物理数据,对数据访问性能有着越来越高的要求。构建统一命名空间的分级存储系统方案已经被广泛采用。一般根据访问热度不同将数据存储于不同性能、不同价格的存储设备上。当数据热度变化时,再将数据迁移至合适的存储层级。目前数据热度预测广泛采用基于人工经验的启发式算法,由于不同用户计算模式的差异,预测准确率较低。提出了一种借助LSTM深度学习算法,基于文件访问特征预测未来访问热度的方法,作为分级存储中数据迁移的依据。以高能物理实验LHAASO的真实数据为例做了对比测试,结果表明,在相同测试条件下,与已有预测模型相比,该模型具有更高的预测精度和更强的适用性。
附件下载: