机器学习是人工智能的核心。近年来随着理论和算法的飞速发展,机器学习可以更快速的处理复杂、多维度的数据,去除噪声、自动识别关键信息;也可以通过筛选特征和融合模型进一步提高预测能力。其中一个新的研究方向——深度学习,能够从海量的数据中对数据的内在规律进行自动的分析、挖掘和学习,很大地推进了人工智能相关技术的发展和应用。因为机器学习的功能强大,它在图像识别、数据分类、计算机视觉(包括图像和视频等)等多个领域的应用也趋向繁荣。
机器学习的优势可以跟空间天气预报研究相结合,促进预报先兆因子的提取和预报模型的建立,进一步提升空间天气的预报能力。
太阳耀斑及其伴随或引发的太阳质子事件、日冕物质抛射事件,可能引发剧烈的空间环境扰动,严重威胁到航天器和卫星的安全。研究太阳耀斑爆发的先兆因子、建立起满足空间天气业务预报需求的太阳耀斑预报模型,是空间天气预报的重点内容。
中国科学院国家空间科学中心空间环境态势感知技术重点实验室王晶晶副研究员、刘四清研究员等人利用机器学习方法,开展了太阳耀斑爆发的先兆因子提取、以及太阳耀斑预报建模的研究。
王晶晶等(2019)利用活动区中性线梯度图像将十二个传统的耀斑先兆因子(磁通量、螺度平均值等)进行改造,将活动区中性线梯度作为权重代入了先兆因子的计算中,提取了一组新的耀斑先兆因子;经测试,这组新的先兆因子在用于预报强耀斑(M级及以上级别耀斑)时,明显优于传统的先兆因子,其中统计量F评分(Fisher score)超出了后者两倍,以此建立的随机森林预报模型的技巧评分也平均提升了约30%。结果表明,新颖的、可以反映太阳耀斑爆发物理机制、与耀斑爆发具有很强相关性的先兆因子,对进一步提升耀斑预报的能力至关重要。
以上研究结果发表于The Astrophysical Journal。
活动区中性线梯度图像不仅包含了活动区中性线附近的磁场梯度数值,也包含了中性线长度、形态和位置信息;在传统的预报先兆因子(如Schrijver (2007)的R值——中性线附近区域的通量之和)的计算过程中,活动区的中性线位置和形态等一系列至关重要的磁场演化特征被忽略了。王晶晶等(2020)利用核函数从活动区中性线梯度图像中成功提取了两个新的耀斑先兆因子,分别表征当前活动区中性线梯度的特征、在过去48小时内活动区中性线梯度的演化特征,再与两个相似的传统先兆因子——R值(中性线附近区域的通量之和)和R值差分值进行对比后发现,新的先兆因子在用于预报强耀斑(M级及以上级别耀斑)时,明显优于传统先兆因子,其中统计量F评分超出了后者八倍,并成功的将预报时间提前量提升至72小时。结果表明,机器学习方法可以更完善的描述活动区中性线梯度图像特征,提取出新的耀斑先兆因子,有利于提升耀斑预报能力、以及预报提前量。
以上研究结果发表于The Astrophysical Journal,被收录在HMI Science Nugget作为亮点研究推荐(http://hmi.stanford.edu/hminuggets/?p=3263 )。
Citations:
[1] Jingjing Wang, Siqing Liu, Xianzhi Ao, Yuhang Zhang, Tieyan Wang, Yang Liu, Parameters Derived from the SDO/HMI Vector Magnetic Field Data: Potential to Improve Machine-learning-based Solar Flare Prediction Models, 2019, ApJ, 884, 175, DOI: 10.3847/1538-4357/ab441b.
[2] Jingjing Wang, Yuhang Zhang, Hess Webber Shea A., Siqing Liu, Xuejie Meng, Tieyan Wang, Solar Flare Predictive Features Derived from Polarity Inversion Line Masks in Active Regions Using an Unsupervised Machine Learning Algorithm, 2020, ApJ, 892, 140, DOI: 10.3847/1538-4357/ab7b6c.
图一:活动区光球径向磁图(左上)、正/负级活跃磁场区域图(右上)、中性线梯度图像(左下)、中性线梯度图像48小时差分图(右下)
图二:利用中性线梯度图像提取的特征(Feature 1)预报强耀斑的F评分(Fisher score)随预报时间提前量的变化趋势(上图)、以及利用中性线梯度差分图像提取的特征(Feature 2)预报强耀斑的F评分随差分时间的变化趋势(下图)