花诱导指植物从营养生长向生殖生长转变的关键过程。荔枝成花诱导受多种因素包括树龄、品种和动态的环境气候变量影响,花诱导期时长对荔枝开花时间和成花质量起着决定性的作用。
近日,华南农业大学园艺学院、岭南现代农业科学与技术广东省实验室茂名分中心、广东省荔枝工程研究中心陈厚彬研究员团队应用机器学习技术准确预测了荔枝成花诱导期时长,并筛选出影响荔枝成花诱导期的重要生态和生理因素,相关研究成果发表在农林科学领域知名期刊《Computers and Electronics in Agriculture》(中科院1区Top期刊,影响因子6.757),题目为“Predicting flower induction of litchi (Litchi chinensis Sonn.) with machine learning techniques”(链接:https://authors.elsevier.com/c/1gPmjcFCSTfRe)
先前对荔枝成花诱导期时长的研究主要集中于使用数学模型来估计特定荔枝品种的花朵诱导的基础温度和冷量需求。然而,更多可能的相关性尚未深入探讨。在本研究中,研究者应用包括随机森林和逐步回归在内的机器学习算法来预测荔枝成花诱导期时长。利用2009-2020年持续记录的荔枝品种、树龄、末次秋梢老熟期、现“白点”期物候以及相应的气象数据,并考虑了从1小时到10天时间尺度数据集对模型精度的影响。预测模型经5倍交叉验证R2达到0.96-0.99,对2019年和2020年的成花诱导期盲测R2分别为0.97-0.98和0.78-0.88。
应用5天时间尺度数据集预测模型的鲁棒性和预测准确性评估。A和B,5-fold 999交重复交叉验证时两个预测模型的Rp2值。C和D,利用验证数据集估计模型的预测能力。E-H,利用盲测试数据集估计模型的预测能力。RF,随机森林模型,STR,逐步回归模型。
从以上稳健的预测模型中,作者筛选出影响荔枝成花诱导期时长的重要变量,分别是最低日气温降温速率、末次秋梢成熟时间、最高日气温升温速率、高于22℃最低日气温的累积热量、低于26℃最高日气温冷积累量、低于6℃最低日气温冷积累量、树龄和大气相对湿度等,它们对荔枝成花诱导期时长有着正向或负向影响。
应用1天时间尺度数据所建随机森林算法评估的特征重要性(黑色圆圈)、特征与因变量的Pearson(橙色三角形)相关性和Spearman(深绿色三角形)相关性。横坐标数值表示重要性/相关性的程度,1为最重要/相关,0为不重要/不相关;正负值表示正相关或负相关。
以上发现将有助于更好地理解影响荔枝诱导过程中的生理和气象特征,有助于实现荔枝的精准智能管理。
本论文以华南农业大学为第一完成单位,团队成员苏钻贤助理研究员为第一作者,华南农业大学园艺学院陈厚彬与贵州大学李云琦研究员为论文通讯作者,中国科学院长春应用化学研究所刘伦洋助理研究员参与了本研究工作。该研究得到了国家荔枝龙眼技术体系(CARS-32)、粤西特色亚热带水果种质创新与新品种培育技术研究与应用(2021B0707010004)和乡村振兴战略专项资金(农业科技能力提升)项目(43-2018-XMZC-0002-90)的资助。
文图/园艺学院