新疆野苹果(Mɑlus siersii)为蔷薇科(Populusaceae)苹果属(Mɑlus)的落叶乔木,是中亚干旱地区第三纪遗留的阔叶林优势建群种,也是现代栽培苹果品种的祖先。在我国新疆伊犁河谷、塔城已有近300年的分布历史[1],由于气候变化和人类活动的干扰,伊犁野苹果林面积已经大范围缩减。叶绿素是进行光合作用的主要色素,是光合作用中将光能转化为同化物的色素,是反映植株树势及代谢水平的最理想指标[2-3]。由于新疆野苹果分布广泛,地面监测耗时耗力、成本较高,因此迫切需要建立无损、快速测定新疆野苹果叶绿素含量的方法,为树势分析及保护提供支撑。
传统的叶绿素含量测定方法准确度高,但存在破坏性采样、耗时耗力、难以大范围推广应用等缺陷[4]。遥感技术,尤其是高光谱技术是快速估测植物生化参数特别是叶绿素含量的理想手段。光谱成像数据源主要包括地面光谱仪、卫星遥感及无人机遥感。地面光谱测量需要采集植物叶片,导致样品数量有限,不具有代表性,难以反映区域整体情况;而卫星遥感则容易受大气影响和空间分辨率的限制,难以提取冠层细节信息。无人机高光谱成像技术在空间分辨率、灵活性、获取冠层信息等方面具有优势,大量用于多种植物生化参数的反演[5-6]。朱志成等[7]基于无人机高光谱影像对冬小麦叶绿素含量变化进行探究,并筛选出了对叶绿素最为敏感的窄波段光谱指数;谢东等[8]对获取的水稻无人机高光谱数据进行多种预处理,并通过对比相关系数法和主成分分析(PCA)法筛选特征波段,结果表明通过PCA筛选的特征波段反演水稻SPAD效果更佳;陈圯凡等[9]通过无人机高光谱数据对大田马铃薯SPAD值进行估算,表明SVR模型对马铃薯SPAD具有较高预测精度;呼斯乐等[10]基于获取春小麦3个生长期的无人机高光谱影像和地面实测数据对春小麦SPAD进行估算,展现了集成学习估算其SPAD值的高预测能力。
以上研究主要集中于冬小麦、水稻和马铃薯等低矮大田作物。为克服林木高大、冠层结构复杂及背景干扰带来的冠层尺度光谱有效信息提取难题,栗方亮等[11]分析了蜜柚叶片光谱特征与SPAD值的相关性,并基于筛选的NDVI(691 748)和GRVI(550 770)构建了多元回归模型;李旭等[12]为提升枣树的氮肥精准施用,通过构建敏感植被指数,建立了氮素预测模型,发现原始光谱模型性能更优;针对柑橘,Li等[13]构建了一种基于无人机光谱影像和纹理特征的半监督协同回归模型,对柑橘叶片氮含量进行了精确估算,结果表明,结合光谱和纹理特征的随机森林协同回归模型(CoRFR)表现最优。虽然以上研究取得了较好的成果,但迄今为止基于无人机高光谱遥感融合机器学习技术反演新疆野苹果冠层叶绿素含量的研究鲜有报道。
综上所述,针对新疆野苹果树体高大、冠层结构复杂、冠层背景复杂的特点,本研究基于8种预处理光谱系统构建了不同的光谱指数(DSI、RSI和NDVI),并比较不同机器学习算法(RFR、XGBoost、GBDT、KNN)的冠层SPAD反演精度,最后通过最优模型获取研究区苹果冠层SPAD反演图。研究结果可为下一步新疆野苹果的准确检测、保护和有效利用提供技术基础及理论依据。
1.1.1 研究区概况 伊犁河谷地处新疆维吾尔自治区西北部天山山脉西段,是中国干旱区唯一的湿岛。本研究区位于新疆伊犁河谷新源县境内的萨哈野果林(43°27'~43°34' N,83°28'~83°35' E)(图1)。萨哈野果林被认为是地球上第三纪暖温带阔叶林最重要的残留群落,是研究中西亚乃至全球温带果树起源、演化、多样性以及古生境的绝佳地区。研究核心区地处萨哈山南麓浅山地带,海拔1100~1600 m,属中温带大陆性半湿润气候,年平均气温7 ℃,春、夏半年的平均降水量为650 mm。逆温带气候条件是成为古老物种避难所的必要条件之一。萨哈野果林是新疆天山世遗点之一,也是国家重点保护野生动植物分布区。本文于2025年野苹果落花期获取了研究区的叶绿素含量与无人机影像高光谱数据。
图1 研究区样点分布
Fig. 1 The distribution of sampling sites in study area
1.1.2 野苹果树外形特征 新疆野苹果树平均寿命为115 a(年),树高2~10 m,最高可达14 m,多随机分布于山地及河谷地带[14]。本研究选取萨哈野果林的平地区域作为研究区,其株行距为2~8 m。选取85株高6~8 m、胸径0.5~1 m、冠幅4~8 m的野苹果树作为样本(图2),树冠主要呈圆形或广卵圆形,枝条较为舒展。野苹果叶片主要为卵圆形和宽椭圆形,落花期叶片长5~8 cm,宽3~5 cm,叶尖急尖,叶基主要为楔形和歪斜形,稀椭圆形,叶缘一般具有圆钝锯齿。
图2 野苹果样点树及其叶片
Fig. 2 Malus siersii sample point tree and its leaves
1.2.1 野苹果叶绿素(SPAD)测定 野苹果冠层SPAD的测定与无人机高光谱影像采集同时进行。同时,使用实时动态差分设备(型号:RTK;精度:厘米级)记录野苹果样本树的地理坐标(WGS-84),并与无人机高光谱数据坐标信息进行对应,以确定样本树在影像中的位置信息。在每个样本的东、西、南、北4个方位随机选取12枚健康、成熟叶片,使用SPAD-502 Plus叶绿素仪测定叶片(避开主脉)中部2个位点的SPAD值,取其平均值作为该叶片的SPAD值;最后计算12枚叶片的平均值作为该样点的冠层SPAD值。共获得85个SPAD有效样本数据,并将其随机划分为训练集(59个)和测试集(26个),分别将SPAD值按照从小到大的顺序对样点进行排序,统计特征如表1所示。
表1 野苹果样本的SPAD值统计数据
Table 1 Statistical data of SPAD values for wild apple samples
特征统计Feature statistics总样本Total sample训练集Training set测试集Testing set样本数Sample size 85 59 26最小值Minimum value 17.1 17.1 17.3最大值Maximum value 39.8 39.8 37.3平均值Average value 31.8 31.8 31.9标准差Standard deviation 5.0 5.0 5.1
1.2.2 无人机高光谱数据获取 使用大疆M350RTK搭载GaiaSky-mini3-VN高光谱成像系统获取研究区苹果近地冠层高光谱影像数据。GaiaSky-mini3-VN成像光谱范围为400~100 nm,波段范围为399.08~1 002.98 nm,光谱分辨率5 nm,224个通道(B1~B224),B60(553.58)表示第60通道波长为553.58 nm。拍摄方式为无人机悬停推扫,在每个架次获取数据前对成像光谱仪分别进行定标板(灰板)及背景数据采集,导入计算好的航点坐标,采样间隔为1 ms,悬停时间为12 s,飞行高度为80 m,飞行速度为5 m·s-1,光谱仪镜头垂直向下,光谱仪视场角30°,60%航点重叠,60%航线重叠。通过HiRegistrator软件进行高光谱图像几何校正,然后使用Metashape软件进行影像拼接。
1.2.3 冠层高光谱窄波段光谱指数构建 由于测定环境、机载平台噪声等固有因素,获取的UAV高光谱影像存在误差,导致光谱数据存在附加散射变化、基线变化、多重共线[15]等问题。为了减少噪声对模型的影响,本研究将高光谱数据分别用卷积平滑(savitzky golay,SG)、多元散射校正(multivariate scattering correction,MSC)、标准正态变换(standard normal variate transform,SNV)、移动平均平滑(moving average,MA)4种方法进行预处理,记为基础预处理数据;分别对4组基础预处理数据进行一阶导数变换(difference of first order,D1)处理,记为基础一阶求导预处理数据,共得到8组预处理数据。本文研究了基础一阶求导预处理方法对模型的影响,其中SG可以用来去除组件工作时无人机带来的背景噪声和部分光谱噪声;MSC可以剔除太阳角度变化带来的光谱扰动,显著提高信噪比;SNV则能消除固体粒度、光程差异等外部因素影响对光谱的影响;MA通过滑动窗口在高光谱数据逐点求平均值,实现平滑去噪;一阶导数可同步消除线性和二次背景漂移,突出光谱的真实变化区域[16]。
高光谱蕴含了极其丰富的光谱信息,通过任意两波段组合可以在高光谱的每一个波段上构建高光谱窄波段光谱指数。为了便于研究野苹果冠层高光谱窄波段光谱指数与SPAD值的相关性,本研究在409.27~1 002.98 nm范围内,以4种基础预处理及其对应的一阶导数光谱为数据源,系统构建了任意两波段的差值光谱指数(difference spectral index,DSI)、比值光谱指数(ratio spectral index,RSI)和归一化光谱指数(normalized spectral index,NDSI),其计算公式如(1)~(3)所示[17]:
式中i、j为高光谱波长,单位是nm;Ri、Rj分别表示i、j波长所对应的高光谱反射率。
采用随机森林回归算法(random Forest regression algorithm,RFR)、XGBoost、梯度优化决策树(gradient boosting decision tree,GBDT)、K最近邻回计算野苹果冠层叶片SPAD值。
RFR是一种基于决策树模型的集成学习组合预测器,均在随机抽样的样本与子特征空间上独立训练,借随机性抑制过拟合,提升模型泛化性能[18];XGBoost[19]是一种以速度和性能著称的快速、高效的改进决策树(GBDT),其通过迭代方式生成新决策树来纠正前一个模型的错误预测,从而逐步提升模型性能。其优势在于:利用硬件加速、并行计算、缓存优化、提升计算速度、支持多种损失函数。GBDT[20]是一种集成学习方法,通过顺序方式构建决策树,其中每棵决策树都是在前一棵决策树的基础上构建的,利用新决策树纠正前一棵树的预测误差,最终的模型预测为所有决策树的预测之和,梯度的提升是指每新增一棵决策树,即沿损失函数负梯度方向拟合残差,逐步修正预测值,使模型损失递减、精度递增;KNN[21]回归是一种非参数方法,预测时,在训练集中检索与待测样本最邻近的3个邻居,并以它们目标值的均值作为输出;模型无显式训练阶段,全部计算延迟至预测阶段一次性完成。
决定系数(R2)、均方根误差(RMSE)表示测量与预测野苹果冠层叶片SPAD值的一致性(表2)。R2值越大,表明建模的精度越高;RMSE表示模型的预测能力,其大小与模型精度成反比。其中R2越接近1,RMSE越小,表明模型的预测效果越好[22]。
表2 机器学习模型精度验证指标
Table2AccuracyindicatorsforallMLRMs
?
利用ENVI5.6的ROI感兴趣区将高光谱图像中的野苹果树、草地及野苹果树阴影进行分割,保留野苹果树感兴趣区。根据测定的叶片SPAD值样点位置,在每个样本的东、南、西、北和冠层5个位置避开枯枝采集光谱数据,计算其平均值作为样本的光谱反射率。剔除原始波段中噪声较大的4个光谱波段,保留409.27~1002.98nm波段作为原始光谱数据。野苹果冠层光谱曲线如图3所示,叶片在波长约550nm处出现波峰,在波长约750nm处反射率进入一个高值平台区,并在750~1002.98nm趋于稳定。
图3 野苹果冠层光谱曲线
Fig.3Spectralcurveofwildapplecanopy
本研究基于无人机高光谱数据(409.27~1002.98nm),结合公式(1)~(3)构建了8种不同预处理方式下的DSI、RSI、NDSI值(表3)。其中,24类窄光谱和红外光波段的DSI、RSI、NDSI值与SPAD值相关系数为0.58~0.75(P<0.01),在0.01水平上相关性显著,表明本研究构建的DSI、RSI、NDSI光谱指数对野苹果冠层叶绿素含量具有较高的表征能力。进一步分析发现,这些光谱指数主要集中分布在红边区和近红外波段,红边波段(约700nm)属于叶绿素吸收-反射转换区,近红外光波段则受叶片内部结构影响较小,对冠层背景噪音不敏感,因而这些指数对叶绿素变化尤为敏感性。散射校正类方法(SNV、MSC)对DSI、RSI的提取具有较好的响应,如SNV-DSI(495.07,414.39)r=0.74,此外一阶导数变换SNV-DSI(495.07,414.39)r=0.74,此外一阶导数变换显著提升了光谱特征可分性,MA-D1-NDSI(580.43,447.92)的相关性最高(r=0.75),SG-D1-NDSI(546.30,419.52)为r=0.73(表3)。
表3 窄波段光谱指数的最佳波段组合
Table 3 Optimal band combinations of narrow-band spectral indices
光谱变换Spectral transformation SG光谱变换Spectral transformation SG-D1 MSC MSC-D1 SNV SNV-D1 MA光谱指数Spectral index NDSI(474.02, 419.52)RSI(474.02, 419.52)DSI(508.29, 416.95)NDSI(784.77, 411.83)RSI(724.46, 930.83)DSI(809.49, 427.23)NDSI(419.52, 495.07)RSI(419.52, 495.07)DSI(495.07, 414.39)NDSI(453.12, 432.39)RSI(453.12, 432.39)DSI(697.12, 414.39)相关系数Correlation coeffcient 0.74 0.73 0.67 0.70 0.69 0.74 0.73 0.73 0.74 0.74 0.74 0.67 MA-D1光谱指数Spectral index NDSI(546.30, 419.52)RSI(419.52, 492.43)DSI(422.08, 637.21)NDSI(691.66, 727.20)RSI(427.23, 688.93)DSI(708.04, 566.26)NDSI(691.66, 727.20)RSI(427.23, 688.93)DSI(708.04, 566.26)NDSI(580.43, 447.92)RSI(447.92, 497.71)DSI(510.93, 529.53)相关系数Correlation coeffcient 0.73 0.70 0.70 0.62 0.58 0.67 0.62 0.58 0.67 0.75 0.73 0.70
基于相关系数极值准则,对SNV、SG-D1、MAD1预处理后的光谱指数生成了相关系数等势图(图4)。结果表明,在红边-近红外波段出现了连续的高相关带(|r|>0.7),而在可见光波段(<600 nm)则不连续分布(图4-Ⅰ)。因此,可见光波段易受冠层结构和噪声影响。SG-D1和MA-D1预处理下植被指数的相关系数均大于0.70,可见卷积平滑和散射校正与其导数变换相结合的优势。
图4 窄波段光谱指数与野苹果叶绿素含量的相关系数等势图
Fig. 4 Isopleth map of correlation coefficients between narrow-band spectral indices and chlorophyll content of wild apple leaves
在不经过导数变换的基础预处理上,RFR作为表现最佳的预处理模型,测试集平均R2=0.746(RMSE=2.707),其优势在散射校正预处理上表现最明显,如MSC-RFR和SNV-RFR的R2分别为0.772和0.775;XGBoost次之,平均R2=0.666,在MSC预处理下表现最好(R2=0.703);KNN和GBDT表现较差,平均R2分别为0.613和0.587,其中GBDT在SG预处理下出现过拟合现象(训练集R2=0.618,测试集R2=0.588,泛化缺口ΔR2=0.030),表明其对高维光谱适应力不足。综上所述,RFR模型表现最佳,其性能优于XGBoost、KNN以及GBDT模型。
图5展示了基于4种预处理方法的RFR模型对野苹果冠层SPAD值的预测效果。结果表明,SNV-RFR和MSC-RFR的预测点最贴近1∶1等线,分别取得了最高测试集精度(R2=0.775,R2=0.772)和最低误差(RMSE=2.645,RMSE=2.508);SG-RFR和MA-RFR的表现次之,SG预处理下的低值样本(SPAD<25)出现轻微高估(预测点位于参考线上方),而MA的预测点离散度最大(R2=0.718),西北部低值样本偏离参考线超过±3 SPAD。散射校正类预处理(SNV、MSC)的预测效果显著优于平滑类(SG、MA),直接验证了表4中关于散射校正能够将RFR测试集R2提升至0.772~0.775的核心结论。
表4 基础处理模型精度统计
Table 4 Accuracy Statistics of the Basic Processing Model
模型Model训练集Training set测试集Testing set预处理方法Pretreatment method SG MSC SNV MA SG MSC SNV MA训练集Training set测试集Testing set R2 R2模型Model R2 R2 RFR XGBoost GBDT 0.727 0.806 0.792 0.737 0.618 0.613 0.629 0.599 RMSE 2.517 2.135 2.120 2.407 2.975 3.200 2.941 3.312 0.720 0.772 0.775 0.718 0.588 0.586 0.585 0.587 RMSE 2.734 2.508 2.645 2.941 3.315 2.832 3.347 2.787 KNN预处理方法Pretreatment method SG MSC SNV MA SG MSC SNV MA 0.654 0.711 0.702 0.642 0.577 0.637 0.660 0.605 RMSE 2.801 2.582 2.877 2.890 3.189 3.089 2.945 3.283 0.635 0.703 0.685 0.64 0.576 0.633 0.646 0.595 RMSE 3.275 2.872 2.370 3.170 3.295 2.778 2.827 2.706
图5 4个较优模型对实测值与测试集的拟合结果
Fig. 5 Shows the fitting results of the measured values and the test set by the four superior models
将一阶导数变换引入高光谱数据预处理能显著提升模型性能。SG处理可以去除高光谱高分辨率下的频谱曲线高频噪声(本文选用21窗口),继而进行一阶导数变换,该变换能明显增强光谱曲线的形态特征,特别是对叶绿素较为敏感的红边区域(680~750 nm)。如图3所示,光谱曲线在红边区域(约694.58 nm)出现了反射率跳跃,而一阶导数变换能突出红边区域的反射率变化,精准显示出了叶绿素对红边区域的敏感性。如表3所示,引入D1并与SG预处理相结合,使得敏感波段组(SPAD相关系数r>0.7)在红边区域的占比大幅提升了32%,提高了特征的区分性。
由表5可知,SG-D1-RFR模型在测试集上表现出较高的预测能力(R2=0.818,RMSE=2.419)。与2.3中基础预处理(无导数)时的最优模型(SNVRFR)相比,R2增加了5.6%,RMSE降低了8.6%。SG-D1-RFR验证了这一性能,预测点密集分布在1∶1等线附近,离散度远低于基础预处理的最优模型图SNV-RFR和MSC-RFR(图6)。
表5 基础-一阶导数处理模型精度统计
Table 5 Accuracy statistics of the Basic - First-order Derivative Processing Model
模型Model训练集Training set测试集Testing set预处理方法Pretreatment method SG-D1 MSC-D1 SNV-D1 MA-D1 SG-D1 MSC-D1 SNV-D1 MA-D1训练集Training set测试集Testing set R2 R2模型Model R2 R2 RFR XGBOOST GBDT 0.833 0.860 0.830 0.824 0.653 0.614 0.629 0.613 RMSE 1.891 1.917 1.985 2.051 3.098 3.265 3.026 2.970 0.818 0.727 0.732 0.770 0.645 0.591 0.612 0.595 RMSE 2.419 2.398 2.749 2.473 2.522 2.709 3.094 3.346 KNN预处理方法Pretreatment method SG-D1 MSC-D1 SNV-D1 MA-D1 SG-D1 MSC-D1 SNV-D1 MA-D1 0.733 0.619 0.580 0.693 0.750 0.712 0.694 0.639 RMSE 2.622 3.040 2.641 2.648 2.436 2.801 2.899 2.871 0.725 0.604 0.577 0.689 0.729 0.711 0.686 0.620 RMSE 2.470 3.062 4.138 3.002 2.673 2.095 2.372 3.232
图6 基础-一阶导数处理下4种模型最优拟合结果
Fig. 6 Shows the optimal fitting results of four models under the basic - first-order differentiation processing
KNN及XGBoost同样受益于SG-D1的预处理特征。SG-D1-KNN(R2=0.729)和SG-D1-XGBoost(R2=0.725)的测试集精度比其基础预处理均有提高(KNN:R2=0.613;XGBoost:R2=0.666);SG-D1-KNN、SG-D1-XGBoost的拟合效果优于基准(表4)。然而,二者的最终精度仍远低于SG-D1-RFR,表明在处理高维、复杂的高光谱衍生特征(DSI,RSI,NDSI)时,其学习能力或抗过拟合能力不及RFR。GBDT在SG-D1预处理下表现最差,略高于其在基础预处理下的平均表现(GBDT:R2=0.587),且绝对值最低,增幅最小(表5)。验证结果进一步表明,该模型在高维数据情境下仍存在适配缺陷,该问题在2.3节SG-GBDT试验中已体现出来。尽管SG-D1预处理可在一定程度上提升精度,却并未突破GBDT面对高维特征时的固有局限,SG-D1-GBDT的预测散点依旧较为离散(图6)。
根据2.2、2.4小节的结论,确定SG-D1为最佳处理方法。选择SG-D1处理下的敏感窄波段光谱指数NDSI(546.30,419.52)、RSI(419.52,492.43)、DSI(422.08,637.21),分别计算波段指数,并将其作为多属性输入RFR,计算反演SPAD值,进而获得研究区野苹果冠层叶绿素含量的空间分布图(图7)。
图7 基于SG-D1-RFR的研究区野苹果SPAD反演图
Fig. 7 Inversion map of SPAD of wild apples in the study area based on SG-D1-RFR
分布结果显示,树影过重区域(SPAD>35)受遮阴影响,红边波段(680~750 nm)反射率畸变,近红外多次散射,导致一阶导数NDSI/RSI指数失真;高枝枯冠(SPAD<18)叶绿素极度匮乏、组织被破坏,550 nm绿峰消失且近红外反射率低于20%,模型可精准捕捉其生理退化特征;低矮草本背景(SPAD 20~25)呈现平缓红边斜率与40%~45%的近红外反射率,与光谱形态吻合。尽管阴影干扰导数变换,但空间格局仍清晰刻画野苹果冠层叶绿素分布:东南侧高值区>32,西北侧低值区<28。总体而言,研究区野苹果树冠层和草地的叶绿素含量(SPAD值)均表现正常。而野苹果冠层SPAD值可视化反演图则更直观清晰地揭示了野苹果冠层SPAD值的空间分布,这对及时掌握野苹果的营养状况与病虫害防治等具有一定的促进作用。
叶片SPAD值作为植物生理生态研究的关键敏感性指标[23],与作物的光合作用密切相关,不仅是表征植物健康状态的关键变量之一,也是实施精准农业管理的重要依据。本文对原始光谱数据进行了平滑和一阶导数预处理,发现基于一阶导数构建的窄波段差值植被指数MA-D1-NDSI(580.43 nm,447.92 nm)与SPAD值的相关性最强,相关系数r达0.75。进一步研究表明,系统构建的窄波段植被指数结合一阶导数处理,可显著提升SPAD值的估算精度,其中SG-D1-RFR模型决定系数R2为0.818,均方根误差RMSE为2.419,明显优于其他模型。
针对新疆野苹果,本研究提出的SG平滑联合一阶导数的预处理方案(SG-D1)提高了光谱特征的可分性(测试集R2=0.818)。SG平滑(波段窗口为21)过滤了高频的传感器高空噪声、无人机抖动和大气干扰等,而D1放大了红边区叶绿素敏感特征,这与Zhang等[24]在苹果树冠层研究中“导数变换提高了红边区域敏感度”的结论一致。其次,本研究基于SNV与MSC等散射校正过滤了叶表面散射与土壤背景,与以往的大田作物水稻、小麦、玉米等相比,精度明显提高,但对新疆野苹果冠层三维结构(枝叶混搭、阴影等)干扰的校正效果不如SG平滑。靖娟利等[25]在柑橘研究中也有此类发现,即MSC抑制冠层垂直背景杂音的能力低于低矮作物。
鉴于利用RFR、XGboost、GBDT以及KNN等机器学习模型进行作物生化参数估测的研究较多,本研究在此基础上,结合DSI、RSI、NDSI三个窄波段光谱指数,构建了基于新疆野苹果叶片SPAD值估测的高光谱模型。结果表明,不同的预处理方式对模型估算结果具有较大的影响。SG-D1-RFR模型对新疆野苹果SPAD值估算的效果最佳,表明在模型的建立过程中应选择适合的预测模型和预处理方法,避免出现过拟合现象,提高模型的估算精度。RFR模型因具有集成学习特性及高维数据不易过拟合等特点,利用指数构建的光谱特征具有较好的预测结果,目前广泛应用于植物叶片参数预测。例如,Wang等[26]证实利用无人机多光谱影像及RFR模型,能够高精度地估测玉米叶片含水量,其效果优于MLR和RR模型。研究结果进一步表明,KNN在R2和RMSE指标上与RFR相近;GBDT对高维特征不敏感且泛化能力差;SG-D1-RFR的准确率较GBDT、KNN提高了16.5%以上,这一发现验证了王鑫梅等[27]关于RFR模型在核桃冠层N素反演中优于SVM模型的结论,表明RFR对于复杂林木冠层参数的反演具有普遍适应性。
无人机搭载高光谱传感器获取的研究区野苹果树冠层和草地的SPAD值(叶绿素相对含量)分布,不仅反映了野苹果冠层叶绿素含量的空间分布情况,还揭示了研究区域内外野苹果冠层叶绿素含量的差异。然而,本试验在仅3 hm2的平地环境中进行,而新疆野苹果主要生境和分布区域是山地环境(如天山野果林)。为了更为全面、客观地反映新疆野苹果生理生态对环境的响应特征,提高新疆野苹果研究结果的适用性,后期研究将增加无人机高度并扩大研究区范围,进一步提取冠层信息。此外,笔者团队将对获取的野苹果不同生长时期的高光谱影像进行监测,以便揭示野苹果野外分布的叶绿素特征。针对树荫导致的SPAD值过高的问题,下一步将结合LiDAR进行阴影校正,并基于多时相无人机高光谱影像构建野苹果叶绿素含量动态模型。
本研究基于无人机获取的萨哈野果林3 hm2高光谱影像,对其范围内的85棵野苹果树冠层进行光谱提取,利用8种预处理方法结合3种窄波段植被指数构建反演模型,探讨了不同预处理方式对模型性能效果的影响。结果表明,SG-D1预处理方式显著提高了模型精度,为基于机器学习方法反演新疆野苹果冠层叶绿素含量提供了范例。此外,基于SGD1-RFR模型生成了研究区SPAD值空间分布图,显著提升了无人机高光谱在野果林大范围监测中的方法可行性与实践应用价值。
[1] 秦爱丽,刘博,陈强,郑祥坤,金崑. 伊犁和塔城地区新疆野苹果种群结构及动态特征[J] . 生态学报,2025,45(1):197-209.QIN Aili,LIU Bo,CHEN Qiang,ZHENG Xiangkun,JIN Kun.Population structure and dynamic characteristics of Mɑlus sieversii distributed in Ili and Tacheng regions of Xinjiang,China[J] .Acta Ecologica Sinica,2025,45(1):197-209.
[2] 骆美雯,朱威霖,曲梦君,雷训,王文凯,李景文. 额尔齐斯河流域河谷林叶绿素含量特征及其影响因素[J] . 北京林业大学学报,2025,47(10):63-73.LUO Meiwen,ZHU Weilin,QU Mengjun,LEI Xun,WANG Wenkai,LI Jingwen. Characteristics of chlorophyll content of valley forests in the Irtysh River Basin of northwestern China and its influencing factors[J] . Journal of Beijing Forestry University,2025,47(10):63-73.
[3] 李玮祎,孙明馨,曾风玲,王凤文. 低温胁迫下冬小麦叶片叶绿素含量的高光谱估算[J] . 中国农业气象,2022,43(2):137-147.LI Weiyi,SUN Mingxin,ZENG Fengling,WANG Fengwen.Hyperspectral estimation of chlorophyll content in winter wheat leaves under low temperature stress[J] . Chinese Journal of Agrometeorology,2022,43(2):137-147.
[4] 李成举,刘寅笃,秦天元,王一好,范又方,姚攀锋,孙超,毕真真,白江平. 基于机器学习的马铃薯叶片叶绿素含量估算[J] .光谱学与光谱分析,2024,44(4):1117-1127.LI Chengju,LIU Yindu,QIN Tianyuan,WANG Yihao,FAN Youfang,YAO Panfeng,SUN Chao,BI Zhenzhen,BAI Jiangping.Estimation of chlorophyll content in potato leaves based on machine learning[J] . Spectroscopy and Spectral Analysis,2024,44(4):1117-1127.
[5] LIU Q S,CHEN F,CUI N B,WU Z J,JIN X L,ZHU S D,JIANG S Z,GONG D Z,ZHENG S S,ZHAO L,WANG Z H. Inversion of citrus SPAD value and leaf water content by combining feature selection and ensemble learning algorithm using UAV remote sensing images[J] . Agricultural Water Management,2025,314:109524.
[6] HE N,CHEN B,LU X J,BAI B,FAN J C,ZHANG Y J,LI G W,GUO X Y. Integration of UAV multi-source data for accurate plant height and SPAD estimation in peanut[J] . Drones,2025,9(4):284.
[7] 朱志成,武永峰,马浚诚,冀琳,柳斌辉,靳海亮. 基于无人机载遥感的水分胁迫下冬小麦叶绿素变化及冠层光谱响应[J] . 光谱学与光谱分析,2023,43(11):3524-3534.ZHU Zhicheng,WU Yongfeng,MA Juncheng,JI Lin,LIU Binhui,JIN Hailiang. Response of winter wheat canopy spectra to chlorophyll changes under water stress based on unmanned aerial vehicle remote sensing[J] . Spectroscopy and Spectral Analysis,2023,43(11):3524-3534.
[8] 谢东,何敬,何嘉晨,王彬,林远杨,刘刚. 基于无人机高光谱影像的水稻叶片SPAD值反演方法研究[J] . 山西农业大学学报(自然科学版),2024,44(1):120-129.XIE Dong,HE Jing,HE Jiachen,WANG Bin,LIN Yuanyang,LIU Gang. Inversion method of rice leaf SPAD values based on UAV hyperspectral imagery[J] . Journal of Shanxi Agricultural University (Natural Science Edition),2024,44(1):120-129.
[9] 陈圯凡,郭发旭,冯全. 基于机器学习和无人机高光谱遥感的马铃薯SPAD值估算[J] . 河南农业科学,2024,53(8):133-144.CHEN Yifan,GUO Faxu,FENG Quan. Estimation of potato SPAD values based on machine learning and UAV hyperspectral remote sensing[J] . Journal of Henan Agricultural Sciences,2024,53(8):133-144.
[10] 呼斯乐,包玉龙,图布新巴雅尔,陶际峰,郭恩亮. 基于无人机高光谱和集成学习的春小麦叶绿素含量反演[J] . 中国农业科技导报(中英文),2025,27(6):93-103.HU Sile,BAO Yulong,TU Buxinbayaer,TAO Jifeng,GUO Enliang. Chlorophyll content inversion of spring wheat based on unmanned aerial vehicle hyperspectral and integrated learning[J] .Journal of Agricultural Science and Technology,2025,27(6):93-103.
[11] 栗方亮,孔庆波,张青. 基于光谱特征参数的琯溪蜜柚叶片叶绿素含量估算[J] . 福建农业学报,2021,36(12):1447-1456.LI Fangliang,KONG Qingbo,ZHANG Qing. Spectral measurements-based estimation for chlorophyll in Guanxi Honey Pomelo leaves[J] . Fujian Journal of Agricultural Sciences,2021,36(12):1447-1456.
[12] 李旭,石子琰,刘伟,白铁成,吴翠云,张宇阳,邬竞明. 基于高光谱的枣树叶片氮素表征方法[J] . 华中农业大学学报,2023,42(3):203-210.LI Xu,SHI Ziyan,LIU Wei,BAI Tiecheng,WU Cuiyun,ZHANG Yuyang,WU Jingming. Method for characterizing nitrogen in jujube leaves based on hyperspectral analysis[J] . Journal of Huazhong Agricultural University,2023,42(3):203-210.
[13] LI Y,WU T,GE Y,XI S Z,ZHANG T X,ZHANG W. Semi-supervised cooperative regression model for small sample estimation of citrus leaf nitrogen content with UAV images[J] . International Journal of Remote Sensing,2023,44(23):7237-7262.
[14] 林培钧,崔乃然. 天山野果林资源[M] . 北京:中国林业出版社,2002.LIN Peijun,CUI Nairan. Tianshan wild fruit forest resources[M] .Beijing:China Forestry Publishing House,2002.
[15] AASEN H,BURKART A,BOLTEN A,BARETH G. Generating 3D hyperspectral information with lightweight UAV snapshot cameras for vegetation monitoring:From camera calibration to quality assurance[J] . ISPRS Journal of Photogrammetry and Remote Sensing,2015,108:245-259.
[16] 马荣菲,陈妍,侯鹏,任晓琦. 植被叶绿素含量的高光谱遥感反演方法研究进展[J] . 林草资源研究,2024(5):166-178.MA Rongfei,CHEN Yan,HOU Peng,REN Xiaoqi. Progress on hyperspectral remote sensing inversion method for vegetation chlorophyll content[J] . Forest and Grassland Resources Research,2024(5):166-178.
[17] 陈晓凯,李粉玲,王玉娜,史博太,侯玉昊,常庆瑞. 无人机高光谱遥感估算冬小麦叶面积指数[J] . 农业工程学报,2020,36(22):40-49.CHEN Xiaokai,LI Fenling,WANG Yuna,SHI Botai,HOU Yuhao,CHANG Qingrui. Estimation of winter wheat leaf area index based on UAV hyperspectral remote sensing[J] . Transactions of the Chinese Society of Agricultural Engineering,2020,36(22):40-49.
[18] 赖佳政,李贝贝,程翔,孙丰,陈炬廷,王晶,张芊,叶协锋. 基于无人机高光谱遥感的烤烟叶片叶绿素含量估测[J] . 智慧农业(中英文),2023,5(2):68-81.LAI Jiazheng,LI Beibei,CHENG Xiang,SUN Feng,CHEN Juting,WANG Jing,ZHANG Qian,YE Xiefeng. Monitoring of leaf chlorophyll content in flue-cured tobacco based on hyperspectral remote sensing of unmanned aerial vehicle[J] . Smart Agriculture,2023,5(2):68-81.
[19] 徐逸,甄佳宁,蒋侠朋,王俊杰. 无人机遥感与XGBoost的红树林物种分类[J] . 遥感学报,2021,25(3):737-752.XU Yi,ZHEN Jianing,JIANG Xiapeng,WANG Junjie. Mangrove species classification with UAV-based remote sensing data and XGBoost[J] . National Remote Sensing Bulletin,2021,25(3):737-752.
[20] 孟畅,红梅,李斐. 高光谱敏感波段筛选与机器学习协同提升土壤重金属预测精度[J] . 生态环境学报,2025,34(6):950-960.MENG Chang,HONG Mei,LI Fei. Collaborative enhancement of soil heavy metal prediction accuracy using hyperspectral sensitive band selection and machine learning[J] . Ecology and Environmental Sciences,2025,34(6):950-960.
[21] 齐浩,吕亮杰,孙海芳,李偲,李甜甜,侯亮. 基于无人机高光谱遥感与机器学习的小麦品系产量估测研究[J] . 农业机械学报,2024,55(7):260-269.QI Hao,LÜ Liangjie,SUN Haifang,LI Si,LI Tiantian,HOU Liang. Yield estimation of wheat lines based on UAV hyperspectral remote sensing and machine learning[J] . Transactions of the Chinese Society for Agricultural Machinery,2024,55(7):260-269.
[22] 郭金锋,张志从,吾木提·艾山江,周忠晔,续文宇,玉苏甫·艾海买江. 基于小波变换和VCPA-GA算法的人参果叶片叶绿素含量高光谱估算[J] . 热带地理,2025,45(3):514-526.GUO Jinfeng,ZHANG Zhicong,Umut·Hasan,ZHOU Zhongye,XU Wenyu,Yusup·Ahmat. Hyperspectral estimation of chlorophyll content in ginseng fruit leaves based on wavelet transform and VCPA-GA algorithm[J] . Tropical Geography,2025,45(3):514-526.
[23] 宫兆宁,赵雅莉,赵文吉,林川,崔天翔. 基于光谱指数的植物叶片叶绿素含量的估算模型[J] . 生态学报,2014,34(20):5736-5745.GONG Zhaoning,ZHAO Yali,ZHAO Wenji,LIN Chuan,CUI Tianxiang. Estimation model for plant leaf chlorophyll content based on the spectral index content[J] . Acta Ecologica Sinica,2014,34(20):5736-5745.
[24] ZHANG C J,CHEN Z B,CHEN R Q,ZHANG W J,ZHAO D,YANG G J,XU B,FENG H K,YANG H. Retrieving the chlorophyll content of individual apple trees by reducing canopy shadow impact viɑ a 3D radiative transfer model and UAV multispectral imagery[J] . Plant Phenomics,2025,7(1):100015.
[25] 靖娟利,丁顺顺,窦世卿,华志铭,刘兵. 基于无人机高光谱的柑橘冠层叶绿素含量预测模型[J/OL] . 桂林理工大学学报,2025:1-12. (2025-05-18). https://link.cnki.net/urlid/45.1375.N.20250517.1159.002.JING Juanli,DING Shunshun,DOU Shiqing,HUA Zhiming,LIU Bing. Prediction model of Citrus cɑnopy chlorophyll content based on UAV hyperspectral data[J/OL] . Journal of Guilin University of Technology,2025:1-12. (2025-05-18). https://link.cnki.net/urlid/45.1375.N.20250517.1159.002.
[26] WANG Y C,WANG J L,LI J Y,WANG J C,XU H,LIU T,WANG J. Estimating maize leaf water content using machine learning with diverse multispectral image features[J] . Plants,2025,14(6):973.
[27] 王鑫梅,张劲松,孟平,杨洪国,孙圣. 基于无人机遥感影像的核桃冠层氮素含量估算[J] . 农业机械学报,2021,52(2):178-187.WANG Xinmei,ZHANG Jinsong,MENG Ping,YANG Hongguo,SUN Sheng. Estimation of nitrogen content in walnut canopy based on UAV remote sensing image[J] . Transactions of the Chinese Society for Agricultural Machinery,2021,52(2):178-187.
Estimation of chlorophyll content in the canopy of Malus sieversii based on unmanned aerial vehicle hyperspectral imaging combined with ma‐chine learning algorithms