本文以脐橙为实验对象,对采集得到的高光谱数据行进预处理和降维处理,提取出它们的特征波长。以降维过的高光谱数据建立数学模型来实现对样品农药残留浓度的判别,分析不同模型的性能好坏。
选取哒螨灵农药为实验对象,将选取好的80个脐橙样品洗净,放置通风处等其干燥完毕。然后随机将其分成4组,每种浓度每组各20个(1:400、1:800、1:1500以及不含农药)。同样的我们确定脐橙的感兴趣区域,得到感兴趣区域内的平均光谱作为原始光谱数据,如图所示。
提取每类样品的感兴趣光谱图,可以得到四类样品20组原始光谱图,下图为其中一组浓度为1:400的原始光谱。将得到的全部四组样品各20条原始光谱图。利用标准正态变换(SNV)后得到4类样品各20条原始光谱取平均得到的平均光谱曲线如图所示。
从图中可以看出不同浓度农药残留的脐橙光谱反射率曲线具有明显差异,不同浓度农药以及蒸馏水组的光谱平均反射率在400-1000nm的范围类曲线走势基本一致,并且部分波段下反射率差异较大,部分波段下曲线会重叠,无法识别出光谱反射率区别。可以看出在670nm和980nm处光谱有一个反射率波谷,而在700nm有一个较小的反射率波峰。在400-650nm反射率曲线基本重叠,在900-1000nm处蒸馏水和嘧霉胺组反射率曲线基本重叠,而在650-890nm处各组反射率曲线有明显差别。
通过主成分分析算法对预处理后的原始光谱数据进行特征提取,得到主成分图像和各个主成分的累积贡献率。一般而言,PC-1具有最多的原始图像信息,且前几个主成分基本包含99%的光谱信息,如表所示前四个主成分贡献率就可以达到99.87%。
用ENVI软件对实验样品进行PCA图像提取,每个主成分图像理论上都是由原始数据中每个波长下的灰度图像数字矩阵经过线性运算而形成,通过ENVI软件计算可以得到每个不同主成分的光谱数据,包括每个主成分的协方差、相关系数以及特征向量。一般情况下,PC-1包括的原始信息最多,前4个主成分图像如图所示。
通过提取PC-2和PC-3图像中所有波段的特征向量,我们可以绘制出高光谱主成分图像PC-2和PC-3的权重系数图如图4.5。就权重曲线而言。我们认为波峰和波谷处对应的波长就是特征波长,具有最佳信息量。可以看出PC-2的特征波长为500nm,680nm,980nm;PC-3选取的特征波长为500nm,580nm,850nm,930nm。选取500nm,580nm,680,850nm,930nm,980nm为特征波长。
本文对四组表面喷洒有不同浓度嘧霉胺农药的脐橙样品进行光谱提取和预处理,选用主成分分析法(PCA)和连续投影法(SPA)进行高光谱全波段下的降维以提取特征波长,然后就提取的特征波长分别建立支持向量机(SVM)、BP神经网络和极限学习机(ELM)分类模型,分析不同降维方法和不同分类模型结合的实验数据结果,选出判别脐橙表面不同浓度的最优模型。