猕猴桃亦称奇异果,含有多种微量元素和丰富的有机物,营养价值高且口感酸甜,拥有“水果之王”的美誉。糖度是猕猴桃主要的内部参数之一,猕猴桃内部品质参数直接影响其口感,也是决定猕猴桃采摘时间及储存时间的重要指标,猕猴桃的糖度中85%左右的成分是可溶性固形物,因此常用的传统糖度检测方法是采用折射仪测量被挤出的果汁中的可溶性固形物含量来反映糖度值,该方法繁琐、耗时且破坏样本,无法实现快速的工业化检测。高光谱成像技术因其信息量大、光谱分辨率高、操作方便等特点,已广泛用于如苹果、樱桃、柿子、芝麻菜、梨、荔枝等]果蔬内部参数的无损检测。
1 实验部分
1.1 材料
实验材料为某猕猴桃基地现采的“红阳”猕猴桃。选取120个大小相近、表面无损伤和疤痕的猕猴桃样本并依次编号,静置于实验室24h,等待采集其高光谱图像并随后测量其糖度,实验期间的环境温度(26±1)℃。
1.2仪器与设备
本实验应用了400-1000nm的高光谱相机,可采用杭州彩谱科技有限公司产品FS13进行相关研究。光谱范围在400-1000nm,波长分辨率优于2.5nm,可达1200个光谱通道。采集速度全谱段可达128FPS,波段选择后最高3300Hz(支持多区域波段选择)。
1.3高光谱图像信息采集
高光谱分选仪预热30 min后开始采集图像,以保证采集时的环境温度和光源强度在采集初期和后期保持一致。将标准白板的高度调整至与猕猴桃样本在同一焦面上,光谱相机曝光时间为13.5ms,样本平台与镜头的距离为170mm,电控移动平台前进距离为11 cm,其前进速度及回退速度分别为0.46和5cm·s¹。
1.4猕猴桃糖度测定
采集完所有样本的高光谱图像后,当天进行并完成猕猴桃糖度测定。根据行业规定,常以猕猴桃赤道部位的糖度来代表整体糖度,参照NT/T2637—2014《水果、蔬菜制品可溶性固形物含量的测定-折射仪法》,对每个猕猴桃样本依次将其赤道上的果皮削掉,取出适量果肉压汁,随后用一次性滴管将汁液滴到SKY107手持式糖度折射仪的检测槽中,读出该样本的糖度理化值示数。每个样本以两次平行测定结果的算术平均值作为该样本的糖度理化测量值。
1.5 高光谱数据的提取
采用Spec View软件对猕猴桃样本的原始高光谱图像进行黑白校正,利用ENVI5.1软件从校正后的图像中选择猕猴桃整个赤道区域作为感兴趣区域并提取光谱,以ROI区域的平均光谱作为此猕猴桃的原始光谱信息,如图2(a)所示。
由图2(a)可知,原始光谱曲线的首尾两端存在明显噪声,故选取每个样本400~1000 nm波长范围内的高光谱信息作为有效光谱,如图2(b)所示,该范围共计237个波长。
1.6模型评价
利用5个指标值即校正集的相关系数(Rc)及其均方根误差(RMSEC)、预测集的相关系数(Ro)及其均方根误差(RMSEP)、相对分析误差(RPD)来评价模型的预测性能。其中,Rc和Rp越接近于1,表明模型的稳定性及拟合度越高;RMSEC和RMSEP越接近于0,表明模型的预测能力越强;RPD定义为样本的标准差与其均方根误差之比,若RPD<1.4,模型对样本无法实施预测,1.4≤RPD<1.8,模型可对样本进行粗略预测,1.8≤RPD<2.0,模型可对样本进行较好预测,RPD≥2,模型可对样本进行极好预测。
2 结果与讨论
2.1样本划分
对120个猕猴桃样本利用拉依达准则方法进行异常值的判别和剔除,结果显示无异常值,随后将其按照3:1比例用KS(Kennard-Stone )算法将其划分为90个校正集样本、30个预测集样本,猕猴桃样本糖度测量值结果见表1。
2.2光谱及预处理
为了减少提取的光谱数据中掺杂的噪声和光谱倾斜,以便提高光谱分辨的灵敏度,进行合理的光谱预处理是必要的。利用多元散射校正、标准正态变量变换、直接正交信号校正等3种方法对有效光谱进行预处理,并分别建立对应的ELM预测模型,其预测结果见表2。由表2可知,DOSC-ELM模型的Rc和Rr值最大且RMSEC和RMSEP值最小,预测效果好,故后续均基于DOSC预处理方法进行。
DOSC方法通过将光谱矩阵与待测浓度矩阵正交,在不损害数据结构特性的前提下滤除原始光谱中与糖度不相关的信息,保留最相关的信息用于构建预测模型。DOSC预处理前的校正集和预测集的光谱反射率分别如图3(a)和图3(c)所示,DOSC预处理后的校正集和预测集的光谱反射率分别如图3(b)和图3(d)所示。
从图3可知,相较于未经过预处理的高光谱图像,DOSC预处理后的光谱图像线条更加紧密,图3(b)和图3(d)中所凸起的波峰也反映了预处理后的光谱数据与待测成分即糖度的相关性得到了良好的提升。DOSC预处理前后各高光谱波段与猕猴桃糖度的相关系数如图4所示。通常相关系数0.5≤|r<0.8时为显著相关,|r|≥0.8时为高度相关,由图4可知,经DOSC预处理后大量光谱数据与糖度呈现显著甚至高度相关。
2.3 特征光谱变量的提取与组合
2.3.1 基于IRIV的特征光谱变量提取
对预处理后的光谱用IRIV算法提取特征光谱变量时,设定IRIV算法的交叉验证次数为5,PLS模型中的最大主成分个数为10。IRIV算法一共进行了7轮迭代,如图5所示。在图5中,前4轮迭代过程中特征光谱变量的个数迅速减少,变量个数从237个缩减到36个,随着特征光谱变量个数减少的速度放缓,经第6轮迭代后完全剔除了其中的无信息变量和干扰变量,变量缩减到10个,在反向消除2个变量后,最终得到8个特征光谱变量,占全光谱波段的3.4%。经过IRIV提取的特征光谱变量分布如图6所示。
2.3.2 基于CARS的特征光谱变量提取
对预处理后的光谱用CARS算法提取特征光谱变量时,设定蒙特卡罗采样50次,采用5折交叉验证法。图7(a)为呈现指数衰减函数的选择过程,特征光谱变量的数量随着采样次数的增加先迅速下降然后平缓减少,具有“粗选”和“精选”2个特征。由图7(b)可知,随着Monte-Carlo采样次数的增加,内部交叉验证均方根误差(RMSECV)呈先缓慢减小后陡然增大的趋势,这是由于选择过度而移除了富含信息的关键变量,导致模型的预测性能下降。图7(c)是特征光谱变量随着采样次数变化的回归系数路径图,当图7(b)中RM-SECV值达到最小值时,各特征光谱变量的回归系数位于图7(c)中的“*”所在的垂直线位置,此时采样运行5次,最终提取出49个特征光谱变量。
3结论
以“红阳”猕猴桃为研究对象,本文利用高光谱成像技术结合不同特征光谱变量提取方法构建不同模型,对猕猴桃糖度进行无损检测。研究结果如下:
(1)对猕猴桃原始有效光谱分别采用MSC,SNV和DOSC预处理后,结合ELM模型的预测结果,分析不同预处理方法对模型预测精度的影响,对比结果显示DOSC预处理效果最好。
(2)对DOSC预处理后的光谱分别采用一次降维、一次组合降维和二次组合降维共7种特征提取方法,提取到的特征光谱变量个数分别为49,9,8,58,55,11和19,占全光谱波段的20.7%,3.8%,3.4%,24.5%,23.2%,4.6%和8%。