茄子又称昆仑瓜、矮瓜、落苏和酪酥等,属于非呼吸跃变型果实,起源于亚洲东南热带地区,西汉时传入我国。茄子富含膳食纤维、维生素、多酚、蛋白质和矿物质等多种营养物质,具有降血脂、防治高血压和糖尿病、保肝以及抗氧化等保健功效。茄子的生产和开发利用市场前景广阔,然而茄子存在木栓化和烂果等缺陷问题,严重影响了茄子的产量和品质,进而降低了其商品性。木栓化可能是高温或者气候变化异常导致茄子钙硼缺失引起;烂果则可能由虫害、菌害、雨水和光照等因素造成。在实际生产过程中,将茄子木栓化和烂果样本剔除仍然靠人工来完成,不仅耗时耗力、效率低下,还易造成漏选,因此实现一种能够快速、准确识别木栓化和烂果茄子的方法则尤为重要。
高光谱成像技术将光谱分析技术和数字成像技术相结合,可以同时获得样本大量波段的空间图像信息和每一像素点的光谱信息,具有灵敏度高、测量速度快和抗干扰能力强等优点,广泛应用于农产品无损检测、病害检测等领域中。
本研究采用高光谱技术对茄子完好、木栓化和烂果进行检测,通过多种预处理方法对原始光谱数据进行预处理,并建立PLS判别模型比较分析,选择最佳预处理方法进行后续研究。采用SPA、RC和CARS对预处理后的光谱数据提取特征波长,基于特征波长分别建立PLS和MLR判别模型进行比较分析,以实现对茄子缺陷的定性判别,为进一步开发茄子在线分选装备提供了理论依据。
1材料与方法
1.1试验材料
为保证研究的可靠性,采摘时选择大小(单果质量450 g-680g)均匀,形状为近圆球形以及缺陷类型(完好、木栓化和烂果)齐全得茄子作为试验样本,图1所示为3类样本图。对其表面泥土进行清理,共挑选252个样本,包含完好样本170个,木栓化样本60个和烂果样本22个。采集各样本的高光谱图像,然后从中提取252个光谱数据,运用Kennard-Stone算法将3类样本按近似3:1的比例随机划分为校正集样本189个和预测集样本63个。
2 基于高光谱数据的茄子外观品质定性判别分析
2.1茄子完好、木栓化和烂果3种区域的平均光谱曲线图
使用ENVI4.7软件的提取感兴趣区域(ROI)函数分别提取茄子的木栓化、烂果和完好3种区域的光谱数据,然后计算并求取各类样本的平均光谱,如图2所示。“紫瓜”茄子呈类球状,且表皮光滑发亮,导致采集到的高光谱图像中间区域漫反射强度大、信噪比高,影响建模精度以及试验可靠性。因此,在利用ENVI4.7提取感兴趣区域时应避开中间反光区域。
由图2可知,完好茄子、木栓化区域和烂果区域的平均光谱曲线具有很大差别,在900~1300 nm范围内,完好区域的反射率最高,原因可能是完好茄子表皮光滑,对光的反射最强;在1200 nm附近的3种曲线均为波谷,这是由于茄子表皮叶绿素的C-H基团二级倍频吸收作用12;大于1350nm的波段范围,完好区域的反射率低于木栓化和烂果区域的反射率。
2.2特征波段提取
特征波段来源于全光谱波段,携带其最重要的光谱判别信息。其作用主要有:消除原始数据的线性相关性、奇异性和不稳定性;降低数据维数,减少变量数,排除多余的干扰信息等。特征波段的提取直接影响模型建立的效率以及建模后预测结果的可靠性和准确性。
2.2.1连续投影法(SPA)
连续投影算法是一种使矢量空间共线性最小化的前向变量选择算法。作为一种新兴的特征波长筛选方法,它能够有效消除波长变量之间共线性的影响,进而有效提取出特征波长变量。对normalize预处理后的样本光谱数据进行SPA特征波长提取,如图3所示。当特征波长数为14时,RMSE值为0.3274,且值达到最小;所提取的特征波长分别为:931.02、924.64、1399.29、1093.68、950.17、902.3、1380.21、1147.86、895.91、1345.23、1265.68、1332.5、1173.34、982.08 nm,其重要程度依次递减。
2.2.2回归系数法(RC)
回归系数法[15(RC):通过对预处理后的样本光谱数据建立PLS判别模型,并从模型中提取回归系数。本研究选取了9个特征波长值,分别为924、978、1103、1202、1367、1402、1586、1666、1681 nm,所依据的原则为:将局部极值作为特征波长值,如图5所示。
3结论
3.1基于高光谱技术采集茄子样本的高光谱数据。比较原始光谱数据和经过多种预处理方法预处理后建立PLS模型,结果表明,经Normalize预处理后的PLS判别模型效果最佳,其校正集决定系数R²为0.74,均方根误差RMSEC为0.33;其预测集决定系数Rp²为0.85,均方根误差RMSEP为0.26。
3.2采用SPA、RC和CARS分别对Normalize预处理后的光谱数据提取特征波长,基于特征波长分别建立PLS和MLR模型。比较多种模型可知,CARS-MLR模型效果最优,其校正集决定系数R²为0.94,预测集决定系数Rp²为0.90,RMSEC和RMSEP分别为0.19和0.21,预测集判别准确率达到96.82%,较好地实现了茄子外部缺陷的检测。