枇杷是蔷薇科、枇杷属植物,常绿小乔木被誉为“果之冠”,是一种药食两用的经济型水果,果味甘酸,供生食、蜜饯和酿酒用;枇杷在春末夏初成熟,正值水果淡季,是度淡水果。从成熟到最终售卖,枇杷需要经过采摘、储藏、包装、运输等一系列过程,由于枇杷皮薄、质细、松软多汁,在此过程中极易发生碰伤,表面变黑,影响终端售卖,造成极大的经济损失。因此,判断枇杷是否碰伤及其碰伤程度至关重要,提前挑选出碰伤枇杷可以节省仓储成本和运输成本:碰伤较轻的可以制作枇杷汁、枇杷膏等;碰伤程度略重的可以去除损伤部分制作枇杷罐头进行保存;碰伤程度严重的直接处理掉以节约仓储成本。
目前,在枇杷的采摘及采后处理过程中,枇杷是否受损往往通过操作员的肉眼进行辨别,受到个人习惯、光线强度和主观心理因素影响,效率低、准确度差,因此需要一种方法可以实现枇杷碰伤程度的高精度、快速、无损检测。
1、实验部分
1.1样品
实验样品枇杷购买某果园,共计135个。为减少其他无关因素对实验造成影响,枇杷的大小均为长轴60 mm,短轴40 mm左右。试验前先对样品进行挑选,去除表面损伤和畸形样品,保证样品外观无缺陷,无机械损伤等,最后对枇杷表面进行清洁处理并编号。
传统人工分类依据GB/T 13867—1992鲜枇杷果的标准进行分类,操作员依据个人经验对碰伤枇杷做了大概划分,由于操作员的主观性以及光线强度等环境影响,对枇杷分类极易造成误判。枇杷本身存在个体差异,受到枇杷自身的硬度、大小、成熟度等影响,在相同大小的力作用下,枇杷损伤区域的面积以及碰伤深度也会存在差异,这不符合单一变量原则,因此本研究通过控制碰撞高度来调节作用力,保持相同的力碰撞同一组内样品来获取碰伤枇杷。力的大小通过模拟真实环境中的跌落力,通过标准质量的枇杷的常规跌落高度推出力的大小,进一步根据碰撞面积选择合适的金属球,最终计算出碰撞高度。
实验中的表面碰伤样品,通过自由落体碰撞装置(如图1所示)获取,将直径30 mm,质量100 g的金属球在距离枇杷表面0.4、0.5和0.6 m处进行自由落体运动,撞击枇杷赤道区域,以此来模拟现实中的不同损伤程度枇杷。开关闭合时,电磁感应装置垂直向下投射红外光用于定位碰伤区域;开关打开时,电磁感应装置末端充斥着磁场,发生电磁感应作用,此时将碰撞金属球放置在此处可固定;最后,开关闭合,磁场消失,金属球进行自由落体运动,对枇杷进行碰撞。操作完成后将样品置于室温24 ℃环境中保存,使样品温度与室温保持一致。同一储存时间的不同碰伤等级枇杷,如图2所示。碰伤样品静置3 h后开始实验,利用高光谱成像系统获取轻度、中度、重度的碰伤枇杷高光谱图像,用于后续建立模型。由于枇杷样品是逐个测量,因此所有样品的测量时间略有差异。
本研究应用了400-1000nm的高光谱相机,可采用杭州彩谱科技有限公司产品FS13进行相关研究。光谱范围在400-1000nm,波长分辨率优于2.5nm,可达1200个光谱通道。采集速度全谱段可达128FPS,波段选择后最高3300Hz(支持多区域波段选择)。
枇杷平均反射光谱如图4所示,几种等级的枇杷光谱波形变化趋势基本一致,波峰波谷位于同一波长点,只是反射率的数值有所差异,在相同波长,随着碰伤程度增加,反射率下降。造成这种情况的原因是枇杷发生碰撞之后,原有的细胞壁和细胞膜遭到破坏,细胞内部的水分流失到枇杷表侧,随着碰伤程度增加,释放的水分增加。在图像上,枇杷表面变黑,枇杷碰伤时间越久,碰伤部位颜色越黑;在光谱上,由于枇杷内侧水分的释放,造成表面含水量增加,反射率降低。由于枇杷细胞水分的流失是一个缓慢变化的过程,随着水分的流失,枇杷的表侧颜色以及光谱也会出现缓慢的变化,因此枇杷碰撞不同时间后光谱检测结果会略有差异,但整体趋势是不变的。本次实验采集枇杷碰伤3 h后的光谱,是基于枇杷从果农果园中采集到入库储藏的运输时间在3h左右,而在入库储藏前对碰伤枇杷的高精度分拣可以减少碰伤枇杷腐烂感染正常枇杷带来的损失。
高光谱成像系统采集的枇杷图像分辨率为960×366pixel,图像中过多的采集了传送带背景,由于其不是纯黑背景,在卤素灯的作用下,造成其自身带有灰度值。实验采用的变量为RGB通道的均值及HSI模型的均值作为变量结合光谱信息进行建模分析,因此利用阈值分割的方法将枇杷样品图像作为前景从图片中分离出来,根据获取的边界值选用图像掩膜的方法保留前景灰度值进行后续计算,作为颜色特征与光谱特征混合建模进行分析。整体流程如图6所示。利用提取出的光谱特征、图像RGB特征、图像HSI特征建立光谱特征模型、光谱特征结合图像RGB特征模型、光谱特征结合图像HSI特征模型、光谱特征结合混合图像特征模型四种枇杷碰伤程度模型。
2、实验分析
2.1基于RF算法的枇杷碰伤程度分析
RF通过集成多个弱分类器,在多个分类器输出的分类结果中票选出投票次数最多的类别作为分类结果,精度和泛化能力较高。基于RF算法建立的枇杷碰伤程度模型如表1所示,其中基于光谱特征、光谱特征结合RGB图像特征、光谱特征结合HSI图像特征、光谱特征结合混合图像特征的RF模型预测集准确率分别为86.67%、91.11%、91.11%、91.11%。RF模型中,基于光谱特征建立的模型准确率最低,加入颜色特征后所建立的模型准确率都获得了提高,但是该模型中光谱特征结合RGB颜色特征、HSI颜色特征、混合图像特征情况下建模集的准确率相同,观察组内误判数可知准确率的提高主要是通过减小重度碰伤组的误判数来实现。
2.2基于PLS-DA算法的枇杷碰伤程度分析
PLS-DA,是一种统计学方法,将高维数据降维后建立回归模型并对结果进行分析。基于PLS-DA算法建立的枇杷碰伤程度模型如表2所示,其中基于光谱特征、光谱特征结合RGB图像特征、光谱特征结合HSI图像特征、光谱特征结合混合图像特征的PLS-DA模型建模集准确率分别为88.89%、91.11%、91.11%、90%,预测集准确率分别为86.67%、86.67%、88.89%、86.67%。PLS-DA模型中,从训练集结果来看,基于光谱特征建立的模型准确率最低,加人颜色特征后所建立的模型准确率都获得了提高。光谱特征、光谱特征结合RGB颜色特征、混合图像特征模型的预测集准确率相同,这是由于预测集组内样本数较小造成的,其RMSEC分别为0.323、0.304、0.321,相较于单光谱特征模型,结合颜色特征的模型RMSEC更小,稳定性更好。
3、结论
利用高光谱成像系统采集不同碰伤程度的枇杷样品的高光谱图像,基于阈值分割和图像掩膜方法提取出枇杷样品的图像信息,并从碰伤枇杷图像中提取出R、G、B通道的平均灰度值和H、S、I通道的平均灰度值作为枇杷碰伤程度模型的颜色特征,感兴区内100个像素点的平均光谱作为光谱特征。利用光谱特征和颜色特征结合化学计量学方法建立光谱特征、光谱特征结合RGB颜色特征、光谱特征结合HSI颜色特征、光谱特征结合混合颜色特征的碰伤程度模型,进行定性判别。结果表明,利用RF、PLS-DA、ELM、LIN-LS-SVM、RBF—LS-SVM算法建立的枇杷碰伤程度模型中,皆为光谱特征结合混合颜色特征模型分类效果最好,其准确率分别为91.11%、86.67%、95.56%、100%其中RBF-LS-SVM模型精度最高,达到了100%。利用高光谱成像系统实现了对枇杷不同碰伤程度的定性分析,该研究为后续利用高光谱成像技术结合颜色特征对水果进行定性判别提供理论基础。