燕麦在《本草纲目》中又称雀麦、野麦。目前,燕麦主要分为皮燕麦和裸燕麦,在全世界42个国家有所种植,总产量在粮食作物中排第5,我国主要种植的是裸燕麦,占燕麦总量的90%以上,青海、内蒙古、甘肃等地为主要种植区。燕麦是低糖、高营养的作物,其膳食纤维中富含的β-葡聚糖具有降低胆固醇、降低血脂、平稳血糖和预防心血管疾病的功效。燕麦中β-葡聚糖含量的监测方法有刚果红检测法、酶检测法、改良酶检测法等,虽然这些方法的准确度高,但检测速度较慢且成本较高,不适合对燕麦中β-葡聚糖含量进行快速检测。
高光谱成像技术能够同时获得检测对象每个像素点的空间分布和光谱信息,提取出被测样本的外观信息和内部品质信息,能够实现对样本的快速、无损检测,同时不需要复杂的前处理,并能同时进行多组分检测。目前常见的有光栅分光技术、声光可调谐滤波分光技术、棱镜分光技术和铝片镀膜技术等。高光谱成像技术已在农业、食品领域得到广泛的研究和应用,如马溴等叫指出通过高光谱成像技术能获取水果丰富的图像等信息进行分析,在水果的综合品质无损检测方面有广阔的前景。
1材料与方法
1.1材料与仪器
燕麦:青海西宁周边种植,进行去壳处理,且无霉变、未发芽、个体完整,于20℃的室内存放备用。
应用了400-1000nm的高光谱相机,可采用杭州彩谱科技有限公司产品FS13进行相关研究。光谱范围在400-1000nm,波长分辨率优于2.5nm,可达1200个光谱通道。采集速度全谱段可达128FPS,波段选择后最高3300Hz(支持多区域波段选择)。
1.2试验方法
1.2.1样本制备
燕麦重复混匀后,采取四分法取出燕麦铺至直径10 cm、厚度1 cm的培养皿中,保持燕麦单粒铺满整个培养皿,燕麦粒之间的空隙越小越好。共做200个,随机分为150个建模组和50个预测组,并编号。
1.2.2高光谱数据采集
利用高光谱成像系统对所有样品进行光谱成像数据采集,如图1,选择的高光谱采集系统条件为相机高度33 cm、曝光时间25 ms、平台移动速度27 mm/s。
1.2.3噪声校正
通过标准的白板和黑板进行全白、全黑的标定图像扫描,获得全白和全黑环境下的标定图像,然后计算校正后的图像,通过计算可消除不同波段下光源强弱不均及仪器暗电流存在导致的噪声影响。
1.2.4数据预处理
由于测试样本为燕麦颗粒铺成的平面,样本的表面凹凸不平且有缝隙,因此需要最大限度地挖掘所检测的光谱数据中的有效信息,去除仪器噪声、样本的背景及杂光等对后期分析结果影响较大的数据。通过试验最终采取了25×25像素点的固定区域为样本的测试区域,计算其均值,采用变量标准化、多元散射矫正等方式矫正表面凹凸带来的测试影响,并在检测的波长范围内去除前后各20个波段。
2结果与讨论
2.1样本中β-葡聚糖含量的测定及统计分析
将经过高光谱数据采集后的样本进行粉粹,然后过0.2 mm筛制成待测样。采用NY/T 2006—2011《谷物及其制品中β-葡聚糖含量的测定》对燕麦中β-葡聚糖的含量进行测定。检测结果见表1。
由表1可以看出,建模组和预测组的燕麦中β-葡聚糖含量具有较好的一致性和均一性。
2.2样本的光谱特征
由150个建模组样本的原始光谱曲线图计算得出每个波长下150个样本的光谱反射率平均值,获得了建模组燕麦的平均光谱曲线图,如图2。
由图2可以看出,燕麦在640、840mm的波长附近有较为明显的光谱吸收,从而产生光谱反射的低谷。
2.3高光谱数据预处理和提取
运用分段线性回归的参数化数值分析方法对数据进行维度降低处理,最终选取波长640 nm,在该波长下能够在不降低检测准确度的情况下,提高识别的速度。本次研究获得的光谱反射率与待估算的β-葡聚糖含量数值的散点图见图3。
2.4基于BP神经网络的预测模型建立
基于BP神经网络建立燕麦中B-葡聚糖含量的预测模型,模型的结构示意图见图4。输人层的 数据向量是通过分段线性回归得到的特征光谱信息Pi,中间的隐藏网络层传递函数为正切函数logsig输出层即燕麦中β-葡聚糖的含量a。隐含网络层目前尚无明确的理论指导进行选择,本次试验结合样本的情况进行不断尝试并优化最终确定隐含层的节点数。采用的函数为logsig(Q+X),其中Q是试验中不同的特征光谱的加权计算权重,X为数值在计算时的残差,训练算法的函数选择高斯牛顿方法,最大训练次数为1000次,目标误差为0.02%。
通过对模型的训练试验,获得燕麦中β-葡聚糖含量的模型及估算结果,最终使模型的期望输出值与估算输出值接近,如图5所示,平均绝对偏差在0.02%以内,实现通过观测特征光谱估算燕麦中β-葡聚糖含量的定量模型。
2.5模型输出结果的检验
通过建立的BP神经网络模型,对50个预测组的样本进行估算,其中最小的差值为0,最大的差值为0.56,整体的准确率较高,且误差较小,详见表2。
由表2可以看出,估算值与检测值之间的差值大于0.5的仅一个,60%的样本数的差值小于0.2。通过对建模组和预测组的数据进行分析,结果见表3,可以发现建模组的R为0.97,RMSE为0.64,预测组的R为0.98,RMSE为0.58,模型预算表现的精确度较好。
图6是利用BP神经网络模型得到的估算值与利用NY/T 2006—2011得到的检测值的散点分布图,由图6可以看出,散点图中所有点基本在直线附近,说明预算组中利用模型估算的燕麦中β-葡聚糖的含量与采用NY/T 2006—2011检测的数值基本趋于一致,因此利用建立的BP神经网络模型对燕麦中β-葡聚糖的含量进行预测是可行的。
3结论
本文利用高光谱成像系统对燕麦进行400~1000mm范围的光谱反射扫描,采用了分段式线性回归分析的方法对数据进行处理,建立了3层BP神经网络模型,对燕麦中β-葡聚糖含量进行模型预测,获得了满意的精度。该试验为燕麦中β-葡聚糖含量的快速、无损检测提供了新的方法,为后续搭建多光谱成像系统提供了参考和依据,并在燕麦品质监控上有较为广阔的前景。