中国是世界上茶科植物分布最广的国家,也是世界上最大的茶籽油生产基地。茶籽油色清味香,是我国传统食用植物油,在国内高端食用油市场上仅次于橄榄油。为更好地选育优良品种,提高茶籽油的市场竞争力,迫切需要一种快速、准确、高效分析油茶籽品质的方法。本研究通过油茶籽油酸、亚油酸、棕榈酸的化学定量计量法比较主成分回归法、偏最小二乘回归和径向基神经网络3种高光谱校正建模的效果,寻求检测油茶籽脂肪酸成分含量的最优建模方法,实现对油茶籽脂肪酸成分含量的快速、可靠、无损检测。
1 实验仪器与方法
分别从湖南、湖北、江西等地采集了30个品种的油茶种子,去壳、编号,将茶籽分为校正集20个,预测集10个用于实验。
1.1 仪器
本研究应用了400-1000nm的高光谱相机,可采用杭州彩谱科技有限公司产品FS13进行相关研究。光谱范围在400-1000nm,波长分辨率优于2.5nm,可达1200个光谱通道。采集速度全谱段可达128FPS,波段选择后最高3300Hz(支持多区域波段选择)。
1.2方法
1.2.1 油茶籽脂肪酸组成含量的化学测定
将油茶籽粉碎后用索氏抽提法获取油样,取油样30mg于10mL试管中,用移液管移取2mL异辛烷溶解试样,再用微量移液管加入4mL氢氧化钾甲醇溶液2mol/L),盖上玻璃塞剧烈振摇30s后静置至澄清;向溶液中加入少量硫酸氢钠,剧烈振摇,中和氢氧化钾;待盐沉淀后,将上层甲酯溶液倒入样瓶中,用气相色仪获得油茶籽中油酸、亚油酸、棕榈酸的含量。
1.2.2 油茶籽反射光谱采集
高光谱仪视场角25°,波段范围为400~1000nm,采样间隔1.4nm,数据间隔1nm,分辨率3nm,重复性优于0.3%;测量是在一个晴朗无风天气中进行的。测量时,传感器垂直向下,距离样品0.15m,每个样品测量前、后均用白板校正,每个样本连续采集30次取平均得样本光谱。
2 模型建立方法
首先用校正样本集建立校正模型,通过软件得出油茶籽光谱与油茶籽油酸、亚油酸、棕榈酸含量的相关系数,找出最优的光谱范围;通过逐步回归方法去除光谱中的冗余信息,然后采用主成分回归法PCR)、偏最小二乘回归法(PLS)及径向基神经网络法(RBF)建立预测模型后对模型进行外部验证。
3 结果与分析
3.1 油茶籽中脂肪酸组成的测定
高光谱仪在其测量临界区有较强的机器噪声,因此分析时截去两端噪声较严重波段,得高光谱如图1所示。其记录了400~920nm范围内样本的高光谱反射率。
油茶籽脂肪酸的主要成分是油酸、亚油酸、棕榈酸。这些物质中甲基、亚甲基的C-H键在近红外有较强的吸收。从图中可以看出不同品种的油茶籽在同一波长处有不同的反射率,故高光谱可以作为油茶籽脂肪酸含量定量分析的依据。
3.2 光谱预处理
由于检测到的光谱信号除含样品待测成分信息外,还包括各种仪器噪声,如高频随机噪声、基线漂移、杂散光及一些背景噪声等。因此,在数据分析前,对数据进行一些合理的预处理,减弱甚至消除各种因素对光谱信号的影响,为稳定、可靠地校正模型建立奠定基础。常用的预处理方法包括:平滑处理消除噪声及多元散射校正MSC)消除多重光谱偏差等。
表1所示为预处理前后油茶籽脂肪酸各成分模型的预测相关系数、预测集均方差、校正集均方差值。由表1可以看出,经过平滑和多元散射校正后油酸、亚油酸、棕榈酸的校正集相关系数增大,而校正集均方差、预测集均方差减小。这说明光谱的预处理是有效的。
3.3 光谱的波段选择
高光谱数据包含大量冗余信息,建模波段过宽会严重影响预测结果。首先,将校正集样本光谱逐个波段与油茶籽油酸、亚油酸、棕榈酸的化学测量值做相关性分析。其次,检测其显著性水平,用逐步回归滤除其中冗余波段,得到16个相关性较强、显著性水平较高的波段,如表2所示。
4结论
本实验采用高光谱和化学计量法对油茶籽中脂肪酸的成分进行测定,结果表明利用高光谱可以简单、快捷、无损、可靠、稳定的测量油茶籽中油酸、亚油酸、棕榈酸的含量,为大批量油茶籽脂肪酸含量的快速检测提供便捷技术。
本研究比较了主成分回归、偏最小二乘回归、径向基神经网络3种建模方法对油茶籽中油酸、亚油酸、棕榈酸的预测效果,结果表明径向基神经网络建模的预测效果最好,油酸、亚油酸、棕榈酸相关系数系数分别为0.9403、0.8935和0.9122;校正均方根误差和预测均方根误差分别为0.441、0.1749、0.0664和0.3518、0.184、0.162。