近红外光谱法预测烟草中的纤维素含量

近红外光谱法预测烟草中的纤维素含量

关键词:近红外光谱法;烟草;纤维素

摘要:为了快速测定烟草中的纤维素含量,对1214 个国产烤烟烟叶样品进行了近红外(NIR) 漫反射光谱扫描及其纤维素含量的化学测定,而后根据这些烟叶样品的NIR 光谱数据及其纤维素含量的化学测定数据,利用偏最小二乘法建立了烟叶纤维NIR 预测模型,并对建模参数和模型的预测效果进行了评价。结果表明: 优化后, 该NIR 模型预测纤维素的决定系数为019649 ,实际预测的平均相对偏差< 2 %。该模型适合大批量烟叶纤维素含量的快速分析。

烟草中纤维素的测定主要采用稀酸、稀碱与样品依次共煮后用有机溶剂处理,再经烘干后称重的方法。这种方法操作繁琐,费力耗时,且由于操作人员的技术差异会带来很大的误差。近年来,近红外(NIR) 光谱分析技术已用于烟草中多种化学成分的测定。由于纤维素分子结构中富含能产生NIR 吸收的C - H 和O - H 化学键,从理论上讲,不同烟草样品中的纤维素含量差异会很容易地在其NIR 吸收光谱中得到体现,因而用NIR 光谱法对烟草纤维素含量进行分析具有很大的可行性,但目前尚未见到有关用NIR 光谱法测定烟草中纤维素含量的报道。因此,作者开展了应用NIR 光谱法测定烟草中纤维素含量研究。

1  材料与方法

1.1  仪器设备

Unity Spectrastar2500XL 近红外光谱仪; FOSS CYCLOTEC 1093 型旋风磨(美国FOSS 公司,带40 目筛) ; 101A26 型普通可调温烘箱(上海崇明实验仪厂) ;BP2211D 型电子天平(感量0.01g ,德国赛多利斯公司) ; SX224210 型马福炉(长沙实验电炉厂) ;40目标准筛;以及实验室常规化学仪器等。

1.2  样品与处理

国家烟草专卖局“烟草近红外合作分析”项目用的来自全国各烟区的1214 个烤烟烟叶粉末样品,其中2003 年746 个,2004 年468 个(表1) ,包括K326、云烟85 、云烟87 和红花大金元等烤烟品种。烟末样品在40 ℃下干燥约3h (含水率6 %~

8 %) ,过40 目筛,装入样品瓶,盖紧瓶盖,常温下避光贮存。

1.3  光谱数据采集、纤维素含量测定和建模

取6g 烟粉样品,置于Á5cm 石英杯中,用“图q章”形压样器轻轻压平杯中样品后,放到光谱仪旋转台上进行漫反射光谱扫描。扫描时以积分球镀金内壁作背景,每取一个样品扫一次背景。扫描前,光谱仪开机预热115h。光谱采集条件为: 扫描范围(Data Range) : 4000 ~ 10000cm- 1 ; 分辨率(Resolution) :8cm- 1 ;扫描次数:72 次。

取2g 烟末样品,采用文献中介绍的方法测定其纤维素含量。

采用TQ Analyst 612 分析软件处理采集的光谱数据,应用软件中的偏最小二乘法(PLS) 把各烟样的光谱数据与其对应的纤维素含量数据进行统计分析建立模型,并对模型进行优化和检验。

2  结果与讨论

2.1  建模谱段的选择

从图1 看出,烟粉在4000~8000cm- 1时信息量很丰富,而且信号强度比较高。通过选用二阶导数预处理光谱+ Norris 导数滤波(段长5 ;段间距5) ,内部交叉检验[ 每次从建模样品集中依次剔除n 个样品, 用剩下的样品建立模型预测被剔除的n 个样品。所有样品都被剔除并预测过。对预测值与其化学分析值进行统计分析, 主要考察预测值与化学分析值的决定系数(R2) 和内部交叉检验均方差(Root Mean Square Error of Cross Val2idation ; RMSECV) 的最佳主因子数为10 ,选择4000~10000cm- 1 (全谱区) 、4238~6433 cm- 1 (软件自动优化选择区) 、4500~6500cm- 1 (人工优化选择区) 和4000~7029cm- 1 (软件自动+ 人工优化选择区) 4 个谱段进行优化建模,以考察不同谱区范围对模型预测效果的影响。结果(表2) 表明,全谱与软件自动+ 人工优化区所得的结果相差不大,4500~6500cm- 1的效果最差。考虑到既要尽可能利用每一个有用的光谱数据,以提高模型精度,又要使优化运算的速度加快,故选择在4000~7029cm- 1谱段建立PLS 回归模型。

  

2.2 光谱预处理方法的选择

为消除NIR 光谱信号中的基线漂移与光散射等各种干扰和噪声,充分提取光谱包含的有效特征信息,提高校正模型的预测精度,对光谱进行必要的预处理。实验选择4000 ~ 7029cm- 1 谱区,交叉检验的最佳主因子数为10 ,分别采用一阶导数和二阶导数结合Norris 导数滤波(段长5 ;段间距5) 和Savitzky2Golay(SG) 平滑滤波(段长7 ;段间距3) 对光谱进行预处理。结果(表3) 显示,不同预处理方法对模型的预测结果均有一定的影响。其中,二阶导数处理的效果最差,而一阶导数结合SG 平滑滤波预处理的最好。因而,选择一阶导数+ SG平滑滤波进行光谱预处理。

  

2.3 模型的预测效果

优化了用于建模的谱段和光谱预处理方法后,用PLS 法建立了预测烟草中纤维素含量的NIR 模型。经内部交叉检验,预测值与化学测定值之间有较好的相关性(图2) 。模型的预测决定系数(R2) 和内部交叉检验均方差(RM SECV) 分别为0.9649 和0.596。

2.3.1  预测的精确性

利用建立的优化模型对未知的30 个烟粉样品的纤维素含量进行预测(外部验证) 。结果(表4) 表明,30 个样品纤维素含量的NIR 预测值与实际化学测定值均基本一致,其平均相对偏差为1.89 % ,说明模型的预测精确性较高。

  

2.3.2 预测的重复性

对5 个不同产地的烟叶样品分别平行扫描10 次NIR ,用得到的校正模型预测其纤维素含量。结果(表5) 显示,预测的相对标准偏差(RSD) <3 % ,说明本模型的预测结果具有很高的重复性。

  

2.3.3 预测的精确性

利用建立的优化模型对未知的30 个烟粉样品的纤维素含量进行预测(外部验证) 。结果(表4) 表明,30 个样品纤维素含量的NIR 预测值与实际化学测定值均基本一致,其平均相对偏差为1.89 % ,说明模型的预测精确性较高。

  

3 结论

结合PLS 的数学统计分析方法,通过优化光谱范围和进行合理的光谱预处理,建立具有较好准确度和精密度的NIR 纤维素测定模型。本模型的预测值与化学测定值非常接近,预测的重复性也很好,适合大批量烟草样品的纤维素含量的预测分析。

新消息