(2)用于識別霉變花生的波長特征(WFs)
在不同波長和尺度下,計算了每個樣本光譜的小波系數(shù),圖 5 展示了健康與霉變花生樣本的平均光譜結(jié)果。隨后,通過計算不同類別小波系數(shù)之間的 J-M 距離,生成了一張指示W(wǎng)Fs光譜敏感性和區(qū)分能力的尺度圖(圖 6)。在本研究中,頂部 1% 元素的閾值 J-M 值為 1.70,基于該閾值篩選出五個對霉變花生高度敏感的小波特征區(qū)域(圖 6 中的橙*區(qū)域)。如圖 6 所示,這些敏感特征區(qū)域主要集中在 1000–1500 納米的波長范圍內(nèi)。該波長區(qū)域的光譜曲線形狀在健康與霉變花生之間表現(xiàn)出顯著差異(圖 4)。在每個特征區(qū)域中,選取 J-M 距離*大的點,*終選擇了五個用于區(qū)分霉變與健康花生的小波特征。它們的具體波長和尺度見表 1 。
1005納米、1045納米和1410納米的波段分別與花生中的纖維素、油脂和水分有關(guān),這些是花生的主要組成部分。在其他波段中,1422納米和1518納米與1430納米和1510納米相似,與總**感染有關(guān)。1430納米波段可以歸因于蔗糖/淀粉的O?H伸縮**泛音,而1510納米對應于O?H變形羥基和C?O伸縮的第三泛音,這可以歸因于角質(zhì)層和β-葡聚糖。

圖5.不同尺度下健康與霉變花生平均光譜的小波系數(shù)

圖6.用于提取WFs的連續(xù)小波分析的J-M距離尺度圖
(3)通過SPA進行*佳波段選擇
每個類別的樣本按照2:1的比例被隨機分為校準和驗證數(shù)據(jù),并根據(jù)RMSE選擇*佳波段的數(shù)量。校準和驗證數(shù)據(jù)的隨機分割導致了在不同實現(xiàn)中選擇的波長有所變化;因此,為了選擇*佳波段,樣本分割和SPA程序被重復執(zhí)行。在進行了五次樣本分割和SPA程序后,比較了產(chǎn)生的五組波長,并選擇了至少有3組共同認同的波長。*終,確定了七個波長(1005納米、1208納米、1450納米、1927納米、2078納米、2190納米和2251納米)作為識別霉變花生的*佳波段,如圖4所示。我們可以看到,在*佳波段和WFs之間只有一個共同的波段(1005納米)。這主要是由于兩種方法的選擇標準不同,CWT主要捕捉光譜形狀的差異,而SPA主要選擇具有*小共線性的波段。在其他波段中,1208納米對應于淀粉分子吸收相關(guān)的C?H**泛音和**泛音以及C?H組合;1450納米波段可以歸因于花生中的蛋白質(zhì)含量;1927納米波段,與1930納米相似,可能歸因于淀粉的O?H伸縮/HOH變形組合;2078納米波段,與2090納米相似,與總**感染有關(guān)。其他波段,2190納米和2251納米,更接近2200納米和2270納米,可能分別歸因于?CHO的C–H伸縮/C=O伸縮組合和纖維素的O?H伸縮/C?O伸縮組合。
(4)WFs性能評估
使用五個WFs和七個*佳波段作為輸入變量,結(jié)合PLS-DA和SVM建立了分類模型。對于WFs和*佳波段,PLS-DA的理想LVs數(shù)量分別為3和6。對于SVM參數(shù)(C,σ),采用了基于網(wǎng)格的方法和五折交叉驗證進行優(yōu)化,WFs和*佳波段的*優(yōu)SVM模型對應的(C,σ)分別為(1,0.5)和(100,0.5)。然后,對花生仁中的每個像素進行了分類,使用SVM對HY(健康與霉變)的分類結(jié)果可見于圖7。

圖7.使用SVM對訓練數(shù)據(jù)集進行逐像素分類的結(jié)果,其中(a)使用*佳波段,(b)使用WFs;對測試數(shù)據(jù)集進行逐像素分類的結(jié)果,其中(c)使用*佳波段,(d)使用WFs
在逐像素分類后,使用受**污染的像素數(shù)量與總花生像素數(shù)量的比率來確定花生仁是否受到污染。比率低于0.05、0.1和0.15的閾值分別被認為是健康花生。圖8顯示了β=0.15和SVM時HY的核尺度分類結(jié)果,定量結(jié)果如表2所示。從圖8中我們可以看到,對于訓練數(shù)據(jù),無論使用WFs還是*佳波段,兩種分類器和閾值都能正確識別健康和霉變花生。相比之下,對于測試數(shù)據(jù),如表2所示,WFs在使用兩種分類器的三個閾值上的整體準確度上都優(yōu)于*佳波段。此外,使用WFs的靈敏度和特異性高于或等于使用*佳波段,表明WFs在健康和霉變花生分類中的性能更佳。CWT能夠在不同尺度上分離吸收特征,將狹窄和寬的吸收特征分別分離到低尺度和高尺度。這種特性的好處是可以實現(xiàn)對WFs的**調(diào)查,從而能夠選擇*佳的光譜特征。

圖8.使用SVM對訓練數(shù)據(jù)集進行核尺度分類的結(jié)果,其中(a)使用*佳波段,(b)使用WFs;對測試數(shù)據(jù)集進行核尺度分類的結(jié)果,其中(c)使用*佳波段,(d)使用WFs。白色圓圈表示被誤分類的花生仁

在此,我們使用了一個閾值來確定花生仁是否霉變。理論上,較小的閾值更好,因為它可以避免將霉變的花生誤判為健康的花生。相反,較小的閾值可能會增加將健康花生仁誤判為霉變的風險,這可能會導致因錯誤丟棄而造成的經(jīng)濟損失。因此,確定閾值至關(guān)重要。考慮到使用0.05、0.1和0.15的不同分類器的整體分類結(jié)果,本文推薦使用0.1作為折中的閾值。但是,未來應該探索一種可靠的閾值確定方法。此外,盡管本研究表明,通過結(jié)合CWT和高光譜成像技術(shù),有可能以相對較高的準確度識別霉變花生,但本研究得到的特征和模型可能仍不適合實際應用于多樣化的花生。不過,本研究中描述的特征提取和建模方法可以作為開發(fā)核心算法的參考。
結(jié)論
健康和霉變的花生在對短波紅外光的光譜響應上表現(xiàn)出顯著差異。在本研究中, CWT被應用于高光譜分類框架中,以提取特征來識別霉變花生。確定了五個WFs用于將花生分類為健康或霉變。本文展示的結(jié)果表明,WFs結(jié)合PLS-DA或SVM有希望識別出花生仁上的霉變——測試數(shù)據(jù)的準確度至少為96.19%。這比使用由SPA獲得的*佳波段進行分類的性能更好。未來的研究應包括更多樣化和不同種類的花生樣本,建立霉變嚴重程度評估方法,對不同霉菌的霉變花生進行分類,并建立更可靠的閾值確定方法。這些改進可以增強所選WFs的魯棒性。
推薦產(chǎn)品
GaiaSorter
作者簡介(人名+單位+博導/碩導)
通訊作者:蔣金豹,中國礦業(yè)大學,博士生導師
參考文獻
論文引用自二區(qū)文章:Xiaotong Qi, Jinbao Jiang, Ximin Cui, Deshuai Yuan (2019). Moldy Peanut Kernel Identification Using Wavelet Spectral Features Extracted from Hyperspectral Images. Food Analytical Methods. https://doi.org/10.1007/s12161-019-01670-w