清空記錄
歷史記錄
取消
清空記錄
歷史記錄
1、ENVI軟件介紹
遙感圖像處理軟件ENVI是一款基于交互式數(shù)據(jù)語(yǔ)言IDL的框架開發(fā)的遙感影像處理系統(tǒng),具有功能齊全且強(qiáng)大的特點(diǎn)。它能有效地讀取、顯示和分析各式各樣的高光譜數(shù)據(jù)信息,還給出全套處理工具,其中包含高光譜圖像預(yù)處理、有效信息獲取,和地理位置信息系統(tǒng)匹配整合。正因如此,軟件被普遍地結(jié)合于國(guó)家領(lǐng)土、環(huán)境勘測(cè)、森林農(nóng)田、軍事安全、自然資源勘察和領(lǐng)海資源管理等多個(gè)應(yīng)用領(lǐng)域。
2、番茄葉霉病的高光譜圖像和波譜獲取
本章所用數(shù)據(jù)集仍取自番茄葉霉病的樣本。前一章節(jié)中主要就采集的光譜信息進(jìn)行分析,證實(shí)了高光譜成像技術(shù)采集的光譜數(shù)據(jù)更加寬泛,并且優(yōu)于RGB圖像,側(cè)面拓寬人眼的視覺(jué)能力,實(shí)現(xiàn)病害的識(shí)別,但并未反映到圖像上進(jìn)行可視化標(biāo)定,本章側(cè)重光譜信息和圖像信息進(jìn)行融合來(lái)判別番茄葉霉病的檢驗(yàn),圖1表示在可見(jiàn)光波段下,采集的番茄葉霉病高光譜圖像及感興趣區(qū)選擇和數(shù)據(jù)的獲取。
(a) (b) (c)
(d)
圖1番茄葉霉可將光(400-1000nm)采集的高光譜圖像及感興趣區(qū)選擇和數(shù)據(jù)的獲取
(a)原始數(shù)據(jù)光譜立方體( x,y,λ ) ;(b)波長(zhǎng)等于λi,(i =1,2,···,k )時(shí)的高光譜圖像;
(c)感興趣區(qū)的選擇;(d)ROI內(nèi)所有像元分類后的平均光譜曲線
根據(jù)上圖可以引出以下解釋,圖1(a)表示光譜數(shù)據(jù)的立方體,即原始數(shù)據(jù)集可以看到數(shù)據(jù)集共有三個(gè)維度,分別是圖像維度(x,y)和光譜維度λ,當(dāng)我們?cè)趫D像上取一點(diǎn)時(shí),其實(shí)可以得到一個(gè)帶有強(qiáng)度變化的寬波段上的譜線信息;圖1(b)表示的是高光譜圖像在多個(gè)譜段(或波長(zhǎng))下融合成的,即λi,(i =1,2,···,k ),但這里要解釋的是,為了方便表達(dá),該圖是有三色合成(450,554和661nm)的類人眼視覺(jué)下的合成圖樣;據(jù)我們觀察在整幅圖像中,有絕大部分區(qū)域是不存在病害的,僅有葉片的左側(cè)中部和底部存在病害區(qū)域,因此,在劃分有效區(qū)域時(shí),就是挑選感興趣區(qū)域200×200的像素大小,如圖1(c);挑選出感興趣區(qū)域后,對(duì)組織的光譜信息進(jìn)行深入處理,最關(guān)鍵的就是對(duì)患病和健康的葉片進(jìn)行分類,共分為三類,健康區(qū)域、輕微患病和嚴(yán)重病害,通過(guò)對(duì)比圖1(d)不難發(fā)現(xiàn)光譜強(qiáng)度在此波段范圍內(nèi)存在明顯差異,具體的討論在前一章有所體現(xiàn),這里不再贅述。
3、基于不同降維方式的番茄葉霉病的早期檢測(cè)
對(duì)高光譜數(shù)據(jù)進(jìn)行數(shù)據(jù)集壓縮降維處理常常使用主成分分析法,選取累計(jì)貢獻(xiàn)率為94.26%的前六個(gè)主成分,使光譜維度的個(gè)數(shù)從1040降至6,截取面積相同的病害區(qū)域并繪制出這六個(gè)主成分的圖像,如圖2所示。
圖2主成分前七個(gè)分量信息和合成RGB圖像分析
(a)主成分分析處理后,前6個(gè)分量的灰度圖像;(b)合成RGB圖像
其中,圖上(a)中編號(hào)(1-6)分別對(duì)應(yīng)前6個(gè)主成分(PC1,PC2,…,PC6),最右側(cè)為合成RGB圖樣。經(jīng)過(guò)比較分析不難發(fā)現(xiàn):主成分PC1的貢獻(xiàn)率為89.56%,主要能夠?qū)⑷~片的信息和背景信息形成極其鮮明的對(duì)比,背景基本定義為淺白色,葉片上無(wú)論是患病或是健康都為暗黑色,區(qū)別來(lái)講患病的區(qū)域略顯灰色;另外,可以看出葉脈的分布狀況,主成分PC2的貢獻(xiàn)率為3.58%,這里可以看出葉脈上輪廓極其明顯的勾勒出來(lái),對(duì)于嚴(yán)重病害區(qū)域圖像上標(biāo)注為黑色,無(wú)法區(qū)別輕微病害;主成分PC3的貢獻(xiàn)率為1.76%,不難看出PC3是對(duì)于PC2的補(bǔ)充,將輕微病害區(qū)域基本表達(dá)完全,但忽略了嚴(yán)重病害區(qū)域的反射率強(qiáng)度信息,并且健康區(qū)域識(shí)別效果明顯;主成分PC4的貢獻(xiàn)率僅有0.70%,依然將病害(輕微病害與嚴(yán)重病害)區(qū)識(shí)別出來(lái)并標(biāo)記;就PC5和PC6而言,兩者綜合貢獻(xiàn)率為0.83%,存在一定噪聲信息?;谇叭齻€(gè)主成分合成的RGB圖像,雖然不同病變程度的部分樣本有重疊,但各類樣本的差異十分明顯,能夠嚴(yán)格地區(qū)分輕微病害(淡藍(lán)色)和嚴(yán)重病害(暗紅色),健康葉片(淡綠色)和葉脈均有很好的表達(dá)效果。
圖3數(shù)據(jù)降維(ICA、MNF、PCA)的方法對(duì)比
a、d)ICA處理;b、e)PCA處理;c、f)MNF處理
選取兩塊不同的葉片區(qū)域,同時(shí)對(duì)比三類模型分別采用三種方法降維處理后的數(shù)據(jù),各自合成一幅RGB圖像,并在圖像上選取兩個(gè)區(qū)域與原始數(shù)據(jù)進(jìn)行對(duì)比分析,分析結(jié)果如圖3所示。其中,第I列是經(jīng)過(guò)獨(dú)立主成分(ICA)處理后的圖像,能夠區(qū)分健康和輕微病害區(qū)域,但是沒(méi)有標(biāo)識(shí)出嚴(yán)重病害區(qū)域,因而存在較大的誤差;第III列是經(jīng)過(guò)MNF的圖像,整幅圖像變得十分清晰,葉脈的紋理清晰可見(jiàn),很好的去除噪聲,缺點(diǎn)是嚴(yán)重和輕微病害的界限不分明。經(jīng)過(guò)PCA后,健康與不同程度的病害區(qū)域被分類,見(jiàn)第II列。對(duì)比PCA和MNF兩種方式,后者不僅準(zhǔn)確的劃分四類區(qū)域,而且葉脈部分也十分清晰。以上分析表明,PCA運(yùn)算速度快,能夠很好的保留樣本特征,但造成噪聲無(wú)法有效去除;MNF則既能夠清晰地反映圖片中包含的信息,在不損失過(guò)多信息的同時(shí),提高程序的運(yùn)行效率。
4、基于不同分類算法的番茄葉霉病的早期檢測(cè)
關(guān)于分類建模,在第三章中我們已經(jīng)敘述了常見(jiàn)算法的基本原理,其實(shí),分類的方法有兩大類,其一是監(jiān)督分類,就是指需要事先進(jìn)行機(jī)器學(xué)習(xí)并訓(xùn)練的分類方法,如支持向量機(jī),神經(jīng)網(wǎng)絡(luò)。這種方法要在學(xué)習(xí)訓(xùn)練實(shí)現(xiàn)分類之前,將各類樣本記錄在高光譜圖像的樣本數(shù)據(jù)中。其二則是非監(jiān)督分類,理論上講這種方法不在依賴人工完成判別地物樣本點(diǎn)數(shù)據(jù)信息,大部分是以聚類算法為主的全自動(dòng)分類,如IsoData,k-means等。本節(jié)后續(xù)均以某一代表性的患病葉片區(qū)域進(jìn)行分析,得出處理結(jié)果。
4.1非監(jiān)督學(xué)習(xí)
圖4非監(jiān)督學(xué)習(xí)的對(duì)病害區(qū)域分類效果對(duì)比
a)原始數(shù)據(jù)的分布狀況;b)采用IsoData分類效果;c)采用k-means分類效果;
d)MNF處理后的分布狀況;e)MNF+IsoData分類效果;f)MNF+k-means分類效果
從圖4發(fā)現(xiàn),對(duì)嚴(yán)重病害明顯的區(qū)域,運(yùn)用兩種非監(jiān)督學(xué)習(xí)算法均可實(shí)現(xiàn)對(duì)于病害的劃分,并且劃分效果明顯,能夠?qū)崿F(xiàn)基本吻合;但是對(duì)于病害輕微的患區(qū),識(shí)別效果差距明顯,我們可以看出k-means對(duì)于這類病患的識(shí)別效果要更優(yōu)異一些,尤其是表現(xiàn)在嚴(yán)重病害邊緣區(qū)域的輕微病害,也就是說(shuō),非監(jiān)督的學(xué)習(xí)也能區(qū)別患病區(qū)域,并且運(yùn)用k-means分類效果會(huì)更好一些。
4.2監(jiān)督學(xué)習(xí)
圖4非監(jiān)督學(xué)習(xí)的對(duì)病害區(qū)域分類效果對(duì)比
a)原始數(shù)據(jù)的分布狀況;b)采用IsoData分類效果;c)采用k-means分類效果;
d)MNF處理后的分布狀況;e)MNF+IsoData分類效果;f)MNF+k-means分類效果
圖5表明,①在可見(jiàn)光全譜(400-1000nm)下,運(yùn)用監(jiān)督學(xué)習(xí)算法均可實(shí)現(xiàn)對(duì)于病害的劃分,并且劃分效果明顯,能夠?qū)崿F(xiàn)基本吻合。對(duì)于患病區(qū)尤其是重度患病區(qū)的劃分效果優(yōu)良,而對(duì)于輕微病害區(qū)域,SVM不受葉片紋理的影響,能夠?qū)⒔】祬^(qū)域劃分成片,識(shí)別患病區(qū)域的特征。②經(jīng)過(guò)降維處理后,最小距離(MD),光譜角分離(SAM)和支持向量機(jī)(SVM)三類方法的識(shí)別效果差距明顯。MD法識(shí)別的病害區(qū)域整體來(lái)講較為清晰,但邊緣模糊;SAM甚至大面積混淆兩類病害區(qū)域,并造成干擾健康區(qū)域的識(shí)別,效果不佳;SVM識(shí)別的病害區(qū)域也有所擴(kuò)大。通過(guò)全譜和降維后的對(duì)比發(fā)現(xiàn),降維處理雖然減少了數(shù)據(jù)量,但也保留了大部分的有效信息。所以,能夠?qū)崿F(xiàn)患病和健康區(qū)域的區(qū)分,并且提高效率。然而,由于損失了一部分有效信息,也使得識(shí)別精準(zhǔn)度略有下降。
4.3基于不同核函數(shù)的支持向量機(jī)
圖6全譜(a、b、c)和MNF(d、e、f)下不同核函數(shù)的對(duì)病害區(qū)域分類效果對(duì)比
a、d)多項(xiàng)式核;b、e)徑向基核;c、f)sigmoid核
圖6的分類結(jié)果表明,運(yùn)用支持向量機(jī)法處理待分類樣本,分別使用幾種核函數(shù)都可以得到良好的劃分效果??v向?qū)Ρ龋╝、d)處理結(jié)果,在全譜下,a圖嚴(yán)重病害和輕微病害的界限清晰,而經(jīng)MNF處理后,d圖邊界變得模糊識(shí)別出的病害區(qū)域擴(kuò)大。橫向?qū)Ρ龋╠、e和f)不同的核函數(shù),多項(xiàng)式核函數(shù)識(shí)別出的邊緣更加銳利,f圖表面Sigmoid核函數(shù)識(shí)別嚴(yán)重病害區(qū)域最接近全譜下的識(shí)別效果,而其他會(huì)降低該區(qū)域的識(shí)別能力。由此看出,MNF在程序運(yùn)行時(shí)間上有所減短,但是損失了部分有效信息,也就犧牲了部分細(xì)節(jié);不同核函數(shù)對(duì)于病害程度識(shí)別略有差別,其中Sigmoid對(duì)病害識(shí)別效果更接近于全譜下的識(shí)別效果。
5、模型質(zhì)量評(píng)估
5.1混淆矩陣及其衍生參數(shù)
經(jīng)過(guò)以上分析,我們已經(jīng)基本確定運(yùn)用MNF和SVM相結(jié)合的算法,下面我們?cè)偻ㄟ^(guò)混淆矩陣來(lái)進(jìn)一步評(píng)價(jià)。往往使用總體分類精度(OA)、Kappa系數(shù)等因子來(lái)評(píng)估SVM模型的識(shí)別準(zhǔn)確度,結(jié)果見(jiàn)表1。從表中還可看出,各種核函數(shù)的分類精度一般在95%以上,其中,多項(xiàng)式核函數(shù)的效果最優(yōu),達(dá)到98.7955%,Kappa系數(shù)達(dá)到0.9667。
表1全譜和MNF之后,不同核函數(shù)的總體分類精度與Kappa系數(shù)
5.2 AUC和ROC
任取某閾值對(duì)機(jī)器學(xué)習(xí)的泛化性能的影響,通常用ROC曲線來(lái)表示。從圖7的曲線看出,健康樣本的數(shù)據(jù)學(xué)習(xí)的泛化能力較弱,通過(guò)分析數(shù)據(jù)集發(fā)現(xiàn),在健康部分包含了葉肉,葉脈和葉片表面的紋路,對(duì)健康區(qū)域的識(shí)別結(jié)果有影響。為了能夠挑選出閾值的最優(yōu)解,當(dāng)ROC曲線愈貼近左上方區(qū)域,表明所選模型的準(zhǔn)確性就愈高;換句話說(shuō),分類結(jié)果中出現(xiàn)錯(cuò)誤最少的點(diǎn)一般就處在最靠近左上方ROC曲線的點(diǎn),稱之為最優(yōu)解閾值。存在最少的假正(反)例總數(shù),不難看出患病區(qū)域應(yīng)用三種核函數(shù)均有良好的區(qū)分效果。若在同一坐標(biāo)系下,將各類學(xué)習(xí)器的ROC曲線都繪制出來(lái),更直觀地比較出學(xué)習(xí)器的優(yōu)劣,越貼近“十點(diǎn)鐘方向”的ROC曲線學(xué)習(xí)器,具有更高準(zhǔn)確性。最后,通過(guò)計(jì)算Sigmoid核函數(shù)處理番茄的三類樣本AUC值均大于97.2%,證明Sigmoid效果更好。
(a)
(b)
(c)
圖7不同核函數(shù)下的ROC曲線
(a)多項(xiàng)式核函數(shù)(b)徑向基核函數(shù)(c)Sigmoid核函數(shù)
6、分類模型普適性的驗(yàn)證
為了驗(yàn)證模型的普適性,將已構(gòu)建的模型拓展性地應(yīng)用到感染黑斑病的刺五加葉片的研究中,能為藥用植物病害的早期篩選與精準(zhǔn)治療提供研究基礎(chǔ)。實(shí)驗(yàn)?zāi)康?,運(yùn)用高光譜成像技術(shù)實(shí)現(xiàn)植物病害的自動(dòng)監(jiān)督分類與識(shí)別。實(shí)驗(yàn)過(guò)程,首先使用高光譜成像系統(tǒng)在可見(jiàn)光波段(380-960nm)內(nèi)采集刺五加黑斑病的葉片樣本,光譜數(shù)據(jù)經(jīng)過(guò)去除亮暗噪聲和平滑預(yù)處理后,再經(jīng)過(guò)主成分分析實(shí)現(xiàn)數(shù)據(jù)降維,對(duì)比分析前四個(gè)主成分(PC1、PC2、PC3、PC4)在分類表達(dá)上存在差異,繼而運(yùn)用基于不同核函數(shù)的支持向量機(jī)算法構(gòu)建分類模型,最后利用總體分類精度、Kappa系數(shù)等因子評(píng)價(jià)不同核函數(shù)對(duì)分類器性能的影響。表明,利用高光譜成像技術(shù)能夠準(zhǔn)確地識(shí)別刺五加的健康葉片和患病葉片,為實(shí)現(xiàn)自動(dòng)診斷藥用植物葉片病害提供新方法。
圖8輕度病害、重度病害、健康(亮部)和健康(暗部)的分區(qū)及其光譜曲線
將葉片劃分成四類樣本:①健康(亮部),即health(L)。②健康(暗部),即health(D)。健康樣本出現(xiàn)亮暗差異的原因有:實(shí)驗(yàn)環(huán)境下外界光照不均勻,葉片存在彎折卷曲;生長(zhǎng)中植株尖端的葉片受光照面積大且通風(fēng)好,表面油光;而植株底部的葉片受光面積小,通風(fēng)差葉片暗淡許多。③輕度病害,即MildDisease(M),表現(xiàn)出葉片的暗色小點(diǎn)狀。④重度病害,即SevereDisease(S),顯現(xiàn)出大斑塊,斑塊邊緣呈現(xiàn)暗黑色,中心區(qū)域更暗,與周圍的光譜差異明顯。從圖像空間上,很難分辨出健康亮部和嚴(yán)重病害的差異,容易造成錯(cuò)判。然而,在光譜空間上,可以清晰地分辨兩者的差異,準(zhǔn)確地定義健康與患病樣本,見(jiàn)圖8。
光譜成像技術(shù)已經(jīng)越來(lái)越廣泛地應(yīng)用于植物病害分析中。以刺五加的黑斑病葉片作為研究對(duì)象,采集380-960nm可見(jiàn)光波段的高光譜數(shù)據(jù),運(yùn)用支持向量機(jī)建立病害樣本與健康樣本的分類模型,利用總體分類精度、Kappa系數(shù)等因子評(píng)價(jià)基于不同核函數(shù)的SVM建模的分類效果。具體結(jié)論如下:
(1)高維的光譜數(shù)據(jù)經(jīng)過(guò)PCA后,由于各個(gè)主成分所包含的信息不同,因此,在分類表達(dá)上也有差異。例如,PC3清晰地表達(dá)了輕微病害的信息,而PC4能夠識(shí)別出嚴(yán)重病害樣本??梢岳弥鞒煞种g的差異進(jìn)行某些易混淆組分的劃分;
(2)基于核函數(shù)的SVM分類效果較好,尤其是在區(qū)分嚴(yán)重病害時(shí)效果最好,而對(duì)健康暗部的識(shí)別效果較差,研究中發(fā)現(xiàn)錯(cuò)分現(xiàn)象多集中在邊界處,后續(xù)將就此開展研究;
(3)采用不同核函數(shù)的SVM算法的分類精度不同,多項(xiàng)式核函數(shù)的分類精度最高,錯(cuò)分誤差和漏分誤差最低。這一結(jié)果與核函數(shù)的參數(shù)設(shè)置有關(guān),證明核函數(shù)受參數(shù)的影響較大。在識(shí)別健康亮或暗,以及輕微病害上均存在一定的誤差,多項(xiàng)式核函數(shù)與徑向基核函數(shù)的效果較好,其中,多項(xiàng)式核函數(shù)的精度更高為92.77%。
7、總結(jié)
本章以ENVI為核心處理軟件,采用高光譜技術(shù)對(duì)番茄葉霉病葉片的病害程度進(jìn)行討論,實(shí)現(xiàn)診斷研究。不同降維的方法(ICA,PCA和MNF)可以實(shí)現(xiàn)數(shù)據(jù)總量的壓縮,提高數(shù)據(jù)處理整體效率,對(duì)比結(jié)果探尋最優(yōu)方法;對(duì)全譜和降維后的數(shù)據(jù),繼續(xù)通過(guò)監(jiān)督學(xué)習(xí)和和非監(jiān)督學(xué)習(xí)實(shí)現(xiàn)病害程度的分類,并結(jié)合不同核函數(shù)判別分類的差異,得出壓縮數(shù)據(jù)和分類模型的最優(yōu)組合。
(1)以一組高光譜數(shù)據(jù)源為例,對(duì)比三種數(shù)據(jù)降維的方法,ICA處理后的圖像無(wú)法去除噪聲干擾,PCA壓縮數(shù)據(jù)速度最快,能夠較好的保留樣本有效特征,MNF則能夠清晰地標(biāo)識(shí)圖片中包含的信息。選用MNF即能滿足運(yùn)行效率的提升,又將分類各區(qū)域準(zhǔn)確劃分,且某些敏感區(qū)域(如葉脈)清晰顯示。
(2)評(píng)價(jià)非監(jiān)督學(xué)習(xí),k-means對(duì)葉霉病的病患識(shí)別效果明顯要更優(yōu)異一些,尤其是表現(xiàn)在嚴(yán)重病害與輕微病害的邊緣區(qū)域定義范圍。同時(shí)監(jiān)督學(xué)習(xí)中,支持向量機(jī)要優(yōu)于最小距離和光譜角等算法,并且對(duì)應(yīng)不同核函數(shù)也有相應(yīng)的處理效果差異,結(jié)果顯示Sigmoid核函數(shù)的對(duì)于番茄葉霉病的識(shí)別精度更高為98.79%,結(jié)合AUC值判別每類樣本達(dá)97.2%以上。
(3)拓展研究刺五加黑斑病的模型,并且得出分析植株、患病種類不同所用核函數(shù)存在差異,對(duì)于該種病害來(lái)說(shuō)多項(xiàng)式核函數(shù)與徑向基核函數(shù)的效果較好,其中多項(xiàng)式核函數(shù)的精度更高,為92.77%。
推薦:
便攜式高光譜成像系統(tǒng) iSpecHyper-VS1000
專門用于公安刑偵、物證鑒定、醫(yī)學(xué)醫(yī)療、精準(zhǔn)農(nóng)業(yè)、礦物地質(zhì)勘探等領(lǐng)域的最新產(chǎn)品,主要優(yōu)勢(shì)具有體積小、幀率高、高光譜分辨率高、高像質(zhì)等性價(jià)比特點(diǎn)采用了透射光柵內(nèi)推掃原理高光譜成像,系統(tǒng)集成高性能數(shù)據(jù)采集與分析處理系統(tǒng),高速USB3.0接口傳輸,全靶面高成像質(zhì)量光學(xué)設(shè)計(jì),物鏡接口為標(biāo)準(zhǔn)C-Mount,可根據(jù)用戶需求更換物鏡。