在應(yīng)用傳統(tǒng)神經(jīng)網(wǎng)絡(luò)進行圖像識別的過程中,首先進行的二值化處理往往會造成圖像中豐富多樣的顏色信息的丟失。必須認識到,在圖像中,黑色、黃色、紅色、藍色、白色等不同顏色各自承載著特定的意義。此外,二值化處理后的圖像常常伴隨著信息的大量重疊。如果圖像本身含有“噪聲”,那么在使用傳統(tǒng)神經(jīng)網(wǎng)絡(luò)進行識別時,錯誤率將顯著上升。
為了解決這些挑戰(zhàn),微云全息(NASDAQ:HOLO)提出了一種圖像壓縮感知重構(gòu)神經(jīng)網(wǎng)絡(luò)算法,并開發(fā)了一種創(chuàng)新的CS神經(jīng)網(wǎng)絡(luò)算法。該算法旨在從性能和效率兩個核心方面,對CS重構(gòu)算法進行根本性的提升。當原始圖像包含許多在分類過程中不必要的特征信息時,傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)(CNN)會遭遇計算量龐大、運行時間過長的問題。然而,微云全息的圖像壓縮感知重構(gòu)神經(jīng)網(wǎng)絡(luò)能夠巧妙地將原始圖像轉(zhuǎn)換至壓縮感知領(lǐng)域。在這個領(lǐng)域內(nèi),它能夠保留圖像的關(guān)鍵特征,從而大幅減少計算量和運行時間,并顯著增強圖像識別的魯棒性,最終實現(xiàn)快速且精確的圖像重建。
微云全息技術(shù)通過巧妙地組合底層特征,構(gòu)建出更為抽象的高層屬性類別或特征,從而實現(xiàn)對數(shù)據(jù)分布式特征表示的精確識別。卷積神經(jīng)網(wǎng)絡(luò)(CNN),作為首個真正意義上的多層結(jié)構(gòu)學習算法,充分利用空間相對關(guān)系以減少參數(shù)數(shù)量,顯著提升訓練性能。CNN 是為識別二維形狀而精心設(shè)計的多層感知器,其獨特的網(wǎng)絡(luò)架構(gòu)對平移、比例縮放、傾斜及其他形式的變形展現(xiàn)出高度的不變性;诖耍⒃迫⒃ HOLO 圖像壓縮感知重構(gòu)神經(jīng)網(wǎng)絡(luò)中,創(chuàng)新性地提出了一種由枝蔓拓展卷積網(wǎng)絡(luò)(簡稱 ZMTCN)構(gòu)成的圖像 CS 模型。此外,微云全息還設(shè)計了樹結(jié)構(gòu)殘差塊(TSRB),以專門學習不同尺度圖像的特征。
ZMTCN 利用多個 TSRB 模塊,充分發(fā)揮其功能以學習多尺度特征。隨后,通過一個精心設(shè)計的特征融合層,將各個 TSRB 模塊的輸出進行有效整合,確保能夠重建出高質(zhì)量的圖像。為了能夠從 CS 測量中迅速恢復圖像,微云全息創(chuàng)造性地將擴張卷積引入 TSRB 模塊,并在其中構(gòu)建起擴張卷積的樹狀結(jié)構(gòu)。這種設(shè)計使得 TSRB 能夠輕松獲取圖像的多尺度特征,同時確保提取的淺層信息在深層網(wǎng)絡(luò)中得以保留。
與基于塊的壓縮感知(BCS)相似,ZMTCN 運用 CNN 出色地完成三項關(guān)鍵操作:壓縮采樣、初步重建和深度重建。ZMTCN 包括一個采樣網(wǎng)絡(luò)和一個重建網(wǎng)絡(luò)。采樣網(wǎng)絡(luò)通過學習采樣矩陣來獲取 CS 測量;重建網(wǎng)絡(luò)則負責從 CS 測量中成功重建圖像。通常,重建網(wǎng)絡(luò)由初步重建網(wǎng)絡(luò)和深度重建網(wǎng)絡(luò)組成。初步重建網(wǎng)絡(luò)是一種線性操作,能在初始階段從 CS 測量中重建圖像;深度重建網(wǎng)絡(luò)則是一種非線性操作,能夠進一步提升初步重建圖像的質(zhì)量。

在本次研究中,微云全息(NASDAQ:HOLO)提出了針對圖像壓縮傳感的枝蔓拓展卷積網(wǎng)絡(luò)。該網(wǎng)絡(luò)算法巧妙地運用了樹狀結(jié)構(gòu)的殘差塊,全面且細致地恢復了深度重建網(wǎng)絡(luò)中的圖像特征細節(jié)。展望未來,微云全息計劃積極探討將ZMTCN應(yīng)用于高光譜遙感圖像的壓縮傳感中,并致力于研究利用光譜間相關(guān)性以獲得更高重建質(zhì)量的算法,持續(xù)為圖像重構(gòu)技術(shù)的發(fā)展作出貢獻。