前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇卷積神經(jīng)網(wǎng)絡(luò)的主要思想范文,相信會(huì)為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
關(guān)鍵詞: 計(jì)算機(jī)視覺; D像理解; 卷積神經(jīng)網(wǎng)絡(luò); 多層感知器
中圖分類號(hào): TN915.63?34; TP311 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)14?0170?04
Abstract: The optical network is a lightweight, versatile and purely Matlab?based deep learning framework. The idea underlying its design is to provide an easy?to?understand, easy?to?use and efficient computational platform for deep learning research. The framework supports major deep learning architectures such as multilayer perceptron(MLP) networks, convolutional neural networks (CNN) and recurrent neural networks (RNN). The framework also supports the straightforward switch between both CPU and GPU for computation. The experiment result indicates that the framework has different applications in computer vision, natural language processing and robotic technology.
Keywords: computer vision; image understanding; convolutional neural network; multilayer perceptron
0 引 言
深層神經(jīng)網(wǎng)絡(luò)[1]已經(jīng)給出了許多機(jī)器智能問題的主要進(jìn)展,最新的神經(jīng)網(wǎng)絡(luò)模型的實(shí)現(xiàn)主要強(qiáng)調(diào)效率。這些框架可以由20萬~50萬行代碼組成,并經(jīng)常涉及多個(gè)編程語言[2?4]。它需要付出巨大的努力來徹底理解和改進(jìn)模型。一個(gè)簡(jiǎn)單的和自我解釋的深層學(xué)習(xí)框架是高度預(yù)期的且加快深層神經(jīng)網(wǎng)絡(luò)模型的理解和應(yīng)用。
在此提出的光網(wǎng)絡(luò)是一個(gè)輕便的、通用的和純基于Matlab的深層神經(jīng)網(wǎng)絡(luò)模型。簡(jiǎn)潔、高效的Matlab編程技術(shù)已被用來實(shí)現(xiàn)所有的計(jì)算模塊。許多神經(jīng)網(wǎng)絡(luò)流行的類型,如多層感知器、卷積神經(jīng)網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)都在光網(wǎng)絡(luò)中得以實(shí)現(xiàn),是結(jié)合隨機(jī)梯度下降的幾個(gè)變化(SDG)為基礎(chǔ)的優(yōu)化算法。
自從光網(wǎng)絡(luò)僅用Matlab實(shí)現(xiàn),主要的計(jì)算用幾百行代碼來矢量化和執(zhí)行,數(shù)量級(jí)比現(xiàn)有的框架更簡(jiǎn)潔。所有基本操作都可以輕松定制,只需有Matlab編程基本知識(shí)。數(shù)學(xué)化研究人員可以專注于數(shù)學(xué)建模的一部分而不是工程部分。
應(yīng)用程序的用戶可以很容易地理解和修改任何部分的框架,開發(fā)新的網(wǎng)絡(luò)架構(gòu),使他們適應(yīng)新的應(yīng)用。除了簡(jiǎn)單,光網(wǎng)絡(luò)還具有以下特點(diǎn):光網(wǎng)絡(luò)包含最現(xiàn)代的網(wǎng)絡(luò)架構(gòu);計(jì)算機(jī)視覺中的應(yīng)用、自然語言處理和強(qiáng)化學(xué)習(xí)已被證明;光網(wǎng)絡(luò)提供了一個(gè)綜合的優(yōu)化算法的收集;光網(wǎng)絡(luò)支持在CPU和GPU之間計(jì)算的簡(jiǎn)單切換;快速傅里葉變換來有效地計(jì)算卷積,從而使大卷積核被支持;光網(wǎng)絡(luò)自動(dòng)化的超參數(shù)優(yōu)化了新型選擇性的SGD算法。
1 模 塊
主要的計(jì)算模塊包括前饋過程和向后/反向傳播過程。前饋過程評(píng)估模型,反向傳播報(bào)告網(wǎng)絡(luò)梯度。隨機(jī)梯度下降算法是用來優(yōu)化模型參數(shù)。
1.1 核心計(jì)算模塊
光網(wǎng)絡(luò)能夠?qū)W⒂跀?shù)學(xué)部分而不是低層次的工程細(xì)節(jié)。為了使本文更完備,在此說明光網(wǎng)絡(luò)中的主要計(jì)算模塊。本文的所有網(wǎng)絡(luò)和相關(guān)實(shí)驗(yàn)都是建立在這些模塊的基礎(chǔ)之上。
1.1.1 線性感知器層
一個(gè)線性感知器層可以表示為y=Wx+b。在這里,x表示input_dim×1大小的輸入數(shù)據(jù),W表示output_dim× input_dim大小的權(quán)重矩陣,b是一個(gè)output_dim× 1大小的偏置向量,y表示output_dim× 1大小的線性層輸出。
從線性感知器輸入映射到最終的網(wǎng)絡(luò)輸出可以表示為z=f(y)=f(Wx+b),f是一個(gè)非線性函數(shù),它表示在更深層次的網(wǎng)絡(luò)的計(jì)算;z是網(wǎng)絡(luò)輸出,通常是一個(gè)損失值。
1.1.2 卷積層
卷積層由一個(gè)多維濾波器組kio將輸入特征圖Nmap_in映射到輸出特征圖Nmap_out。每個(gè)輸入特征圖xi與相對(duì)應(yīng)的濾波器組kio進(jìn)行卷積,卷積的結(jié)果是求和并添加偏置值Bo生成o?th輸出圖: 。允許使用大的卷積核,快速傅里葉變換(FFT)是用來計(jì)算卷積(及相關(guān))。根據(jù)卷積定理[5],在空間域卷積等價(jià)于在頻域的逐點(diǎn)乘法。因此,ki*xi可以用傅里葉變換計(jì)算:ki*xi=F-1{F{ki}?F{xi}}。在這里,F(xiàn)表示傅里葉變換,“”表示逐點(diǎn)乘法運(yùn)算,卷積層支持填充和跨越。
從o?th輸出特征圖到網(wǎng)絡(luò)輸出的映射可以表示為z=f(yo)。這里f是從o?th輸出特征圖yo到最終的網(wǎng)絡(luò)輸出的非線性映射。與第1.1.1節(jié)類似,,,需要在反向的過程中計(jì)算。
1.1.3 Max?pooling層
最大pooling層計(jì)算在窗口中的最大元素與步幅大小,一個(gè)定制的im2col_ln功能是實(shí)現(xiàn)轉(zhuǎn)換pooling補(bǔ)丁為列向量,來矢量化在Matlab中的pooling計(jì)算。內(nèi)置的最大功能是這些列向量可以返回pooling結(jié)果和這些最大值的指數(shù),然后,在原來的批量數(shù)據(jù)恢復(fù)相應(yīng)指數(shù)。此外,零填充可應(yīng)用于輸入數(shù)據(jù)。
不失一般性,從Max?pooling層輸入到最終的網(wǎng)絡(luò)輸出的映射可以表示為z=f(y)=f(Sx),其中S是選擇矩陣,x是一個(gè)列向量,它表示輸入數(shù)據(jù)到這層。
在反向的過程中,被計(jì)算并傳遞給淺層:。
當(dāng)pooling范圍小于或等于該步長(zhǎng)大小時(shí),可以用Matlab中簡(jiǎn)單的矩陣索引技術(shù)計(jì)算出。具體來說,與輸入數(shù)據(jù)相同大小的一個(gè)空的張量dzdx被創(chuàng)建。dzdx(from)=dzdy,from是pooling指數(shù),dzdy是一個(gè)記錄pooling結(jié)果的張量。當(dāng)pooling范圍大于步長(zhǎng)大小時(shí),x中的每一個(gè)條目都可以被匯集多次,并且反向傳播梯度需要為這些多個(gè)匯集條目積累。在這種情況下,計(jì)算可以利用Matlab自帶的功能accumarray()。
1.1.4 修正線性單元
修正線性單元(ReLU)作為一個(gè)主要的非線性映射函數(shù)被實(shí)現(xiàn),一些其他的函數(shù)包括sigmoid和tanh這里的討論就省略了。ReLU函數(shù)是很獨(dú)特的函數(shù),如果輸入大于0,則輸出0,否則y=ReLU(x)=x?ind(x>0)。在反向的過程中,如果輸入數(shù)據(jù)是非負(fù)的,則梯度傳遞到較淺層,否則,梯度被忽略。
1.2 損失函數(shù)
通常,一個(gè)損失函數(shù)會(huì)和最深核心計(jì)算模塊的輸出相連。目前,為了達(dá)到分類任務(wù)光網(wǎng)絡(luò)還支持softmax 中的LogLoss函數(shù)。
1.3 優(yōu)化算法
隨機(jī)梯度下降(SGD)為基礎(chǔ)的優(yōu)化算法是訓(xùn)練深層神經(jīng)網(wǎng)絡(luò)的主要工具。標(biāo)準(zhǔn)的SGD算法和它的一些流行的變型如adagrad[6],rmsprop[7], Adam[8],同樣實(shí)現(xiàn)了深度學(xué)習(xí)的研究。值得一提的是,在此實(shí)現(xiàn)了一個(gè)新的選擇性的SGD算法便于參數(shù)尤其是學(xué)習(xí)速率的選擇。
2 實(shí) 驗(yàn)
2.1 多層感知器網(wǎng)絡(luò)
在MNIST數(shù)據(jù)上[9]構(gòu)造一個(gè)多層感知器網(wǎng)絡(luò)來測(cè)試光網(wǎng)絡(luò)的性能。網(wǎng)絡(luò)從MNIST圖像數(shù)據(jù)集取得28×28輸入,在接下來的兩層分別有128個(gè)節(jié)點(diǎn)。然后,128維特征連接10個(gè)節(jié)點(diǎn)來計(jì)算softmax輸出。實(shí)驗(yàn)結(jié)果見圖1。
和測(cè)試階段的損失和錯(cuò)誤率
2.2 卷積神經(jīng)網(wǎng)絡(luò)
在cifar?10數(shù)據(jù)[10]上由4個(gè)卷積層構(gòu)建一個(gè)卷積網(wǎng)絡(luò)來測(cè)試光網(wǎng)絡(luò)的性能。此結(jié)構(gòu)與來自MatConvNet的一個(gè)報(bào)告相同[3]。32,32,64,64在前三層有5×5大小的卷積核,最后一層有4 × 4大小的內(nèi)核。ReLU函數(shù)應(yīng)用到每一個(gè)卷積層之后作為非線性映射函數(shù)。光網(wǎng)絡(luò)自動(dòng)選擇和調(diào)整學(xué)習(xí)速率并可以達(dá)到非常精確。與有固定的學(xué)習(xí)速率的SGD標(biāo)準(zhǔn)比較,選擇性SGD具有更好的精度。最重要的是,使用選擇性SGD避免手動(dòng)調(diào)諧的學(xué)習(xí)速率。圖2為實(shí)驗(yàn)結(jié)果。計(jì)算在一個(gè)Intel i5 6600K CPU和Nvidia Titan X GPU(12 GB內(nèi)存)的臺(tái)式電腦上進(jìn)行。當(dāng)前版本的光網(wǎng)絡(luò)用這種網(wǎng)絡(luò)結(jié)構(gòu)在GPU上每秒可以處理750個(gè)圖像,大約比使用的CPU速度快5倍。
2.3 LSTM網(wǎng)絡(luò)
長(zhǎng)短期記憶(LSTM)[11]是一個(gè)流行的遞歸神經(jīng)網(wǎng)絡(luò)模型。由于光網(wǎng)絡(luò)的通用性,LSTM網(wǎng)絡(luò)作為一個(gè)特定的應(yīng)用程序可以在光網(wǎng)絡(luò)包中實(shí)現(xiàn)。值得注意的是,在光網(wǎng)絡(luò)中的核心計(jì)算模塊用于執(zhí)行時(shí)域前向過程和反向傳播為L(zhǎng)STM。
在一個(gè)LSTM模型中的前向過程可以用公式表示為:
和測(cè)試階段的損失和錯(cuò)誤率
優(yōu)化LSTM模型,在LSTM中通過時(shí)間的反向傳播實(shí)現(xiàn)和計(jì)算最關(guān)鍵值:
采用一個(gè)關(guān)鍵的迭代屬性來計(jì)算上述值:
一些其他的梯度可以通過使用上述計(jì)算輸出的鏈規(guī)則計(jì)算:
LSTM網(wǎng)絡(luò)測(cè)試一個(gè)字符語言建模任務(wù),該數(shù)據(jù)集由選自莎士比亞作品的20 000個(gè)句子組成,每個(gè)句子斷成67字(和標(biāo)點(diǎn)符號(hào)),LSTM模型可以根據(jù)前一個(gè)字符預(yù)測(cè)下一個(gè)字符。網(wǎng)絡(luò)模型中使用30個(gè)隱含節(jié)點(diǎn)并且RMSProp用于訓(xùn)練。在后10次訓(xùn)練,下一個(gè)字符的預(yù)測(cè)精度提高到70%。
2.4 Q?網(wǎng)絡(luò)
作為強(qiáng)化學(xué)習(xí)中的應(yīng)用,創(chuàng)建一個(gè)和MLP網(wǎng)絡(luò)一致的Q?network[12]。然后將Q?network應(yīng)用到經(jīng)典的Cart?Pole的問題中[13]。Cart?Pole系統(tǒng)的動(dòng)力學(xué)可以在一個(gè)兩層網(wǎng)絡(luò)數(shù)百次迭代中學(xué)習(xí)到。對(duì)Q?network更新過程的一次迭代為:
式中,act是由概率ε隨機(jī)選擇的。所需的網(wǎng)絡(luò)輸出值Qnew是利用觀測(cè)到的reward和由此產(chǎn)生的狀態(tài)的貼現(xiàn)值γV(statenew)計(jì)算出來的,通過均衡器預(yù)測(cè)當(dāng)前的網(wǎng)絡(luò)。通過使用最小平方損失函數(shù):
3 結(jié) 論
為了深層神經(jīng)網(wǎng)絡(luò)模型的理解與發(fā)展,光網(wǎng)絡(luò)提供了一個(gè)易于擴(kuò)展的生態(tài)系統(tǒng)。在Matlab環(huán)境下,整個(gè)計(jì)算過程可以很容易地跟蹤和可視化。這些設(shè)置的主要功能可以對(duì)深度學(xué)習(xí)研究界提供獨(dú)特的便利。
⒖嘉南
[1] KRIZHEVSKY A, SUTSKEVER I, HINTON G E. Imagenet classification with deep convolutional neural networks [J]. Advances in neural information processing systems, 2012, 25(2): 1097?1105.
[2] JIA Y, SHELHAMER E, DONAHUE J, et al. Caffe: Convolutional architecture for fast feature embedding [C]// Proceedings of the ACM International Conference on Multimedia. [S.l.]: ACM, 2014: 675?678.
[3] VEDALDI A, LENC K. Matconvnet: Convolutional neural networks for Matlab [C]// Proceedings of the 23rd Annual ACM Conference on Multimedia. [S.l.]: ACM, 2015: 689?692.
[4] BASTIEN F, LAMBLIN P, PASCANU R, et al. Theano: new features and speed improvements [J]. arXiv preprint arXiv, 2012, 20: 42?51.
[5] MALLAT S G. A wavelet tour of signal processing: the sparse way [J]. Academic press, 1998 , 31 (3) :83?85.
[6] DUCHI J, HAZAN E, SINGER Y. Adaptive subgradient methods for online learning and stochastic optimization [J]. The journal of machine learning research, 2011 (12): 2121?2159.
[7] TIELEMAN T, HINTON G. Lecture 6.5?rmsprop: Divide the gradient by a running average of its recent magnitude [J]. Neural networks for machine learning, 2012, 4 (2): 20?26.
[8] KINGMA D, BA J. Adam: A method for stochastic optimization [C]// Proceedings of the 3rd International Conference for Learning Representations. San Diego: [s.n.], 2015: 1412?1418.
[9] LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient?based learning applied to document recognition [J]. Proceedings of the IEEE, 1998, 86(11): 2278?2324.
[10] KRIZHEVSKY A, HINTON G. Learning multiple layers of features from tiny images [M]. [S.l.: s.n.], 2009.
[11] HOCHREITER S, SCHMIDHUBER J. Long short?term memory [J]. Neural computation , 1997, 9(8): 1735?1780.
【關(guān)鍵詞】人工智能 醫(yī)學(xué)領(lǐng)域
1 引言
人工智能(AI)是上世紀(jì)50年展起來的新興學(xué)科,主要內(nèi)容包括:知識(shí)表示、自然語言理解、機(jī)器學(xué)習(xí)和知識(shí)獲取、知識(shí)處理系統(tǒng)、計(jì)算機(jī)視覺、自動(dòng)推理和搜索方法、智能機(jī)器人、自動(dòng)程序設(shè)計(jì)等方面。在過去的幾十年里人工智能涌現(xiàn)出了大量的方法,大致可分為兩大類:第一類是基于Newell和Simon的物理符號(hào)系統(tǒng)假說的符號(hào)處理方法。這種方法大多采用從知識(shí)階段向下到符號(hào)和實(shí)施階段的自上而下的設(shè)計(jì)方法,第二類是采用自下而上設(shè)計(jì)的“字符號(hào)”方法。
2 人工智能的發(fā)展
全球?qū)θ斯ぶ悄艿难邪l(fā)經(jīng)歷了已經(jīng)有70年的發(fā)展,從上個(gè)世紀(jì)的50年代開始一直到今天,歷經(jīng)了兩次大起大落,但伴隨著深度學(xué)習(xí)的重燃、龐大的大數(shù)據(jù)支撐以及計(jì)算能力的不斷提升和成本的不斷下降這些因素的出現(xiàn),尤其是在摩爾定律、大數(shù)據(jù)、互聯(lián)網(wǎng)和云計(jì)算、新方法這些人工智能進(jìn)步的催化劑作用下,將迎來人工智能新的春天。
3 人工智能在醫(yī)學(xué)領(lǐng)域上的應(yīng)用
3.1 在神經(jīng)網(wǎng)絡(luò)中人工智能的應(yīng)用
在醫(yī)學(xué)診斷中人工智能的應(yīng)用會(huì)出現(xiàn)一些難題,例如知識(shí)獲取比較難、推理速度慢、自主學(xué)習(xí)以及自適應(yīng)變化能力弱。研究人腦連接發(fā)現(xiàn)了以人工神經(jīng)為特點(diǎn)可以解決在獲取知識(shí)中所出現(xiàn)的瓶頸和知識(shí)種類繁瑣問題,能夠提高對(duì)知識(shí)的推理能力,包括自主學(xué)習(xí),自組織等方面的能力,促進(jìn)了神經(jīng)網(wǎng)絡(luò)在醫(yī)學(xué)專家系統(tǒng)中的快速發(fā)展。
人工智能領(lǐng)域ANN,有不同于其他人工智能的方法,在傳統(tǒng)的結(jié)構(gòu)上,它只是AI分支中的一個(gè),只能通過邏輯符號(hào)來模擬人腦的思維方式,進(jìn)一步來實(shí)現(xiàn)人工智能,與之相比,不同的ANN是學(xué)習(xí)和訓(xùn)練為一體來達(dá)到智能的。ANN具有學(xué)習(xí)的能力及特殊方法,用戶不用編寫復(fù)雜的程序來解決所遇到的問題,只用提供有效的數(shù)據(jù)就可以完成。迄今為止,醫(yī)學(xué)領(lǐng)域中對(duì)大部分的病理原因無法解釋,無法確定病理原因,加上各種疾病的表現(xiàn)種類復(fù)雜多變。在醫(yī)學(xué)的日常實(shí)踐中,疾病相應(yīng)的治療只能以經(jīng)驗(yàn)為基礎(chǔ)來判斷。所以,ANN有著記憶,學(xué)習(xí)和歸納總結(jié)為一體的人工智能服務(wù),在醫(yī)學(xué)領(lǐng)域有很好的應(yīng)用發(fā)展趨勢(shì)。
3.2 在中醫(yī)學(xué)中人工神經(jīng)網(wǎng)絡(luò)的應(yīng)用
在中醫(yī)學(xué)中,所提出的“辨證論治”中的“證”具有模棚性、不確定性的特點(diǎn),主觀性比較強(qiáng),因此中醫(yī)的診斷方法和治療手段與醫(yī)師的經(jīng)驗(yàn)水平有很大聯(lián)系。數(shù)年來在實(shí)驗(yàn)研究,臨床觀察,文章整理,經(jīng)驗(yàn)總結(jié)上,都有著對(duì)“證”的研究思想的深入調(diào)查。一部分“辨證”的過程可以用人工神經(jīng)網(wǎng)絡(luò)來替換使用。恰當(dāng)?shù)闹嗅t(yī)癥狀可以作為基本輸入和適當(dāng)人工神經(jīng)網(wǎng)絡(luò)模型,人工神經(jīng)網(wǎng)絡(luò)能夠根據(jù)以往的學(xué)習(xí)“經(jīng)驗(yàn)”來進(jìn)行綜合分析,從而提出中醫(yī)診斷方法。
由神經(jīng)元結(jié)構(gòu)模型、網(wǎng)絡(luò)連接模型、網(wǎng)絡(luò)學(xué)習(xí)算法等幾個(gè)要素組成了人工神經(jīng)網(wǎng)絡(luò)。具有某些智能系統(tǒng)的功能。 按照網(wǎng)絡(luò)結(jié)構(gòu)來劃分,人工神經(jīng)網(wǎng)絡(luò)有很多不同的種類,例如感知器、BP網(wǎng)絡(luò)、Hopfield網(wǎng)絡(luò)等,目前應(yīng)用最為廣泛的神經(jīng)網(wǎng)絡(luò)就是其中的BP網(wǎng)絡(luò)。這種前沿網(wǎng)絡(luò)非 BP網(wǎng)絡(luò)所屬,網(wǎng)絡(luò)的結(jié)構(gòu)與權(quán)值能夠表達(dá)復(fù)雜的非線性 I/0映射關(guān)系。憑借 BP網(wǎng)絡(luò)優(yōu)良的自主學(xué)習(xí)功能,既可以通過誤差的反向傳播方法,對(duì)照已知樣本反復(fù)進(jìn)行訓(xùn)練,也可以調(diào)整網(wǎng)絡(luò)的權(quán)值,直到網(wǎng)絡(luò)的 I/0關(guān)系在某一塊訓(xùn)練指標(biāo)下最接近樣本為止。
3.3 人工智能在臨床醫(yī)療診斷中的應(yīng)用
計(jì)算機(jī)編寫的程序主要根據(jù)專家系統(tǒng)的設(shè)計(jì)原理和方法來模擬醫(yī)生的醫(yī)學(xué)診斷,以及通常治療手段的思維過程來進(jìn)行。醫(yī)療專家系統(tǒng)是臨床醫(yī)療診斷中人工智能的很好體現(xiàn),不僅能夠處理較為復(fù)雜的醫(yī)學(xué)治療問題,還能當(dāng)做醫(yī)生診斷疾病的重要工具,更重要的是傳承了專家們的寶貴醫(yī)學(xué)治療經(jīng)驗(yàn)。
3.4 人工智能技術(shù)在醫(yī)學(xué)影像診斷中的應(yīng)用
目前,在醫(yī)學(xué)影像中存在著的問題,比如:誤診率高、缺口大。這些問題需要通過人工智能的方法來解決。在醫(yī)學(xué)影像技術(shù)領(lǐng)域人工智能的應(yīng)用包括主要的兩個(gè)方面,分別是:第一個(gè)方面為圖像識(shí)別,第二個(gè)方面為深度學(xué)習(xí),其中人工智能應(yīng)用最核心的部分實(shí)深度學(xué)習(xí)。這兩個(gè)部分都是基于醫(yī)學(xué)影像大數(shù)據(jù)所進(jìn)行的數(shù)據(jù)上的挖掘和應(yīng)用。這兩個(gè)方面所進(jìn)行的數(shù)據(jù)挖掘及其應(yīng)用都是依據(jù)醫(yī)學(xué)影像大數(shù)據(jù)來完成的。
Geoffrey Hinton教授是神經(jīng)網(wǎng)絡(luò)領(lǐng)域的大師,2006年,他與其博士生在《Science》和相關(guān)的期刊上發(fā)表了論文,第一次提出了“深度信念網(wǎng)絡(luò)”的概念。2012年,由斯坦福大學(xué)Fei-Fei Li教授舉辦的ImageNet ILSVRC大規(guī)模圖像識(shí)別評(píng)測(cè)任務(wù)是由Hinton教授的研究團(tuán)隊(duì)參加的。這個(gè)任務(wù)包括了120萬張高分辨率圖片,1000個(gè)類比。Hinton教授團(tuán)隊(duì)使用了全新的黑科技多層卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),將圖像識(shí)別錯(cuò)誤率突破性地從26.2%降低到了15.3%。 這個(gè)革命性的技術(shù),讓神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)以迅速的速度進(jìn)入了醫(yī)療和工業(yè)的領(lǐng)域范圍,隨后這一技術(shù)被陸續(xù)出現(xiàn)的醫(yī)療影像公司使用。例如:國(guó)際知名的醫(yī)學(xué)影像公司Enlitic和國(guó)內(nèi)剛剛獲得有峰瑞資本600萬天使輪融資的DeepCare。都是不斷積累大量影像數(shù)據(jù)和診斷數(shù)據(jù),繼續(xù)對(duì)神經(jīng)元網(wǎng)絡(luò)進(jìn)行深度的學(xué)習(xí)訓(xùn)練,從而有效的提高了醫(yī)生診斷的準(zhǔn)確率。
人工智能不僅能使患者的健康檢查快速進(jìn)行,包括X光、B超、核磁共振等。另外還能大量減少醫(yī)生的讀片時(shí)間,提升了醫(yī)生的工作效率,降低誤診率。
4 總結(jié)
人工智能軟件工作效率遠(yuǎn)遠(yuǎn)超過了人類大腦,不僅能夠更快速的找到數(shù)據(jù)的模式和相似性,還能有效幫助醫(yī)生和科學(xué)家提取重要的信息。隨著人工智能的發(fā)展及其在醫(yī)學(xué)領(lǐng)域的逐漸普及和應(yīng)用,兩者的互相融合在未來必定成為醫(yī)學(xué)發(fā)展的重要方向。
參考文獻(xiàn)
[1]馮伍,張俊蘭.人工智能在醫(yī)學(xué)上的應(yīng)用[J].電子設(shè)計(jì)工程,2010(01).
[2]楊琴,陳家榮.人工智能在醫(yī)學(xué)領(lǐng)域中的應(yīng)用[J].科技風(fēng),2012(12),100-101.
[3]王宇飛,孫欣.人工智能的研究與應(yīng)用[J].信息與電腦,2016(05).
[4]鉛筆道.人工智能與影像診斷相結(jié)合的醫(yī)生界阿爾法狗,2016(03).
關(guān)鍵詞:計(jì)算機(jī)工程;視覺領(lǐng)域;深度學(xué)習(xí)技術(shù)
引言
計(jì)算機(jī)視覺簡(jiǎn)言之即是依靠電子設(shè)備成像來代替生物視覺系統(tǒng),隨后依靠提前寫好的程序?qū)Λ@取的圖像信息實(shí)施處理。該技術(shù)的短期應(yīng)用目的在于完成相對(duì)簡(jiǎn)單的智能視覺工作,而深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用,在很大程度上豐富了其功能,提高了識(shí)別效率,讓其能夠在更多行業(yè)發(fā)揮出自身價(jià)值。
1計(jì)算機(jī)視覺領(lǐng)域的深度學(xué)習(xí)技術(shù)
1.1圖像分類中的深度學(xué)習(xí)技術(shù)
基于深度學(xué)習(xí)技術(shù),卷積神經(jīng)網(wǎng)絡(luò)得到了進(jìn)一步的發(fā)展,其應(yīng)用范圍也更為寬泛,例如說在圖像分類中的運(yùn)用。圖像分析需要對(duì)圖像實(shí)施掃描分析,隨后對(duì)其具體類別予以劃分,更加注重其整體語義。目前相對(duì)普遍進(jìn)行圖像分類的數(shù)據(jù)集為ImageNet,其中囊括了非常豐富的內(nèi)容,存儲(chǔ)了近1500萬個(gè)圖像的URL并將圖像劃分為數(shù)萬余個(gè)類型。ImageNet每年組織開展的大規(guī)模視覺識(shí)別挑戰(zhàn)賽(ILSVRC)中,圖像分類算法與技術(shù)也不斷創(chuàng)新,圖像分類的準(zhǔn)確性也持續(xù)提升。ImageNet數(shù)據(jù)集表現(xiàn)出規(guī)模大、類型多的突出特點(diǎn),所以更加適用于遷移學(xué)習(xí),即是把部分核心技術(shù)或結(jié)構(gòu)拓展應(yīng)用到各個(gè)領(lǐng)域,對(duì)于視覺領(lǐng)域的深度模型來說,能夠把模型內(nèi)的網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)直接共享到其他數(shù)據(jù)集,從而對(duì)數(shù)據(jù)實(shí)施微調(diào)。圖像分類屬于計(jì)算機(jī)視覺領(lǐng)域最為基礎(chǔ)的環(huán)節(jié),對(duì)于圖像分類模型創(chuàng)建和數(shù)據(jù)分析處理經(jīng)驗(yàn)也能夠遷移應(yīng)用到其他領(lǐng)域中。
1.2目標(biāo)檢測(cè)中的深度學(xué)習(xí)技術(shù)
目標(biāo)檢測(cè)相對(duì)于圖像分類而言表現(xiàn)出更多的復(fù)雜性,主要任務(wù)是在囊括多種不同類型物體的圖像內(nèi)精確定位和識(shí)別某一物體,恰恰是出于這一目的,深度學(xué)習(xí)技術(shù)在目標(biāo)檢測(cè)中的應(yīng)用更為復(fù)雜,要實(shí)現(xiàn)更加精準(zhǔn)的效果也相對(duì)更難。近年來針對(duì)目標(biāo)檢測(cè)的算法日益更新,如優(yōu)化后的R-CNN算法,是借助于卷積神經(jīng)網(wǎng)絡(luò)思想,對(duì)物體進(jìn)行分類,提取物體特征。而SelectiveSearch算法的出現(xiàn)有了進(jìn)一步的創(chuàng)新和突破,有效促進(jìn)了檢測(cè)準(zhǔn)確性的提高,這也給通過卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行目標(biāo)檢測(cè)帶來了更多可能性,隨后的FastR-CNN算法極大地促進(jìn)了目標(biāo)檢測(cè)效率的提升,該算法對(duì)提取候選區(qū)的問題予以優(yōu)化,大大減少了候選區(qū)提取和目標(biāo)檢測(cè)過程的時(shí)間。目標(biāo)檢測(cè)網(wǎng)絡(luò)以FastR-CNN算法作為支撐,于輸出位置設(shè)置滑動(dòng)窗同時(shí)和候選區(qū)域網(wǎng)絡(luò)實(shí)施連接,目標(biāo)檢測(cè)的關(guān)鍵在于卷積神經(jīng)網(wǎng)絡(luò),依靠它把各個(gè)點(diǎn)的特征進(jìn)行提取,再借助回歸算法獲得對(duì)應(yīng)范圍出現(xiàn)目標(biāo)的概率[1]。
1.3人臉識(shí)別中的深度學(xué)習(xí)技術(shù)
人臉識(shí)別主要是借助相應(yīng)算法對(duì)人臉特征實(shí)施提取,因?yàn)槠浣⒌娜四樐P捅憩F(xiàn)出一定的不穩(wěn)定性,因此模型建立往往也表現(xiàn)出一定的難度,相對(duì)于建立剛體模型而言更為困難。人臉識(shí)別通常來說涉及人臉檢測(cè)定位以及特征提取兩個(gè)方面,人臉檢測(cè)定位是基于背景圖像中將人臉目標(biāo)分割出來,實(shí)施歸一化處理,而人臉特征提取算法不變。前者存在的技術(shù)難點(diǎn)是人臉目標(biāo)具有多樣性以及背景圖像具有復(fù)雜性,所以對(duì)背景情境實(shí)施合理假設(shè)并予以簡(jiǎn)化是十分關(guān)鍵的。與此同時(shí),高維空間人臉模型的建立較為復(fù)雜,精確度估算難度較大,人臉特征提取的技術(shù)難度是因?yàn)槿四槍儆趶椥阅P停潆y度超過剛體模型。一般來說,較為常見對(duì)人臉特征實(shí)施提取與識(shí)別的方法有幾何特征法、特征臉?biāo)惴ㄒ约皬椥阅P头ǎ珻NN算法和過去的特征提取算法比起來表現(xiàn)出更高的穩(wěn)定性和適用性,同時(shí)能夠有效抵抗外部干擾,促進(jìn)人臉識(shí)別技術(shù)的推廣應(yīng)用。
2應(yīng)用實(shí)例
2.1安防領(lǐng)域的應(yīng)用
深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺領(lǐng)域中的應(yīng)用可以為安防行業(yè)提供更佳的解決方案,比如說人臉識(shí)別技術(shù)的應(yīng)用,很多大型企業(yè)如Facebook、騰訊、阿里巴巴等都將非常關(guān)注和重視。作為深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺領(lǐng)域應(yīng)用的重要內(nèi)容,人臉識(shí)別在安檢以及反恐等領(lǐng)域中也能夠發(fā)揮出很好的效果。與此同時(shí),對(duì)行人角度的REID技術(shù)實(shí)施研究,依托于深度學(xué)習(xí)強(qiáng)化目標(biāo)檢測(cè),對(duì)目標(biāo)特征實(shí)施提取和刻畫,能夠?yàn)楫惓P袨楸O(jiān)控和跟蹤帶來支持[2]。
2.2無人駕駛領(lǐng)域的應(yīng)用
對(duì)于無人駕駛領(lǐng)域來說,選擇激光或雷達(dá)這類傳感器的成本更高,基于深度學(xué)習(xí)的計(jì)算機(jī)視覺技術(shù)也能夠提供新的解決方案。依靠攝像機(jī)對(duì)視頻畫面進(jìn)行采集,對(duì)獲取到的圖像實(shí)施分析,提供類似于前車碰撞預(yù)警等功能。在這一過程中,計(jì)算機(jī)視覺技術(shù)可以實(shí)現(xiàn)對(duì)目標(biāo)的檢測(cè)識(shí)別、對(duì)目標(biāo)車輛的跟蹤分析、對(duì)車道線是否偏離進(jìn)行檢測(cè)等。基于深度學(xué)習(xí)技術(shù)的檢測(cè)識(shí)別表現(xiàn)出更加強(qiáng)大的優(yōu)勢(shì),現(xiàn)階段深度學(xué)習(xí)芯片日益增多,對(duì)于無人駕駛技術(shù)的發(fā)展也帶來了更加有力的支持。
2.3智能家居領(lǐng)域的應(yīng)用
過去的很多智能家居產(chǎn)品一般都是依靠智能手機(jī)藍(lán)牙或者WiFi等途徑來實(shí)現(xiàn)對(duì)家居產(chǎn)品的控制,這一方案即便能夠做到家居智能化,但其水平依舊有待提高。基于深度學(xué)習(xí)技術(shù),能夠有效促進(jìn)智能家居行業(yè)的更新發(fā)展,除開語言、語音識(shí)別之外,還能夠利用計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)人際交流與互動(dòng),比如說手勢(shì)識(shí)別控制。2.4教育領(lǐng)域和圖片搜索領(lǐng)域的應(yīng)用基于深度學(xué)習(xí)的計(jì)算機(jī)視覺技術(shù)也能夠在智慧教育中得以普及應(yīng)用,如近年來很多新的拍照解題App,使用者只需要利用手機(jī)相機(jī)拍照上傳即可獲得相關(guān)題目的分析解答,促進(jìn)學(xué)習(xí)者學(xué)習(xí)效率的提升。此時(shí)視覺技術(shù)包括了對(duì)文字的檢測(cè)與識(shí)別,另外針對(duì)個(gè)人簡(jiǎn)歷識(shí)別、文檔識(shí)別等方面也能夠進(jìn)行拓展應(yīng)用。同時(shí)計(jì)算機(jī)視覺技術(shù)還可以在圖片搜索領(lǐng)域中得以應(yīng)用,使用者通過拍攝上傳相應(yīng)的圖片,即可從數(shù)據(jù)庫中找出與原圖相似的圖片,深度學(xué)習(xí)屬于一種非常高效的技術(shù)手段,能夠提供更加快速高效的圖像檢測(cè)功能,結(jié)合圖像搜索引擎,為用戶帶來更加便捷的服務(wù)[3-5]。
2.5醫(yī)療影像數(shù)據(jù)中的應(yīng)用
醫(yī)學(xué)影像直接關(guān)系到對(duì)患者疾病診斷的準(zhǔn)確性,對(duì)于放射科的醫(yī)務(wù)人員來說,依靠醫(yī)學(xué)影像能夠促進(jìn)診斷效率的提升。現(xiàn)階段國(guó)內(nèi)外諸多醫(yī)學(xué)專家隊(duì)伍,在心血管、腫瘤、神經(jīng)內(nèi)科以及五官科等都建立了精準(zhǔn)深度學(xué)習(xí)模型,極大地推動(dòng)醫(yī)療水平的提升,為廣大患者帶來了更加便捷和高效的醫(yī)療服務(wù)。基于深度學(xué)習(xí)技術(shù)的計(jì)算機(jī)視覺在醫(yī)療影像數(shù)據(jù)中的應(yīng)用主要集中在如下幾個(gè)方面:(1)能夠提供臨床診斷輔助等醫(yī)療服務(wù);(2)依靠數(shù)據(jù)分析技術(shù),能夠在很大程度上促進(jìn)醫(yī)療機(jī)構(gòu)經(jīng)營(yíng)管理水平的提升;(3)在醫(yī)學(xué)影像中的應(yīng)用,能夠讓醫(yī)務(wù)工作者更加直觀便捷地獲取患者影像;(4)深度學(xué)習(xí)技術(shù)能夠?yàn)獒t(yī)療大數(shù)據(jù)的可視化帶來便利;(5)在藥企研發(fā)工作中的應(yīng)用,可以處理好過去一直以來藥物研發(fā)周期長(zhǎng)和成本居高不下的問題;(6)在健康管理領(lǐng)域中的應(yīng)用,借助于可穿戴設(shè)備來對(duì)個(gè)人健康數(shù)據(jù)實(shí)施監(jiān)測(cè),進(jìn)而對(duì)疾病風(fēng)險(xiǎn)予以提前預(yù)測(cè)。
關(guān)鍵詞:諧波電流;電力系統(tǒng);檢測(cè)
一、引言
近年來,隨著電力電子技術(shù)的迅速發(fā)展,各種新型電力電子器件相繼進(jìn)入市場(chǎng),隨之而來的諧波污染日益嚴(yán)重,由電網(wǎng)諧波引起的電能質(zhì)量問題也日益受到重視,采用有源電力濾波器已成為諧波補(bǔ)償?shù)囊环N重要趨勢(shì)。其基本原理是從補(bǔ)償對(duì)象中檢測(cè)出諧波電流,由補(bǔ)償裝置產(chǎn)生一個(gè)與該諧波電流大小相等,極性相反的補(bǔ)償電流與其相抵消,其中,諧波電流的正確檢測(cè)是決定補(bǔ)償效果的重要環(huán)節(jié)。下面就分別論述一下目前這幾種諧波電流檢測(cè)方法。
二、諧波電流的檢測(cè)方法
(一)模擬濾波器
模擬濾波器的實(shí)現(xiàn)方法是:當(dāng)信號(hào)不含低于基頻的次諧波時(shí)采用低通濾波器,當(dāng)信號(hào)含有次諧波時(shí)采用帶通濾波器來獲得基波分量,用減法從信號(hào)中減去基波分量就得到分量。該方法具有簡(jiǎn)單快速的優(yōu)點(diǎn),但是這種檢測(cè)方式有很多缺陷:對(duì)環(huán)境的依賴較高,當(dāng),電網(wǎng)頻率波動(dòng)或?yàn)V波器的元件參數(shù)變化時(shí)效果變差:無法分離出基波中的有功與無功分量;當(dāng)諧波頻率與基波接近時(shí),濾波器的歸一化截止頻率很小,波動(dòng)特性很差;特別是當(dāng)基波頻率不固定而在較大范圍波動(dòng)時(shí),濾波器設(shè)計(jì)非常困難。
(二)Fryze有功電流檢測(cè)
其原理是將負(fù)載電流分解為與電壓波形一致的分量,將其余分量為廣義無功電流(包括諧波電流)。它的缺點(diǎn)是:因?yàn)镕ryze的功率定義是建立在平均功率基礎(chǔ)上的,需要一個(gè)周期的積分,有至少一個(gè)周期的延時(shí),不適于負(fù)載變化頻繁的場(chǎng)合。而且只能同時(shí)檢測(cè)出諧波及無功電流,不能只檢測(cè)諧波電流或只檢測(cè)無功電流,有很大的局限性。
(三)基于FFT的諧波電流檢測(cè)
離散傅立葉變換DFT(DiscreteFourierTransform)在實(shí)際中非常重要,利用它可以計(jì)算信號(hào)的頻譜、功率譜和線性卷積等。但是當(dāng)N很大時(shí),DFT的計(jì)算量太大,這樣使DFT的應(yīng)用受到限制。1965年J.W.Colley和J.W.Tukey提出快速傅立葉變換,大大減少了計(jì)算量。FFT并不是DFT的另一種變換,而是為了減少DFT計(jì)算次數(shù)的一種有效的快速算法。基于FFTDE 的諧波電流檢測(cè),是一種建立在傅立葉分析基礎(chǔ)上的數(shù)字化分析方法。其工作原理如圖1—2所示。其中i1表示負(fù)載電流,ic表示檢測(cè)所的諧波電流。
圖1的工作原理是:在同步脈沖作用下將模擬信號(hào)進(jìn)行離散化處理,通過模擬轉(zhuǎn)換器變?yōu)閿?shù)字量,再用數(shù)字分析的方法,快速傅立葉變換(FFT)進(jìn)行處理,最后得到各次諧波幅值和相位系數(shù),經(jīng)過低通濾波器(LPF)檢測(cè)出所需要的信號(hào),對(duì)于檢測(cè)出的信號(hào)作FFT反變換即得補(bǔ)償電流信號(hào)。如果需要得到其模擬量,需要用到
數(shù)摸轉(zhuǎn)換器再把數(shù)字量轉(zhuǎn)化為模擬量。采用這種方法需要有高精度的數(shù)摸轉(zhuǎn)換器,同時(shí)要求輸入信號(hào)有較高的信噪比。基于傅立葉的數(shù)學(xué)化分析方法,要求被補(bǔ)償?shù)牟ㄐ问侵芷谧兓駝t會(huì)帶來較大的誤差。這種方法的優(yōu)點(diǎn)是可以選擇擬消除的諧波次數(shù),缺點(diǎn)是具有較長(zhǎng)的時(shí)間延遲,實(shí)時(shí)性差,存在柵欄效應(yīng)和泄漏現(xiàn)象,使得算出的信號(hào)參數(shù):頻率、幅值和相位不準(zhǔn),尤其是相位誤差很大,無法滿足準(zhǔn)確的諧波測(cè)量要求。
(四)同步檢測(cè)法
對(duì)于同步檢測(cè)法用于不平衡三相系統(tǒng)中無功和諧波電流的補(bǔ)償,其基本思想是分別考慮各相情況,并把補(bǔ)償分量分配到三相中,統(tǒng)一確定各相補(bǔ)償電流。但是由于該檢測(cè)法實(shí)現(xiàn)根據(jù)總平均功率確定補(bǔ)償后電流,再計(jì)算出補(bǔ)償指令電流,而在計(jì)算補(bǔ)償后電流時(shí),不僅需要知道三相電路的平均功率,還需要知道每個(gè)相電壓的幅值,因此檢測(cè)過程中的延遲較大,也僅適用于三相電壓均為正弦波的情況,若電壓波形存在畸變,必將影響檢測(cè)精度。
(五)基于瞬時(shí)無功補(bǔ)償理論的檢測(cè)方法
(1)瞬時(shí)無功功率的基礎(chǔ)理論。三相電路瞬時(shí)無功功率理論首次于1983年由赤木泰文提出,以后該理論經(jīng)過不斷研究逐漸完善。赤木泰文最初提出的理論亦稱pq理論,是以瞬時(shí)實(shí)功率p和瞬時(shí)虛功率q的定義為基礎(chǔ),其主要一點(diǎn)不足是未對(duì)有關(guān)的電流量進(jìn)行定義。下面介紹以瞬時(shí)電流ip和iq為基礎(chǔ)的理論體系。設(shè)三相電路各相電壓和電流的瞬時(shí)值分別為 va、vb、vc和ia、ib、ic。分別為分析問題方便,把它們變換到α-β兩相正交的坐標(biāo)系上研究。由下面的變換可以得到α、β兩相瞬時(shí)電壓vα、vβ和α、β兩相瞬時(shí)電流iα、iβ。嚴(yán)格地講,基于瞬時(shí)無功功率理論的諧波電流檢測(cè)法僅適用于三相三線制、電源電壓為三相對(duì)稱無畸變、三相負(fù)荷平衡的負(fù)載諧波電流的檢測(cè)。所以,在有源電力諧波濾波器設(shè)計(jì)中必須針對(duì)具體電網(wǎng)和負(fù)載的特點(diǎn)采取相應(yīng)措施來消除或減小各種不利因數(shù)的影響:①變流器盡可能采用三相三線制接法的橋式電路,從而避免零序電流的存在。②如果只需要諧波電流的檢測(cè),則只要一組與電源同頻率的三相對(duì)稱正弦電壓,此電壓不必是負(fù)荷的實(shí)際供電電源電壓。因此,為了避免變流器網(wǎng)側(cè)電源電壓波形畸變嚴(yán)重,可采取下列措施之一:A、三相電源電壓經(jīng)過低通濾波器濾除高次諧波后再參與諧波電流的檢測(cè)運(yùn)算,此時(shí)要求三相所用的低通濾波器特性一致;B、運(yùn)用鎖相技術(shù)產(chǎn)生三相正弦電壓,再參與瞬時(shí)諧波電流的檢測(cè)運(yùn)算。
二、結(jié)語
本文從理論上對(duì)有源電力濾波器的實(shí)現(xiàn)技術(shù)和控制策略進(jìn)行研究,提出了以上幾種有源電力濾波器諧波電流的檢測(cè)方法。由于這幾種檢測(cè)方法在應(yīng)用中都有其局限性,因此,針對(duì)有源電力濾波器的檢測(cè)技術(shù)和控制策略還需要做進(jìn)一步的探索。隨著計(jì)算機(jī)運(yùn)算速度的提高和高速微處理器(DSP)的出現(xiàn),為控制系統(tǒng)的數(shù)字化奠定了基礎(chǔ)。有源電力濾波器要求其控制電路必須能完成實(shí)時(shí)檢測(cè)、計(jì)算并做出決策,這就為計(jì)算機(jī)開辟了嶄新的應(yīng)用領(lǐng)域,必將為有源電力濾波器的實(shí)用化發(fā)揮越來越重要的作用。
參考文獻(xiàn):
[1] 吳競(jìng)昌.供電系統(tǒng)諧波.北京: 中國(guó)電力出版社,1998
[2] IEC1000-3-2, Electromagnetic Compatibility-Part 3: Linits-section 2:Limits for harmonic crrentemissions (equipmentinputcurrent <16A per phase)[s].March,1995
[3] 中國(guó)國(guó)家標(biāo)準(zhǔn)GB/T14549-93. 電能質(zhì)量公用電網(wǎng)諧波 . 中國(guó)標(biāo)準(zhǔn)出版社 ,1994
[4] 肖國(guó)春等. 電能質(zhì)量控制技術(shù)的發(fā)展. 江蘇機(jī)械制造與自動(dòng)化,2001年第1期
論文摘要:當(dāng)點(diǎn)擴(kuò)展函數(shù)未知或不確知的情況下,從觀察到的退化圖像中恢復(fù)原始圖像的過程稱為圖像盲復(fù)原。近年來,圖像盲復(fù)原算法得到了廣泛的研究。本文在介紹了盲圖像恢復(fù)算法的現(xiàn)狀的基礎(chǔ)上進(jìn)一步研究其的發(fā)展方向。
一、引言
圖像恢復(fù)是圖像處理中的一大領(lǐng)域,有著廣泛的應(yīng)用,正成為當(dāng)前研究的熱點(diǎn)。圖像恢復(fù)的主要目的是使退化圖像經(jīng)過一定的加工處理,去掉退化因素,以最大的保真度恢復(fù)成原來的圖像。傳統(tǒng)的圖像恢復(fù)假設(shè)圖像的降質(zhì)模型是己知的。而許多情況下,圖像的降質(zhì)模型未知或具有較少的先驗(yàn)知識(shí),必須進(jìn)行所謂的盲恢復(fù)。其重要性和艱巨性而成為一個(gè)研究熱點(diǎn)。目前所能獲取的觀測(cè)圖像是真實(shí)圖像經(jīng)過觀測(cè)系統(tǒng)成像的結(jié)果。由于觀測(cè)系統(tǒng)本身物理特性的限制,同時(shí)受觀測(cè)環(huán)境的影響,觀測(cè)圖像和真實(shí)圖像之間不可避免地存在著偏差和失真,稱觀測(cè)系統(tǒng)對(duì)真實(shí)圖像產(chǎn)生了降質(zhì)。圖像恢復(fù)的目的就是根據(jù)降質(zhì)的觀測(cè)圖像分析和計(jì)算得出真實(shí)圖像。
二、圖像盲恢復(fù)算法的現(xiàn)狀
總體來說,圖像盲復(fù)原方法主要分為以下兩類:一是首先利用真實(shí)圖像的特別特征估計(jì)PSF,然后借助估計(jì)得到的PSF,采用經(jīng)典的圖像復(fù)原方法進(jìn)行圖像的復(fù)原。這類方法將PSF的估計(jì)與圖像的復(fù)原過程分為2個(gè)不同的過程,因而具有較少計(jì)算量的特點(diǎn);二是PSF辨識(shí)和真實(shí)圖像估計(jì)相結(jié)合,同時(shí)辨識(shí)PSF和真實(shí)圖像。這類算法較為復(fù)雜,計(jì)算量較大。另外,對(duì)于點(diǎn)擴(kuò)展函數(shù)也考慮了空間變化的復(fù)雜情況。針對(duì)目前的盲復(fù)原算法的現(xiàn)狀,根據(jù)退化模型的特點(diǎn),重新將算法分為空間不變的單通道盲復(fù)原算法、空間不變多通道盲復(fù)原算法和空間變化圖像盲復(fù)原算法3類。
(一)單通道空間不變圖像盲復(fù)原算法
在這類算法中,最為常用的是參數(shù)法和迭代法。
1)參數(shù)法。所謂參數(shù)法,即模型參數(shù)法,就是將PSF和真實(shí)圖像用某一類模型加以描述,但模型的參數(shù)需要進(jìn)行辨識(shí)。在參數(shù)法中,典型的有先驗(yàn)?zāi):孀R(shí)法和ARMA參數(shù)估計(jì)法,前者先辨識(shí)PSF的模型參數(shù),后辨識(shí)真實(shí)圖像,屬于第1種類型的圖像盲復(fù)原算法,因而計(jì)算量較小;后者同時(shí)辨識(shí)PSF和真實(shí)圖像模型參數(shù),屬于第2種類型圖像盲復(fù)原算法。
2)迭代法。所謂的迭代法,不是通過建立模型而是通過算法的迭代過程,加上有關(guān)真實(shí)圖像和PSF的約束來同時(shí)辨識(shí)PSF和真實(shí)圖像的方法。迭代法是單通道
圖像盲復(fù)原算法中應(yīng)用最廣泛的一類算法,它不需建立模型,也不要求PSF為最小相位系統(tǒng),因而跟實(shí)際更為接近。在這類算法中,迭代盲復(fù)原算法(IBD),基于非負(fù)性和決策域的遞歸逆濾波器算法(NAR2RIF),基于高階統(tǒng)計(jì)特性的最小
熵算法等最為典型。
(二)多通道二維圖像盲復(fù)原
多通道二維圖像盲復(fù)原,這類方法將數(shù)字通訊領(lǐng)域應(yīng)用的一維多通道盲原分離算法擴(kuò)展到二維情況并用于圖像的盲恢復(fù)。這類算法中有兩種代數(shù)方法,一種是先辨識(shí)模糊函數(shù),再采用常規(guī)的恢復(fù)算法進(jìn)行復(fù)原;另一種是直接對(duì)逆濾波器進(jìn)行估計(jì)。此類算法的優(yōu)點(diǎn)在于不需對(duì)初始圖像進(jìn)行估計(jì),也不存在穩(wěn)定性和收斂性問題,對(duì)圖像以及模糊函數(shù)的約束是松弛的,算法具有一般性。但是第1種算法要求采用復(fù)原算法具有收斂性;第2種算法對(duì)噪聲敏感。
(三)空間改變的圖像盲復(fù)原方法
在許多實(shí)際的應(yīng)用中,模糊往往是空間變化的,但由于處理工作的難度,目前的研究較少,基本有相關(guān)轉(zhuǎn)換恢復(fù)和直接法兩類。
相關(guān)轉(zhuǎn)換恢復(fù)的基本思想是區(qū)域分割,即將整幅圖像分為若干局部區(qū)域,然后假設(shè)在各個(gè)局部區(qū)域模糊是空間不變的,利用空間不變的圖像復(fù)原有關(guān)算法進(jìn)行復(fù)原。這類方法都是基于窗口的模糊辨識(shí)技術(shù),圖像的估計(jì)取決于窗口的大小,由于模糊參數(shù)是連續(xù)變化的,在范圍較大時(shí)空間不變的假設(shè)是不成立的,因而模糊的估計(jì)精度較差,而且這種方法只能針對(duì)部分空間變化的模糊進(jìn)行處理,缺乏通用性;其次在區(qū)域的邊上存在振鈴現(xiàn)象。
直接法的基本思想是直接對(duì)圖像進(jìn)行處理。如采用簡(jiǎn)化的二維遞推卡爾曼濾波器進(jìn)行圖像模型和模糊模型的直接轉(zhuǎn)換方法,其缺點(diǎn)是只能針對(duì)有限的模型,而且模型數(shù)增加,計(jì)算量會(huì)顯著增大;采用共軛梯度迭代算法,但只見到一個(gè)31×31的文本圖像處理的結(jié)果報(bào)道,對(duì)于大圖像處理效果尚需進(jìn)一步的研究;將空間變化圖像系統(tǒng)建立成馬爾苛夫隨機(jī)模型,對(duì)復(fù)原過程,采用模擬退火算法進(jìn)行最大后驗(yàn)估計(jì)的方法,這種方法避免了圖像的窗口化,并能克服模糊參數(shù)不連續(xù)性造成的影響,但這種方法只能局限于將模糊過程建立成單參數(shù)的馬爾苛夫隨機(jī)模型的情況,而且計(jì)算量也較大。
三、圖像盲恢復(fù)的應(yīng)用前景
(1)現(xiàn)有算法的改進(jìn)以及新的算法研究。現(xiàn)有各種算法還存在許多不足,有必要對(duì)算法進(jìn)一步改進(jìn)。如IBD算法中,如何選擇初始條件才能保證算法的收斂;如何選擇算法終止條件才能保證恢復(fù)的質(zhì)量;如何選擇濾波器中的噪聲參數(shù)才能減少噪聲的影響。又如NAR2RIF算法中,如何進(jìn)一步解決噪聲敏感問題,支持域的確定以及如何將算法擴(kuò)展到非均勻背景的情況等。提出新的算法更好地解決圖像盲復(fù)原問題,也是今后研究的熱點(diǎn)。
(2)基于非線性退化模型的圖像盲復(fù)原算法。在實(shí)際應(yīng)用中,嚴(yán)格來講,所有的退化模型都是非線性的。對(duì)模型采用線性化的方法進(jìn)行近似處理,雖然算法簡(jiǎn)單,但對(duì)非線性嚴(yán)重的情況處理效果并不理想。基于多項(xiàng)式以及神經(jīng)網(wǎng)絡(luò)兩種參數(shù)模型處理非線性信號(hào)盲分離算法,算法擴(kuò)展到二維圖像情況需要進(jìn)一步研究。研究基于非線性退化模型的圖像盲復(fù)原算法也是下一步研究方向之一。
(3)去噪處理算法研究。加性噪聲的存在,使圖像的復(fù)原問題變成了一個(gè)病態(tài)問題,而且由于一般假設(shè)只知道噪聲的統(tǒng)計(jì)特性,因此要從退化圖像中完全去除噪聲是不可能的。另外,由于噪聲的存在,恢復(fù)的效果并不理想,結(jié)合降噪的圖像盲恢復(fù)的算法研究有很現(xiàn)實(shí)的意義,這方面也進(jìn)行了部分工作。為克服噪聲的影響,一般采用先進(jìn)行降噪,后進(jìn)行復(fù)原;二是將降噪和復(fù)原同時(shí)進(jìn)行這兩類方法。目前,大多數(shù)算法中將噪聲描述成高斯噪聲進(jìn)行研究,在實(shí)際應(yīng)用時(shí)有較大局限性。對(duì)于非高斯情況的研究采用基于噪聲的高階統(tǒng)計(jì)特性的去噪算法研究也是很重要的研究方向,也可采用其他類型的方法進(jìn)行降噪,利用自組織映射的非線性獨(dú)立組件分析方法進(jìn)行圖像降噪處理算法。
(4)實(shí)時(shí)處理算法。算法的的復(fù)雜性是制約算法應(yīng)用的一個(gè)重要方面。可采用正則化的離散周期Radon變換的方法將二維的卷積轉(zhuǎn)化為一維進(jìn)行處理,以提高算法的速度;也可采用神經(jīng)網(wǎng)絡(luò)的實(shí)時(shí)處理算法。算法的實(shí)時(shí)性是算法實(shí)際應(yīng)用的先決條件。
(5)應(yīng)用研究。算法的應(yīng)用是推動(dòng)算法研究的動(dòng)力。雖然圖像盲復(fù)原算法在天文學(xué)、醫(yī)學(xué)、遙感等方面獲得了較大的應(yīng)用,但將算法應(yīng)用到一般的工業(yè)圖像實(shí)時(shí)檢測(cè)、機(jī)器視覺、網(wǎng)絡(luò)環(huán)境下的圖像傳輸恢復(fù)、刑事偵破等方面還有大量的工作要做。
參考文獻(xiàn):
[1]薛梅,楊綠溪.用于含噪二值圖像的改進(jìn)NAS-RIF圖像盲復(fù)原算[J].數(shù)據(jù)處理.2006.17.(2).