前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇模式識(shí)別技術(shù)范文,相信會(huì)為您的寫作帶來(lái)幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
關(guān)鍵詞:模式識(shí)別;發(fā)射器;智能系統(tǒng)技術(shù)
1 決策樹構(gòu)造原理
1.1 拆分規(guī)則
對(duì)于決策樹的構(gòu)造來(lái)說(shuō),拆分規(guī)則是用來(lái)確定每個(gè)節(jié)點(diǎn)上應(yīng)該使用哪個(gè)變量,而確定哪些變量的組合把樣本分成若干子群同樣屬于拆分規(guī)則的作用。在拆分規(guī)則的具體應(yīng)用中,我們首先需要確定對(duì)變量取什么閥值,這一閥值的獲取需要首先進(jìn)行各拆分的設(shè)定,圖1為簡(jiǎn)單的分類樹樣圖,結(jié)合該圖我們不難發(fā)現(xiàn),該圖對(duì)的閥值為(a,b,c,d),而(x1、x2、x3、x4)是其各特征變量,而由此給分類樹得以實(shí)現(xiàn)(w1、w2、w3)的不同類劃分。值得注意的是對(duì)于閥值獲取中的各拆分設(shè)定來(lái)說(shuō),我們需要將x∈Rp這一向量包括在坐標(biāo)條件上[1]。
結(jié)合這一分類樹樣圖,我們就需要應(yīng)用L{(xiyi),i=1,...,n}這一帶有標(biāo)簽的訓(xùn)練集進(jìn)行分類樹的具體構(gòu)建,而在這一構(gòu)建的分類樹中,x1與y1分別為數(shù)據(jù)樣本與相應(yīng)的類別標(biāo)簽。令N(t)為L(zhǎng)中xi∈u(t)的樣本數(shù),Nj(t)為xi∈u(t)且yi=?棕j(?撞jNj(t)=N(t))的樣本數(shù),定義p(t)=■為p(x∈u(t))基于L的估計(jì);p(?棕j|t)=■為P(y=?棕j|x∈u(t))基于L的估計(jì)[2]。
結(jié)合上文內(nèi)容,我們可以就u(t)這一節(jié)點(diǎn)t上的上子空間進(jìn)行拆分,而為了較好保證這一拆分的品質(zhì),我們就需要對(duì)反映不純度函數(shù)的變化進(jìn)行度量,這一度量過(guò)程需要實(shí)現(xiàn)不純度函數(shù)最大化下降,而這一最大化下降的實(shí)現(xiàn)就需要得到?祝(sp,t)?艿?祝(t)-(?祝(tL)pL+?祝(tR)pL)的支持,而這本身就屬于所有拆分sp的選擇。結(jié)合?祝(sp,t)?艿?祝(t)-(?祝(tL)pL+?祝(tR)pL),我們需要應(yīng)用吉尼不純度準(zhǔn)則,這樣才能夠順利實(shí)現(xiàn)對(duì)多種形式?祝(t)的針對(duì),?祝(t)=■p(?棕i|t)p(?棕j|t)就是這一吉尼不純度準(zhǔn)則應(yīng)用的結(jié)果。應(yīng)用這一吉尼不純度準(zhǔn)則結(jié)果進(jìn)行CART的訓(xùn)練,我們就能夠組成單個(gè)變量閥值,即sp={x,xk?燮b},這其中的k=(1,...,p),b則在實(shí)數(shù)范圍取值。考慮到要考察拆分?jǐn)?shù)量的限制必要,我們需要限制b只能取一個(gè)有限值,而為了避免過(guò)量計(jì)算,在具體的分類樹節(jié)點(diǎn)拆分中,我們需要應(yīng)用剪枝算法結(jié)束這種節(jié)點(diǎn)拆分。
1.2 剪枝算法
所謂剪枝算法,其本身首先需要形成1棵終止節(jié)點(diǎn)具有純的類別成員的樹,這樣才能夠具體進(jìn)行剪枝算法的應(yīng)用。在具體的剪枝算法應(yīng)用中,我們首先需要進(jìn)行R(t)的定義,這一定義需要將R(t)定義為給定樹T每個(gè)節(jié)點(diǎn)t相關(guān)節(jié)的實(shí)數(shù)。若t為終止節(jié)點(diǎn),t∈■,M(t)為u(t)中不屬于與該終止節(jié)點(diǎn)相關(guān)類別的樣本數(shù),而n則為數(shù)據(jù)點(diǎn)總數(shù)。對(duì)于實(shí)數(shù)?琢來(lái)說(shuō),令R?琢(t)=R(t)+?琢,規(guī)定R(t)=■R(t),R?琢(T)=■R?琢(t)=R(t)+?琢。分類中,R(t)是估計(jì)錯(cuò)分率,■為表示集合■的基數(shù),?琢為常數(shù),R?琢(t)為分類樹的估計(jì)錯(cuò)分率復(fù)雜度[3]。
在具體的CART剪枝算法應(yīng)用中,我們就可以令R(t)=r(t)p(t),這里的r(t)本身指的是錯(cuò)分概率的重新替代估計(jì),而結(jié)合樣本r(t)=1-■p(?棕j|t),o定落入節(jié)點(diǎn)t就能夠得到較好支持。如果這里的t本身為終止節(jié)點(diǎn),那么R(t)便是指代該節(jié)點(diǎn)對(duì)總錯(cuò)誤的影響。這里我們將Tt用于便是子樹,我們就可以對(duì)子樹與節(jié)點(diǎn)t對(duì)復(fù)雜度代價(jià)的影響進(jìn)行深入分析,結(jié)合公式?琢=■,以及最后定義的g(t)=
■,筆者提出了圖2所示的原始樹舉例。值得注意的是,g(t)=■公式為t連接強(qiáng)度的測(cè)度。
結(jié)合圖2所示的原始樹,我們可以通過(guò)不斷進(jìn)行子樹具有最小g(t)值節(jié)點(diǎn)的尋找,最后較好發(fā)現(xiàn)跟節(jié)點(diǎn),這樣我們就可以應(yīng)用Tk表示第k步得到的樹,也能夠通過(guò)R(Tk)表示最小的子樹。
2 智能系統(tǒng)框架設(shè)計(jì)
(1)目標(biāo)獲取:對(duì)于智能系統(tǒng)框架設(shè)計(jì)中的目標(biāo)獲取環(huán)節(jié)來(lái)說(shuō),這一環(huán)節(jié)需要應(yīng)用雷達(dá)等設(shè)備獲取具體的目標(biāo)電子特征信號(hào),這樣才能夠?yàn)楹罄m(xù)的智能系統(tǒng)框架設(shè)計(jì)提供有力支持。(2)目標(biāo)轉(zhuǎn)換:在獲取目標(biāo)電子特征信號(hào)的頻率、脈沖重復(fù)周期和脈沖寬度后,我們就需要對(duì)獲取的這類信息進(jìn)行目標(biāo)轉(zhuǎn)換,這一目標(biāo)轉(zhuǎn)化也可以被稱為原始信號(hào)的預(yù)處理。在具體的目標(biāo)轉(zhuǎn)換過(guò)程中,我們需要將目標(biāo)電子特征信號(hào)的頻率、脈沖重復(fù)周期和脈沖寬度進(jìn)行放大、整形、濾波以及A/D轉(zhuǎn)換。(3)轉(zhuǎn)換后數(shù)字信號(hào)的處理:在將目標(biāo)電子特征信號(hào)的相關(guān)組成進(jìn)行放大、整形、濾波以及A/D轉(zhuǎn)換后,我們就可以將轉(zhuǎn)換取得的數(shù)字信號(hào)送入PC中,結(jié)合上文研究中設(shè)計(jì)好的分類樹模塊進(jìn)行具體的分類運(yùn)算,轉(zhuǎn)換取得的數(shù)字信號(hào)由此實(shí)現(xiàn)智能分類。(4)信號(hào)傳輸:在完成通過(guò)終端顯示結(jié)果后,我們還需要對(duì)取得的結(jié)果進(jìn)行信號(hào)傳輸,這一信號(hào)傳輸主要是通過(guò)網(wǎng)絡(luò)化手段實(shí)現(xiàn)戰(zhàn)場(chǎng)前沿信息與后方的實(shí)時(shí)共享,這對(duì)于我軍戰(zhàn)斗力的提升將帶來(lái)較為積極的影響。
3 結(jié)束語(yǔ)
在本文基于模式識(shí)別與智能系統(tǒng)技術(shù)的發(fā)射器類型識(shí)別方法展開的研究中,筆者詳細(xì)論述了決策樹構(gòu)造原理、智能系統(tǒng)框架設(shè)計(jì),而結(jié)合這一系列論述我們就能夠較為深入地了解利用分類樹原理的發(fā)射器類型識(shí)別的方法,而這種方法具備的清楚鑒別與每個(gè)雷達(dá)相關(guān)的特征空間區(qū)域特征,也使得其本身能夠較好服務(wù)于我軍戰(zhàn)斗力的提升。
參考文獻(xiàn)
[1]廖雯竹,潘爾順,王瑩,等.統(tǒng)計(jì)模式識(shí)別和自回歸滑動(dòng)平均模型在設(shè)備剩余壽命預(yù)測(cè)中的應(yīng)用[J].上海交通大學(xué)學(xué)報(bào),2011(7):1000-1005.
關(guān)鍵詞:對(duì)齊;未登錄詞識(shí)別;構(gòu)詞模式;詞性;分詞碎片
中圖分類號(hào):G353.1
基于二維圖像上兩個(gè)物體的不同空間位置關(guān)系特征與描述語(yǔ)句中的詞匯進(jìn)行對(duì)齊,具體來(lái)說(shuō)是要在描述語(yǔ)句中提取兩個(gè)范疇的詞匯,形狀和方位詞,再把這兩個(gè)范疇的詞與圖像的底層特征進(jìn)行對(duì)應(yīng)。人工標(biāo)注語(yǔ)料經(jīng)過(guò)切分后會(huì)產(chǎn)生許多“分詞碎片”,這是因?yàn)槊枋鲈~的多樣化,如何從“分詞碎片”中將豐富的未登錄方位描述詞和形狀描述詞識(shí)別出來(lái),是本文研究的重點(diǎn)。
1 數(shù)據(jù)準(zhǔn)備
本文的語(yǔ)料庫(kù)是由兩部分組成:人工標(biāo)注語(yǔ)料和圖像語(yǔ)料。
圖像語(yǔ)料是系統(tǒng)自動(dòng)生成的1000幅圖片,圖片上有兩個(gè)基本圖形,用不同的灰度值進(jìn)行區(qū)分,兩個(gè)物體的位置不相交,有一定的方位關(guān)系。如圖1所示:
圖1 圖像語(yǔ)料示例
標(biāo)注語(yǔ)料是對(duì)每幅圖片的人工標(biāo)注,本文采用了開放的不限定維度的語(yǔ)言對(duì)圖像進(jìn)行了人工標(biāo)注。對(duì)600幅圖像的標(biāo)注經(jīng)過(guò)切分、詞性標(biāo)注并去掉表示句式的詞后的結(jié)果如下所示:
0000/m 三角形/n 正/d 五邊形/n 左邊/f
2 基于構(gòu)詞模式自動(dòng)識(shí)別未登錄描述詞的方法
2.1 標(biāo)注預(yù)處理:先將描述語(yǔ)句進(jìn)行一次切分,然后標(biāo)注詞性,因?yàn)楸痉椒▽?duì)于詞性標(biāo)注的準(zhǔn)確性有很高的要求,所以這里選用了中科院研究的分詞工具ICTCLAS進(jìn)行切分,經(jīng)檢測(cè)此切分和詞性標(biāo)注工具準(zhǔn)確率達(dá)到98.5%,然后將表示句式的詞去掉,因?yàn)檫@些詞只是為了表達(dá)句式特點(diǎn)。
2.2 模式初選:因?yàn)椴煌娜擞胁煌枋隽?xí)慣,為了使模式覆蓋面更廣泛,在600條語(yǔ)句中,從每100條中抽取10條,總結(jié)這60條描述語(yǔ)句中“分詞碎片”的詞性的構(gòu)詞模式,構(gòu)成構(gòu)詞模式的初選集。
2.3 模式識(shí)別[1]:根據(jù)初選集中的模式去識(shí)別剩下語(yǔ)料中的“分詞碎片”,在識(shí)別的同時(shí),統(tǒng)計(jì)出每種模式可以識(shí)別出的詞語(yǔ)數(shù)目。識(shí)別時(shí),如果連續(xù)的“分詞碎片”中滿足初選集中的一種或幾種模式,以滿足的最長(zhǎng)模式為最后結(jié)果。例如:左方/f偏/d上/f一點(diǎn)/m,既滿足模式fd,又滿足模式fdfm,選擇fdfm即詞語(yǔ)為左方偏上一點(diǎn)為結(jié)果。
2.4 模式篩選:去掉一些識(shí)別出詞語(yǔ)比較少的模式,因?yàn)檫@些模式往往只是某個(gè)分詞碎片組成的特例,不能稱之為一個(gè)模式。
2.5 用篩選后的模式,對(duì)測(cè)試集中的“分詞碎片”進(jìn)行識(shí)別:篩選后的模式就是可用于對(duì)“分詞碎片”進(jìn)行識(shí)別的模式。
3 實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)中從60條語(yǔ)句中總結(jié)出的“分詞碎片”的詞性成詞模式共18種如下所示:
"mq","fd","ff","fvf","df","fdfm","dn","dfdfm","fn","ffn","fdam","ffnn","nn","nfv","bnf","fda","vf","mnn"
實(shí)驗(yàn)準(zhǔn)備的測(cè)試集為200條分詞碎片語(yǔ)料,用這幾種模式去識(shí)別這200條測(cè)試集中的語(yǔ)料,實(shí)驗(yàn)結(jié)果如表1所示:
表1 實(shí)驗(yàn)結(jié)果
構(gòu)詞模式 mq fd ff fvf df fdfm dn dfdfm
出現(xiàn)頻次 31 39 40 0 25 9 116 2
構(gòu)詞模式 fn fdam ffnn nn fda vf mnn
出現(xiàn)頻次 0 9 0 0 1 0 1
據(jù)統(tǒng)計(jì),該方法識(shí)別出的詞語(yǔ)的正確率為97.5%,召回率為94.7%。
4 結(jié)束語(yǔ)
本文介紹了一種基于構(gòu)詞模式的自動(dòng)識(shí)別未登錄描述詞的方法,并提出把該方法用于特征-描述詞的對(duì)齊中,極大地增強(qiáng)了對(duì)齊語(yǔ)料中的詞語(yǔ)豐富性。
附錄
計(jì)算所漢語(yǔ)詞性標(biāo)記集
Version 5.0
制訂人:劉群 張華平 張浩
n 名詞;t 時(shí)間詞;s 處所詞;f 方位詞;v 動(dòng)詞;a 形容詞;b 區(qū)別詞;
z 狀態(tài)詞;r 代詞;m 數(shù)詞;q 量詞;d 副詞;p 介詞;c 連詞;u 助詞;
e 嘆詞;y 語(yǔ)氣詞;o 擬聲詞;h 前綴;k 后綴;w 標(biāo)點(diǎn)符號(hào);
參考文獻(xiàn):
[1]Richard O.模式分類[M].北京:機(jī)械工業(yè)出版社,2005.
作者簡(jiǎn)介:王玉凡(1972-),女,河北人,碩士,講師,研究方向:信息處理。
一、引 言
漢語(yǔ)是我國(guó)的語(yǔ)言,其中官方通用語(yǔ)言為普通話,學(xué)習(xí)漢語(yǔ)主要是通過(guò)老師上課教、學(xué)生課后根據(jù)書本上的漢語(yǔ)拼音學(xué)習(xí)的方式進(jìn)行。這種方法對(duì)教師的依賴性過(guò)大,雖然教師通過(guò)普通話測(cè)試,但是仍然有一部分教師存在口音問(wèn)題,同時(shí)這種學(xué)習(xí)方式對(duì)學(xué)生的普通話發(fā)音沒(méi)有辦法進(jìn)行嚴(yán)格的評(píng)判。隨著計(jì)算機(jī)多媒體技術(shù)的發(fā)展,可以使用計(jì)算機(jī)通過(guò)評(píng)測(cè)系統(tǒng)進(jìn)行計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)。而目前漢語(yǔ)普通話測(cè)試主要也是基于計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)(computer assisted language learning ,簡(jiǎn)稱call)[1]進(jìn)行的。本文從這個(gè)角度出發(fā),首先獲取模型設(shè)計(jì)的基頻數(shù)據(jù),設(shè)計(jì)并實(shí)現(xiàn)k-gmm模型,并初步分析這一技術(shù)應(yīng)用于計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)中的價(jià)值。
二、基于k-gmm模型的
一種漢語(yǔ)聲調(diào)識(shí)別技術(shù)
漢語(yǔ)是聲調(diào)語(yǔ)言,其單音節(jié)的聲調(diào)模式共有五種,分別為陰平、陽(yáng)平、上聲、去聲和輕聲,[2]本文主要針對(duì)前四種聲調(diào)進(jìn)行分析。漢語(yǔ)最重要的信息是通過(guò)聲調(diào)的基頻保持的,它是提高語(yǔ)音生動(dòng)性的重要因素。因此聲調(diào)識(shí)別在漢語(yǔ)識(shí)別中十分關(guān)鍵,必須選用準(zhǔn)確有效的方式方法提取基頻,并對(duì)其進(jìn)行必要的處理。必要的處理手段主要有插值平滑處理、重采樣處理以及歸一化處理。[3]通過(guò)這些必要的處理后,再通過(guò)建立一個(gè)識(shí)別模型才能夠?qū)崿F(xiàn)聲調(diào)的識(shí)別。識(shí)別模型的好壞在一定程度上決定了識(shí)別率的高低,因此本文為了實(shí)現(xiàn)非特定人聲調(diào)識(shí)別而建立了k-gmm模型。
(一)基頻提取算法原理
為了保證提取基頻的準(zhǔn)確性,同時(shí)又要滿足算法的復(fù)雜度較低以及算法的計(jì)算量小的要求,可選擇自相關(guān)算法提取基頻,并對(duì)基頻數(shù)據(jù)進(jìn)行后處理,得到一個(gè)較好的基頻數(shù)據(jù)輸入模型。算法框圖如圖1所示。
假定隨時(shí)間的變化語(yǔ)音信號(hào)的特性變化緩慢,因此可以將信號(hào)分割成一些短段(分幀)再加以處理,這些短段可以看作是來(lái)自一個(gè)持續(xù)聲音片斷,這個(gè)持續(xù)聲音片段具有固定特性。算法中就是將語(yǔ)音信號(hào)看作是短時(shí)平穩(wěn)過(guò)程,對(duì)其短段進(jìn)行語(yǔ)音信號(hào)處理的。
圖1 基頻提取算法框圖本文由收集整理
1. 語(yǔ)音信號(hào)的預(yù)處理
通過(guò)對(duì)語(yǔ)音的研究表明:[4]成年男性、成年女性基頻范圍分別在70~250hz、160~400hz,而兒童的基頻范圍最高可達(dá)500hz。因此選用60~900hz的帶通濾波器對(duì)語(yǔ)音信號(hào)進(jìn)行濾波,完成預(yù)處理,這樣可以剔除一部分非語(yǔ)音音頻的基頻數(shù)據(jù)。
2. 自相關(guān)計(jì)算
使用信號(hào){x(n)}的短時(shí)自相關(guān)函數(shù)計(jì)算,獲取基頻數(shù)據(jù),如公式(1)所示。
rn(k)=x(m)·x(m+k)·hk(n-m) (1)
其中:hk(n-m)=w(n)·w(n-k)
rn(k)就是自相關(guān)計(jì)算所得的基頻結(jié)果,它是信號(hào)在第n個(gè)樣本附近截取的一段信號(hào)。
3. 插值平滑
通過(guò)自相關(guān)計(jì)算得到的基頻,存在數(shù)據(jù)丟失的情況,這主要是因?yàn)橐恍嵋舨糠值幕l為0,導(dǎo)致基頻序列不連續(xù)。針對(duì)這一情況需要進(jìn)行丟失數(shù)據(jù)的處理。通常可采用插值平滑的方式進(jìn)行。這里采用基于拉格朗日(lagrange插值)插值的插值平滑處理,如公式(2)所示。
pn(x)=lk(x)yk=j ≠ 0 (2)
根據(jù)實(shí)際應(yīng)用模型可知,每個(gè)漢字的基頻曲線應(yīng)該是平滑的,字與字之間的基頻過(guò)渡也應(yīng)該是平滑的。基于這種思想,結(jié)合普通話語(yǔ)音的特點(diǎn),選取lagrange插值平滑處理中的值為3。使用lagrange插值法選取已知點(diǎn)時(shí),選擇四個(gè)點(diǎn),斷點(diǎn)前后各兩個(gè)點(diǎn),其中在斷點(diǎn)前要分別選擇一個(gè)最靠近的已知點(diǎn)和一個(gè)與該斷點(diǎn)有一定距離的已知點(diǎn)。在斷點(diǎn)后也以相同的方法選取已知點(diǎn),注意選取距離一般不超過(guò)10。
采用自相關(guān)計(jì)算提取的基頻,選取n值為3的lagrange插值進(jìn)行平滑處理后,如圖2所示。通過(guò)分析,可以看出平滑后的基頻曲線效果較好。
4. 重采樣處理
為了便于建立識(shí)別模型,必須保證每個(gè)字或詞的特征數(shù)相同,因此需要對(duì)數(shù)據(jù)進(jìn)行重采樣處理。重采樣的基本步驟如下:
(a)平滑處理前
(b)平滑處理后
圖2 插值平滑處理前后對(duì)比
假設(shè)特征維數(shù)設(shè)定為m維,對(duì)應(yīng)在[0,1]上的點(diǎn)間隔1/(m-1)。再假定在二維坐標(biāo)系中取n個(gè)點(diǎn),用于對(duì)應(yīng)提取某個(gè)字的n個(gè)基頻數(shù)據(jù),二維坐標(biāo)系中縱坐標(biāo)為該點(diǎn)對(duì)應(yīng)的基頻數(shù)據(jù)值,橫坐標(biāo)為0到1,其間隔為1/(n-1)。其中m<n并且1 (m-1)>1/(n-1)。
(1)取原始數(shù)據(jù)的第一個(gè)點(diǎn)為重采樣的第一個(gè)點(diǎn)。
(2)計(jì)算重采樣的第二個(gè)點(diǎn)。根據(jù)重采樣的第二個(gè)點(diǎn)x橫坐標(biāo)為1/(m-1),位于區(qū)間[1/(n-1),2/(n-1)],選擇線性插值運(yùn)算在其所在區(qū)間上進(jìn)行插值運(yùn)算,可得到其對(duì)應(yīng)的重采樣數(shù)值y,如公式(3)所示:
y=(f2-f1)(n-1)x+2f1-f2 (3)
這里假設(shè)點(diǎn)1/(n-1)對(duì)應(yīng)的原始基頻為f1,點(diǎn)2/(n-1)對(duì)應(yīng)的原始基頻為f2。
(3)依次選取不同的橫坐標(biāo)點(diǎn)x,可求出重采樣的所有數(shù)據(jù)y。
5. 歸一化處理
提取的基頻數(shù)據(jù)經(jīng)過(guò)以上處理后效果有一定的改善,但針對(duì)漢語(yǔ)聲調(diào)自身的特點(diǎn),為了選擇一種較有效的識(shí)別模型,必須先分析說(shuō)話人的聲調(diào)分布情況。[5]由于每個(gè)人的發(fā)音特點(diǎn)和口音各不相同,相同字的基頻曲線有很大差異,但是每個(gè)人的整體頻域范圍差異卻不顯著。因此,可以通過(guò)歸一化處理讓識(shí)別模型能夠處理大部分人的語(yǔ)音,即將所有的基頻數(shù)據(jù)處理到同一個(gè)數(shù)量區(qū)域內(nèi)。基于此,采用歸一化公式(4)計(jì)算:
=(f-fmin)/(fmax-fmin) (4)
式中fmax表示單個(gè)說(shuō)話人基頻上限的90%,fmin表示單個(gè)說(shuō)話人基頻下限的1.1倍。由于獲取當(dāng)前說(shuō)話人的基頻上下限很困難,因此fmax和fmin的值使用當(dāng)前語(yǔ)音樣本頻率的上限和下限值來(lái)代替。
要注意的是經(jīng)過(guò)插值平滑的基頻數(shù)據(jù)需要取對(duì)數(shù)運(yùn)算后才可以進(jìn)行歸一化。這主要是由于錄音時(shí)可能出現(xiàn)發(fā)音抖動(dòng),使得某個(gè)頻率值過(guò)大或過(guò)小,因此要剔除頻率過(guò)高點(diǎn)或過(guò)低點(diǎn)。
(二)基于k- gmm的聲調(diào)識(shí)別
1. k-gmm模型設(shè)計(jì)
對(duì)于特定人的識(shí)別,k-means聚類算法[6]能夠得到較好的識(shí)別率。但在非特定人識(shí)別模型中,由于每個(gè)人的頻域不同,此方法存在很大的缺陷。
高斯混合模型(gmm)是具有混合高斯密度函數(shù)的隱馬爾科夫模型(hmm),高斯混合模型由多個(gè)高斯分布線性加成在一起構(gòu)成其概率密度函數(shù),用來(lái)描述特征矢量在概率空間的分布情況,更適用于非特定人的識(shí)別,基于此本本文由收集整理文提出了k-gmm模型。
以單字組為例,k-gmm模型識(shí)別的算法思想如下:
(1)對(duì)已知的聲調(diào)訓(xùn)練樣本按聲調(diào)進(jìn)行分類,單字組聲調(diào)分為四類。將每一種聲調(diào)的訓(xùn)練樣本按照k-means聚類算法進(jìn)行聚類,并且求出聚類后的每一類的每一維特征的均值uikj和?滓2ikj方差,以及這一類占整個(gè)這個(gè)聲調(diào)的權(quán)重?棕ik,其中i=1,2,3,4;j=1,2…,m;k=1,2。k值采用遍歷搜索法求出,這里取2。
(2)由(1)求出的均值和方差,按照gmm模型求出其對(duì)應(yīng)的概率密度函數(shù)pikj,如公式(5)所示。
pikj(x:?滋ikj,?滓2ikj)=e (5)
(3)求出每種聲調(diào)的每一類的特征矢量的概率密度函數(shù)。由于可以將特征矢量的每一維特征看作是獨(dú)立的,因此其概率密度函數(shù)就是每一維的概率密度的乘積,如公式(6)所示。
pik=pikj (6)
(4)以(1)(2)(3)為基礎(chǔ),將測(cè)試樣本xn帶入到四類聲調(diào)對(duì)應(yīng)的所有模型中,求出其概率密度函數(shù)值pik。
(5)將每一類進(jìn)行加權(quán)求和,通過(guò)公式(7)進(jìn)行。然后求出基頻數(shù)據(jù)所有模型的最大值max(pi),此最大值對(duì)應(yīng)的值就為測(cè)試樣本的聲調(diào)。
pi=?棕ikpik (7)
注意,由于基頻的數(shù)值進(jìn)行了歸一化處理,因此,求出的概率密度函數(shù)值會(huì)很小,為了便于處理,將其值取對(duì)數(shù)。
(三)實(shí)驗(yàn)結(jié)果分析
利用標(biāo)準(zhǔn)語(yǔ)音庫(kù)863語(yǔ)料樣本的單字組的訓(xùn)練和測(cè)試樣本,訓(xùn)練樣本為104組,測(cè)試樣本為103組。采用上述的基頻提取算法,以k- gmm模型作為識(shí)別模型進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果(基頻特征維數(shù)為15)見表1。
從實(shí)驗(yàn)結(jié)果中可以看出該模型對(duì)聲調(diào)的識(shí)別率還是較高的。同時(shí)利用該模型對(duì)不同的基頻特征維數(shù)分別進(jìn)行了實(shí)驗(yàn),發(fā)現(xiàn)特征維數(shù)不能太小,也不能太多。特征維數(shù)太小不能體現(xiàn)基頻的大部分信息,特征維數(shù)越多,信息體現(xiàn)得越全面。但是特征維數(shù)太多會(huì)加大運(yùn)算量。實(shí)驗(yàn)表明,特征維數(shù)選擇在10到30之間時(shí),識(shí)別率沒(méi)有明顯變化。表1中的數(shù)據(jù)是基頻特征維數(shù)為15時(shí)的實(shí)驗(yàn)結(jié)果。
三、計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)中
對(duì)聲調(diào)識(shí)別的應(yīng)用研究
目前計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)雖然經(jīng)過(guò)了一段時(shí)間的發(fā)展,但是主要還是停留在課堂使用多媒體教學(xué)的層面上,對(duì)于激發(fā)學(xué)生學(xué)習(xí)興趣、培養(yǎng)學(xué)生自主學(xué)習(xí)的能力等方面做得還不夠。鑒于此,聲調(diào)識(shí)別技術(shù)應(yīng)用方向和價(jià)值主要體現(xiàn)在以下幾方面。
(一)計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)中對(duì)聲調(diào)識(shí)別的應(yīng)用方向
1. 計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)語(yǔ)音評(píng)測(cè)系統(tǒng)
應(yīng)用聲調(diào)識(shí)別技術(shù)可以開發(fā)關(guān)于語(yǔ)音發(fā)音評(píng)測(cè)的評(píng)測(cè)系統(tǒng)。該技術(shù)的應(yīng)用可以使得計(jì)算機(jī)識(shí)別人的語(yǔ)音變?yōu)榭赡埽?dāng)然僅僅依靠聲調(diào)識(shí)別技術(shù)是不能夠完全識(shí)別語(yǔ)言的,但是這是識(shí)別語(yǔ)言非常重要的組成部分。通過(guò)識(shí)別的語(yǔ)音再進(jìn)行相關(guān)評(píng)測(cè)技術(shù)的評(píng)測(cè)即可得到發(fā)音者的語(yǔ)音評(píng)測(cè)結(jié)果。通過(guò)語(yǔ)音評(píng)測(cè)系統(tǒng)可以使學(xué)習(xí)者自行進(jìn)行發(fā)音評(píng)測(cè)。
2. 交互型計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)應(yīng)用軟件
應(yīng)用聲調(diào)識(shí)別技術(shù)可以開發(fā)關(guān)于語(yǔ)音的相關(guān)交互型的學(xué)習(xí)軟件。該類軟件可以展示正確的語(yǔ)音、識(shí)別發(fā)音者的語(yǔ)音,可以由發(fā)音者的語(yǔ)音控制某些進(jìn)程動(dòng)作的執(zhí)行,進(jìn)行語(yǔ)音練習(xí)和學(xué)習(xí)。如一些語(yǔ)音小游戲,可通過(guò)語(yǔ)音控制游戲的進(jìn)行。使用這些交互型的計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)應(yīng)用軟件,使得學(xué)習(xí)者可以在一個(gè)交互的環(huán)境中自主地進(jìn)行想要學(xué)習(xí)和練習(xí)的內(nèi)容。
(二)計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)中對(duì)聲調(diào)識(shí)別的應(yīng)用價(jià)值
1. 促進(jìn)計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)的新應(yīng)用
目前計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)主要依靠多媒體輔助教學(xué)的形式來(lái)完成,這一形式注重“教”而忽略了“學(xué)”,同時(shí)在很大程度上阻斷了教師和學(xué)生的交流與聯(lián)系。[7]這對(duì)漢語(yǔ)這一具有豐富信息量的語(yǔ)言學(xué)習(xí)是十分不利的,因此計(jì)算機(jī)輔助語(yǔ)言學(xué)了注重“教”也要注重“學(xué)”。在學(xué)生學(xué)習(xí)漢語(yǔ)的過(guò)程中,很大一部分時(shí)間是在課下進(jìn)行的,而漢語(yǔ)言的發(fā)音是學(xué)習(xí)語(yǔ)言的最基本的要素之一,發(fā)音是否標(biāo)準(zhǔn)是衡量普通話好壞的一個(gè)重要標(biāo)準(zhǔn)。因此對(duì)于學(xué)習(xí)者要進(jìn)行發(fā)音的評(píng)測(cè),如何讓評(píng)測(cè)發(fā)音在教師不在場(chǎng)的情況下進(jìn)行是目前遇到的普遍問(wèn)題。利用本文這種識(shí)別率較高的聲調(diào)識(shí)別技術(shù)開發(fā)普通話評(píng)測(cè)系統(tǒng)即可解決這一問(wèn)題。這一問(wèn)題的解決可以促進(jìn)計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)的發(fā)展,給計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)提供新的應(yīng)用研究方向。
2. 促進(jìn)、激發(fā)學(xué)生的學(xué)習(xí)興趣,提高學(xué)生自主學(xué)習(xí)的能力
計(jì)算機(jī)輔助語(yǔ)言學(xué)習(xí)過(guò)程中,教師通過(guò)多媒體課件、視頻、音頻、電視錄像等技術(shù)手段來(lái)激發(fā)學(xué)生的學(xué)習(xí)興趣,但往往容易忽略和學(xué)生的互動(dòng)性。[8]隨著多媒體技術(shù)軟硬件的發(fā)展,現(xiàn)在可以開發(fā)一些學(xué)習(xí)型的應(yīng)用軟件,利用這些軟件可以和學(xué)生互動(dòng),彌補(bǔ)課堂互動(dòng)性差的不足。使用高質(zhì)量的聲調(diào)識(shí)別技術(shù)可以開發(fā)針對(duì)語(yǔ)音學(xué)習(xí)的軟件,使得學(xué)生可以和計(jì)算機(jī)互動(dòng),評(píng)測(cè)發(fā)音準(zhǔn)確度。甚至通過(guò)開發(fā)一些互動(dòng)語(yǔ)音小游戲,讓學(xué)生在玩的過(guò)程中學(xué)習(xí),來(lái)進(jìn)一步激發(fā)學(xué)生的學(xué)習(xí)興趣。通過(guò)這些方式可以避免學(xué)生單純依賴教師上課進(jìn)行學(xué)習(xí),為學(xué)生課下自主學(xué)習(xí)提供了新的環(huán)境,有助于提高學(xué)生的自主學(xué)習(xí)能力。因此,這一語(yǔ)音聲調(diào)識(shí)別技術(shù)有一定的實(shí)用價(jià)值。
關(guān)鍵詞: 子空間識(shí)別 模態(tài)參數(shù)識(shí)別 隨機(jī)子空間
中圖分類號(hào):P424文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào):
引言
準(zhǔn)確的結(jié)構(gòu)模態(tài)參數(shù)識(shí)別對(duì)于結(jié)構(gòu)響應(yīng)分析、狀態(tài)監(jiān)測(cè)、結(jié)構(gòu)控制等研究有著非常重要的意義。但是傳統(tǒng)的模態(tài)參數(shù)識(shí)別要求同時(shí)測(cè)量輸入和輸出信號(hào),這給大型工程結(jié)構(gòu)的振動(dòng)測(cè)試帶來(lái)了不少困難,如難以施加有足夠能量的激勵(lì)或者激勵(lì)昂貴、測(cè)試過(guò)程中影響結(jié)構(gòu)的正常使用等。于是,研究者們提出了僅測(cè)量結(jié)構(gòu)在正常使用時(shí)的環(huán)境激勵(lì)下的響應(yīng)信號(hào)的模態(tài)參數(shù)識(shí)別思路,稱之為基于環(huán)境激勵(lì)的模態(tài)參數(shù)識(shí)別或工作模態(tài)分析(OMA)。該類方法不但無(wú)需特意施加人工激勵(lì)、測(cè)試過(guò)程中不影響結(jié)構(gòu)使用,并且識(shí)別出的模態(tài)參數(shù)反映了結(jié)構(gòu)的真實(shí)邊界條件和工作時(shí)的動(dòng)態(tài)特性,故受到廣泛關(guān)注和研究。
基于環(huán)境激勵(lì)的方法主要可分為頻域類方法和時(shí)域類方法【1】【2】【3】。頻域類方法主要有峰值拾取法、頻率分解法等【4】。時(shí)域類的方法主要有:①Ibrahim提出的基于隨機(jī)減量技術(shù)從白噪聲激勵(lì)下結(jié)構(gòu)隨機(jī)響應(yīng)中提取自由響應(yīng)進(jìn)而識(shí)別模態(tài)參數(shù)的ITD法【5】【6】;②美國(guó)Sandia實(shí)驗(yàn)室James等提出的自然激勵(lì)技術(shù)(NExT)【7】,作者首次證明了白噪聲激勵(lì)下測(cè)量通道間的互相關(guān)函數(shù)和脈沖響應(yīng)函數(shù)具有相同數(shù)學(xué)表達(dá)式,從而以其代替脈沖響應(yīng),再結(jié)合傳統(tǒng)的基于脈沖響應(yīng)的識(shí)別方法完成環(huán)境激勵(lì)下的模態(tài)參數(shù)識(shí)別;③隨機(jī)子空間方法,該方法的主要貢獻(xiàn)者如Akaike首先解決了狀態(tài)空間模型的隨機(jī)實(shí)現(xiàn)問(wèn)題【8】, Overschee 和Moor于1993年提出了直接基于數(shù)據(jù)的隨機(jī)子空間方法【9】。1999年比利時(shí)魯汶大學(xué)土木系Peeters及Doeck提出基于參考點(diǎn)的隨機(jī)子空間方法【10】。在這些方法中,隨機(jī)子空間方法因無(wú)需迭代、計(jì)算量小,識(shí)別結(jié)果精確可靠而得到廣泛關(guān)注。
在協(xié)方差驅(qū)動(dòng)的參考點(diǎn)隨機(jī)子空間方法中,通過(guò)將識(shí)別方法中全部測(cè)試通道間的相關(guān)函數(shù)計(jì)算減少為全部通道僅和參考通道間的相關(guān)計(jì)算,顯著減少了該類方法的計(jì)算量。該方法在減少運(yùn)算量的同時(shí),是否會(huì)對(duì)模態(tài)參數(shù)識(shí)別的精度帶來(lái)影響?本文將在闡述該方法的識(shí)別理論之后, 以一個(gè)數(shù)值算例探討參考點(diǎn)隨機(jī)子空間方法的識(shí)別效率,包括運(yùn)算時(shí)間,結(jié)果的準(zhǔn)確性,并對(duì)參考通道的選擇提供參考意見。
1 協(xié)方差驅(qū)動(dòng)的參考點(diǎn)隨機(jī)子空間識(shí)別
在基于環(huán)境激勵(lì)的模態(tài)參數(shù)識(shí)別中,激勵(lì)本身未測(cè)量,假定其滿足零均值平穩(wěn)白噪聲條件,則結(jié)構(gòu)的離散隨機(jī)狀態(tài)方程組為:
(6)
假定含未知輸入和噪聲的隨機(jī)項(xiàng)和的協(xié)方差矩陣滿足關(guān)系:
(7)
其中為記號(hào)。
振動(dòng)測(cè)試中,測(cè)量物理量通常為加速度信號(hào),參考點(diǎn)隨機(jī)子空間方法的識(shí)別程序是首先構(gòu)造全部個(gè)測(cè)量通道加速度與個(gè)參考點(diǎn)通道間的相關(guān)函數(shù)的矩陣(非參考點(diǎn)協(xié)方差隨機(jī)子空間方法則為全部通道間的相關(guān)函數(shù)矩陣):
(8)
其中:
(9)
為輸出響應(yīng)間相關(guān)函數(shù)矩陣在時(shí)滯值為的估計(jì)值,。對(duì)矩陣進(jìn)行奇異值分解得:
(10)
由隨機(jī)狀態(tài)方程的性質(zhì)可將矩陣表示為擴(kuò)展觀測(cè)矩陣和逆向隨機(jī)控制矩陣的積,則得到擴(kuò)展觀測(cè)矩陣表達(dá)式為:
(11)
則離散系統(tǒng)矩陣可由擴(kuò)展觀測(cè)矩陣的移位結(jié)構(gòu)關(guān)系得到:
(12)
其中為擴(kuò)展觀測(cè)矩陣的上行矩陣的虛逆, 為下行矩陣。矩陣可直接取擴(kuò)展觀測(cè)矩陣的上行得到。模態(tài)頻率、阻尼及振型可通過(guò)對(duì)離散系統(tǒng)矩陣進(jìn)行特征值分解后由下式得到:
(13)
值得注意的是:在方程(10)中,理論上系統(tǒng)真實(shí)階次可以由不為零的奇異值數(shù)量決定,但是在實(shí)踐應(yīng)用中,普遍出現(xiàn)奇異值均不為零,甚至它們的值之間也不會(huì)出現(xiàn)顯著差異。這時(shí),根據(jù)虛擬模態(tài)(計(jì)算模態(tài))將不會(huì)穩(wěn)定出現(xiàn)的特點(diǎn),可以假定系統(tǒng)階次在一定范圍內(nèi)變化,在各階次中穩(wěn)定出現(xiàn)的總次數(shù)來(lái)判斷其是否是真實(shí)的物理模態(tài)即穩(wěn)定圖方法。
2數(shù)值算例
應(yīng)用Midas/civil軟件建立一平面等截面簡(jiǎn)支梁,計(jì)算跨徑32m,斷面為GB-YB工字形,型號(hào)為I100x68x4.5/7.6,材料為Q235鋼材,彈性模量206,有限元離散劃分為16個(gè)平面梁?jiǎn)卧瑔卧L(zhǎng)度2.0m,如圖1所示。在橋梁半跨內(nèi)的第2至第9號(hào)節(jié)點(diǎn)豎向同時(shí)施加有限帶寬白噪聲動(dòng)荷載模擬環(huán)境激勵(lì)。根據(jù)響應(yīng)結(jié)果,對(duì)照非參考點(diǎn)隨機(jī)子空間方法研究參考點(diǎn)識(shí)別方法的識(shí)別精度,同時(shí)探討參考點(diǎn)的選擇方法。
圖1:簡(jiǎn)支梁數(shù)值模型
2.1 生成白噪聲激勵(lì)信號(hào)
采用的目標(biāo)時(shí)域白噪聲激勵(lì)力信號(hào)的峰值為1KN,采樣頻率為50Hz,持續(xù)時(shí)間為180秒。該信號(hào)采用Matlab程序首先由白噪聲的已知功率譜密度函數(shù)推求頻譜函數(shù),再疊加隨機(jī)相位譜后經(jīng)傅里葉逆變換生成。有限帶寬白噪聲功率譜密度值指定在0.01Hz至100Hz區(qū)段為1.0,原始采樣頻率為400Hz,其它頻率區(qū)間值為0,生成信號(hào)的功率譜密度分別如圖2所示。將該信號(hào)經(jīng)1/8倍重采樣和峰值調(diào)整后便得到目標(biāo)信號(hào)如圖3。連續(xù)執(zhí)行8次得到所需的8個(gè)節(jié)點(diǎn)動(dòng)荷載歷程。
圖2:生成信號(hào)的功率譜密度
圖3: 節(jié)點(diǎn)動(dòng)荷載時(shí)程
網(wǎng)絡(luò)出
>> 基于船舶自動(dòng)識(shí)別系統(tǒng)的局部縮減航道元胞自動(dòng)機(jī)模型 基于構(gòu)詞模式的未登錄描述詞自動(dòng)識(shí)別的研究 基于分類技術(shù)的交通標(biāo)志自動(dòng)識(shí)別的研究與實(shí)現(xiàn) 基于改進(jìn)的神經(jīng)網(wǎng)絡(luò)異常聲音自動(dòng)識(shí)別系統(tǒng)研究 基于自動(dòng)識(shí)別技術(shù)的新疆特色林果產(chǎn)品供應(yīng)鏈管理研究 基于RFID在車輛信息自動(dòng)識(shí)別技術(shù)的研究與應(yīng)用探索 基于數(shù)學(xué)形態(tài)學(xué)的地層特征自動(dòng)識(shí)別方法研究 基于BP神經(jīng)網(wǎng)絡(luò)壁紙自動(dòng)識(shí)別的研究 基于HSI顏色空間的小麥粉精度自動(dòng)識(shí)別研究 基于自動(dòng)識(shí)別的壓力表 基于HOUGH變換的航空儀表自動(dòng)識(shí)別 藏文不自由虛詞的自動(dòng)識(shí)別研究 車牌自動(dòng)識(shí)別的算法研究與實(shí)現(xiàn) 車牌自動(dòng)識(shí)別技術(shù)研究 網(wǎng)頁(yè)體裁自動(dòng)識(shí)別研究 藏文人名自動(dòng)識(shí)別研究 ETC中基于RFID的雙標(biāo)簽汽車牌照自動(dòng)識(shí)別系統(tǒng)研究 淺談自動(dòng)識(shí)別技術(shù)的發(fā)展 中文比較句的自動(dòng)識(shí)別 漢語(yǔ)介詞短語(yǔ)的自動(dòng)識(shí)別 常見問(wèn)題解答 當(dāng)前所在位置:l
基金項(xiàng)目:北京巖溶水資源勘查評(píng)價(jià)工程項(xiàng)目(BJYRS-ZT-01-02);水沙科學(xué)與水利水電工程國(guó)家重點(diǎn)實(shí)驗(yàn)室資助項(xiàng)目(2012-KY-05)
作者簡(jiǎn)介:姚晨晨(1988-),男,江蘇海安人,工程師,主要從事抽水蓄能電站水能設(shè)計(jì)等方面的研究。E-mail:
摘要:基于物理機(jī)理的分布參數(shù)模型廣泛用于評(píng)價(jià)和模擬地下水流和水力響應(yīng)。傳統(tǒng)的確定數(shù)值模型參數(shù)的試錯(cuò)法(人工方法),過(guò)多地依賴于建模者的經(jīng)驗(yàn)和主觀判斷,并且是一個(gè)非常耗時(shí)的過(guò)程。引進(jìn)一種帶約束、非線性、全局收斂且無(wú)需求導(dǎo)的Condor優(yōu)化算法,以理想的地下水模型為例,實(shí)現(xiàn)了模型參數(shù)自動(dòng)識(shí)別的完整過(guò)程,并與廣泛采用的遺傳算法收斂效果進(jìn)行對(duì)比。結(jié)果表明,相比于遺傳算法,Condor算法受參數(shù)初值影響小,尋優(yōu)效率提升顯著。
關(guān)鍵詞:參數(shù)估計(jì);自動(dòng)識(shí)別;Condor算法;分布參數(shù)模型
中圖分類號(hào):P641 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):
1672-1683(2015)04-0733-04
Case study of parameter auto-calibration of distributed parameter model based on Condor algorithm
YAO Chen-chen1, WEI Jia-hua2
(1.PowerChina Huadong Engineering Corporation,Hangzhou 310014,China;
2.State Key Laboratory of Hydroscience and Engineering,Tsinghua University,Beijing 100084,China)
Abstract:Physically-based distributed parameter models have been widely used to evaluate and predict groundwater flow and hydraulic response.The traditional trial-and-error approach for calibrating the numerical model parameters depends on the experience and subjective assessment of the modeler and can be very time-consuming.In this paper,the Condor algorithm,a constrained,non-linear,and derivative-free optimizer,is introduced into parameter auto-calibration of a synthetic groundwater model.It achieves a complete process of parameter auto-calibration of the model.The convergence effects are compared with those using the genetic algorithm,which suggests that the Condor algorithm is less affected by the initial parameters and improves the optimizing efficiency significantly compared with genetic algorithm.
Key words:parameter estimation;auto-calibration;Condor algorithm;distributed parameter model
1 研究背景
參數(shù)識(shí)別是分布參數(shù)數(shù)值模型建模工作中至關(guān)重要的環(huán)節(jié),參數(shù)識(shí)別效果直接關(guān)系到模擬預(yù)測(cè)結(jié)果的可靠性。參數(shù)識(shí)別是一項(xiàng)復(fù)雜、費(fèi)時(shí)的過(guò)程,其表現(xiàn)出的非唯一性、不穩(wěn)定性[1],加大了識(shí)別的難度。絕大部分的分布參數(shù)數(shù)值模型的參數(shù)識(shí)別,多采用試算法,即通過(guò)人工改變參數(shù)值,不斷比對(duì)模擬值和實(shí)測(cè)值,直至擬合效果“滿意”為止。這一過(guò)程由于缺乏收斂準(zhǔn)則,主要依賴建模者的經(jīng)驗(yàn),具有較大的主觀性[2]。為提高模型參數(shù)識(shí)別過(guò)程的工作效率,在參數(shù)自動(dòng)識(shí)別或在自動(dòng)識(shí)別基礎(chǔ)上再進(jìn)行對(duì)比論證,已成為必然趨勢(shì)。一些常用的專業(yè)模型軟件都開發(fā)了參數(shù)自動(dòng)識(shí)別軟件包,如PEST、UCODE、iTough2等。
參數(shù)自動(dòng)識(shí)別,一般通過(guò)最小二乘或極大似然估計(jì)構(gòu)造目標(biāo)函數(shù),借助優(yōu)化算法,在參數(shù)解空間自動(dòng)搜尋參數(shù)最優(yōu)值。由于模擬模型計(jì)算時(shí)間較長(zhǎng),因此對(duì)優(yōu)化算法效率的要求較高。參數(shù)識(shí)別尋優(yōu)算法可以分為四類:一是基于函數(shù)梯度信息的尋優(yōu)方法,如最速下降法、高斯-牛頓法、共軛梯度法[3]等,這類基于梯度的算法需要直接求解目標(biāo)函數(shù)的導(dǎo)數(shù)信息,易陷入局部最優(yōu),較難應(yīng)用到復(fù)雜的模型參數(shù)識(shí)別問(wèn)題中。二是啟發(fā)式全局搜索算法,如遺傳算法、模擬退火、禁忌搜索、人工神經(jīng)網(wǎng)絡(luò)等,這類方法普適性較強(qiáng),應(yīng)用廣,但對(duì)大規(guī)模問(wèn)題而言,搜索效率不高,且難以保證所獲得的解是全局最優(yōu)。三是基于概論統(tǒng)計(jì)分析的參數(shù)識(shí)別,如最大似然法(maximum likelihood),這種方法建立在大量枚舉計(jì)算樣本統(tǒng)計(jì)基礎(chǔ)之上,一般給定一個(gè)概率分布,假定其概率密度函數(shù)(probability density function,PDF)及分布參數(shù),從這個(gè)分布中抽出一個(gè)具有n個(gè)值的采樣,利用概率密度函數(shù),計(jì)算出其概率,并能給出某一概率下的可能參數(shù)值,這種方法目前多與其它優(yōu)化方法結(jié)合使用。四是本文重點(diǎn)關(guān)注的非求導(dǎo)的(derivative-free)優(yōu)化算法,這類方法克服了直接求導(dǎo)帶來(lái)的諸多問(wèn)題,如Tolson和Shoemaker (2007)[4]提出了適合流域模型參數(shù)自動(dòng)識(shí)別的動(dòng)態(tài)維搜索算法(DDS),并通過(guò)實(shí)例分析了算法的應(yīng)用效果。Powell提出COBYLA算法[5],通過(guò)線性插值逼近目標(biāo)函數(shù)進(jìn)行優(yōu)化計(jì)算,隨后Conn的DFO算法[6]、Powell的UOBYQA算法[7],分別用牛頓多項(xiàng)式插值和拉格朗日多項(xiàng)式插值擬合目標(biāo)函數(shù),提高了算法的收斂速度和精度。Frank在UOBYQA算法的基礎(chǔ)上,加入對(duì)約束條件下求解的支持,并引入并行機(jī)制,進(jìn)一步增強(qiáng)了算法的適用范圍,發(fā)展出Condor算法[8]。Condor算法在計(jì)算流體動(dòng)力學(xué)尋優(yōu)問(wèn)題上的成功運(yùn)用,也為其它應(yīng)用提供了參考。
Condor算法克服了最速下降法、高斯-牛頓法、共軛梯度法等算法對(duì)梯度的直接求解,通過(guò)拉格朗日多項(xiàng)式插值技術(shù)獲取目標(biāo)函數(shù)的梯度信息,在克服基于梯度算法對(duì)噪聲靈敏缺點(diǎn)的同時(shí),保持了基于梯度算法的高效率。本文介紹了Condor算法的原理及流程,并通過(guò)理想的地下水模型參數(shù)自動(dòng)識(shí)別為例,分析其在高運(yùn)算負(fù)荷、多維變量函數(shù)尋優(yōu)中的表現(xiàn)。
2 Condor算法
Condor算法利用拉格朗日插值,在小區(qū)域內(nèi)構(gòu)造二次型逼近目標(biāo)函數(shù),利用信賴域方法求解二次型最優(yōu)解以擬合目標(biāo)函數(shù)最優(yōu)解,通過(guò)不斷迭代逐步達(dá)到最優(yōu)。Condor算法充分利用了目標(biāo)函數(shù)的導(dǎo)數(shù)信息,大大增加了尋優(yōu)效率,同時(shí)插值技術(shù)的運(yùn)用又避免了導(dǎo)數(shù)信息的直接求解。Condor算法的簡(jiǎn)要流程如下[8]。
(1)利用拉格朗日多項(xiàng)式插值技術(shù)在初始點(diǎn)xstart附近構(gòu)造二次型多項(xiàng)式q0(s)。插值點(diǎn)集Y中的點(diǎn)(用以構(gòu)造q(x))由初始給定數(shù)值ρstart分散開距離。令xk是當(dāng)前迭代為止使目標(biāo)函數(shù)值最優(yōu)的點(diǎn),ρ0=ρstar。在以下的算法中,通過(guò)集合Y在xk附近插值構(gòu)造f(x)的近似式qk(s)。qk(s)=f(xk)+gtks+stHks,其中g(shù)k表示點(diǎn)xk處f(x)的梯度近似,Hk表示點(diǎn)xk處f(x)的海森矩陣近似。
(2)信賴域半徑Δk=ρk。
(3)內(nèi)部循環(huán):在ρk精度下求解問(wèn)題。
步驟1,①求解步長(zhǎng)sk,滿足mins ∈Rnqk(s) s.t.s2≤Δ;②如果s2ρk或者f(xk+1)
步驟2,檢查qk(s)在信賴域內(nèi)的有效性。若模型無(wú)效,則進(jìn)一步提高二次型qk(s)的擬合質(zhì)量。具體做法:找一個(gè)新點(diǎn)xnew滿足xnew-xkρk跳轉(zhuǎn)至步驟1,否則繼續(xù)。
(4)當(dāng)優(yōu)化步長(zhǎng)s變得很小時(shí),減小ρk,以進(jìn)一步提高精度。
(5)如果ρk=ρend,算法終止,否則k=k+1,返回至流程 (2)。
3 實(shí)例研究
3.1 參數(shù)自動(dòng)識(shí)別框架
針對(duì)模擬問(wèn)題進(jìn)行建模,首次假定“標(biāo)準(zhǔn)參數(shù)”,代入正向模型中模擬運(yùn)行產(chǎn)生模擬值作為“觀測(cè)值”。將不同參數(shù)代入進(jìn)行數(shù)值模擬,通過(guò)模擬值與“觀測(cè)值”的誤差平方和作為目標(biāo)函數(shù)(即最小二乘法),借助合適的算法在參數(shù)約束空間內(nèi)不斷迭代求解,搜尋目標(biāo)函數(shù)的最優(yōu)值,從而實(shí)現(xiàn)分布參數(shù)模型的參數(shù)自動(dòng)識(shí)別。參數(shù)自動(dòng)識(shí)別框架見圖1。
3.2 正向模型建立
假定一個(gè)非均質(zhì)各向同性的理想承壓含水層進(jìn)行數(shù)值實(shí)驗(yàn)。模擬的區(qū)域?yàn)橐?guī)則長(zhǎng)方體,三維尺寸5 000 m×5 000 m×50 m。源匯項(xiàng)除區(qū)域中心的兩口抽水井(坐標(biāo)分別為[2 500,1 500],[2 500,3 500])外,降雨、蒸發(fā)等均忽略不計(jì),抽水井以天為單位,變流量抽水,假定抽水過(guò)程見表1。東西側(cè)邊界條件設(shè)定為定水頭,分別為40 m、45 m,南北側(cè)、頂板、底板為不透水層。模擬區(qū)域內(nèi),除了滲透率、孔隙度不考慮其他參數(shù)的影響,根據(jù)滲透率、孔隙度的變化,將區(qū)域概化為三塊。并在三個(gè)子區(qū)域內(nèi)設(shè)觀測(cè)井(共13個(gè)、位置見圖2)。
其中,K為滲透系數(shù),(xj,yj)為抽、注水井的坐標(biāo),V為抽、注水井?dāng)?shù)量,Qj為抽、注水流量,δ為δ函數(shù)(抽水為正,注水為負(fù)),Ss為貯水率,與孔隙率的關(guān)系Ss=γ(a+φβ) (γ為水的容重,a為土的體積壓縮系數(shù),β為水的體積壓縮系數(shù),φ為孔隙度),水頭H1=40 m,H2=45 m,a=5 000 m。
利用有限差分法對(duì)滲透區(qū)域進(jìn)行離散,單元網(wǎng)格大小為100 m×100 m×50 m,即,整個(gè)滲透區(qū)域分成50×50×1個(gè)網(wǎng)格。借助數(shù)值模擬軟件HST3D程序正向模擬,選擇0.1 d為步長(zhǎng),模擬10 d內(nèi)滲透區(qū)域的水壓力場(chǎng)的情況。單次模型正向運(yùn)行時(shí)間5 s。
該區(qū)域內(nèi)的三維非穩(wěn)定流定解問(wèn)題表述如式(1):
3.3 遺傳算法識(shí)別成果
本例中的遺傳算法采用實(shí)數(shù)編碼方式(RAGA),并對(duì)每代最優(yōu)個(gè)體進(jìn)行保留。算法相關(guān)參數(shù):交叉因子0.85,變異因子0.05,初始種群數(shù)取100,迭代次數(shù)取500,識(shí)別結(jié)果見表3。
3.4 Condor算法識(shí)別成果
設(shè)計(jì)方案1-方案3分別從不同初始值出發(fā),方案4*在目標(biāo)函數(shù)中人為添加了[-100,100]區(qū)間內(nèi)的隨機(jī)均勻噪聲(考慮到實(shí)際觀測(cè)中存在誤差),分別進(jìn)行尋優(yōu)迭代,結(jié)果見表4。算法相關(guān)參數(shù):模型初始步長(zhǎng)0.1,終止步長(zhǎng)1e-6。
4 算法討論
4.1 Condor算法
對(duì)比方案1-方案3,本例中不同參數(shù)初始值對(duì)Condor算法尋優(yōu)的影響并不明顯,相應(yīng)的目標(biāo)函數(shù)在迭代300次左右開始收斂。從識(shí)別效果上來(lái)看(表2),6個(gè)參數(shù)的自動(dòng)識(shí)別結(jié)果相對(duì)誤差均在1%以內(nèi),多數(shù)在0.5%以下,參數(shù)自動(dòng)識(shí)別效果理想。同時(shí),算法尋優(yōu)速度快,整套參數(shù)自動(dòng)識(shí)別的時(shí)間在15 min以內(nèi)。
對(duì)比方案1-方案3、方案4*,由于在方案4*的目標(biāo)函數(shù)中加入了均勻隨機(jī)誤差,參數(shù)識(shí)別值的相對(duì)誤差增大,部分參數(shù)(如k3、φ3)達(dá)到5%,最優(yōu)目標(biāo)函數(shù)值也由方案1的101量級(jí)提高到方案4*的103量級(jí),迭代次數(shù)也略有增加。但從最終識(shí)別的結(jié)果可以看出,人為隨機(jī)誤差對(duì)Condor算
4.2 遺傳算法與Condor算法對(duì)比
對(duì)比遺傳算法及Condor算法的前3個(gè)方案(表5),可以看出,Condor算法克服了遺傳算法效率方面的缺陷,參數(shù)自動(dòng)識(shí)別時(shí)間大為減少(遺傳算法72 h-迭代大約50 000次未收斂,Condor算法15 min-迭代大約370次收斂),同時(shí)大幅提高了參數(shù)識(shí)別的精度(遺傳算法中10%的參數(shù)相對(duì)誤差提高至Condor算法中0.5%的參數(shù)相對(duì)誤差,目標(biāo)函數(shù)值從103量級(jí)減小到101量級(jí))。就本例來(lái)看,Condor算法用于參數(shù)自動(dòng)識(shí)別的效果要優(yōu)于遺傳很多。
5 模型不確定性分析
5.1 靈敏度分析
以Condor算法自動(dòng)識(shí)別的參數(shù)值做模型不確定性分析,靈敏度計(jì)算采用如下標(biāo)準(zhǔn)化形式[9]:
xk=Sak/ak≈S(ak+Δak)-S(ak)Δak/ak (2)
式中,ΔS=S(ak+Δak)-S(ak)為由于參數(shù)變化引起的目標(biāo)函數(shù)從基準(zhǔn)例子S(ak)到新例子S(ak+Δak)的變化量。選取觀測(cè)與模擬水頭殘差均方根(RMS)作為S進(jìn)行計(jì)算,并給予每個(gè)參數(shù)5%的擾動(dòng)。
從圖3可以看出,分區(qū)1的水頭值對(duì)參數(shù)k1較為敏感,分區(qū)2對(duì)參數(shù)k1、φ2敏感,分區(qū)3的水頭值對(duì)6個(gè)參數(shù)的變化都比較敏感,水平較統(tǒng)一。
5.2 一階誤差分析
Var[y]=∑ni=1Var[xi]yxi2X0(3)
假定Condor算法識(shí)別出的6個(gè)參數(shù)服從對(duì)數(shù)均勻分布,給定對(duì)數(shù)擾動(dòng)范圍為5%。
從圖4可以看出,同一分區(qū)對(duì)稱井位受參數(shù)誤差影響幾乎水平相當(dāng),分區(qū)2及靠近分區(qū)2的井位不確定最大,尤以滲透區(qū)域中心的井位最明顯。
6 結(jié)論
本文采用一種帶約束、非線性、全局收斂且無(wú)需求導(dǎo)的Condor優(yōu)化算法,并以理想的地下水模型為例,介紹了模型參數(shù)的自動(dòng)識(shí)別方法,并與廣泛采用的遺傳算法收斂效果進(jìn)行對(duì)比。從識(shí)別的過(guò)程及結(jié)果可以形成如下結(jié)論:利用
Condor算法優(yōu)化識(shí)別分布參數(shù)的地下水流模型參數(shù),優(yōu)化迭代過(guò)程穩(wěn)定,參數(shù)自動(dòng)識(shí)別效果好,初值對(duì)算法影響不明顯,同時(shí)對(duì)人為添加到目標(biāo)函數(shù)中的噪聲表現(xiàn)穩(wěn)定;Condor算法采用插值技術(shù)構(gòu)造二次型,可充分利用目標(biāo)函數(shù)信息,與遺傳算法相比,尋優(yōu)效率大為提高(本例中提升300倍),參數(shù)識(shí)別結(jié)果精度高。
為了便于驗(yàn)證,本例采用了一個(gè)理想的含水層算例,今后將結(jié)合實(shí)際案例,利用Condor算法可并行性的優(yōu)點(diǎn),可將其推廣應(yīng)用到復(fù)雜、非凸、高運(yùn)算負(fù)荷的參數(shù)識(shí)別問(wèn)題中。
參考文獻(xiàn)(References):
[1] Zheng C,Wang P.Parameter structure identification using tabu search and simulated annealing[J].Advances in Water Resources,1996,19(4):215-224.
[2] 薛禹群,謝春紅.地下水?dāng)?shù)值模擬[M].北京:科學(xué)出版社,2007.(XUE Yu-qun,XIE Chun-hong.Numerical Simulation for Groundwater[M].Peking:Science Press,2007.(in Chinese))
[3] Willis R,Yeh W W G.Groundwater systems planning and management[M].NJ:Prentice Hall Inc.,1987.
[4] Tolson,B.A.,and C.A.Shoemaker.Dynamically dimensioned search algorithm for computationally efficient watershed model calibration,Water Resources Research,2007,43(1).
[5] Powell M J D.A direct search optimization method that models the objective and constraint functions by linar interpolation[M].Oaxaca,Mexico:Kluwer Academic Publishers,1994.
[6] Conn A,Scheinberg K,Toint P.Recent progress in unconstrained nonlinear optimization without derivatives[J].Mathematical Programming,1997,79(1):397-414.
[7] Powell M J D.UOBYQA:unconstrained optimization by quadratic approximation[J].Mathematical Programming,2002,92(3):555-582.
北大期刊 審核時(shí)間1-3個(gè)月
中國(guó)科學(xué)技術(shù)協(xié)會(huì);中國(guó)自動(dòng)化學(xué)會(huì)