時間:2023-07-23 09:17:20
引言:易發表網憑借豐富的文秘實踐,為您精心挑選了九篇神經網絡研究現狀范例。如需獲取更多原創內容,可隨時聯系我們的客服老師。
【關鍵詞】模糊系統;神經網絡;結合;現狀
中圖分類號:Q189文獻標識碼: A 文章編號:
一、前言
隨著我國經濟的快速發展,我國的各項事業都取得了巨大的成就。其中模糊系統與神經網絡的結合就是重要的體現,模糊系統與神經網絡的結合在很多方面都得到了應用,同時也引起了更多學者研究其的愿望。相信模糊系統與神經網絡的結合在未來會發展的更好。
二、模糊系統與神經網絡概述
1、模糊系統與神經網絡的概念
(1)、模糊系統概念
模糊系統(Fuzzy System, 簡稱 FS)是仿效人的模糊邏輯思維方法設計的系統, 方法本身明確地說明了系統在工作過程中允許數值量的不精確性存在。
(2)、神經網絡概念
神經網絡( Neural Network, 簡稱 NN) 是由眾多簡單的神經元連接而成的網絡。盡管每個神經元結構、功能都不復雜, 但網絡的整體動態行為極為復雜, 可組成高度非線性動力學系統, 從而可表達許多復雜的物理系統。神經網絡的研究從上世紀40年代初開始, 目前, 在世界范圍已形成了研究神經網絡前所未有的熱潮。它已在控制、模式識別、圖像和視頻信號處理、金融證券、人工智能、軍事、計算機視覺、優化計算、自適應濾波和A/D變換等方面獲得了應用。
2、模糊系統與神經網絡的異同
(1)映射集及映度
神經網絡是用點到點的映射得到輸入與輸出的關系, 它的訓練是確定量, 因而它的映射關系也是一一對應的; 模糊系統的輸入、輸出都是經過模糊化的量, 不是用明確的數來表示的, 其輸入輸出已模糊為一個隸屬度的值,因此它是區域與區域間的映射, 可像神經網絡一樣映射一個非線性函數。
(2)知識存儲方式
神經網絡的基本單元是神經元, 對映射所用的多層網絡間是用權連接的, 因此學習的知識是分布在存儲的權中間的, 而模糊系統則以規則的方式來存儲知識, 因此在隸屬函數形式上, 區域的劃分大小和規則的制定上人為因素較多。
(3)聯結方式
神經網絡的聯結, 以前饋式網絡為例, 一旦輸出的隱層確定了, 則聯結結構就定了, 通過學習后, 幾乎每一個神經元與前一層神經元都有聯系, 因此, 在控制迭代中, 每迭代一次,各權都要學習。而在模糊系統中, 每次輸入可能只與幾條規則有關, 因此聯結不固定, 每次輸入輸出聯系的規則都在變動, 而每次聯結的規則少, 運算簡單方便。
(4)計算量的比較
人工神經網絡的計算方法需要乘法、累加和指數運算, 而模糊系統的計算只需兩個量的比較和累加, 又由于每次迭代的規則不多, 因此在實時處理時, 模糊系統的速度比神經網絡快。但是當模糊輸入與輸出變量很多的時候,模糊規則僅靠一張表已不能描述多變量間的關系, 且規則的控制存在一定困難, 此時人為的先驗指數變得較少, 那么隸屬函數、規則本身都要通過學習得到, 因此它的計算量也會增加。
三、模糊和神經網絡的結合形式
目前,模糊和神經網絡技術從簡單結合到完全融合主要體現在四個方面(見圖1)。由于模糊系統和神經網絡的結合方式目前還處于不斷發展的進程中,所以,還沒有更科學的分類方法,下述結合方式是從不同應用中綜合分析的結果。
1、模糊系統和神經網絡系統的簡單結合(見圖1(a))
模糊系統和神經網絡系統各自以其獨立的方式存在,并起著一定的作用。¹松散型結合 在一系統中,對于可用“if-then”規則來表示的部分,用模糊系統描述;而對很難用“if-then”規則表示的部分,則用神經網絡,兩者之間沒有直接聯系。
(1)并聯型結合 模糊系統和神經網絡在系統中按并聯方式連接,即享用共同的輸入。按照兩系統所起作用的輕重程度,還可分為等同型和補助型。
(2)串聯型結合 模糊系統和神經網絡在系統中按串聯方式連接,即一方的輸出成為另一方的輸入。
圖表 1模糊系統與神經網絡結合形式分類
2、用模糊邏輯增強的神經網絡。這種結合的主要目的是用模糊神經系統作為輔助工具,增強神經網絡的學習能力,克服傳統神經網絡容易陷入局部極小值的弱點。
3、用神經網絡增強的模糊邏輯
這種類型的模糊神經網絡是用神經網絡作為輔助工具,更好地設計模糊系統。
(1)網絡學習型的結合 模糊系統設計的關鍵是知識的獲取,傳統方法難于有效地獲取規則和調整隸屬度函數,而神經網絡的學習能力能夠克服這些問題,故用神經網絡增強的模糊系統。
(2)基于知識擴展型的結合 神經網絡和模糊系統的結合是為了擴展知識庫和不費時地對知識庫進行修正,增強系統的自學習能力,這種自學習能力是靠神經網絡和模糊系統之間進行雙向。
4、模糊系統與神經網絡的等價
(1)函數通近
模糊系統與神經網絡除了都是無模型系統外,它們都是函數的全局逼近器.模糊系統以其插值機理來逼近任意的連續函數。不但傳統的模糊系統模型是任意連續函數的全局逼近器,而且神經網絡與模糊系統的不同結合能逼近不同的函數,如模糊神經網絡可以逼近模糊函數,神經網絡也是任意連續函數的全局逼近器。設任意連續函數h(x),對于緊空間X和任意小的正數,總能找到一個三層的前向神經網絡N(x)滿足:
在前向神經網絡家族中,RBF神經網絡是最優的函數逼近器,即對于任意的神經網絡N(x)總存在一個RBF神經網絡N‘(x),滿足:
(2)神經網絡與模糊系統的等價性
模糊系統和神經網絡的等價性主要有兩個方面:模型的等價性和Madani模型的等價性。對于TS模型.首先Jang〔,5〕給出了標準的Gauss,anRBF神經網絡等價于限制的Ts一型模糊系統。Hunt指出推廣的GaussianRBF神經網絡等價于TS一型模糊系統。Benitez證明了若一個三層的神經網絡,隱含單元的激發函數為對數函數(loglst1C),輸出層的激發函數為單元函數.設N(x),則存在一個模糊系統的輸出也為N(x)。
四、模糊系統與神經網絡結合的現狀
目前, FS和NN的結合主要有模糊神經網絡和神經模糊系統。神經模糊系統是以NN為主, 結合模糊集理論。它將NN作為實現FS 模型的工具, 即在NN的框架下實現FS或其一部分功能。神經模糊系統雖具有一些自己所具有而NN不具備的特性, 但它沒有跳出NN 的框架。神經模糊系統從結構上來看, 一般是四層或五層的前向神經網絡。模糊神經網絡是神經網絡的模糊化。即以模糊集、模糊邏輯為主, 結合 NN 方法, 利用NN的自組織性, 達到柔性信息處理的目的。目前,FS理論和NN結合主要應用于商業及經濟估算、自動檢測和監視、機器人及自動控制、計算機視覺、專家系統、語音處理、優化問題、醫療應用等方面, 并可推廣到工程、科技、信息技術和經濟等領域。
五、模糊神經網絡的發展方向及存在問題
然模糊神經網絡得到了突飛猛進的發展,但目前還存在很多問題:(1)多變量、復雜控制系統中,很難確定網絡的結構和規則點的組合“爆炸”問題;(2)傳統的Bp學習方法昜陷入局部極小值,并切學習速度較慢。
發展方向主要集中于:(1)模糊邏輯和神經網絡的對應關系,將模糊控制器的調整轉化為等價的神經元網絡學習,利用等價的模糊邏輯來初始化神經元網絡;(2)尋找一般模糊集的模糊神經網絡的學習算法
七、結束語
近年來隨著信息技術的發展,模糊理論和人工神經網絡近年來取得了引人注目的進展, 模糊理論和人工神經網絡的各個方面都取得了越來越多的成果。 通過不斷的努力,我們一定可以進一步的推進模糊理論和神經網絡將會在發展新理論, 完善各自體系。相信在未來的研究中,模糊和神經網絡的結合
將會為研究更高智能系統開創一條成功之路,造福人類。
參考文獻
[1]劉增良.模糊技術與應用選篇[J].京航空航天大學出版社,1997.
[2]莊鎮泉,章勁松.神經網絡與智能信息處理[J].中國科學技術大學,2000.
人工神經網絡屬于一種對人腦結構及功能進行反映的數學抽象模型,對人的思維以及存儲知識等功能進行模擬,從而完成某項工作。對于巖土工程來說,主要包括巖體和土體兩項內容,且這兩項內容均具備很高的復雜性。在巖土工程研究過程中,有必要借助人工神經網絡,從而使巖土工程的研究得到有效進步發展。本文在分析人工神經網絡的基礎上,進一步對人工神經網絡在巖土工程中的應用進行分析,以期為巖土工程研究的進展提供一些具有價值的參考建議。
關鍵詞:
人工神經網絡;巖土工程;應用
巖土工程的研究對象分為兩大類:其一為巖體;其二為土體。巖土工程涉及的介質存在兩大特性,即模糊性和隨機性,這兩大特性又統稱為不確定性。近年來,不少學者在巖土工程研究過程中,提出了人工神經網絡這一概念,即利用人工神經網絡,將其應用到巖土工程研究領域當中,從而為深入了解巖土工程的某些介質特征奠定有效基礎[1]。從巖土工程研究的優化及完善角度考慮,本文對“人工神經網絡在巖土工程中的應用”進行分析意義重大。
1人工神經網絡分析
1.1人工神經網絡概念
對于人工神經網絡來說,是一種對人腦結構與功能進行反映的數學抽象模型;主要通過數理策略,經信息處理,進一步對人腦神經網絡構建某種簡化模型,進一步采取大量神經元節點互連,從而形成復雜網絡,最終完成人類思維及儲存知識的能力的模擬。神經網絡無需構建反映系統物理規律的數學模型,與別的方法比較,在噪聲容忍度方面更強[2]。與此同時,還擁有很強的非線性映射功能,對于大量非結構性以及非精準性規律存在自適應能力,具備超強的計算能力,可完成信息的記憶以及相關知識的推理,且其自身還具備自主學習能力;與常規算法相比,優勢、特點突出。
1.2BP網絡簡述
從研究現狀來看,基于實際應用過程中,人工神經網絡模型大多數采取BP網絡。BP網絡即指的是多層前饋網絡,因多層前饋網絡的訓練通常使用誤差反向傳播算法,所以將BP網絡稱之為屬于一類誤差反向傳播的多層前饋網絡。對于其網絡而言,具備輸入節點和輸出節點,同時還具備一層隱層節點與多層隱層節點,基于同層節點當中不存在耦合狀態。其中的輸入信號從輸出層節點依次傳過各個隱層節點,進一步傳輸至輸出節點,每一層節點的輸出只對下一層的節點輸出產生影響。
2人工神經網絡在巖土工程中的應用分析
在上述分析過程中,對人工神經網絡的概念有一定的了解,由于其模型算法的優越性,可將其應用到巖土工程研究領域當中,從而為解決巖土工程問題提供有效憑據。從現狀來看,人工神經網絡在巖土工程中的應用主要體現在以下幾大方面。
2.1在巖石力學工程中的應用
巖石力學工程是巖土工程中尤為重要的一部分,將神經網絡應用到巖石力學工程當中,主要對巖石非線性系統加以識別,同時還能夠為工程巖體分類提供有效幫助,此外在爆破效應預測方面也具備一定的應用價值。對于人工神經網絡來說,存在從有限數據中獲取系統近似關系的優良特性,而巖石當中的各項參數之間又存在很復雜的關系,并且難以獲取完整的參數集。在這樣的情況下,使用人工神經網絡技術,便能夠使巖石非線性系統識別問題得到有效解決[3]。此外,有研究者將巖石抗壓強度、抗拉強度以及彈性能量指數等作為巖爆預測的評判指標,進一步對巖爆預測的神經網絡模型進行構建,然后預測了巖爆的發生與烈度。通過計算得出結論:采取人工神經網絡方法進行巖爆預測行之有效,值得采納借鑒。
2.2在邊坡工程中的應用
對于巖土工程中的邊坡工程來說,邊坡失穩狀況突出,且是由多因素造成的,比如邊坡失穩的地質形成條件、誘發因素的復雜性以及隨機性等。與此同時,由于邊坡動態監測技術從目前來看尚且不夠成熟,因此邊坡失穩在巖土工程研究領域一直視為是一項難以解決的工程項目。而對于神經網絡方法來說,因其具備非常好的預測功能,因此相關巖土工程研究工作者通常會采取人工神經網絡對巖土工程中的邊坡工程問題進行求解。并且,從現有研究成果來看,將人工神經網絡應用于巖土工程的成果突出。有學者對影響巖質邊坡的穩定性的相關因素進行了分析,包括地形因素、巖體因素以及外部環境因素等,并構建了邊坡穩定性分析的BP網絡模型[4]。此外,還有學者將大量水電邊坡工程的穩定狀況作為學習訓練樣本及預測樣本,對以人工神經網絡技術的邊坡巖體的穩定性進行了研究,結果顯示,采取人工神經網絡對邊坡巖體的穩定狀況進行預測可行性高。
2.3在基坑工程中的應用
采取人工神經網絡對基坑變形進行預測主要分為兩種情況:其一,對會影響基坑變形的各大因素及位移的神經網絡模型加以構建;其二,把變形監測數據作為一個時間序列,以歷史數據為依據,將系統演變規律查找出來,進一步完成系統未來發展趨勢的分析及預測。有學者針對基坑變形利用了人工神經網絡方法進行預測,結果表明:對前期實測結果加以應用,使用此方法能夠對后續階段的基坑變形實時預測出來,并且預測結果和實測結果保持一致性。此外,還有學者根據具體工程項目,采取人工神經網絡,對深基坑施工中地下連續墻的位移進行了深入分析及預測,結果顯示:使用人工神經網絡方法進行分析及預測,在精準度上非常高,值得在深基坑工程相關預測項目中使用[5]。
2.4在地鐵隧道工程中的應用
在地鐵隧道施工過程中,存在地表變形和隧道圍巖變形等狀況,為了深入了解這些狀況,可將人工神經網絡應用其中。有學者在對地層的影響因素進行分析過程中,列出了可能的影響因素:盾構施工參數、盾構物理參數以及地質環境條件,進一步利用人工神經網絡,構建了人工神經網絡模型,進一步針對盾構施工期間的地層移動進行實時動態預測,最終得到了不錯的預測成果。此外,還有學者對BP網絡算法進行改進,然后對某地鐵工程中隧道上方的地表變形進行了未來趨勢預測,結果表明:和其他地表變形預測方法相比,人工神經網絡預測方法的應用價值更為顯著。
3結語
通過本文的探究,認識到基于人工神經網絡模型的算法具備很高的優越性,由于巖土工程地質條件復雜,為了深入研究巖土工程,可將人工神經網絡應用其中。結合現狀研究成果可知,人工神經網絡在巖石力學工程、邊坡工程、基坑工程以及地鐵隧道工程中均具備顯著應用價值。例如:將人工神經網絡應用于巖石力學工程當中,能夠預測巖爆的發生與烈度;應用于邊坡工程當中,能夠邊坡工程的穩定性進行精準預測;應用于基坑工程當中,實現對基坑工程變形的實時動態監測;應用于地鐵隧道工程當中,能夠進一步了解地鐵工程中隧道上方的地表變形情況。
總而言之,人工神經網絡在巖土工程中的應用價值高,值得相關工作者采納應用。
作者:張洪飛 單位:山東正元建設工程有限責任公司
參考文獻
[1]鄭惠娜.章超樺.秦小明.肖秀春,等.人工神經網絡在食品生物工程中的應用[J].食品工程,2012(01):16-19.
[2]鄒義懷.江成玉.李春輝,等.人工神經網絡在邊坡穩定性預測中的應用[J].礦冶,2011(04):38-41.
[3]曹建智.張健.人工神經網絡在白洋淀水質評價中的應用[J].電子技術與軟件工程,2016(08):261-262.
【關鍵詞】極限學習機 故障診斷 神經網絡
引言
隨著設備復雜化程度的提高,對故障診斷的快速性和準確性提出了更高的要求。將神經網絡應用于故障診斷中已成為一個非常活躍的研究領域。利用神經網絡強大的分類能力,進行故障模式的分類與學習,診斷出故障。
Huang在前人研究的基礎上提出了一種稱為極限學習機(Extreme Learning Machine,ELM)的學習方法,在保留計算精度的同時可以大幅度的縮減訓練的時間。將ELM運用到設備故障診斷中,極大提高了診斷的快速性和準確性。
一、極限學習機研究現狀
ELM自2004年提出就一直受到學者的極大興趣。我們從ELM的理論和應用兩方面進行闡述。
1.1 ELM的理論
對于傳統ELM算法,網絡結構、激活函數類型以及隱層神經元的選擇對其泛化性能都有重要的影響。為了提高計算效率,使得ELM適用于更多應用領域,研究者提出了許多ELM擴展算法。
1.2 ELM的應用
研究人員已嘗試利用ELM方法解決現實中各種模式分類問題。隨著ELM自身理論的進一步發展和完善,在人臉識別、文本分類、醫療診斷等領域中應用廣泛。
二、故障診斷技術研究現狀
故障診斷技術是由于建立監控系統的需要而發展起來的。其發展至今經歷了3個階段。新的診斷技術帶來了領域內算法的革新,設備精密程度的提高也對診斷實時性提出了更高的要求。如何保證故障的快速準確診斷成了診斷技術發展重要內容。
基于神經網絡的故障診斷運用廣泛,然而傳統的神經網絡學習方法存在許多問題。與傳統的神經網絡相比,極限學習機方法通過隨機選取輸入權值及隱層單元的偏置值,可以產生唯一的最優解,并具有參數易于選擇以及泛化能力好等特點,在眾多領域有著廣泛應用。
三、基于極限學習機的故障診斷方法研究
3.1基于ELM的故障診斷流程
(1)數據預處理。按照選取的特征向量和故障類型對故障樣本進行預處理,并將處理后的樣本按比例分為訓練樣本集和測試樣本集。
(2)ELM的學習算法主要有以下3個步驟:確定隱含層神經元個數;隨機設定輸入層與隱含層間的連接權值和隱含層神經元的偏置;選擇隱含層神經元激活函數,進而計算隱含層輸出矩陣計算輸出層權值。
(3)用訓練好的ELM模型對測試樣本集進行分類,并輸出分類結果。
3.2基于改進ELM的故障診斷
針對極限學習機神經網絡初始權閾值對算法性能的影響問題,提出融合遺傳算法(GA)與粒子群算法(PSO)的GA-PSO算法,用于優化ELM神經網絡初始權閾值。該算法將群組一分為二,分別采用GA和PSO算法,再將優秀個體進行合并,改善了PSO算法全局搜索能力,同時增強GA算法的局部搜索效能。
[關鍵詞]遺傳算法 灰色系統 專家系統 模糊控制 小波分析
一、前言
神經網絡最早的研究20世紀40年代心理學家Mcculloch和數學家Pitts合作提出的,他們提出的MP模型拉開了神經網絡研究的序幕。神經網絡的發展大致經過三個階段:1947~1969年為初期,在這期間科學家們提出了許多神經元模型和學習規則, 如MP模型、HEBB學習規則和感知器等;1970~1986年為過渡期,這個期間神經網絡研究經過了一個低潮,繼續發展。在此期間,科學家們做了大量的工作,如Hopfield教授對網絡引入能量函數的概念,給出了網絡的穩定性判據,提出了用于聯想記憶和優化計算的途徑。1984年,Hiton教授提出Boltzman機模型。1986年Kumelhart等人提出誤差反向傳播神經網絡,簡稱BP網絡。目前,BP網絡已成為廣泛使用的網絡;1987年至今為發展期,在此期間,神經網絡受到國際重視,各個國家都展開研究,形成神經網絡發展的另一個。神經網絡具有以下優點:
(1) 具有很強的魯棒性和容錯性,因為信息是分布貯于網絡內的神經元中。
(2) 并行處理方法,使得計算快速。
(3) 自學習、自組織、自適應性,使得網絡可以處理不確定或不知道的系統。
(4) 可以充分逼近任意復雜的非線性關系。
(5) 具有很強的信息綜合能力,能同時處理定量和定性的信息,能很好地協調多種輸入信息關系,適用于多信息融合和多媒體技術。
二、神經網絡應用現狀
神經網絡以其獨特的結構和處理信息的方法,在許多實際應用領域中取得了顯著的成效,主要應用如下:
(1) 圖像處理。對圖像進行邊緣監測、圖像分割、圖像壓縮和圖像恢復。
(2) 信號處理。能分別對通訊、語音、心電和腦電信號進行處理分類;可用于海底聲納信號的檢測與分類,在反潛、掃雷等方面得到應用。
(3) 模式識別。已成功應用于手寫字符、汽車牌照、指紋和聲音識別,還可用于目標的自動識別和定位、機器人傳感器的圖像識別以及地震信號的鑒別等。
(4) 機器人控制。對機器人眼手系統位置進行協調控制,用于機械手的故障診斷及排除、智能自適應移動機器人的導航。
(5) 衛生保健、醫療。比如通過訓練自主組合的多層感知器可以區分正常心跳和非正常心跳、基于BP網絡的波形分類和特征提取在計算機臨床診斷中的應用。
(6) 焊接領域。國內外在參數選擇、質量檢驗、質量預測和實時控制方面都有研究,部分成果已得到應用。
(7) 經濟。能對商品價格、股票價格和企業的可信度等進行短期預測。
(8) 另外,在數據挖掘、電力系統、交通、軍事、礦業、農業和氣象等方面亦有應用。
三、神經網絡發展趨勢及研究熱點
1.神經網絡研究動向
神經網絡雖已在許多領域應用中取得了廣泛的成功,但其發展還不十分成熟,還有一些問題需進一步研究。
(1) 神經計算的基礎理論框架以及生理層面的研究仍需深入。這方面的工作雖然很困難,但為了神經計算的進一步發展卻是非做不可的。
(2) 除了傳統的多層感知機、徑向基函數網絡、自組織特征映射網絡、自適應諧振理論網絡、模糊神經網絡、循環神經網絡之外,一些新的模型和結構很值得關注,例如最近興起的脈沖神經網絡(spiking neural network)和支持向量機(support vector machine)。
(3) 神經計算技術與其他技術尤其是進化計算技術的結合以及由此而來的混合方法和混合系統,正成為一大研究熱點。
(4) 增強神經網絡的可理解性是神經網絡界需要解決的一個重要問題。這方面的工作在今后若干年中仍然會是神經計算和機器學習界的一個研究熱點。
(5) 神經網絡的應用領域將不斷擴大,在未來的幾年中有望在一些領域取得更大的成功,特別是多媒體技術、醫療、金融、電力系統等領域。
2.研究熱點
(1)神經網絡與遺傳算法的結合。遺傳算法與神經網絡的結合主要體現在以下幾個方面:網絡連接權重的進化訓練;網絡結構的進化計算;網絡結構和連接權重的同時進化;訓練算法的進化設計。基于進化計算的神經網絡設計和實現已在眾多領域得到應用,如模式識別、機器人控制、財政等,并取得了較傳統神經網絡更好的性能和結果。但從總體上看,這方面研究還處于初期階段,理論方法有待于完善規范,應用研究有待于加強提高。神經網絡與進化算法相結合的其他方式也有待于進一步研究和挖掘。
(2)神經網絡與灰色系統的結合。灰色系統理論是一門極有生命力的系統科學理論,自1982年華中理工大學的鄧聚龍教授提出灰色系統后迅速發展,以初步形成以灰色關聯空間為基礎的分析體系,以灰色模型為主體的模型體系,以灰色過程及其生存空間為基礎與內的方法體系,以系統分析、建模、預測、決策、控制、評估為綱的技術體系。目前,國內外對灰色系統的理論和應用研究已經廣泛開展,受到學者的普遍關注。灰色系統理論在在處理不確定性問題上有其獨到之處,并能以系統的離散時序建立連續的時間模型,適合于解決無法用傳統數字精確描述的復雜系統問題。
神經網絡與灰色系統的結合方式有:(1) 神經網絡與灰色系統簡單結合;(2) 串聯型結合;(3) 用神經網絡增強灰色系統;(4) 用灰色網絡輔助構造神經網絡;(5) 神經網絡與灰色系統的完全融合。
(3)神經網絡與專家系統的結合。基于神經網絡與專家系統的混合系統的基本出發點立足于將復雜系統分解成各種功能子系統模塊,各功能子系統模塊分別由神經網絡或專家系統實現。其研究的主要問題包括:混合專家系統的結構框架和選擇實現功能子系統方式的準則兩方面。由于該混合系統從根本上拋開了神經網絡和專家系統的技術限制,是當前研究的熱點。把粗集神經網絡專家系統用于醫學診斷,表明其相對于傳統方法的優越性。
(4)神經網絡與模糊邏輯的結合
模糊邏輯是一種處理不確定性、非線性問題的有力工具。它比較適合于表達那些模糊或定性的知識,其推理方式比較類似于人的思維方式,這都是模糊邏輯的優點。但它缺乏有效的自學習和自適應能力。
而將模糊邏輯與神經網絡結合,則網絡中的各個結點及所有參數均有明顯的物理意義,因此這些參數的初值可以根據系統的模糊或定性的知識來加以確定,然后利用學習算法可以很快收斂到要求的輸入輸出關系,這是模糊神經網絡比單純的神經網絡的優點所在。同時,由于它具有神經網絡的結構,因而參數的學習和調整比較容易,這是它比單純的模糊邏輯系統的優點所在。模糊神經網絡控制已成為一種趨勢,它能夠提供更加有效的智能行為、學習能力、自適應特點、并行機制和高度靈活性,使其能夠更成功地處理各種不確定的、復雜的、不精確的和近似的控制問題。
模糊神經控制的未來研究應集中于以下幾個方面:
(1) 研究模糊邏輯與神經網絡的對應關系,將對模糊
控制器的調整轉化為等價的神經網絡的學習過程,用等價的模糊邏輯來初始化神經網絡;
(2) 完善模糊神經控制的學習算法,以提高控制算法的速度與性能,可引入遺傳算法、BC算法中的模擬退火算法等,以提高控制性能;
(3) 模糊控制規則的在線優化,可提高控制器的實時性與動態性能;
(4) 需深入研究系統的穩定性、能控性、能觀性以及平衡吸引子、混沌現象等非線性動力學特性。
關于神經網絡與模糊邏輯相結合的研究已有很多,比如,用于氬弧焊、機器人控制等。
(5)神經網絡與小波分析的結合
小波變換是對Fourier分析方法的突破。它不但在時域和頻域同時具有良好的局部化性質,而且對低頻信號在頻域和對高頻信號在時域里都有很好的分辨率,從而可以聚集到對象的任意細節。
利用小波變換的思想初始化小波網絡,并對學習參數加以有效約束,采用通常的隨機梯度法分別對一維分段函數、二維分段函數和實際系統中汽輪機壓縮機的數據做了仿真試驗,并與神經網絡、小波分解的建模做了比較,說明了小波網絡在非線性系統黑箱建模中的優越性。小波神經網絡用于機器人的控制,表明其具有更快的收斂速度和更好的非線性逼近能力。
四、結論
經過半個多世紀的發展,神經網絡理論在模式識別、自動控制、信號處理、輔助決策、人工智能等眾多研究領域取得了廣泛的成功,但其理論分析方法和設計方法還有待于進一步發展。相信隨著神經網絡的進一步發展,其將在工程應用中發揮越來越大的作用。
參考文獻:
[1]張曾科.模糊數學在自動化技術中的應用[M].清華大學出版社,1997.
[2]李士勇.模糊控制?神經控制和智能控制論[M].哈爾濱工業大學出版,1996.250-387.
[3]謝聯峻.模糊控制在列車自動駕駛中的應用[J].自動化與儀器儀表,1999,(4).
[4]Collier W C,Weiland,R J Smart Carts,Smart Highways[J].IEEE Spec-trum,1994,31(4):27-33.
[5]Hatwal H,Mikulcik E C.some Inverse Solutions to an Automobile Path Tracking Problem with Input Control of Steeringand Breaks,Ve-hicle system Dynamics,1986,(15):61-71.
[6]Kosuge K,Fukuda T,Asada H.Acquisition if Human Skills for Robotic System[C].In:Proc IEEE Int Symp On Intelligen Control,1991.469-489.
[7]王小平,曹立明.遺傳算法―理論、應用與軟件實現.西安交通大學出版社,2002.
[8]Maniezzo V.Genetic evolution of the topologh and weight distribution
of neural network[J].IEEE Trans on Neural Network,1994,5(1)35-67.
[9]Harrald P G,Kamstra M.Evolving artificial neural networks to combine financial forecase[J].IEEE Trans on Evol Computer ,1997,1(1):39-54.
[10]鄧聚龍.灰色系統理論教程.華中理工大學出版社,1990.
[11]呂宏輝,鐘珞,夏紅霞.灰色系統與神經網絡融合技術探索.微機發展,2000,23(4):67-109.
本文建立相應的BP神經網絡模型,根據民生銀行信貸信用評級指標體系,選取BP神經網絡模型的訓練樣本和檢驗樣本。將訓練樣本輸入BP神經網絡進行訓練,BP神經網絡模型完成訓練后,用檢驗樣本對本文建立的BP神經網絡模型進行檢驗。完成訓練的BP神經網絡模型將根據企業的信用評級信息計算出企業信用得分的預測值,從而使商業銀行規避信貸過程中的信用風險,起到風險預警功能。
關鍵詞:
BP神經網絡;信貸信用;風險預警
我國一直沒有建立起符合市場規范的信用體系,信用風險是商業銀行面臨的最傳統最基本的風險形式,也是最難于控制和管理的風險形式。本文建立相應的BP神經網絡模型,根據民生銀行信貸信用評級指標體系,選取20個企業的信用評級信息作為BP神經網絡模型的訓練樣本,選取10個企業的信用評級信息作為BP神經網絡模型的檢驗樣本。將訓練樣本輸入BP神經網絡,讓BP神經網絡根據信貸企業信用得分的輸出值與真實值之間的誤差不斷調節各個神經元之間的權值與閥值,當誤差滿足要求時,BP神經網絡模型完成訓練。BP神經網絡模型完成訓練后,對本文建立的BP神經網絡模型進行檢驗[1]。完成訓練的BP神經網絡模型將根據企業的信用評級信息計算出企業信用得分的預測值,為商業銀行信貸過程中的信用風險進行預測評價,從而使商業銀行規避信貸過程中的信用風險,起到風險預警功能。
一、BP神經網絡理論
BP神經網絡理論是學習過程由信號的正向傳播與誤差的反向傳播兩個過程組成。正向傳播時,輸入樣本從輸入層傳人,經各隱層逐層處理后,傳向輸出層。若輸出層的實際輸出與期望的輸出(教師信號)不符,則轉入誤差的反向傳播階段。誤差反傳是將輸出誤差以某種形式通過隱層向輸入層逐層反傳,并將誤差分攤給各層的所有單元,從而獲得各層單元的誤差信號,此誤差信號即作為修正各單元權值的依據。這種信號正向傳播與誤差反向傳播的各層權值調整過程是周而復始地進行的[2]。權值不斷調整的過程,也就是網絡的學習訓練過程。此過程一直進行到網絡輸出的誤差減少到可接受的程度,或進行到預先設定的學習次數為止。
(一)BP網絡模型
采用BP算法的多層感知器是至今為止應用最廣泛的神經網絡,在多層感知器的應用中,單隱層網絡的應用最為普遍。一般習慣將單隱層感知器稱為三層感知器,所謂三層包括了輸入層、隱層和輸出層。三層感知器中,輸入向量為()T12,,...,,...,inX=xxxx;隱層輸出向量為()T12,,...,,...,jmY=yyyy;輸出層輸出向量為()T12,,...,,...,klO=oooo;期望輸出向量為()T12,,...,,...,kld=dddd。輸入層到隱層之間的權值矩陣用V表示,()T12,,...,,...,jmV=VVVV,其中列向量jV為隱層第j個神經元對應的權向量;隱層到輸出層之間的權值矩陣用W表示,()T12,,...,,...,kiW=WWWW,其中列向量kW為輸出層第k個神經元對應的權向量[3]。下面分析各層信號之間的數學關系。對于輸出層,有:(net)kko=fk=1,2,...,l(1)0netmkjkjjwy==∑k=1,2,...,l(2)對于隱層,有:(net)jjy=fj=1,2,...,m(3)0netnjijiivx==∑j=1,2,...,m(4)以上兩式中,轉移函數f(x)均為單極性Sigmoid函數:1()1xfxe−=+(5)f(x)具有連續、可導的特點,且有:f′(x)=f(x)[1−f(x)](6)根據應用需要,也可以采用雙極性Sigmoid函數(或稱雙曲線正切函數):1()1xxefxe−−−=+(7)式(1)~式(7)共同構成了三層感知器的數學模型。
(二)網絡訓練與檢驗
網絡設計完成后,要應用訓練樣本進行訓練。訓練時對所有樣本正向運行一輪并反向修改權值一次稱為一次訓練。在訓練過程中要反復使用樣本集數據,但每一輪最好不要按固定的順序取數據,通常訓練一個網絡需要很多次。網絡的性能好壞主要看其是否具有很好的泛化能力,而對泛化能力的測試不能用訓練集的數據進行,要用訓練集以外的測試數據來進行檢驗[4]。一般的做法是,將收集到的可用樣本隨機地分為兩部分,一部分作為訓練樣本,另一部分作為檢驗樣本。
二、基于BP神經網絡的民生銀行信用風險評價研究
(一)建立保險公司投資風險評價指標體系
貸款信用評級財務指標包括貸款企業經營管理能力、貸款企業債務償還能力和貸款企業持續發展能力。貸款企業經營管理能力包括五個指標,分別是資產報酬率、流動資產周轉率、應收賬款周轉率、主營收入現金含量、成本費用利潤率;貸款企業債務償還能力包括五個指標,分別是流動比率、利息保障倍數、資產負債率、現金流與流動負債比、凈資產與貸款余額比;貸款企業持續發展能力包括三個指標,分別是凈資產增長率、主營利潤增長率、工資福利增長率。貸款信用評級非財務指標包括五個指標,分別財務報表質量評價、企業員工能力、企業經營者履歷、企業經營者信譽、行業現狀及前景。
(二)BP神經網絡模型訓練
選取20個企業的信用評級信息作為BP神經網絡模型的訓練樣本。根據民生銀行信貸信用評級指標體系,訓練樣本的輸入向量X由18個指標組成,分別是資產報酬率1x、流動資產周轉率2x、應收賬款周轉率3x、主營收入現金含量4x、成本費用利潤率5x、流動比率6x、利息保障倍數7x、資產負債率8x、現金流與流動負債比9x、凈資產與貸款余額比10x、凈資產增長率11x、主營利潤增長率12x、工資福利增長率13x、財務報表質量評價14x、企業員工能力15x、企業經營者履歷16x、企業經營者信譽17x、行業現狀及前景18x。訓練樣本的輸入向量T121718X=(x,x,,x,x)。訓練樣本的輸出向量為Y,代表企業的信用得分。輸入BP神經網絡模型的訓練樣本如表1所示。建立的BP神經網絡模型為三層網絡,拓撲結構為18-5-1。將20個訓練樣本輸入BP神經網絡進行訓練,讓BP神經網絡根據信貸企業信用得分的輸出值與真實值之間的誤差不斷調節各個神經元之間的權值與閥值[5]。采用MATLAB7.0神經網絡工具箱進行運算,當誤差平方和小于10-5時,訓練終止。訓練樣本中各個信貸企業的真實信用得分和BP神經網絡模型輸出值。
(三)BP神經網絡模型檢驗
由表1可以看出BP神經網絡模型輸出值與信貸企業真實信用得分的誤差很小,下面對本文設計的BP神經網絡模型進行檢驗。BP神經網絡模型采用10個企業的信用評級信息作為檢驗樣本。對本文建立的BP神經網絡模型進行檢驗,將10個企業的信用評級信息作為檢驗樣本輸入完成訓練的BP神經網絡模型,完成訓練的BP神經網絡模型將根據10個企業的信用評級信息計算出企業信用得分的預測值。檢驗樣本中各個信貸企業的真實信用得分和BP神經網絡模型預測值如表2所示。根據表2的數據,得到信貸企業的真實信用得分和BP神經網絡模型預測值之間誤差曲線。檢驗樣本中信貸企業的真實信用得分和BP神經網絡模型預測值的擬合度較高,部分樣本真實值與預測值基本重合。檢驗樣本中信貸企業的真實信用得分和BP神經網絡模型預測值誤差值整體較小,最大誤差11.7%,最小誤差0.27%。假設以絕對誤差小于5%為容忍度,那么本文建立的BP神經網絡模型的準確率為70%。假設以絕對誤差小于10%為容忍度,那么本文建立的BP神經網絡模型的準確率為90%。
三、結論
1、檢驗樣本中信貸企業的真實信用得分和BP神經網絡模型預測值的擬合度較高,樣本21、26、28的真實值與預測值基本重合,樣本24、25的真實值與預測值偏差較大。
2、檢驗樣本中信貸企業的真實信用得分和BP神經網絡模型預測值誤差值整體較小,最大誤差11.7%,最小誤差0.27%。
3、假設以絕對誤差小于5%為容忍度,那么本文建立的BP神經網絡模型的準確率為70%。假設以絕對誤差小于10%為容忍度,那么本文建立的BP神經網絡模型的準確率為90%。計算結果表明本文建立的BP神經網絡模型準確率較高,可以為商業銀行信貸過程中的信用風險進行預測評價,從而使商業銀行規避信貸過程中的信用風險,起到風險預警功能。
參考文獻:
[1]許美玲,齊曉娜,李倩等.基于BP神經網絡的村鎮銀行信用風險預警模型的構建[J].河南科技,2014(22).
[2]黃夢宇.基于BP神經網絡的手機銀行風險預警模型研究[J].時代金融(下旬),2014(4).
[3]遲國泰,陳國斌,遲楓等.基于神經網絡的中國商業銀行效率綜合評價[J].哈爾濱工業大學學報,2006,38(4).
[4]于彤,李海東.基于BP神經網絡的客戶信用風險評價[J].現代電子技術,2014(10).
隨著計算機網絡、信息技術、自動化技術的進步,極大的改變了我們的生活。人工神經網絡技術是一種全新的控制技術,通過互聯網進行動態模擬,從而建立一種新的控制互聯網的系統。經過十幾年的發展,人工神經網絡技術研究取得了巨大的進步,已經廣泛應用在社會各個領域,使現代計算機中的難題得到了解決。本文主要從人工神經網絡技術的概念出發,探討了它在現代社會領域的具體應用。
【關鍵詞】人工神經網絡 信息技術 發展趨勢
人工神經網絡技術在處理實際問題主要包括兩個過程,一個是學習訓練過程,另外一個是記憶聯想過程。近年來隨著人工網絡技術的發展,人工神經網絡技術在信號處理、圖像處理、智能識別等領域已經取得了巨大的改變,為人們研究各類科學問題提供了一種新的方法和手段,使人們在交通運輸、人工智能、軍事、信息領域的工作更加便捷,近年來隨著AI的l展,人工神經網絡技術得到了快速的發展階段。
1 人工神經網絡技術
人工神經網絡技術也稱ANN,是隨著上個世紀八十年代人工智能發展興起的一個研究熱點,它的主要工作原理對人腦神經網絡進行抽象處理,并仿造人腦神經網絡建立簡單的模型,按照不同的連接方式組成一個完整的網絡,因此學術界也直接將它成為神經網絡。神經網絡其實就是一種運算模型,它是通過大量的節點――神經元連接起來的,其中不同的節點所代表的輸出函數也不同,也就是所謂的激勵函數;當有兩個節點連接起來時稱之為通過該連接信號的加權值,也稱為權重,這就相當人腦神經網絡記憶。人工神經網絡技術是采用并行分布式系統,這種工作機理與傳統的信息處理技術和人工智能技術完全不同,是一種全新的技術,它克服了傳統基于邏輯符號的人工智能處理非結構信息化和直覺方面的缺陷,具有實時學習、自適應性和自組織性等特點。
2 人工神經網絡技術應用分析
隨著人工神經網絡技術的發展,它在模式識別、知識工程、信號處理、專家系統、機器人控制等方面的應用較廣。
2.1 生物信號的檢測分析
目前大部分醫學檢測設備都是通過連續波形得到相關數據,從而根據所得數據對病情進行診斷。人工神經網絡技術就是應用了這樣的方式將多個神經元組合起來構成,解決了生物醫學信號檢測方面的難題,其適應性和獨立性強,分布貯藏功能多。在生物醫學領域該技術主要應用于對心電信號、聽覺誘發電位信號、醫學圖像、肌電荷胃腸等信號的處理、識別和分析。
2.2 醫學專家系統
傳統的醫院專家系統是直接將專家的經驗、學歷、臨床診斷方面取得的成績等存儲在計算機中,構建獨立的醫學知識庫,通過邏輯推理進行診斷的一種方式。進入到二十一世紀,醫院需要存儲的醫學知識越來越多,每天產生新的病況和知識,過去的一些專家系統顯然已經無法適應醫院的發展需求,因此醫院的效率很低。而人工神經網絡技術的出現為醫院專家系統的構建提出了新的發展方向,通過人工神經網絡技術,系統能夠自主學習、自己組織、自行推理。因此在醫學專家系統中該網絡技術應用面較廣。麻醉醫學、重癥醫學中生理變量分析和評估較多,目前臨床上一些還沒有確切證據或者尚未發現的關系與現象,通過人工神經網絡便能有效地解決。
2.3 市場價格預測
在經濟活動中,傳統統計方法受到一些因素的制約,無法對價格變動做出準確的預測,因此難免在預測的時候出現失誤的現象。人工神經網絡技術能夠處理那些不完整的、規律不明顯、模糊不確定的數據,并作出有效地預測,因此人工神經網絡技術具有傳統統計方法無法比擬的優勢。例如人工神經網絡技術可以通過分析居民人均收入、貸款利率和城市化發展水平,從而組建一個完整的預測模型,準確預測出商品的價格變動情況。
2.4 風險評價
在從事某一項特定的活動時,由于社會上一些不確定因素,可能造成當事人經濟上或者其他方面的損失。因此在進行某一項活動時,對活動進行有效的預測和評估,避免風險。人工神經網絡技術可以根據風險的實際來源,構筑一套信用風險模型結構和風險評估系數,從而提出有效地解決方案。通過信用風險模型分析彌補主觀預測方面的不足,從而達到避免風險的目的。
3 人工神經網絡技術未來發展
人工神經網絡克服了傳統人工智能對語言識別、模式、非結構化信息處理的缺陷,因此在模式識別、神經專家系統、智能控制、信息處理和天氣預測等領域廣泛應用。隨著科學技術的進步,AI的快速發展,AI與遺傳算法、模糊系統等方面結合,形成了計算智能,很多企業和國家開始大規模研發AI,人工神經網絡正在模擬人類認知的方向發展,目前市場已經有很多不少人工智能產品面世。
4 結語
通過上述研究分析,人工神經網絡技術已經取得了相應的發展,但還存在很多不足:應用范圍狹窄、預測精度低、通用模型缺乏創新等,因此需要我們在此基礎上不斷尋找新的突破點,加強對生物神經元系統的研究和探索,進一步挖掘其潛在的價值,將人工神經網絡技術應用在更多領域中,為社會創造更大的財富。
參考文獻
[1]周文婷,孟琪.運動員賽前心理調控的新策略――基于人工神經網絡技術的比賽場地聲景預測(綜述)[J].哈爾濱體育學院學報,2015,33(03):15-21.
[2]張紅蘭.人工神經網絡技術的應用現狀分析[J].中國新通信,2014(02):76-76.
[3]張廣軍.人工神經網絡技術在光電檢測中的應用[J].北京航空航天大學學報,2001,27(05):564-568.
【關鍵詞】互聯網+ 入侵監測 安全防御 遺傳算法
1 引言
入侵檢測是一種網絡安全防御技術,其可以部署于網絡防火墻、訪問控制列表等軟件中,可以檢測流入到系統中的數據流,并且識別數據流中的網絡包內容,判別數據流是否屬于木馬和病毒等不正常數據。目前,網絡安全入侵檢測技術已經誕生了多種,比如狀態檢測技術和深度包過濾技術,有效提高了網絡安全識別、處理等防御能力。
2 “互聯網+”時代網絡安全管理現狀
目前,我國已經進入到了“互聯網+”時代,互聯網已經應用到了金融、民生、工業等多個領域。互聯網的繁榮為人們帶來了許多的便利,同時互聯網安全事故也頻頻出現,網絡病毒、木馬和黑客攻擊技術也大幅度改進,并且呈現出攻擊渠道多樣化、威脅智能化、范圍廣泛化等特點。
2.1 攻擊渠道多樣化
目前,網絡設備、應用接入渠道較多,按照內外網劃分為內網接入、外網接入;按照有線、無線可以劃分為有線接入、無線接入;按照接入設備可以劃分為PC接入、移動智能終端接入等多種類別,接入渠道較多,也為攻擊威脅提供了較多的入侵渠道。
2.2 威脅智能化
攻擊威脅程序設計技術的提升,使得病毒、木馬隱藏的周期更長,行為更加隱蔽,傳統的網絡木馬、病毒防御工具無法查殺。
2.3 破壞范圍更廣
隨著網絡及承載的應用軟件集成化增強,不同類型的系統管理平臺都通過SOA架構、ESB技術接入到網絡集群平臺上,一旦某個系統受到攻擊,病毒可以在很短的時間內傳播到其他子系統,破壞范圍更廣。
3 “互聯網+”時代網絡安全入侵檢測功能設計
入侵檢測業務流程包括三個階段,分別是采集網絡數據、分析數據內容和啟動防御措施,能夠實時預估網絡安全防御狀況,保證網絡安全運行,如圖1所示。
網絡安全入侵檢測過程中,為了提高入侵檢測準確度,引入遺傳算法和BP神經網絡,結合這兩種數據挖掘算法的優勢,設計了一個遺傳神經網絡算法,業務流程如下:
(1)采集網絡數據,獲取數據源。
(2)利用遺傳神經網絡識別數據內容,對數據進行建模,將獲取的網絡數據包轉換為神經網絡能夠識別的數學向量。
(3)使用已知的、理想狀態的數據對遺傳神經網絡進行訓練。
(4)使用訓練好的遺傳神經網絡對網絡數據進行檢測。
(5)保存遺傳神經網絡檢測的結果。
(6)網絡安全響應。
遺傳神經網絡在入侵檢測過程中包括兩個階段,分別是訓練學習階段和檢測分析階段。
(1)訓練學習階段。遺傳神經網絡訓練學習可以生成一個功能完善的、識別準確的入侵檢測模型,系統訓練學習流程如下:給定樣本庫和期望輸出參數,將兩者作為遺傳神經網絡輸入參數,學習樣本中包含非常典型的具有攻擊行為特征的樣本數據和正常數據,通過訓練學習得到的遺傳神經網絡可以與輸入的期望結果進行比較和分析,直到期望輸出的誤差可以達到人們的期望值。
(2)檢測分析階段。遺傳神經網絡訓練結束之后,使用權值的形式將其保存起來,將其應用到實際網絡入侵檢測系統,能夠識別正常行為或異常行為。
4 結束語
互聯網的快速發展和普及為人們的工作、生活和學習帶來便利,但同時也潛在著許多威脅,采用先進的網絡安全防御技術,以便提升網絡的安全運行能力。入侵檢測是網絡安全主動防御的一個關鍵技術,入侵檢測利用遺傳算法和BP神經網絡算法優勢,可以準確地構建一個入侵檢測模型,準確地檢測出病毒、木馬數據,啟動病毒木馬查殺軟件,清除網絡中的威脅,保證網絡正常運行。
參考文獻
[1]徐振華.基于BP神經網絡的分布式入侵檢測模型改進算法研究[J].網絡安全技術與應用,2016,24(2):111-112.
[2]劉成.試論入侵檢測技術在網絡安全中的應用與研究[J].網絡安全技術與應用,2016,24(2):74-75.
[3]周立軍,張杰,呂海燕.基于數據挖掘技術的網絡入侵檢測技術研究[J].現代電子技術,2016,18(6):121-122.
[4]謝勝軍.云計算時代網絡安全現狀與防御措施探討[J].網絡安全技術與應用,2016,26(2):41-42.
關鍵詞:
中圖分類號: TP391.4文獻標識碼:A文章編號:2095-2163(2011)03-0043-04
Analysis of Training Results based on the Selection of
Parameters Influencing BP Neural Network
HAN Xue
Abstract: Pattern recognition includes two aspects : sample training and sample recognition. And sample training is the premise of sample recognition.Of course, there are lots of training samples and the samples are representative, whichis good, but not the more the better. In the process of training the neural network, it is very important how to determine various parameters that is beneficial to the training efficiency such as the weights and threshold values. This paper is aimed at the use of a simple sample for neural network training, changes parameter values for observing the training effect, thus obtains the different output results and the diagrams. Further study and comparison are carried outto find out the optimal parameter settings. And the experiment method and the conclusion are helpful for application in other identification system development.
Key words:
0引言
在對BP神經網絡進行訓練的過程中,很多時候,一些基本參數和訓練函數參數是隨機生成的,但是訓練效率并不高。對于BP神經網絡所應用的不同領域,這些參數的設置也有所區別。怎樣才能使得訓練網絡的效率更高,就需要了解參數的變化對于訓練結果的影響。本文要解決的問題就是變化其中的各項參數值,對得到的不同訓練結果進行對比分析,并找出相關規律。
1研究現狀
“神經網絡”的研究內容主要包括人工神經網絡、生物神經網絡、認知科學和混沌。
在研究方法上,對于神經網絡的研究已經收獲了很多不同的研究方法,比較重要且已有一定成果的研究有多層網絡 BP算法、Hopfield網絡模型、自適應共振理論和自組織特征映射理論等。
在研究領域上也可以分為理論研究和應用研究兩大方面。理論研究包括兩個方面:其一是理論上的深入研究,通過對已有算法的性能分析來探索功能更完善、效率更高的神經網絡模型,包括對穩定性、收斂性、容錯性、魯棒性等各個性能的最優化研究;其二是朝著智能的方向發展,利用神經生理與認知科學對人類思維和智能機理進行研究。應用研究也包含了兩個方面,分別是神經網絡的軟硬件研究和神經網絡在各個領域中應用的研究,其中包括:模式識別、信號處理、知識工程、專家系統、優化組合、機器人控制等[1]。
BP神經網絡是當前最流行、應用最廣泛的神經網絡模型之一。但是仍存在一些缺陷,如訓練速度較慢,所以很多學者正在尋找快速有效的BP學習算法,而且也取得了一些成效,最重要的幾種快速變體有QuickProp[Fah88]、 SuperSAB [Tol90]和共軛梯度法[Bat92][1]。
除了收斂速度較慢之外,BP神經網絡還存在一些缺點:容易在優化的過程中產生局部最優解而不是全局最優解;在對新樣本訓練的同時容易遺忘舊的樣本。基于對以上缺陷的改進,目前已有了一些行之有效的解決方法。
為了提高網絡訓練速度,在調整權值時增加了動量項,從而對某時刻前后的梯度方向都進行了必要的考慮;為了加快算法收斂速度,采用了自適應學習率調節的方法,如VLBP神經網絡,后面的實驗中還會進一步比較介紹。
目前,BP神經網絡作為很重要的神經網絡模型之一,在很多應用領域中發揮著重要的作用,包括圖像壓縮編碼、人臉識別、分類、故障診斷、最優預測等。
2算法原理
BP神經網絡的基本思想是通過不斷地訓練權值,并設有一個標準的輸出,每次訓練以后得到的實際輸出與標準的輸出比較,設置一個最小誤差,達到這個誤差就表示網絡訓練好了,否則繼續訓練;經過一定的訓練次數后,若還沒有達到這個誤差標準,就表示網絡的設置有問題。本實驗通過對參數的改變,尋找出最優參數設置的規律。
3算法實現
使用matlab開發平臺,程序編寫分為定義輸入向量和目標向量、創建 BP網絡設置訓練函數、初始化權值閾值、設置訓練函數參數、訓練神經網絡五個部分。進行對比實驗時,只需將相關參數進行修改即可。對基本的BP神經網絡進行訓練時,設置基本參數:權值、閾值;訓練函數參數:學習率、最后達到的均方誤差、最大步長。分別對學習率、均方誤差、初始權值、初始閾值進行修改,對比實驗結果;基本的BP神經網絡中無法對學習率實現事先最優,所以用VLBP神經網絡進行改進。
程序如下:
netbp.trainParam.goal=0.0001//設置最后達到的均方誤差為 0.0001
netbp.trainParam.epochs=5000 //設置最大訓練步長
[netbp,tr]=train(netbp,p,t)
4實驗結果
初始訓練樣本的輸入設為[1;3],期望輸出設為[0.95;0.05],第一層的權值設為[1 2;-2 0],第二層的權值設為[1 1;0 -2],第一層的閾值設為[-3;1],第二層的閾值設為[2;3],學習率設為1,均方差設為0.0001。其實驗仿真圖如圖1所示。
4.1改變學習率
只改變學習率的訓練函數參數時,運行程序后的對比結果如表1所示。
從表1中的實驗結果可見:在其他條件不變、學習率增大的情況下,所需的訓練步長變短,即誤差收斂速度快。但是學習率不可以無限制地增大,增大到一定程度后,誤差收斂速度將減慢,甚至有可能達不到誤差范圍內,進入局部穩定狀態。
表1中的各組實驗仿真圖如圖2-圖7所示。
4.2改變均方差
將均方差由原來的0.0001變為0.001后與原初始樣本參數對比結果如表2所示。
均方差變為0.001后的仿真圖如圖8所示。
可見,在其他條件一樣的前提下,將最后要達到的均方誤差值設置較大時,網絡訓練步長變短,誤差收斂速度慢些,最后的輸出結果較為精確些。
4.3改變初始權值
將初始權值改變后的對比結果如表3所示。
改變初始權值后的仿真圖如圖9所示。
可見,后者的初始權值比較合適些,因此訓練的時間變短,誤差收斂速度明顯快些。
4.4改變初始閾值
將初始閾值改變后的對比結果如表4所示。
改變初始閾值后的仿真圖如圖10所示。
可見,后者的初始閾值比較合適些,因此訓練的時間變短,誤差收斂速度明顯快些。
4.5學習率可變的VLBP神經網絡
用最基本的 BP 算法來訓練 BP神經網絡時,學習率、均方誤差、權值、閾值的設置都對網絡的訓練均有影響。選取合理的參數值會有利于網絡的訓練。在最基本的 BP算法中,學習率在整個訓練過程是保持不變的。學習率過大,算法可能振蕩而不穩定;學習率過小,則收斂速度慢,訓練時間長。而在對網絡進行訓練之前是無法選擇最佳學習率的。
雖說學習率在訓練前無法選最優,但是在訓練的過程中能否可變呢?因此BP神經網絡的一種改進算法VLBP可派上用場。也就是說,另外設置學習增量因子和學習減量因子,當誤差以減少的方式趨于目標時,說明修正方向正確,可以使步長增加,因此學習率乘以增量因子k,使學習率增加;而修正過頭時,應減少步長,可以乘以減量因子k,使學習率減小。
程序設計中加入下列語句:
netbp=newff([-1 1;-1 1],[2 2],‘logsig’ ‘logsig’,‘traingdx’)
netbp.trainParam.lr_inc=1.1//增量因子設為1.1
netbp.trainParam.lr_dec=0.65 //減量因子設為0.65
經過訓練后最后的輸出結果為[0.963 8;0.050 0],訓練步長為50,訓練后第一層的權值為[1.004 5 2.013 5;-1.408 4 1.774 8],訓練后第二層的權值為[0.766 9 0.768 3;-1.544 7 -2.865 0]。
VLBP神經網絡訓練仿真圖如圖11所示。
觀察網絡的收斂速度,采用學習率可變的VLBP算法要比學習率不變BP算法收斂速度提高很多。以上兩種算法都是沿著梯度最陡的下降方向修正權值,誤差減小的速度最快。
5結束語
通過上述驗證性實驗,可以看出參數的選取對網絡的訓練結果有著很大的影響,當然BP算法還很多,但沒有一個算法適合所有 BP 網絡。在實際運用時,需根據網絡自身的特點、誤差要求、收斂速度要求、存儲空間等來做具體選擇。
參考文獻:
[ 1 ] http://blog.csdn.net/zrjdds/archive/2008/01/02/2010730.aspx.
[ 2 ] 陳兆乾,周志華,陳世福. 神經計算研究現狀及發展趨勢. 南京
大學計算機軟件新技術國家重點實驗室,2008:3-7.
[ 3 ] 趙艷. 神經計算與量子神經計算的研究綜述[J]. 計算機與信息
【關鍵詞】 功率預測 短期預測 均方根誤差
發電與用電必須實時平衡是電力系統運行的重要特點,只有這樣系統才能保證安全和穩定。因而無論在國內還是國外,電網調度部門主要負責電力系統的調頻、調峰、安排發電計劃和備用容量等業務。對于新能源發電方面,尤其以光伏和風電為代表,當其在電力系統中達到較高透率時,準確預測其輸出功率不僅有助于調度部門提前調整調度計劃來減輕光伏風電間歇性對電網的影響,而且還可減少備用容量的安排,從而降低系統運行成本。因此,新能源功率預測在電網調度領域占有舉足輕重的地位,更精確的預測風能、太陽能發電功率有利于制定合理的電力調度計劃。
1 國內外研究現狀
對新能源發電功率預測技術的研究較早起源于國外,尤其以丹麥、德國、瑞士、西班牙和日本等國的相關大學和科研機構為代表。上世紀90年代丹麥開始大力發展風電,促使了其不同公司或高校開始研究新能源功率預測問題。[1]相繼產生了多個產品,如Riso實驗室開發了Prediktor系統,丹麥技術大學開發出WPPT(Wind Power Prediction Tool)系統,而后的用于風電功率預測的Zephry系統就是由Prediktor和WPPT整合而來,另外由ENFOR公司研發的用于光伏功率預測的SOLARFOR系統也比較有代表性;作為國際上較早大面積應用新能源的德國,其Oldenburg大學開發了Previento系統,德國太陽能研究所開發了風電功率管理系統(WPMS);西班牙Joen大學建立了19kW的光伏發電站驗證其發電預報準確率[2],通過人工神經網絡算法,以實測的光伏板溫度、日照輻射強度為輸入值,以其I/V曲線為目標函數,訓練神經網絡的多層傳感器,求解出逼近實際工況的I/V曲線,建立了發電功率日照強度、板溫之間的函數關系,經過驗證,該系統2003年發電量預測值與實測值的歷史相關系數高達0.998。國內方面光伏發電量預測技術研發起步較晚。華北電力大學[3]結合光伏組件數學模型和保定地區氣象資料,模擬了30MW光伏電站發電量數據,利用支持向量機回歸分析方法進行功率預測,但該方法無實際光伏電站的實況發電量數據,缺乏實驗驗證,對實際光伏電站發電量預報的指導意義有限。華中科技大學[4]利用該校屋頂光伏并網發電系統資料進行研究,通過2005―2010年不同季節氣象因素與發電量之間的相關分析,得出光伏發電量與輻照度的相關性最大、溫度次之、風速再次之。
2 功率預測方法及分類
為提高功率預測精度,國內外研究機構都在嘗試各種新的預測方法,主要的功率預測方法分類如(圖1)。
時間序列分析是持續預測法中的一種,其認為風速、輻照強度預測值等于最近幾個風速、輻照強度歷史數據的滑動平均值,通常只是簡單地把最近一點的觀測值作為下一點的預測值。該模型的預測誤差較大,且預測結果不穩定。改進的方法有ARMA模型法、卡爾曼濾波法。
人工神經網絡方法被廣泛用來解決非線性問題的建模方法。它由大量簡單元件相互連接而成的復雜網絡,具有高度的非線性,能夠進行復雜的邏輯操作的非線性關系。其具有很多優良性能,如非線性映射能力、自組織性和自適應性能力、記憶聯想能力、容錯能力等。
按照風電或光伏功率預測的時間尺度可分為中長期、短期和超短期預測。對于中長期預測或更長時間尺度,主要用于風光電場或電網的檢修維護計劃安排等的預測。對于30分鐘~72小時的預測,主要用于電力系統的功率平衡和經濟調度、電力市場交易、暫態穩定評估等稱為短期功率預測。一般認為不超過30分鐘的預測為超短期預測。從預測模型建立角度考慮,不同時間尺度的預測有本質區別:0~3小時的預測主要由大氣條件的持續性決定,所以如果不通過數值天氣預報也能得出較好的預測結果,如采用可得到更好結果。對于時間尺度超過3小時的預測,不考慮數值天氣預測無法反應大氣運動的本質,所以難以得到較好的預測結果,所以通常的預測方法都采用數值天氣預報的數據。
基于物理方法的功率預測流程示意圖如下(以風功率預測為例)。首先通過數值天氣預報得到風速、風向等氣象數據,再根據電場周圍的地理信息參數(等高線、粗糙度、障礙物、溫度分層等)采用軟件計算得到風機輪轂高度的風速、風向、氣溫、氣壓等參數,最后根據風機功率曲線計算得到風電場輸出功率。因為在不同的風向和溫度條件下,即使風速相同,風電場輸出功率也不相等,因此風電場功率曲線是一族曲線,同時還應考慮風電機組故障和檢修的情況。對整個區域進行風電功率預測時,可對所有的風電場輸出功率進行預測,然后求和得到區域總功率。
基于統計方法的風電/光伏的功率預測不考慮風速/輻照變化的物理過程,根據歷史統計數據找出天氣狀況與風光電場出力的關系,然后根據實測數據和數值天氣預報數據對電場輸出功率進行預測。
兩種方法各有優缺點。物理方法無需大量的測量數據,但對大氣的物理特性及風/光電場特性的數學描述要求較高,這些描述方程求解困難、計算量大。統計方法無需對求解方程,計算速度快,但需要大量歷史數據,采用機器學習方法對數據進行挖掘與訓練,得到氣象參數與風/光電場輸出功率的關系。目前的趨勢是將兩種方法混合使用,稱之為綜合方法。
3 三種預測方法的對比
通過應用三種統計預測算法于某案例中對其預測精度進行了對比。案例以某島嶼上的分布式風光電站發電量為檢驗對象,該電站由25臺30kw并網光伏逆變器、5臺50kw風機組成,合計1000kw。選取2013年4月份的歷史功率數據和歷史數值天氣預報數據作為模型建立依據,5月份發電量作為預測對象(因為該區域4,5月份天氣變化相對最小),并采用同時段的歷史功率數據對模型的預測結果進行驗證。
3.1 ARMA預測模型
3.1.1 ARMA模型的基本原理
ARMA模型也稱為自回歸滑動平均模型,是研究時間序列的重要方法之一,是由自回歸與滑動平均兩種模型“混合”而成。常用于長期追蹤資料的研究和用于具有季節變動特征數據的預測中,所以可將其應用于風電光伏功率預測領域。
3.1.2 預測結果及誤差分析
運用ARMA模型分別對5月1日9時0分至5月31日18時00分進行預測,得到原始風電光伏總功率和預測功率。預測結果如(圖3、4)所示。
常見的預測誤差的評估方法有平均絕對誤差,均方根誤差,相關系數等。均方根誤差放大了出現較大誤差的點,能更好的反映光伏電站預測模型的準確度,因此本文采用均方根誤差RMSE對模型的誤差進行評估。
其中,N-測試樣本數;P-裝機容量。
通過Matlab的計算,我們得到各項指標結果如表1。
3.2 卡爾曼濾波預測模型
3.2.1 模型基本原理
卡爾曼濾波法運用了濾波的基本思想,利用前一時刻預報誤差的反饋信息及時修正預報方程,以提高下一時刻的預報精度。要實現卡爾曼濾波法預測風光功率,首先必須推導出正確的狀態方程和測量方程。因已通過時間序列分析建立了風電功率時間序列的ARMA模型,故可將ARMA模型轉換到狀態空間,建立卡爾曼濾波的狀態方程和測量方程。
3.2.2 預測結果及誤差分析(如圖5、圖6)
通過Matlab的計算,我們得到各項指標結果如(表2)。
3.3 小波神經網絡預測模型
對于上文的ARMA模型和卡爾曼濾波模型都屬于線性模型,都必須先對模型結構做出假設,然后對模型參數的估計得到預測值。因此,模型結構的合理與否,直接影響到最終預測的精度。由于風光電場功率具有高度的不確定性,因而單一的線性預測模型不足以挖掘其功率數據中的所有信息。而神經網絡具有自學習、自組織和自適應性,可以充分逼近任意復雜的非線性關系,所以本文選擇小波神經網絡方法對風光功率進行非線性預測研究。
3.3.1 小波神經網絡法基本原理
小波神經網絡是一種以BP神經網絡拓撲結構為基礎,把小波基函數作為隱含層節點的傳遞函數,信號前向傳播的同時誤差反向傳播的神經網絡。小波神經網絡的拓撲結構如圖7。
3.3.2 模型建立
首先采集四月份一整月的光伏風電功率數據,每隔15min記錄一個時間點,共有960個時間節點的數據,用前四月份30天的功率數據訓練小波神經網絡,最后用訓練好多的神經網絡預測之后的功率數據。基于小波神經網絡的功率預測算法流程圖如圖8所示。
小波神經網絡的拓撲結構如圖9所示。
小波神經網絡訓練:通過數據訓練小波神經網絡,網絡反復訓練100次。
神經網絡網絡測試:用訓練好的神經網絡預測風光功率,并對預測結果進行分析。
3.3.3 預測結果
利用Matlab處理數據并進行計算,我們得到基于小波神經網絡的功率預測結果(圖10、11)。
預測結果分析:
本文采用了ARMA模型、卡爾曼濾波預測算法和小波神經網絡算法對該島的分布式風光電功率數據樣本進行了預測。分析表1~表3預測效果評價指標,我們得到以下認識:小波神經網絡模型中我們得到預測結果:超短期預測精確度誤差最小達到到7%,短期預測精確度誤差最小達到到9%,表明小波神經網絡的預測結果已經相當精確。對小波神經網絡預測曲線與線性預測模型的預測曲線進行對比,可以看到:神經網絡對于光伏風電功率的描繪更加平緩。
4 結論與展望
在對國內外文獻廣泛調研的基礎上,較為全面地論述了風電、光伏功率預測技術的研究現狀和最新動態,對當前功率預測技術方法進行了總結歸納,建立了針對某島嶼分布式風光互補示范工程的高精度發電功率預測模型,成功實現了分布式電源總輸出(光伏風電)的精確預測,實驗運行結果表明:該系統能夠準確預測次日短期和未來4小時超短期光伏發電出力,短期和超短期預測的月平均均方根誤差分別為9%和7%。
為了進一步提高功率預測精度還需要提高數值天氣預報質量,從而得到精度更高更豐富的區域氣象數據。因此需要盡快建立我國數值天氣預報商業化服務,進一步完善風電光伏功率預測系統,提高預測精度。
參考文獻:
[1]BOSSANYI E A. Short-term wind prediction using Kalman filters[J]. Wind Engineering, 1985,9(1):1-8.
[2]Almonacid F, Rus C, Perez P J,et al.Estimation of the energy of a PV generator using artificial neural network [J]. Renewable Energy, 2009, 34(12):2743-2750.