數據挖掘機械學(xué)習算法探討論文

時(shí)間:2022-06-25 01:43:15 機械/重工/工業(yè)自動(dòng)化 我要投稿
  • 相關(guān)推薦

數據挖掘機械學(xué)習算法探討論文

  摘要:隨著(zhù)我國經(jīng)濟技術(shù)的不斷發(fā)展,信息技術(shù)水平也在不斷的提升,計算機技術(shù)的廣泛應用,對社會(huì )的各個(gè)領(lǐng)域都有著(zhù)影響。信息系統在現在社會(huì )中也有著(zhù)廣泛的應用,在傳統的數據分析以及統計技術(shù)的基礎上有了一定的創(chuàng )新,現在社會(huì )在不斷的進(jìn)步,對大規模數據的研究力度應該加強,不斷的挖掘出一些有用的知識,然后使挖掘技術(shù)不斷的完善。機械學(xué)習算法有利于解決數據挖掘問(wèn)題。機械學(xué)習可以進(jìn)行自我完善,在這個(gè)過(guò)程中,計算機會(huì )逐漸的積累經(jīng)驗,從而提高自身的性能,機械學(xué)習的能力雖然沒(méi)有人類(lèi)大腦學(xué)習能力強,但是隨著(zhù)不斷的創(chuàng )新,使計算機具備了從大量數據中提取特征、發(fā)現隱含規律的能力。也正是因為這樣,數據挖掘中的機械學(xué)習算法也被廣泛的運用。

數據挖掘機械學(xué)習算法探討論文

  關(guān)鍵詞:數據挖掘;機械學(xué)習;學(xué)習算法;應用探討

  信息管理技術(shù)在各大企業(yè)中數據管理技術(shù)也被廣泛利用,數據管理技術(shù)的廣泛運用有利于企業(yè)內部職能部門(mén)之間的溝通聯(lián)絡(luò )。但是在使用的過(guò)程中還是有些不足之處,數據信息越來(lái)越多,這就會(huì )使數據分析具有一定的復雜性。

  1完善GA-BP神經(jīng)網(wǎng)絡(luò )模型

  本文就在傳統的遺傳算法的基礎上提出了一種新的改進(jìn)型遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò )模型。這種神經(jīng)網(wǎng)絡(luò )模型對傳統的這種神經(jīng)網(wǎng)絡(luò )模型在遺傳算法的染色體結構和遺傳算子兩個(gè)方面進(jìn)行了相關(guān)的優(yōu)化,然后在進(jìn)行BP神經(jīng)網(wǎng)絡(luò )結構參數改進(jìn)的時(shí)候,采用了自適應交叉和變異概率,下面就對改進(jìn)的過(guò)程進(jìn)行了簡(jiǎn)要的分析說(shuō)明。

  (1)設計染色體結構?刂苹蚝蛥祷蚴巧衔乃枋龅男滦腿旧w基因結構的兩個(gè)表現形式,這種神經(jīng)網(wǎng)絡(luò )模型對傳統的遺傳算法的染色體結構和遺傳算子進(jìn)行了優(yōu)化,從而對對BP神經(jīng)網(wǎng)絡(luò )結構參數進(jìn)行改進(jìn)?刂苹驅P神經(jīng)網(wǎng)絡(luò )結構參數的改進(jìn)主要是對BP神經(jīng)網(wǎng)絡(luò )的隱含層節點(diǎn)數優(yōu)化。另一種結構參數基因對BP神經(jīng)網(wǎng)絡(luò )的連接權值和閾值進(jìn)行優(yōu)化[2]。

  (2)對適應度函數進(jìn)行設計,具體過(guò)程如下:在上述函數中,訓練樣本個(gè)數用n表示;訓練數據的均方根誤差用∫rmse表示,誤差一般在0~1之間。

  (3)選擇算子。從提出的被改進(jìn)的遺傳算法上來(lái)看,在進(jìn)行型遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò )算法在實(shí)現算子選取改進(jìn)以常規適應值比例算法的時(shí)候經(jīng)常采用最優(yōu)個(gè)體保留方法,這樣做會(huì )引發(fā)局部最小值等問(wèn)題。

  (4)交叉、變異算子。采用單點(diǎn)交叉和基本變異算子是上文中提出的控制基因是改進(jìn)型遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò )算法的上層所采用的。下層參數基因所采用的是整體算數交叉和非一致變異算子。

  (5)自適應交叉、變異概率。上文中提出的改進(jìn)型遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò )算法的方式,在進(jìn)行優(yōu)化的時(shí)候可以對設計自適應交叉、變異概率,以此對遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò )神經(jīng)算法的機構和初始權重進(jìn)行平衡優(yōu)化。對設計分析的簡(jiǎn)要過(guò)如下,自適應交叉概率可以表示為∫avr表示種群的平均適應值,∫min表示種群的最小適應值,k1,k2通常在1.0上。

  上文中提出的改進(jìn)型遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò )算法的過(guò)程的主要幾個(gè)步驟可以分為以下幾點(diǎn):

  (1)對相關(guān)的數據進(jìn)行及時(shí)的統一優(yōu)化處理。訓練樣本數據和測試樣本數據是數據優(yōu)化處理之后可分為的種類(lèi)。

  (2)在對改進(jìn)型遺傳算法模型的基本參數進(jìn)行設計的時(shí)候,可以用G來(lái)表示最大化代數,在設定的時(shí)候要考慮隱含層節點(diǎn)數對種群的規模N的有關(guān)規定。

  (3)在對種群上層個(gè)體進(jìn)行優(yōu)化的時(shí)候采用采用二進(jìn)制編碼,種群下層種群個(gè)體進(jìn)行優(yōu)化采用實(shí)數編碼。

  (4)在確定BP神經(jīng)網(wǎng)絡(luò )結構參數的時(shí)候,可以采用對種群各個(gè)個(gè)體解碼的形式進(jìn)行。

  (5)對種群中適很好的個(gè)體,采用遺傳操作的形式。

  (6)獲得新的子群,可以對種群中的遺傳個(gè)體使用自適應概率進(jìn)行交叉、變異操作。

  (7)對BP神經(jīng)網(wǎng)絡(luò )結構隱含層節點(diǎn)、權值以及閾值等結構參數進(jìn)行優(yōu)化改進(jìn),進(jìn)行不斷的創(chuàng )新的過(guò)程就是對上下層的子群個(gè)體解碼的優(yōu)化。

  (8)進(jìn)行(5)循環(huán)的要求有兩個(gè),就是在迭代步數達到了設定的最大值執行(5)循環(huán),在最大個(gè)體適應度值滿(mǎn)足要求的時(shí)候,也要進(jìn)行(5)循環(huán)過(guò)程。

  (9)在確定最佳的BP神經(jīng)網(wǎng)絡(luò )隱含層節點(diǎn)數、閾值和連接權值等參數的時(shí)候,采用對適應值最佳的個(gè)體進(jìn)行解碼的形式。

  2機械學(xué)習算法實(shí)例

  下面就舉出有關(guān)的例子對上文所提出的優(yōu)化過(guò)程進(jìn)行簡(jiǎn)要分析,下文所采用的實(shí)例是煤礦空壓機的故障診斷系統,然后對改進(jìn)型遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò )算法進(jìn)行有效的探索研究。

  (1)首先應該做好相應的準備工作,閱讀相關(guān)的空壓機的說(shuō)明書(shū),例如使用說(shuō)明書(shū)和故障說(shuō)明書(shū)等。在使用空壓機的時(shí)候,還應該對使用過(guò)程中的經(jīng)驗進(jìn)行積累,在使用結束后再對相關(guān)經(jīng)驗進(jìn)行分析總結,空壓機的故障類(lèi)型以及故障是怎么來(lái)的,在進(jìn)行數據整理的時(shí)候都要進(jìn)行分析研究,及時(shí)的發(fā)現問(wèn)題所在。煤礦空壓機的故障診斷系統就是本文所采用的實(shí)例。通過(guò)相應的實(shí)驗數據分析,煤礦空壓機呈現出5種工作狀態(tài),用符號Y1-Y5表示,以此作為神經(jīng)網(wǎng)絡(luò )故障診斷模型的輸出。Y1-Y5所表示的內容如下:Y1表示煤礦空壓機正常的工作狀態(tài);Y2表示煤礦空壓機冷卻水系統出現故障的工作狀態(tài);Y3表示煤礦空壓機潤滑體統出現故障的工作狀態(tài);Y4表示煤礦空壓機軸承出現故障的工作狀態(tài);Y5表示煤礦空壓機電路系統出現故障的工作狀態(tài)。如果出現以上故障,根據相關(guān)的經(jīng)驗以及故障的了解,故障的表現形式可以分為10種,用符號X1-X10表示,即為神經(jīng)網(wǎng)絡(luò )故障診斷模型的輸入。X1-X10分別表示:X1表示煤礦空壓機排氣量過(guò)低;X2表示空壓機排氣壓力不足;X3表示空壓機排氣溫度超限;X4表示空壓機冷卻水溫度超限;X5表示空壓機冷卻水壓力不足;X6表示空壓機主機轉速低限;X7表示空壓機振動(dòng)超限;X8表示空壓機潤滑系統油溫超限;X9表示空壓機潤滑油壓力不足;X10表示軸承溫度超限。

  (2)空壓機經(jīng)過(guò)數據挖掘之后的故障診斷分析。通過(guò)對空壓機可能出現的故障進(jìn)行分析,為了看出新的神經(jīng)網(wǎng)絡(luò )的良好的性能,采用傳統的遺傳神經(jīng)網(wǎng)絡(luò )算法建立了煤礦空壓機故障針對系統,在進(jìn)行網(wǎng)絡(luò )訓練的時(shí)候應該采用相同的訓練數據樣本,在測試的時(shí)候也應該采用相同的測試數據樣本。通過(guò)相應的實(shí)驗可以看出,在經(jīng)過(guò)569次迭代后改進(jìn)型GA-BP神經(jīng)網(wǎng)絡(luò )算法就使得誤差達到了設定范圍內,但是如果采用傳統的神經(jīng)網(wǎng)絡(luò )算法就沒(méi)有那么好的效果,只有在進(jìn)行2779次迭代才使得誤差滿(mǎn)足要求。由此可以看出,優(yōu)化改進(jìn)后的BP神經(jīng)網(wǎng)絡(luò )算法在各個(gè)方面上都有很好的效果,特別是網(wǎng)絡(luò )的訓練速度、收斂速度和收斂精度方面。改進(jìn)型GA-BP神經(jīng)網(wǎng)絡(luò )算法在個(gè)方面都有比傳統的算法要好。為了能夠更加明顯的看出效果,下面采用100組數據進(jìn)行研究分析。從測試的結果可以看出,87.5%是傳統的P神經(jīng)網(wǎng)絡(luò )的診斷正確率,診斷時(shí)間為564s,輸出值存在一定的不穩定性,而上文中所提到的優(yōu)化改進(jìn)后的GA-BP神經(jīng)網(wǎng)絡(luò )的診斷正確率為98.2%,診斷時(shí)間為246s,輸出值相對穩定,從這數據可以看出,改進(jìn)后的效果明顯比傳統的BP神經(jīng)網(wǎng)絡(luò )算法要好的多。改進(jìn)后的BP神經(jīng)網(wǎng)絡(luò )算法的錯誤率比較低,檢測的準確率和速度都有提高,工作性能也有所提高。

  3結語(yǔ)

  在社會(huì )的不斷發(fā)展進(jìn)步的過(guò)程中,數據挖掘技術(shù)也在不斷的創(chuàng )新,在社會(huì )中的運用也越來(lái)越廣泛,發(fā)展速度也越來(lái)越快。本文就在傳統的遺傳算法的基礎上提出了一種新的改進(jìn)型遺傳優(yōu)化BP神經(jīng)網(wǎng)絡(luò )模型。這種神經(jīng)網(wǎng)絡(luò )模型對傳統的神經(jīng)網(wǎng)絡(luò )模型在遺傳算法的染色體結構和遺傳算子兩個(gè)方面進(jìn)行了相關(guān)的優(yōu)化,然后在進(jìn)行BP神經(jīng)網(wǎng)絡(luò )結構參數改進(jìn)的時(shí)候,采用了自適應交叉和變異概率,這樣有利于各種數據的處理。

  參考文獻

  [1]李運.機器學(xué)習算法在數據挖掘中的應用[D].北京郵電大學(xué),2015.

  [2]胡秀.基于Web的數據挖掘技術(shù)研究[J].軟件導刊,2015(1):149-150.

【數據挖掘機械學(xué)習算法探討論文】相關(guān)文章:

淘寶面試題求解--數據挖掘-算法07-13

數據挖掘在工商管理中的運用論文07-03

軟件工程行業(yè)中數據挖掘的應用論文06-30

聘:數據分析 數據挖掘07-10

數據挖掘技術(shù)的醫療信息管理應用論文07-03

關(guān)于數據分析與數據挖掘的數據10個(gè)問(wèn)題07-10

網(wǎng)絡(luò )游戲的數據挖掘與數據分析07-10

數據挖掘讀書(shū)筆記06-27

數據挖掘技術(shù)在在線(xiàn)考試系統中的應用研究論文07-03

請問(wèn)大數據和數據挖掘的關(guān)系是什么?07-10

99久久精品免费看国产一区二区三区|baoyu135国产精品t|40分钟97精品国产最大网站|久久综合丝袜日本网|欧美videosdesexo肥婆