- 相關(guān)推薦
淺析人工智能中的圖像識別技術(shù)論文
圖像識別技術(shù)是信息時(shí)代的一門(mén)重要的技術(shù),其產(chǎn)生目的是為了讓計算機代替人類(lèi)去處理大量的物理信息。隨著(zhù)計算機技術(shù)的發(fā)展,人類(lèi)對圖像識別技術(shù)的認識越來(lái)越深刻。圖像識別技術(shù)的過(guò)程分為信息的獲取、預處理、特征抽取和選擇、分類(lèi)器設計和分類(lèi)決策。文章簡(jiǎn)單分析了圖像識別技術(shù)的引入、其技術(shù)原理以及模式識別等,之后介紹了神經(jīng)網(wǎng)絡(luò )的圖像識別技術(shù)和非線(xiàn)性降維的圖像識別技術(shù)及圖像識別技術(shù)的應用。從中可以總結出圖像處理技術(shù)的應用廣泛,人類(lèi)的生活將無(wú)法離開(kāi)圖像識別技術(shù),研究圖像識別技術(shù)具有重大意義。
1 圖像識別技術(shù)的引入
圖像識別是人工智能科技的一個(gè)重要領(lǐng)域。圖像識別的發(fā)展經(jīng)歷了三個(gè)階段:文字識別、數字圖像處理與識別、物體識別。圖像識別,顧名思義,就是對圖像做出各種處理、分析,最終識別我們所要研究的目標。今天所指的圖像識別并不僅僅是用人類(lèi)的肉眼,而是借助計算機技術(shù)進(jìn)行識別。雖然人類(lèi)的識別能力很強大,但是對于高速發(fā)展的社會(huì ),人類(lèi)自身識別能力已經(jīng)滿(mǎn)足不了我們的需求,于是就產(chǎn)生了基于計算機的圖像識別技術(shù)。這就像人類(lèi)研究生物細胞,完全靠肉眼觀(guān)察細胞是不現實(shí)的,這樣自然就產(chǎn)生了顯微鏡等用于精確觀(guān)測的儀器。通常一個(gè)領(lǐng)域有固有技術(shù)無(wú)法解決的需求時(shí),就會(huì )產(chǎn)生相應的新技術(shù)。圖像識別技術(shù)也是如此,此技術(shù)的產(chǎn)生就是為了讓計算機代替人類(lèi)去處理大量的物理信息,解決人類(lèi)無(wú)法識別或者識別率特別低的信息。
1.1 圖像識別技術(shù)原理
其實(shí),圖像識別技術(shù)背后的原理并不是很難,只是其要處理的信息比較繁瑣。計算機的任何處理技術(shù)都不是憑空產(chǎn)生的,它都是學(xué)者們從生活實(shí)踐中得到啟發(fā)而利用程序將其模擬實(shí)現的。計算機的圖像識別技術(shù)和人類(lèi)的圖像識別在原理上并沒(méi)有本質(zhì)的區別,只是機器缺少人類(lèi)在感覺(jué)與視覺(jué)差上的影響罷了。人類(lèi)的圖像識別也不單單是憑借整個(gè)圖像存儲在腦海中的記憶來(lái)識別的,我們識別圖像都是依靠圖像所具有的本身特征而先將這些圖像分了類(lèi),然后通過(guò)各個(gè)類(lèi)別所具有的特征將圖像識別出來(lái)的,只是很多時(shí)候我們沒(méi)有意識到這一點(diǎn)。當看到一張圖片時(shí),我們的大腦會(huì )迅速感應到是否見(jiàn)過(guò)此圖片或與其相似的圖片。其實(shí)在“看到”與“感應到”的中間經(jīng)歷了一個(gè)迅速識別過(guò)程,這個(gè)識別的過(guò)程和搜索有些類(lèi)似。在這個(gè)過(guò)程中,我們的大腦會(huì )根據存儲記憶中已經(jīng)分好的類(lèi)別進(jìn)行識別,查看是否有與該圖像具有相同或類(lèi)似特征的存儲記憶,從而識別出是否見(jiàn)過(guò)該圖像。機器的圖像識別技術(shù)也是如此,通過(guò)分類(lèi)并提取重要特征而排除多余的信息來(lái)識別圖像。機器所提取出的這些特征有時(shí)會(huì )非常明顯,有時(shí)又是很普通,這在很大的程度上影響了機器識別的速率?傊,在計算機的視覺(jué)識別中,圖像的內容通常是用圖像特征進(jìn)行描述。
1.2 模式識別
模式識別是人工智能和信息科學(xué)的重要組成部分。模式識別是指對表示事物或現象的不同形式的信息做分析和處理從而得到一個(gè)對事物或現象做出描述、辨認和分類(lèi)等的過(guò)程。
計算機的圖像識別技術(shù)就是模擬人類(lèi)的圖像識別過(guò)程。在圖像識別的過(guò)程中進(jìn)行模式識別是必不可少的。模式識別原本是人類(lèi)的一項基本智能。但隨著(zhù)計算機的發(fā)展和人工智能的興起,人類(lèi)本身的模式識別已經(jīng)滿(mǎn)足不了生活的需要,于是人類(lèi)就希望用計算機來(lái)代替或擴展人類(lèi)的部分腦力勞動(dòng)。這樣計算機的模式識別就產(chǎn)生了。簡(jiǎn)單地說(shuō),模式識別就是對數據進(jìn)行分類(lèi),它是一門(mén)與數學(xué)緊密結合的科學(xué),其中所用的思想大部分是概率與統計。模式識別主要分為三種:統計模式識別、句法模式識別、模糊模式識別。
2 圖像識別技術(shù)的過(guò)程
既然計算機的圖像識別技術(shù)與人類(lèi)的圖像識別原理相同,那它們的過(guò)程也是大同小異的。圖像識別技術(shù)的過(guò)程分以下幾步:信息的獲取、預處理、特征抽取和選擇、分類(lèi)器設計和分類(lèi)決策。
信息的獲取是指通過(guò)傳感器,將光或聲音等信息轉化為電信息。也就是獲取研究對象的基本信息并通過(guò)某種方法將其轉變?yōu)闄C器能夠認識的信息。
預處理主要是指圖像處理中的去噪、平滑、變換等的操作,從而加強圖像的重要特征。
特征抽取和選擇是指在模式識別中,需要進(jìn)行特征的抽取和選擇。簡(jiǎn)單的理解就是我們所研究的圖像是各式各樣的,如果要利用某種方法將它們區分開(kāi),就要通過(guò)這些圖像所具有的本身特征來(lái)識別,而獲取這些特征的過(guò)程就是特征抽取。在特征抽取中所得到的特征也許對此次識別并不都是有用的,這個(gè)時(shí)候就要提取有用的特征,這就是特征的選擇。特征抽取和選擇在圖像識別過(guò)程中是非常關(guān)鍵的技術(shù)之一,所以對這一步的理解是圖像識別的重點(diǎn)。
分類(lèi)器設計是指通過(guò)訓練而得到一種識別規則,通過(guò)此識別規則可以得到一種特征分類(lèi),使圖像識別技術(shù)能夠得到高識別率。分類(lèi)決策是指在特征空間中對被識別對象進(jìn)行分類(lèi),從而更好地識別所研究的對象具體屬于哪一類(lèi)。
3 圖像識別技術(shù)的分析
隨著(zhù)計算機技術(shù)的迅速發(fā)展和科技的不斷進(jìn)步,圖像識別技術(shù)已經(jīng)在眾多領(lǐng)域中得到了應用。2015年2月15日新浪科技發(fā)布一條新聞:“微軟最近公布了一篇關(guān)于圖像識別的研究論文,在一項圖像識別的基準測試中,電腦系統識別能力已經(jīng)超越了人類(lèi)。人類(lèi)在歸類(lèi)數據庫Image Net中的圖像識別錯誤率為5.1%,而微軟研究小組的這個(gè)深度學(xué)習系統可以達到4.94%的錯誤率!睆倪@則新聞中我們可以看出圖像識別技術(shù)在圖像識別方面已經(jīng)有要超越人類(lèi)的圖像識別能力的趨勢。這也說(shuō)明未來(lái)圖像識別技術(shù)有更大的研究意義與潛力。而且,計算機在很多方面確實(shí)具有人類(lèi)所無(wú)法超越的優(yōu)勢,也正是因為這樣,圖像識別技術(shù)才能為人類(lèi)社會(huì )帶來(lái)更多的應用。
3.1神經(jīng)網(wǎng)絡(luò )的圖像識別技術(shù)
神經(jīng)網(wǎng)絡(luò )圖像識別技術(shù)是一種比較新型的圖像識別技術(shù),是在傳統的圖像識別方法和基礎上融合神經(jīng)網(wǎng)絡(luò )算法的一種圖像識別方法。這里的神經(jīng)網(wǎng)絡(luò )是指人工神經(jīng)網(wǎng)絡(luò ),也就是說(shuō)這種神經(jīng)網(wǎng)絡(luò )并不是動(dòng)物本身所具有的真正的神經(jīng)網(wǎng)絡(luò ),而是人類(lèi)模仿動(dòng)物神經(jīng)網(wǎng)絡(luò )后人工生成的。在神經(jīng)網(wǎng)絡(luò )圖像識別技術(shù)中,遺傳算法與BP網(wǎng)絡(luò )相融合的神經(jīng)網(wǎng)絡(luò )圖像識別模型是非常經(jīng)典的,在很多領(lǐng)域都有它的應用。在圖像識別系統中利用神經(jīng)網(wǎng)絡(luò )系統,一般會(huì )先提取圖像的特征,再利用圖像所具有的特征映射到神經(jīng)網(wǎng)絡(luò )進(jìn)行圖像識別分類(lèi)。以汽車(chē)拍照自動(dòng)識別技術(shù)為例,當汽車(chē)通過(guò)的時(shí)候,汽車(chē)自身具有的檢測設備會(huì )有所感應。此時(shí)檢測設備就會(huì )啟用圖像采集裝置來(lái)獲取汽車(chē)正反面的圖像。獲取了圖像后必須將圖像上傳到計算機進(jìn)行保存以便識別。最后車(chē)牌定位模塊就會(huì )提取車(chē)牌信息,對車(chē)牌上的字符進(jìn)行識別并顯示最終的結果。在對車(chē)牌上的字符進(jìn)行識別的過(guò)程中就用到了基于模板匹配算法和基于人工神經(jīng)網(wǎng)絡(luò )算法。
3.2非線(xiàn)性降維的圖像識別技術(shù)
計算機的圖像識別技術(shù)是一個(gè)異常高維的識別技術(shù)。不管圖像本身的分辨率如何,其產(chǎn)生的數據經(jīng)常是多維性的,這給計算機的識別帶來(lái)了非常大的困難。想讓計算機具有高效地識別能力,最直接有效的方法就是降維。降維分為線(xiàn)性降維和非線(xiàn)性降維。例如主成分分析(PCA)和線(xiàn)性奇異分析(LDA)等就是常見(jiàn)的線(xiàn)性降維方法,它們的特點(diǎn)是簡(jiǎn)單、易于理解。但是通過(guò)線(xiàn)性降維處理的是整體的數據集合,所求的是整個(gè)數據集合的最優(yōu)低維投影。經(jīng)過(guò)驗證,這種線(xiàn)性的降維策略計算復雜度高而且占用相對較多的時(shí)間和空間,因此就產(chǎn)生了基于非線(xiàn)性降維的圖像識別技術(shù),它是一種極其有效的非線(xiàn)性特征提取方法。此技術(shù)可以發(fā)現圖像的非線(xiàn)性結構而且可以在不破壞其本征結構的基礎上對其進(jìn)行降維,使計算機的圖像識別在盡量低的維度上進(jìn)行,這樣就提高了識別速率。例如人臉圖像識別系統所需的維數通常很高,其復雜度之高對計算機來(lái)說(shuō)無(wú)疑是巨大的“災難”。由于在高維度空間中人臉圖像的不均勻分布,使得人類(lèi)可以通過(guò)非線(xiàn)性降維技術(shù)來(lái)得到分布緊湊的人臉圖像,從而提高人臉識別技術(shù)的高效性。
3.3 圖像識別技術(shù)的應用及前景
計算機的圖像識別技術(shù)在公共安全、生物、工業(yè)、農業(yè)、交通、醫療等很多領(lǐng)域都有應用。例如交通方面的車(chē)牌識別系統;公共安全方面的人臉識別技術(shù)、指紋識別技術(shù);農業(yè)方面的種子識別技術(shù)、食品品質(zhì)檢測技術(shù);醫學(xué)方面的心電圖識別技術(shù)等。隨著(zhù)計算機技術(shù)的不斷發(fā)展,圖像識別技術(shù)也在不斷地優(yōu)化,其算法也在不斷地改進(jìn)。圖像是人類(lèi)獲取和交換信息的主要來(lái)源,因此與圖像相關(guān)的圖像識別技術(shù)必定也是未來(lái)的研究重點(diǎn)。以后計算機的圖像識別技術(shù)很有可能在更多的領(lǐng)域嶄露頭角,它的應用前景也是不可限量的,人類(lèi)的生活也將更加離不開(kāi)圖像識別技術(shù)。
4 總結
圖像識別技術(shù)雖然是剛興起的技術(shù),但其應用已是相當廣泛。并且,圖像識別技術(shù)也在不斷地成長(cháng),隨著(zhù)科技的不斷進(jìn)步,人類(lèi)對圖像識別技術(shù)的認識也會(huì )更加深刻。未來(lái)圖像識別技術(shù)將會(huì )更加強大,更加智能地出現在我們的生活中,為人類(lèi)社會(huì )的更多領(lǐng)域帶來(lái)重大的應用。在21世紀這個(gè)信息化的時(shí)代,我們無(wú)法想象離開(kāi)了圖像識別技術(shù)以后我們的生活會(huì )變成什么樣。圖像識別技術(shù)是人類(lèi)現在以及未來(lái)生活必不可少的一項技術(shù)。
【淺析人工智能中的圖像識別技術(shù)論文】相關(guān)文章:
淺析多媒體技術(shù)中教學(xué)的應用論文12-16
淺析在廣告設計中的情感需求論文12-16
淺析廣告設計中運用的語(yǔ)言元素論文12-11
淺析種植及養殖高效循環(huán)農業(yè)技術(shù)論文12-15
淺析汽車(chē)底盤(pán)的保養與維修技術(shù)論文12-13
淺析信息技術(shù)學(xué)科的網(wǎng)絡(luò )化教學(xué)論文12-10
生活中電子技術(shù)的應用論文12-12