- 相關(guān)推薦
人工智能評判學(xué)生作文可靠嗎
深度學(xué)習目前最接近人類(lèi)智能
要回答上述問(wèn)題,需要先了解一下人工智能在自然語(yǔ)言處理中的工作模式。
所謂自然語(yǔ)言處理,簡(jiǎn)單點(diǎn)說(shuō),就是利用計算機對人類(lèi)語(yǔ)言進(jìn)行分析,以完成自動(dòng)分詞、詞性標注、語(yǔ)音識別、自動(dòng)文摘、機器翻譯、人機對話(huà)等一系列由簡(jiǎn)到繁的語(yǔ)言任務(wù)。
在自然語(yǔ)言處理技術(shù)的發(fā)展過(guò)程中,經(jīng)歷了三種研發(fā)模式:
第一種是基于規則的自然語(yǔ)言處理模式,主要通過(guò)對話(huà)語(yǔ)進(jìn)行語(yǔ)法分析和語(yǔ)義分析,然后轉換成計算機程序以實(shí)現自然語(yǔ)言的理解和表達。這種工作模式是最容易想到也是最早進(jìn)行廣泛研究的,它依賴(lài)于語(yǔ)言學(xué)家和計算機專(zhuān)家的通力合作。
但是,這種模式很快就遇到了無(wú)法突破的瓶頸,因為人類(lèi)的語(yǔ)言理解過(guò)程實(shí)在太復雜,而語(yǔ)言學(xué)家對自然語(yǔ)言的分析很不充分,無(wú)法提供充足的語(yǔ)法規則和語(yǔ)義規則,計算機專(zhuān)家就陷入了“巧婦難為無(wú)米之炊”的窘境。
第二種是基于統計的自然語(yǔ)言處理模式,主要是對語(yǔ)言表達進(jìn)行概率統計。這種模式下的人工智能,不需要了解話(huà)語(yǔ)的句法結構和語(yǔ)義關(guān)系,只需考察它被人類(lèi)說(shuō)出的可能概率就行,被說(shuō)出的概率越大,相關(guān)話(huà)語(yǔ)就越合理。而概率的計算,可以通過(guò)大語(yǔ)料庫基礎上的詞頻統計來(lái)實(shí)現。
這種工作模式不需要語(yǔ)言學(xué)家提供復雜的規則,讓計算機搞統計正是它最拿手的工作。統計模式的廣泛運用,在語(yǔ)音識別、機器翻譯等領(lǐng)域產(chǎn)生了革命性變化,使很多技術(shù)從實(shí)驗室走向了實(shí)際應用。
第三種是深度學(xué)習的自然語(yǔ)言處理模式。深度學(xué)習依賴(lài)的是大規模人工神經(jīng)網(wǎng)絡(luò ),也就是利用大量電腦處理單元對人類(lèi)大腦的神經(jīng)元系統進(jìn)行模擬,然后讓這個(gè)人工神經(jīng)網(wǎng)絡(luò )通過(guò)不斷自我學(xué)習和自我調整來(lái)完成相應的工作。
這可能是目前最接近人類(lèi)智能的一種人工智能模式,目前的發(fā)展態(tài)勢驚人,全面超越“阿爾法圍棋”的“阿爾法元”利用的主要就是深度學(xué)習技術(shù)。
把作文評分交給電腦?高利害考試中無(wú)法實(shí)施
三種工作模式下的不同人工智能能不能應用于語(yǔ)文教育呢?我們不妨以作文評分為例來(lái)分別加以說(shuō)明。
如果讓人工智能給學(xué)生作文評分,按照基于規則的工作模式,就必須把評價(jià)一篇作文好壞的要素都找出來(lái),如語(yǔ)言、結構、內容、思想等等。最關(guān)鍵的工作還要把這些評分因素量化,比如給一篇作文的“語(yǔ)言”項目打10分,你就得告訴電腦,這10分的依據是什么?是詞匯量多少,還是句子的復雜度,還是句式的不同類(lèi)型?
在第二語(yǔ)言教學(xué)中,類(lèi)似的評分系統已經(jīng)得到較為廣泛的應用,因為僅是“語(yǔ)言”項目的話(huà)還比較容易量化,但在母語(yǔ)作文評價(jià)中其可行性顯然不大。因為對于母語(yǔ)作文評分來(lái)說(shuō),結構、思想等項目更為重要,之前人類(lèi)閱卷者的評價(jià)主要依賴(lài)整體感知,但這種感覺(jué)很難分解,更無(wú)法量化。因此,基于規則的人工智能模式很難在作文評分上有用武之地。
如果是基于統計的工作模式,那我們就必須掌握足夠數量的作文語(yǔ)料,然后構建大型語(yǔ)料庫,分析其中各類(lèi)型作文的各種數據。
比如,優(yōu)秀作文和一般作文在詞匯量和句子結構上有什么統計差異;
比如,議論文平均用幾個(gè)例子,平均引用多少句名人名言;
又比如,記敘文寫(xiě)了幾個(gè)細節,每個(gè)細節平均多少字……
在統計的基礎上,把每篇作文在各方面的表現與平均值進(jìn)行比對,然后評分數。
顯然,基于統計的人工智能模式可以詳細描寫(xiě)作文的各方面數據,也可以根據這些數據對作文進(jìn)行等級排序,但是統計哪些數據、這些數據的解釋意義,這些數據與作文分數之間的關(guān)系,仍然需要語(yǔ)文專(zhuān)家提供意見(jiàn),而這方面的研究仍然非常薄弱的。
如果是深度學(xué)習的工作模式,那就需要有大量事先標注好的作文對機器進(jìn)行訓練,這些已經(jīng)精準給分的學(xué)生作文,被稱(chēng)為“訓練語(yǔ)料”。
將訓練語(yǔ)料輸入到人工神經(jīng)網(wǎng)絡(luò ),由其分解為一組向量,再通過(guò)分層計算得出評分,然后將機器評分與已經(jīng)標注好的得分相比較,得到誤差值。
再根據誤差值,調整人工神經(jīng)網(wǎng)絡(luò )的計算方法和各個(gè)向量的權重,這樣反復訓練后最后可以達到理想效果:人工神經(jīng)網(wǎng)絡(luò )的評分結果和事先標注的作文分數高度一致。
這樣,就算在訓練語(yǔ)料的封閉環(huán)境里獲得了成功,然后就可以推向開(kāi)放環(huán)境,也就是提供沒(méi)有正確評分的陌生作文,直接由機器打分。如果經(jīng)驗證后和人類(lèi)專(zhuān)家的評分結果一致,那么我們就得到了一個(gè)能自動(dòng)評分的人工智能。
深度學(xué)習的自動(dòng)評分在理論上是有可能獲得成功的,但是問(wèn)題也很多。
首先,即使評分結果可用,過(guò)程的可解釋性也很差。人工神經(jīng)網(wǎng)絡(luò )把輸入的作文僅當作一個(gè)數據序列,不考慮這篇作文的語(yǔ)言表現、思想內容,只是通過(guò)各種復雜計算的調試獲得理想的結果。機器的分析過(guò)程是沒(méi)有理?yè),準確地說(shuō)是和人類(lèi)評價(jià)作文優(yōu)劣的理?yè)厝徊煌皇前鸦罡闪,但是它是以機器的方式干成的,人類(lèi)無(wú)法理解。
其次,我們剛才對研發(fā)過(guò)程的說(shuō)明其實(shí)是過(guò)于輕描淡寫(xiě)了,真正要獲得實(shí)用的理想結果,訓練復雜度以及因此而要耗費的精力和財力在目前技術(shù)條件下恐怕是沒(méi)法想象的。
更重要的是,這里還存在一個(gè)“智能倫理”問(wèn)題,如果把代表人類(lèi)智能結晶的作文交給機器去評分,而這機器又是以人類(lèi)無(wú)法理解的方式評閱的,這恐怕會(huì )大規模引發(fā)公眾的質(zhì)疑甚至恐懼,在高利害考試中是根本無(wú)法實(shí)施的。
根據以上分析,要在作文評價(jià)領(lǐng)域完全使用人工智能,不說(shuō)完全不可能,至少要走的路還很長(cháng)很長(cháng)。
作為語(yǔ)文教育的輔助工具人工智能將大有作為
那么,在語(yǔ)文教育領(lǐng)域,人工智能是否毫無(wú)作為呢?當然不是。我們認為,人工智能可以成為一個(gè)很好的輔助工具,在諸多領(lǐng)域大有可為。
在閱讀教學(xué)中,人工智能可以全面統計閱讀材料的各種表現,為閱讀材料的難度分級提供可量化的標準,從而為教材選文、編制課外閱讀書(shū)目等教學(xué)實(shí)踐提供有效的幫助。
在寫(xiě)作教學(xué)中,人工智能可以通過(guò)自動(dòng)摘要、自動(dòng)校對等技術(shù)對學(xué)生作文進(jìn)行輔導,從而提升一些基本的語(yǔ)言技能和寫(xiě)作技術(shù)。
在練習系統中,人工功能可以構建封閉的專(zhuān)家系統,對一些有標準答案的知識自動(dòng)出題、自動(dòng)測試、自動(dòng)講解,極大提高參與性和趣味性……
在評價(jià)領(lǐng)域,我們還是以之前分析過(guò)的作文評分來(lái)詳細談?wù)勅斯ぶ悄艿目赡軕冒。在中考、高考這樣的高利害考試中,套題寫(xiě)作是一個(gè)非常嚴峻的問(wèn)題,在實(shí)際評分時(shí),有時(shí)難以認定并客觀(guān)給分。
今后,如果有統計型的人工智能參與,那就可以找出相似度很高的作文來(lái)對比、評判,并且給出精確的重復率百分比。在記敘文評價(jià)時(shí),甚至可以更精細地通過(guò)自動(dòng)摘要技術(shù)、關(guān)鍵詞技術(shù)找出同樣事例來(lái)一起評分。這些技術(shù)處理無(wú)疑為杜絕抄襲、套題等不良行為提供了有效的防治措施。
此外,可以通過(guò)計算作文語(yǔ)句在大數據庫中出現的概率值來(lái)對作文語(yǔ)言的規范性進(jìn)行評價(jià)。作文語(yǔ)言的出現概率值越高,說(shuō)明其用法越常規,越符合大眾的語(yǔ)言規范。而概率值特別低則提示了兩種可能性,一個(gè)是語(yǔ)言不規范,應給予負面評價(jià),一個(gè)是語(yǔ)言新穎,應給予正面評價(jià),機器初步篩選后的具體判斷工作可以交給人類(lèi)專(zhuān)家來(lái)執行,從而使作文語(yǔ)言項目的評分更加準確規范。
還有,統計型人工智能還可以對學(xué)生作文的整體表現進(jìn)行系統評估。通過(guò)對歷屆考試作文的統計分析,可以得出一系列大數據,如作文平均詞量和字量、平均句長(cháng)和句法復雜度、虛詞使用情況等進(jìn)行統計分析,為基層的作文教學(xué)提供充足的科學(xué)數據。
最后想強調的是,人工智能除了在實(shí)際應用中對語(yǔ)文教育有多方面的輔助作用,其開(kāi)發(fā)和研究中遇到的一些問(wèn)題也在倒逼語(yǔ)文教育工作者思考一些最基本的語(yǔ)文問(wèn)題:
要解決閱讀材料難度分級的問(wèn)題,就必須搞清楚構成閱讀材料難度的因素有哪些;
要解決人工智能自動(dòng)命題自動(dòng)訓練的問(wèn)題,就必須搞清楚語(yǔ)文學(xué)科必備的知識點(diǎn)有哪些;
要解決作文自動(dòng)評分的問(wèn)題,就必須搞清楚作文的可操作的評價(jià)量表是怎么樣的……
這些基本的語(yǔ)文難題以前都是含混處理掉了,這些問(wèn)題不解決,人工智能再先進(jìn)也不可能對語(yǔ)文教育產(chǎn)生決定性的影響。
【人工智能評判學(xué)生作文可靠嗎】相關(guān)文章:
京東超級理財可靠嗎?07-11
網(wǎng)上買(mǎi)的玫琳凱產(chǎn)品可靠嗎?07-12
想做兼職,安全可靠嗎?07-10
華碩公司招暑期工可靠嗎?07-14
世紀佳緣相親網(wǎng)可靠嗎?07-10
家樂(lè )福兼職收銀員可靠嗎?07-10
泰康人壽保險公司可靠嗎?07-13
蘇州英格瑪人力資源公司可靠嗎?07-12