“數據分析觀(guān)念”的內涵及教學(xué)建議

時(shí)間:2022-07-10 19:29:15 教師 我要投稿
  • 相關(guān)推薦

“數據分析觀(guān)念”的內涵及教學(xué)建議

“數據分析觀(guān)念”的內涵及教學(xué)建議數學(xué)教育熱點(diǎn)問(wèn)題系列訪(fǎng)談錄

“數據分析觀(guān)念”的內涵及教學(xué)建議

摘要:統計是數據分析的科學(xué)和藝術(shù),統計課程的核心是發(fā)展學(xué)生的數據分析觀(guān)念。準確把握數據分析觀(guān)念的內涵是進(jìn)行統計課程設計、教科書(shū)編寫(xiě)和教學(xué)實(shí)施的必要前提和重要基礎。體會(huì )數據中蘊涵著(zhù)信息、認識到需要根據問(wèn)題的背景選擇合適的方法、通過(guò)數據分析體驗隨機性是數據分析觀(guān)念的重要方面。義務(wù)教育階段統計教學(xué)關(guān)鍵是使學(xué)生想到用數據,愿意“親近”數據,能從數據中提取信息。

關(guān)鍵詞:數據分析觀(guān)念;教學(xué)建議

我國在基礎教育階段將統計作為重要的學(xué)習內容,隨著(zhù)大家對統計教學(xué)的不斷探索和實(shí)踐,人們逐漸認識到對于統計學(xué)習而言,重要的不是畫(huà)統計圖、求平均數等技能的學(xué)習,而是發(fā)展學(xué)生的數據分析觀(guān)念。那么,數據分析觀(guān)念到底體現在哪些方面呢?如何設計課程和實(shí)施教學(xué),才能更好地發(fā)展學(xué)生的數據分析觀(guān)念呢?本文訪(fǎng)談了東北師范大學(xué)著(zhù)名統計學(xué)家史寧中教授,并輔助于資料查詢(xún)等形式就這些問(wèn)題提出了一些思考。

一、發(fā)展學(xué)生的數據分析觀(guān)念

問(wèn):您在多種場(chǎng)合不斷強調,無(wú)論哪一部分內容的學(xué)習,都應該抓住這部分的核心內容,那么統計學(xué)習的核心內容是什么呢?

▲史教授:首先必須明確的是,我們希望在課程中給出一些關(guān)鍵詞。關(guān)鍵詞是某部分學(xué)習的核心內容。核心內容不是指具體的知識點(diǎn),甚至不是指具體的知識本身,而是概括很多知識的共性所反映出來(lái)的思想和思維方式,這個(gè)就叫做核心詞,或者叫做核心內容。統計最核心的就是數據分析,統計是處理數據的一門(mén)科學(xué)和藝術(shù)。在這部分內容中,我們提出了數據分析觀(guān)念的核心詞,就跟代數學(xué)習里的數感、符號意識、模型等都是核心內容。

▲問(wèn):統計的核心是數據分析,那么到底是什么是數據呢,數據與數有什么關(guān)系呢?

▲史教授:我們在義務(wù)教育階段處理的數據主要是用數來(lái)表達的,當然這些數都是有實(shí)際背景的。脫離實(shí)際問(wèn)題的單純地數的研究是數與代數的內容,不是統計的內容。但是,這些年隨著(zhù)信息的迅速增長(cháng),我們需要擴大對數據的認識。事實(shí)上,現在的數據不僅僅是數,圖是數據、語(yǔ)句也是數據。比如,人們在網(wǎng)上經(jīng)常用GOOGLE來(lái)進(jìn)行檢索,GOOGLE是用統計的方法來(lái)進(jìn)行語(yǔ)句檢索,此時(shí)統計處理的是語(yǔ)句,我們把這些都叫做數據。

▲問(wèn):能不能這樣理解,只要蘊含著(zhù)一定信息,無(wú)論是什么表現形式,就是數據,統計能幫助人們從這些數據中提取出大量的信息?

▲史教授:是這樣的。人們在實(shí)際生活和各行各業(yè)中面臨的數據越來(lái)越多,必須樹(shù)立利用數據的意識,掌握一些分析數據的方法和模型。所以,數據分析觀(guān)念是非常重要的。數據分析觀(guān)念主要體現在三個(gè)方面:第一,了解在現實(shí)生活中有許多問(wèn)題應當先做調查研究,收集數據,通過(guò)分析做出判斷,體會(huì )數據中是蘊涵著(zhù)信息的。第二,了解對于同樣的數據可以有多種分析的方法,需要根據問(wèn)題的背景選擇合適的方法。第三,通過(guò)數據分析體驗隨機性。

二、數據隨機性的內涵和教學(xué)

(一)數學(xué)隨機性的內涵

問(wèn):對于很多人而言,對第三點(diǎn)“通過(guò)數據分析體驗隨機性”都比較陌生。首先遇到的一個(gè)困難是,數據隨機性的涵義是什么呢?

▲史教授:簡(jiǎn)單而言,數據的隨機主要有兩層涵義:一方面對于同樣的事情每次收集到的數據可能會(huì )是不同的;另一方面只要有足夠的數據就可能從中發(fā)現規律。舉一個(gè)例子,袋中裝有若干個(gè)紅球和白球,一方面,每次摸出的球的顏色可能是不一樣的,事先無(wú)法確定;另一方面,有放回重復摸多次(摸完后將球放回袋中,搖晃均勻后再摸),從摸到的球的顏色的數據中就能發(fā)現一些規律,比如紅球多還是白球多、紅球和白球的比例等。

問(wèn):那么,構成數據隨機性的原因主要有哪些呢?

▲史教授:一般來(lái)說(shuō),產(chǎn)生隨機有兩方面的原因。

一方面,是運用部分來(lái)推斷總體,我們知道這是統計的一個(gè)基本思想。這里首先假設每一次實(shí)驗取得的數據是來(lái)源于一個(gè)總體的,這是很重要的一個(gè)假設。比如上面提到的摸球例子,第一需要假設摸的是同一個(gè)袋子里的球,而且是有放回的摸;第二,摸之前需要晃一晃,搖晃均勻了。為什么要強調這些呢,就是要保證每一次要處理的事情都是一樣的,數據是來(lái)源于一個(gè)總體的。有了這個(gè)假設后就去做重復實(shí)驗,每一次在摸之前,你不可能知道這次摸的是什么結果,但是摸的次數多了,就能估計出來(lái)摸到各種結果的可能性是多大,由此推斷總體的情況。比如在上面的例子中,可以推斷袋子中什么顏色的球多,各種顏色球的比例,如果知道了袋中球的總數,我們還可以推斷出各種球的數量。但是,由于是用部分來(lái)推斷總體,就不能擔保推斷一定是準確無(wú)誤的,而是允許結論可能出錯。好的統計方法的主要標志就是出錯的可能性較小。

另一方面,是重復測量中的誤差。對一些數據,特別是連續型數據總是有測量誤差的,而產(chǎn)生誤差的原因是多方面的。比如多次測量同一人的身高,由于測量工具、觀(guān)察者的角度、測量時(shí)間等各種各樣的原因,每次測量的結果可能都是不一樣的,測量數據是隨機的。但是如果出現隨機誤差的平均是零,也就是有時(shí)候比真實(shí)結果大一點(diǎn),有時(shí)候比真實(shí)結果小一點(diǎn),平均下來(lái)零,這個(gè)時(shí)候就能研究了,如何進(jìn)行研究這里就不細談了。主要是以上兩方面原因構成了我們研究問(wèn)題的隨機性。

(二)數據隨機性的教學(xué)

問(wèn):說(shuō)到這里,我感覺(jué)您非常強調運用統計(數據分析)來(lái)幫助學(xué)生體會(huì )隨機。不少老師有這樣的一個(gè)困惑,概率也是研究隨機現象的,在概率中教師也組織學(xué)生做了很多摸球、擲硬幣等游戲。那么為什么又提出數據的隨機性呢?

▲史教授:我聽(tīng)了一些課,老師們經(jīng)常這樣處理:比如對于擲一枚均勻的硬幣,先得到出現正面或反面的概率是二分之一,然后讓學(xué)生通過(guò)反復擲硬幣去驗證這個(gè)結果(二分之一)。這里有兩個(gè)問(wèn)題。第一,一個(gè)硬幣,先假定它出現正面和反面的可能性是二分之一,這是數學(xué)(或者稱(chēng)為概率)。這個(gè)二分之一是通過(guò)概率的定義得到的,不是依靠擲硬幣驗證出來(lái)的。實(shí)際上,學(xué)生做了很多次實(shí)驗也得不到二分之一,反而更加糊涂了。第二,運用定義的方式教學(xué)隨機,不能很好的培養學(xué)生的隨機觀(guān)念。

需要指出的是,我們贊成做實(shí)驗,贊成運用統計的思想來(lái)做實(shí)驗。統計是通過(guò)數據來(lái)獲取一些信息,來(lái)幫助人們做出一些判斷。同樣是擲硬幣的問(wèn)題,在統計上就會(huì )這樣設計實(shí)驗:先讓學(xué)生多次擲硬幣,計算出現正面的比例(頻率),然后用頻率來(lái)估計一下出現正面的可能性是多大。如果這個(gè)可能性接近二分之一的話(huà),就推斷這個(gè)硬幣大概是均勻的,這是統計的思想。

對于先給出定義,教師往往比較習慣,而對于“逆過(guò)來(lái)”通過(guò)數據來(lái)進(jìn)行推斷,教師往往比較陌生。為了幫助大家理解,再闡述一下上面的摸球的例子。同樣是一個(gè)袋子里有5個(gè)球,4個(gè)白球、1個(gè)紅球,如果讓學(xué)生通過(guò)摸來(lái)驗證出現白球的可能性是五分之四、出現紅球的可能性是五分之一,這不是統計。統計是這樣的,告訴學(xué)生們袋子里有很多球,有白顏色的和紅顏色的。讓孩子們去摸,摸到一定程度的時(shí)候,學(xué)生發(fā)現摸出白球的次數比紅球的次數多,由此推斷袋子里白球可能比紅球多。進(jìn)一步的話(huà),能推斷出白球和紅球的比例大概是多少。再告訴球的總數的時(shí)候,能夠估計出來(lái)幾個(gè)白球和幾個(gè)紅球,這個(gè)是統計的過(guò)程。

我并不是反對前一種教法本身,而是說(shuō)如果這么教,蘊含的隨機思想并不強,學(xué)生也不感興趣,都知道了概率為什么還要做實(shí)驗。而后來(lái)的這種教法,學(xué)生體會(huì )到每一次摸的結果事先都不知道,但是摸多了能夠幫助我們做一些判斷。這樣一來(lái),學(xué)生既體會(huì )了隨機,又感受到了數據中蘊含著(zhù)信息,我想這種類(lèi)似于“猜謎”的活動(dòng)學(xué)生也會(huì )很有興趣。

問(wèn):實(shí)際上,并不是簡(jiǎn)單地贊成或反對做實(shí)驗,而是做實(shí)驗的目的。不是通過(guò)實(shí)驗去驗證概率是多少,而是通過(guò)實(shí)驗從數據中獲取信息,對總體做一些推斷。說(shuō)到做推斷,老師們還有一個(gè)困惑,因為數據是隨機的,用部分的數據進(jìn)行估計有時(shí)可能會(huì )估計得準一些,有時(shí)會(huì )偏差很大。那么這種推斷是不是有點(diǎn)“瞎猜”的味道,能不能保證這種估計是合理的。

▲史教授:這里絕不是“瞎猜”。還是上面摸球的例子(袋子里有5個(gè)球,4個(gè)白球,1個(gè)紅球),我們知道如果真是隨機摸球的話(huà),那么出現白球的概率是五分之四。而實(shí)驗中,要使摸球的頻率剛好是 五分之四(十分之八)的可能性并不大。但是如果取一個(gè)范圍,比如在十分之七和十分之九之間,此時(shí)頻率落在這個(gè)范圍內,用它去進(jìn)行估計是可以接受的。如果要使摸出白球的頻率落在這個(gè)范圍之間的可能性達到80%的話(huà),通過(guò)計算只要做27次左右的實(shí)驗;如果要使95%的可能性落在這個(gè)范圍內的話(huà),摸球的次數要增加,大概是60次左右。所以,實(shí)際上有相當多的科學(xué)依據在后邊支撐著(zhù)我們做類(lèi)似摸球的試驗。也就是雖然不能保證估計得完全一致,但能保證在一定實(shí)驗次數下,估計值與實(shí)際情況相差不大的可能性是很大的。

問(wèn):聽(tīng)了您的解釋挺有啟發(fā)的。是不是雖然不能達到100%的精確,但無(wú)論實(shí)際情況需要多高的精確度,都可以計算出需要做多少次實(shí)驗來(lái)保證達到這個(gè)精確度?

▲史教授:是這樣的。因此,我們可以提供一些數據,如果想達到95%的可能性,你至少要摸多少次球。再比如社會(huì )上通過(guò)打電話(huà)做民意調查,不可能給所有擁有電話(huà)的人都打,如果調查允許在一定的誤差范圍內,通過(guò)計算可以提供至少需要打電話(huà)的數量。當然計算中需要概率的知識,從這些例子中我們也能看到統計與概率的聯(lián)系。

問(wèn):通過(guò)上面的兩種教法和您的分析,我們可以感覺(jué)到概率是定義出來(lái)的,它的推理方式是主要是演繹;而統計是用數據來(lái)進(jìn)行推斷,它的推理方式主要是歸納。兩種思維方式是不一樣的。

▲史教授:是這樣的。統計體現了與傳統數學(xué)不一樣的思路,而這種思路是培養學(xué)生歸納能力的最好方法之一。在義務(wù)教育階段,也有一些素材可以讓學(xué)生經(jīng)歷歸納的過(guò)程,比如歸納一些公式和規律,但這些公式和規律往往都是準備好了的。很難找到讓學(xué)生真正通過(guò)歸納自己得到結論的素材,但是通過(guò)統計可以讓學(xué)生做一些,所以說(shuō),運用

[“數據分析觀(guān)念”的內涵及教學(xué)建議]相關(guān)文章:

1.“數據分析觀(guān)念”的內涵及教學(xué)建議

【“數據分析觀(guān)念”的內涵及教學(xué)建議】相關(guān)文章:

《簡(jiǎn)單的數據分析》教學(xué)反思02-22

簡(jiǎn)單的數據分析教學(xué)設計12-11

銷(xiāo)售數據的分析方法07-25

數據分析報告07-28

大數據分析07-20

大數據分析07-25

簡(jiǎn)單的數據分析教學(xué)設計4篇12-11

多維數據分析方法04-07

數據分析簡(jiǎn)歷模板02-17

數據分析工作職責07-28

99久久精品免费看国产一区二区三区|baoyu135国产精品t|40分钟97精品国产最大网站|久久综合丝袜日本网|欧美videosdesexo肥婆