正態(tài)分布圖在數據分析中的應用例子

時(shí)間:2022-07-10 18:12:10 其他 我要投稿
  • 相關(guān)推薦

正態(tài)分布圖在數據分析中的應用例子

當我們面對一堆龐大的數據,且需要從中尋找某種規律時(shí),往往不知如何下手。最近我在處理油耗數據時(shí),就碰到了這樣的難題,偶然間記得概率統計中存在一種比較特殊的數據分布方式,即所謂的正態(tài)分布

從維基百科中搜到的結果是“正態(tài)分布是自然科學(xué)與行為科學(xué)中的定量現象的一個(gè)方便模型。各種各樣的心理學(xué)測試分數和物理現象比如光子 計數都被發(fā)現近似地服從常態(tài)分布。盡管這些現象的根本原因經(jīng)常是未知的, 理論上可以證明如果把許多小作用加起來(lái)看做一個(gè)變量,那么這個(gè)變量服從正態(tài)分布”,如

圖1

既然這樣,那我何不驗證一下呢?進(jìn)一步閱讀相關(guān)文章后,對概率統計方法的相關(guān)要求和步驟有了初步的了解,為便于了解,用圖2來(lái)表示推斷過(guò)程

在總體數據量不大的情況下,我傾向于用總體做為分析依據,以減少樣本抽取的誤差

在上圖所示四步中,用統計工具進(jìn)行分析的過(guò)程是最需引起重視的,大概有兩點(diǎn):

1.對總體(或樣本)數據的分組。由于油耗屬于連續型變量,不同變量之間的變化非常小,我采用較多數組的組距分組方式

2.求平均值。數據分布不同,平均值的計算方法也有不同,最常用的是算術(shù)平均值,在呈正態(tài)分布的數據中,它與中位數(Median)和眾數(Mode)的計算結果基本一致,且概率密度函數(Normdist)也是默認算術(shù)平均值的計算方式

實(shí)際操作一遍:

1.準備統計數據

2.求中間參數值

3.求頻率(Frequency)和概率(Normdist)

4.用第3步的函數計算結果分別作柱形圖和折線(xiàn)圖

5.客觀(guān)推論最后得下圖

推論之一:上圖數據分布的趨勢比較明顯,油耗值趨向于柱形最高的區域集中,且波動(dòng)范圍較小,說(shuō)明對應車(chē)輛的油耗比較穩定


【正態(tài)分布圖在數據分析中的應用例子】相關(guān)文章:

淺談信息技術(shù)在數學(xué)教學(xué)中的應用03-03

演講藝術(shù)中思維導圖的應用07-03

思維導圖教學(xué)中應用心得體會(huì )06-14

電子商務(wù)中的數據分析指標05-24

不怕失敗的例子10-08

物理教學(xué)中多媒體的應用08-13

《一次函數圖象的應用》評課稿08-11

一次函數圖象的應用評課稿06-01

標桿超越法在薪酬與考核中的應用04-20

數據分析報告07-28

99久久精品免费看国产一区二区三区|baoyu135国产精品t|40分钟97精品国产最大网站|久久综合丝袜日本网|欧美videosdesexo肥婆