- 相關(guān)推薦
數據分析六部曲
明確分析的內容和目的、數據收集、數據處理、數據分析、數據展現、報告撰寫(xiě)等6個(gè)步驟。
明確數據分析的目的和內容是確保數據分析過(guò)程有效的進(jìn)行的先決條件,以便明確數據分析方向,保證不迷失方向。
數據收集是按照確定的數據分析內容,收集相關(guān)數據的過(guò)程,它為數據分析提供了素材和依據。這里所說(shuō)的數據包括第一手數據與第二手數據,第一手數據是指可以直接獲取的數據,第二手數據是指經(jīng)過(guò)加工整理后得到的數據。一般數據來(lái)源主要有數據庫、互聯(lián)網(wǎng)、公開(kāi)出版物、市場(chǎng)調查等形式。
數據處理:
是指對收集過(guò)來(lái)的數據進(jìn)行加工處理,形成適合分析的樣式,它是數據分析必不可少的步驟。數據處理基本是從大量的、雜亂無(wú)章、難以理解的數據中推導出對解決問(wèn)題有價(jià)值、有意義的數據。(數據處理主要包括數據清洗、數據轉化、數據提取、數據計算等方法。)
數據分析:
主要是指通過(guò)統計分析或者數據挖掘技術(shù)對處理過(guò)的數據分析,從中發(fā)現數據的內部關(guān)系和規律,為解決問(wèn)題提供參考。
數據分析與數據處理的區別:數據處理是數據分析的基礎。通過(guò)數據處理,將收集到的原始數據轉換為可以分析的數據形式,并保證數據的一致性和有效性。如果數據本身存在問(wèn)題,那么即使采用最新進(jìn)的數據分析方法,得到的結果也是錯誤的。
數據分析與數據挖掘的關(guān)系:數據挖掘就是一種高級的書(shū)分析方法,數據挖掘就是從大量的數據中挖掘出有用的信息,它是根據用戶(hù)的特定要求,從浩瀚如煙的數據中找出所需要的數據,以滿(mǎn)足用戶(hù)的需求。數據挖掘主要側重于解決四類(lèi)數據分析問(wèn)題:分類(lèi)、聚集、關(guān)聯(lián)、預測。
數據展現:
數據是通過(guò)表格和圖形的方式呈現出來(lái)的,我們常說(shuō)用圖標說(shuō)話(huà)就是這個(gè)意思。常用的數據圖表包括餅圖、柱形圖、條形圖、折線(xiàn)圖、散點(diǎn)圖、雷達圖等。也可以對這些圖進(jìn)行加工,展現出來(lái)我們所需要的圖。一般情況下用圖說(shuō)明問(wèn)題的就不用表格,用表格說(shuō)明問(wèn)題的就不文字。
報告撰寫(xiě):
數據分析報告其實(shí)就是對整個(gè)數據分析過(guò)程的一個(gè)總結與呈現。通過(guò)報告,把數據分析的起因,過(guò)程,結果及建議完整的呈現出來(lái),以供決策者參考。數據分析報告一定要有建議和解決方案,作為決策者,需要的不僅僅是找出問(wèn)題,最重要的是建議和解決方案,以便他們在決策時(shí)候做參考。所以數據分析師不僅僅需要掌握數據分析的方法,而且還需要了解和熟悉業(yè)務(wù),這樣才能根據發(fā)現的業(yè)務(wù)問(wèn)題,提出具有可行性的建議和解決方案。
數據分析常用的指標和術(shù)語(yǔ):
平均數:一般指的是算數平均數。算數平均數是非常重要的基礎性指標。平均數是綜合指標,它的特點(diǎn)是將總體內各單位的數量差異抽象化,代表總體的一邊水平,掩蓋總體內各單位的差異。
絕對數與相對數
絕對數是反映客觀(guān)現象總體在一定時(shí)間、地點(diǎn)條件下的總規模、總水平的綜合性指標。也就是數據分析中的常用指標,如:GDP,總人口等。
相對數是指由倆個(gè)有聯(lián)系的指標對比計算而得到的數值,它是反映客觀(guān)現象之間數量連續程度的綜合指標。計算相對數的基本公式:相對數=比較數值(比數)/基礎數值(基數)
說(shuō)明:分母就是用作對比標準的指數數值,簡(jiǎn)稱(chēng)基數。分鐘是用做與基數對比的指數數值,簡(jiǎn)稱(chēng)比數。相對數一般以倍數、成數、百分數等表示,它反映了客觀(guān)現象之間數量聯(lián)系的程度。
百分比與百分點(diǎn):百分比是相對數的一種,它表示一個(gè)數是另一個(gè)數的百分之幾,也稱(chēng)百分率或者百分數。百分比通常采用百分號來(lái)表示。由于百分比的分母都是100,也就是以1%作為度量單位,由于比較便捷,被廣泛應用。百分點(diǎn)是指不同的時(shí)期以百分數的形式表示的相對指標的變動(dòng)幅度。
頻數與頻率:頻數是指一組數據中個(gè)別數據重復出現的次數。頻率是指每組類(lèi)別次數與總次數的比值,它代表某類(lèi)別在總體中出現的頻繁程度,一邊用百分數表示。
比例與比率:比例是指在總體中各部分的數值占全部數值的比重,通常反映總體的構成和結構。比率是指不用類(lèi)別數值的對比,它反映的不是部分與整體之間的關(guān)系,而是一個(gè)整體各部分之間的關(guān)系。
倍數與番數:倍數與番數同樣屬于相對數。倍數是一個(gè)數吃了另一個(gè)數所得的商,倍數一般是表示數量增長(cháng)或上升幅度而不適用于表示數量的減少或者下降。番數是指原來(lái)數量的2的N次方倍。
同比和環(huán)比:同比是指與歷史同期進(jìn)行比較得到的值,該指標主要是反映的是事物發(fā)展的相對情況。環(huán)比是指與前一個(gè)統計期進(jìn)行比較得到的值,該指標主要是反映的是事物逐漸發(fā)展的情況。
[數據分析六部曲]相關(guān)文章:
1.數據分析六部曲
【數據分析六部曲】相關(guān)文章:
數據分析三部曲07-10
游戲數據分析三步曲07-10
職業(yè)生涯規劃的“六部曲”07-10
數據分析與辦公軟件:數據分析方法07-10
數據分析07-10
聘:數據分析 數據挖掘07-10
游戲數據分析(充值分析)07-10
數據分析之如何用數據?07-10