數據分析師都干啥?

時(shí)間:2022-07-10 19:16:53 其他 我要投稿
  • 相關(guān)推薦

數據分析師都干啥?

數據分析師,簡(jiǎn)單切詞為“數據”,“分析”,“師”。因此,獲取必要的數據,分析這些數據,然后從數據中發(fā)現一些問(wèn)題提出自己的想法,這就是一個(gè)數據分析師的基本工作內容。

自己做了兩年數據分析師,真的覺(jué)得古語(yǔ)說(shuō)的對,“功夫在詩(shī)外”。一名好的數據分析師,接到一個(gè)需求時(shí),會(huì )更多考慮這個(gè)需求本身,包括要做的東西是什么,為什么這么做,還可以怎么做,怎么去做,關(guān)鍵點(diǎn)是什么。都想清楚了,才去動(dòng)手做。建議任何一名數據分析人員,都能在做以前把問(wèn)題想清楚,確認清楚,不要等到做完才發(fā)現自己做錯了,那樣會(huì )很浪費時(shí)間。自己這方面曾犯過(guò)N多錯誤。

下面簡(jiǎn)單談下做一名數據分析師要經(jīng)歷的幾個(gè)步驟:

(1)獲取數據

獲取相關(guān)的數據,是數據分析的前提。每個(gè)企業(yè),都有自己的一套存儲機制。比如淘寶,所有的數據都在HADOOP上,很多數據都要經(jīng)過(guò)HADOOP,hive來(lái)獲取。因此,基礎的SQL語(yǔ)言是必須的。具備基本SQL基礎,再學(xué)習下HIVE的細節的語(yǔ)法,基本就可以通過(guò)HIVE拿到很多數據了。每個(gè)需求明確以后,都要根據需要,把相關(guān)的數據獲取到,做基礎數據。

(2)數據處理

獲取數據,把數據處理成自己想要的東西,是一個(gè)關(guān)鍵點(diǎn)。很多時(shí)候,有了數據不是完成,而是分析的開(kāi)始。數據分析師最重要的工作就是把數據根據需求處理好,只有數據跟需求結合起來(lái),才能發(fā)揮數據的價(jià)值,看到需求的問(wèn)題和本質(zhì)所在。如果連數據都沒(méi)處理好,何談從數據中發(fā)現問(wèn)題呢?

對于數據的處理,有兩種形式:

a>如果初步提取的數據是在LINUX上,建議學(xué)一門(mén)腳本語(yǔ)言,比如AWK,或者PYTHON。如果掌握一門(mén)腳本語(yǔ)言,不僅可以在LINUX系統上寫(xiě)很多自動(dòng)腳本來(lái)運行,會(huì )大大節省自己的時(shí)間,而且可以通過(guò)腳本語(yǔ)言把基礎數據處理成自己想要的任何形式,直接可以使用。

b>如果數據沒(méi)有在LINUX上,那可以download,然后通過(guò)其他統計軟件來(lái)處理。個(gè)人推薦SAS或者R語(yǔ)言。SAS的強大,不必多說(shuō)。沒(méi)有SAS解決不了的問(wèn)題,而且SAS也有SQL,處理起來(lái)也方便。R語(yǔ)言最近也很火,而且免費,packages越來(lái)越多,畫(huà)圖也簡(jiǎn)單,類(lèi)似Matlab。如果前期數據處理的好,后續只需要通過(guò)R或者SAS畫(huà)一些圖就可以了。在數據分析師的世界,按照價(jià)值排序,圖>表>文字。

(3)分析數據

這里的數據,包括圖,表,數字幾種。分析數據是整個(gè)分析的關(guān)鍵,也考驗分析師的水平。好的分析師,可以根據趨勢圖,對比數據,敏銳的觀(guān)察到很多問(wèn)題?墒沁@需要對業(yè)務(wù),對數據有很深的了解,才會(huì )把數據和業(yè)務(wù)結合起來(lái),發(fā)揮兩者的價(jià)值,完成需求。所以,一名數據分析師,要把更多的時(shí)間放在了解業(yè)務(wù)上。只有業(yè)務(wù)了解,細節清楚,才會(huì )明白業(yè)務(wù)變動(dòng)可能引起的數據指標的變動(dòng),也會(huì )在后續的需求分析中,更快更全面的解決其他人提出的問(wèn)題?赡芎芏嗳硕己芾Щ,怎么才能“敏銳”的觀(guān)察到數據的變動(dòng)呢,我為什么怎么也發(fā)現不了問(wèn)題呢?個(gè)人感覺(jué)可以通過(guò)以下方法,來(lái)慢慢鍛煉:

a>多問(wèn)幾個(gè)為什么。比如,看到一些指標,就想想這些指標代表什么,用自己的話(huà)可以怎么理解;看到一條趨勢線(xiàn)有波動(dòng),就想想為啥子某個(gè)點(diǎn)異常波動(dòng)呢?多問(wèn)問(wèn)問(wèn)題,自己就會(huì )加深對業(yè)務(wù)和指標關(guān)聯(lián)的敏感性。

b>借鑒統計方法。統計學(xué)中,都會(huì )有一些橫縱對比,趨勢分析等等。對比,在分析師數據時(shí)候,是一個(gè)很重要的東西。任何東西,也因為了對比,才會(huì )有高有低,有長(cháng)有短。另外,分布,也是一個(gè)很好的東西。分布的變化,就意味著(zhù)變動(dòng),變動(dòng)的發(fā)展結果,就能知道業(yè)務(wù)發(fā)展的好壞。再次,占比啊等等,都是很簡(jiǎn)單但是實(shí)用的方法。

c>向師兄請教。有的時(shí)候,一個(gè)問(wèn)題,自己沉迷其中不能自拔,旁觀(guān)者一句話(huà),就能點(diǎn)清自己的思路。當自己分析數據不得要領(lǐng)的時(shí)候,就多請教師兄。

(4)展示成果

分析數據以后,解決需求的問(wèn)題,就需要匯總分析的成果,給到其他人?赡芊治龅倪^(guò)程,拿到的數據有很多,需要全部給其他人么?怎么去羅列這些數據呢?可能很多人都犯難。有一次,一個(gè)同學(xué)來(lái)問(wèn)我,她有很多數據,但是就是不知道該怎么組織,才能證明自己的結論是對的。其實(shí),作為一名數據分析師,就是根據數據,把問(wèn)題解決,提出一兩條參考建議給到需求方就OK了。因此,回復的結果簡(jiǎn)單明了就好。如果是回復一封郵件,可以這樣來(lái)做:

a>郵件正文,先寫(xiě)主要結論,即根據數據和需求,有什么結論。這樣大家第一眼就能抓到最關(guān)鍵的東西,可能不需要看那些詳細的數據;

b>如果覺(jué)得有必要,就在下面再把分析過(guò)程寫(xiě)進(jìn)去;

c>如果圖和圖表不多,可以添加到郵件第三部分。畢竟放上數據,任何同學(xué)有疑問(wèn),可以隨時(shí)去看數據。如果圖和圖表實(shí)在太多,就放到附件!

其實(shí),做一名數據分析師,真的不容易,不僅要懂業(yè)務(wù),還要會(huì )技術(shù),更要敏銳發(fā)現問(wèn)題,總結,還要提出建議。自己干了N多工作,最后還不一定能得到一個(gè)好的結果。做了兩年數據分析師,自己的重心也在慢慢的轉移。從剛開(kāi)始技術(shù)學(xué)習,到后面技術(shù)+業(yè)務(wù)的結合,到現在自己又鉆到業(yè)務(wù),研究業(yè)務(wù),慢慢發(fā)現:一名好的數據分析師,是一個(gè)好的產(chǎn)品的規劃者和行業(yè)的領(lǐng)跑者。

【數據分析師都干啥?】相關(guān)文章:

數據分析師的職責02-07

數據分析師工作職責05-27

數據分析師的崗位職責11-03

數據分析師崗位職責07-01

數據分析師的職責15篇02-07

數據分析師的職責(15篇)02-08

數據分析師的職責精選15篇02-08

數據分析師個(gè)人簡(jiǎn)歷03-03

高級數據分析師的工作職責12-30

數據分析師工作職責(精選15篇)04-14

99久久精品免费看国产一区二区三区|baoyu135国产精品t|40分钟97精品国产最大网站|久久综合丝袜日本网|欧美videosdesexo肥婆