- 相關(guān)推薦
阿里數據分析師校招筆試題參考
1觀(guān)測宇宙中單位體積內星球的個(gè)數,屬于什么分布:
A學(xué)生分布B泊松分布C正態(tài)分布D二項分布
2一些關(guān)于數據挖掘說(shuō)法是正確的
A數據挖掘是萬(wàn)能的
B如果你建立了一個(gè)database,那就意味著(zhù)你已經(jīng)有足夠的數據可以做數據挖掘了
C數據挖掘=數據+算法,數據挖掘人員大部分的時(shí)間用來(lái)處理復雜的挖掘算法
DABC均有錯
3已知隨機變量X,Y分別服從泊松分布P(S),卡方分布X2(t),E(X)=4,D(Y)=9,則參數s,t分別:
A2,9;B4,9C4,4.5;D2,4.5
4下面算法中哪一種不屬于廣義線(xiàn)性回歸算法
A生存模型算法 Bbeta回歸算法 Clogit回歸算法 D判別分析算法
5有一列1000萬(wàn)淘寶買(mǎi)家的淘寶運費險保費數據,要計算該列數據的P1-P100分位數,可使用哪個(gè)SAS語(yǔ)句?
Aproc sort Bproc rank Cproc univariate Dproc freq
6X服從區間(2,6)上的均勻分布,求對X進(jìn)行3次獨立觀(guān)測中,至少有2次的觀(guān)測值大于3的概率。
A0.84375 B0.75275 C0.65275 D0.80370
7下面對于“預測變量間可能存在較嚴重的多重共線(xiàn)性”的論述中錯誤的是?
A回歸系數的符號與專(zhuān)家經(jīng)驗知識不符 B方差膨脹因子(VIF)<5
C其中兩個(gè)預測變量的相關(guān)系數>=0.85 D變量重要性與專(zhuān)家經(jīng)驗嚴重違背
8由于淘寶買(mǎi)家消費數據是億級別,假設為了快速計算買(mǎi)家每月的平均消費額,采用抽樣1W個(gè)買(mǎi)家來(lái)計算
A采用分層抽樣方法把全量淘寶買(mǎi)家按照星級,每層抽取相同的數量,計算平均值
B采用系統抽樣方法,把全量買(mǎi)家隨機排序,每隔一定數量抽一個(gè),計算平均值
C采用無(wú)放回隨機方法,從全量買(mǎi)家中隨機挑選一個(gè)買(mǎi)家,不放回,如此循環(huán)
D采用有放回隨機方法,從全量買(mǎi)家中隨機挑選一個(gè)買(mǎi)家,然后再放回,如此循環(huán)
9請找出數列4,9,23,60,157的下一項()
A 411 B 314 C 425 D ABC均錯
11以下哪個(gè)語(yǔ)法不是R的基礎語(yǔ)言
Aproc glot Bselect *from table
Ckc<-kmeans(data,3) Dprint”hello world”
Esd<-summary(data) Fimport
12分析師在工作中的良好習慣是
A將工作空間的密碼共享給別人 B將數據下載到私人電腦進(jìn)行分析處理
C在處理資源高峰期提交大任務(wù)運算 D不定期地將分析報告分享給團隊
E定期清理存儲空間 F固話(huà)日常需要分析的數據表方便計算
16請分析淘寶消費者的流失情況
17淘寶和天貓上每天都有大量的用戶(hù)在線(xiàn)上購買(mǎi),作為分析師可以從哪些角度對用戶(hù)進(jìn)行分析,說(shuō)明理由
20已知A商家近五年每月的成交數據,請列出兩種不同的時(shí)間序列預測模型可以用來(lái)預測商家接下來(lái)三個(gè)月的成交,并詳細闡述在使用每一種方法前需要對數據進(jìn)行什么預處理以及具體方法
21你理解中的分析師是什么樣的?你覺(jué)得自己目前應聘分析師職位的優(yōu)勢是什么?并說(shuō)明理由。
【阿里數據分析師校招筆試題參考】相關(guān)文章:
阿里校招前端電話(huà)面試06-29
阿里巴巴15校招運營(yíng)筆試經(jīng)驗06-30
2015阿里校招產(chǎn)品經(jīng)理(業(yè)務(wù)型)筆試經(jīng)驗06-30
阿里 社招 面試06-29
數據分析師的層級07-10
數據分析師的職責02-07
中國工商銀行校招筆經(jīng)06-28
阿里云面試題06-29