- 相關(guān)推薦
百度數據分析員面試測試題
大概一個(gè)月前,筆者接到百度的面試電話(huà),去應試數據分析員的工作。盡管無(wú)意去工作,但是還是希望能看看他們的測試題到底是怎么樣的。于是接觸到了一下的題目:
總共十個(gè)題目(當然全是excel函數題):
1、根據員工的身份證號,統計員工的生日。眾所周知,我國居民身份證號有18位和15位數之分。對于同樣位數的身份證號統計想必不是很難,但是混雜了兩種情況的統計怎么來(lái)做呢?
背景材料:
15位的身份證號碼:450104771010156
(1)1~6位為地區代碼
(2)7~8位為出生年份(2位),9~10位為出生月份,11~12位為出生日期
(3)第13~15位為順序號,并能夠判斷性別,奇數為男,偶數為女。
18位的身份證號碼:450104197710101516
(1)1~6位為地區代碼,
(2)7~10位為出生年份(4位),如1977
(3)11~12位為出生月份,如10
(4)13~14位為出生日期,如10
(5)第15~17位為順序號
2、從備注材料中抽提其中的物料代碼,代碼的格式是“0000-00000”,備注是文字和數字的混合。如“某某客戶(hù)投訴0000-00000產(chǎn)品有質(zhì)量問(wèn)題,香氣偏淡”。讓你寫(xiě)出函數從中提取出物料代碼。
3、AB列各有N多個(gè)單字節文本,但其中個(gè)別單元格有空白。要求:B3單元格有文字就顯示B3單元格,若B3無(wú)文字而A3有,則顯示A3單元格文字,如果A3也沒(méi)有文字,則顯示“濟南”。
4.有個(gè)物料庫存區域,有諸多原料進(jìn)倉數據,單個(gè)原料有多次進(jìn)倉記錄的,讓統計部分原料的庫存總數量。
5、考勤情況統計。A代表上班,K曠工,S遲到,B病假,W出差
按照日期記錄每個(gè)員工的考勤情況。月底對員工考勤情況進(jìn)行統計。
6、小數點(diǎn)的取舍。保留小數點(diǎn)后兩位,和截留取整。
7、有一副用數字0填充單元格組成的圖畫(huà),讓改變該副圖畫(huà)的背景顏色。
還有三個(gè)題時(shí)隔久遠,一時(shí)想不起了,抱歉,只能發(fā)這幾個(gè)題了。
知道答案的可以在隨后的評論中寫(xiě)出,猜不出的可以問(wèn)我。
--
--以下為本人收集的幾種數據分析工具--
1.QUEST
QUEST是IBM公司Almaden研究中心開(kāi)發(fā)的一個(gè)多任務(wù)數據挖掘系統,目的是為新一代決策支持系統的應用開(kāi)發(fā)提供高效的數據開(kāi)采基本構件。系統具有如下特點(diǎn):
提供了專(zhuān)門(mén)在大型數據庫上進(jìn)行各種開(kāi)采的功能:關(guān)聯(lián)規則發(fā)現、序列模式發(fā)現、時(shí)間序列聚類(lèi)、決策樹(shù)分類(lèi)、遞增式主動(dòng)開(kāi)采等。
各種開(kāi)采算法具有近似線(xiàn)性(O(n))計算復雜度,可適用于任意大小的數據庫。
算法具有找全性,即能將所有滿(mǎn)足指定類(lèi)型的模式全部尋找出來(lái)。
為各種發(fā)現功能設計了相應的并行算法。
2.MineSet
MineSet是由SGI公司和美國Standford大學(xué)聯(lián)合開(kāi)發(fā)的多任務(wù)數據挖掘系統。MineSet集成多種數據挖掘算法和可視化工具,幫助用戶(hù)直觀(guān)地、實(shí)時(shí)地發(fā)掘、理解大量數據背后的知識。MineSet有如下特點(diǎn):
MineSet以先進(jìn)的可視化顯示方法聞名于世。
提供多種 萃誥蚰J健0 ǚ擲嗥鰲⒒毓檳J、关 嬖頡⒕劾喙欏⑴卸狹兄匾 取?br>
支持多種關(guān)系數據庫?梢灾苯訌腛racle、Informix、Sybase的表讀取數據,也可以通過(guò)SQL命令執行查詢(xún)。
多種數據轉換功能。在進(jìn)行挖掘前,MineSet可以去除不必要的數據項,統計、集合、分組數據,轉換數據類(lèi)型,構造表達式由已有數據項生成新的數據項,對數據采樣等。
操作簡(jiǎn)單、支持國際字符、可以直接發(fā)布到Web。
3.DBMiner
DBMiner是加拿大SimonFraser大學(xué)開(kāi)發(fā)的一個(gè)多任務(wù)數據挖掘系統,它的前身是DBLearn。該系統設計的目的是把關(guān)系數據庫和數據開(kāi)采集成在一起,以面向屬性的多級概念為基礎發(fā)現各種知識。DBMiner系統具有如下特色:
能完成多種知識的發(fā)現:泛化規則、特性規則、關(guān)聯(lián)規則、分類(lèi)規則、演化知識、偏離知識等。
綜合了多種數據開(kāi)采技術(shù):面向屬性的歸納、統計分析、逐級深化發(fā)現多級規則、元規則引導發(fā)現等方法。
提出了一種交互式的類(lèi)SQL語(yǔ)言數據開(kāi)采查詢(xún)語(yǔ)言DMQL。
能與關(guān)系數據庫平滑集成。
實(shí)現了基于客戶(hù)/服務(wù)器體系結構的Unix和pC(Windows/NT)版本的系統。
4.EXCEL MATLAB Origin 等等
當前流行的圖形可視化和數據分析軟件有Matlab,Mathmatica和Maple等。這些軟件功能強大,可滿(mǎn)足科技工作中的許多需要,但使用這些軟件需要一定的計算機編程知識和矩陣知識,并熟悉其中大量的函數和命令。而使用Origin就像使用Excel和Word那樣簡(jiǎn)單,只需點(diǎn)擊鼠標,選擇菜單命令就可以完成大部分工作,獲得滿(mǎn)意的結果。 但它又比excel要強大些。一般日常的話(huà)可以用Excel,然后加載宏,里面有一些分析工具,不過(guò)有時(shí)需要數據庫軟件支持。
【百度數據分析員面試測試題】相關(guān)文章:
數據分析員工作總結01-26
數據分析員崗位職責03-07
數據分析員崗位職責說(shuō)明07-10
數據分析員工作總結2篇02-02
數據分析員工作總結4篇01-26
數據分析員工作總結(3篇)02-23
數據分析員工作總結3篇02-23
數據分析員崗位職責5篇03-07
數據分析員崗位職責(5篇)03-07