如(rú)何成為(wèi)數據分(fēn)析師
作(zuò)者: 36大數據  來(lái)源: 36大數據  發表時(shí)間(jiān):2016-10-26  點擊:3380

最近幾年大數據的概念比較火(huǒ),越來(lái)越多的人(rén)感受到數據的價值,許多公司都開始招聘數據分(fēn)析相關(guān)的職位。但(dàn)如(rú)果你去看看國内的高校(xiào),會發現(xiàn)沒有一(yī)所大學開有數據分(fēn)析專業的,職位的成熟度還不夠。相比之下(xià),從2003年興起的互聯網産品經理(lǐ)職位,就(jiù)成熟一(yī)些(xiē),至少你可以找到大量的書,教你如(rú)何成為(wèi)一(yī)名産品經理(lǐ)。而數據分(fēn)析領域就(jiù)沒這(zhè)麽幸運了(le),相關(guān)的書籍雖然也(yě)有,但(dàn)總覺得還沒到火(huǒ)候。

都有哪些(xiē)人(rén)想要成為(wèi)數據分(fēn)析師

從我看到想要成為(wèi)數據分(fēn)析師的人(rén)大緻有三類:

第一(yī)類是非計算(suàn)機專業的在校(xiào)生(shēng),不知道怎麽回事(shì),反正就(jiù)是對數據感興趣了(le),然後想畢業之後從事(shì)相關(guān)工作(zuò),但(dàn)對職位要求、該做什(shén)麽準備一(yī)無所知,處于懵懂期;

  第二類是互聯網公司的産品經理(lǐ)和運營經理(lǐ),及少數的市(shì)場(chǎng)經理(lǐ)。這(zhè)些(xiē)人(rén)在實際工作(zuò)中,發現(xiàn)确實數據很有用,但(dàn)對自己的數據分(fēn)析能(néng)力感到不滿意,進而想做出提升;

  第三類是傳統企業的業務(wù)人(rén)員(yuán),也(yě)是不知道怎麽就(jiù)對數據感興趣了(le),想要從事(shì)數據分(fēn)析相關(guān)的崗位,但(dàn)缺少時(shí)間(jiān)系統學習,工作(zuò)經曆又不足以支撐自己跳(tiào)到數據分(fēn)析職位

  對于不同的背景,采用一(yī)樣的方法去訓練,顯然是不合理(lǐ)的。我先來(lái)講解一(yī)下(xià)數據相關(guān)的角色以及職責,說(shuō)不定你認識清楚了(le)就(jiù)不想成為(wèi)數據分(fēn)析師了(le),就(jiù)可以不用往下(xià)看了(le)。如(rú)果還有信心,那我就(jiù)介紹一(yī)下(xià)要學習的基礎内容,然後再介紹進階的内容。

數據相關(guān)的角色

  圍繞數據分(fēn)析,主要有六種角色。從平台建設線上(shàng),包括:

  數據平台工程師:負責數據平台的研發,牽涉到從數據采集到分(fēn)析的相關(guān)組件開發。

  數據挖掘工程師:利用機器(qì)學習/數據挖掘相關(guān)技術,研發算(suàn)法模型,用于個(gè)性化(huà)推薦、用戶畫像、精準廣告等。

  數據産品經理(lǐ):把數據相關(guān)的需求抽象為(wèi)數據平台的功能(néng)産品。

  從數據流向的角度,包括:

  ETL工程師:把工程團隊的模塊産生(shēng)的數據,不管是日志、數據表,還是埋點的數據,進行清洗、轉換,建模成利于數據分(fēn)析的數據。ETL是Extract–Transform–Load的縮寫。

  數據分(fēn)析師:利用ETL工程師處理(lǐ)好(hǎo)(hǎo)的數據,滿足業務(wù)人(rén)員(yuán)的數據需求。

  業務(wù)人(rén)員(yuán):産品、運營、市(shì)場(chǎng)、管理(lǐ)層等,因為(wèi)産品改進、運營活動、商(shāng)業決策等,有數據需求

數據分(fēn)析師的職責範圍

  通過上(shàng)面的角色劃分(fēn),我們可以清楚數據分(fēn)析師在整個(gè)數據版圖中的位置。數據分(fēn)析師一(yī)方面要和業務(wù)人(rén)員(yuán)打交道,滿足業務(wù)人(rén)員(yuán)的數據需求,另一(yī)方面,要借助ETL工程師建模好(hǎo)(hǎo)的數據,以及數據平台工程師開發的平台,來(lái)更高效的完成工作(zuò)。

  有些(xiē)公司在人(rén)員(yuán)緊缺的情況下(xià),會把ETL工程師要做的工作(zuò),也(yě)安排給數據分(fēn)析師,這(zhè)樣對數據分(fēn)析師的開發能(néng)力和建模能(néng)力,就(jiù)會有更高的要求。最後一(yī)點是提供洞察,前面的工作(zuò)更多的是被動的,數據分(fēn)析師還要主動的發現(xiàn)數據中的異常,将這(zhè)些(xiē)異常指導業務(wù)。

  看了(le)這(zhè)些(xiē)工作(zuò)内容,可能(néng)并不會覺得特别高大上(shàng)。我曾經有個(gè)組員(yuán),幹了(le)一(yī)年多的數據統計工作(zuò),覺得整天寫腳本太枯燥了(le),堅決要求再也(yě)不做相關(guān)工作(zuò)了(le)。其實數據分(fēn)析師如(rú)果做的不好(hǎo)(hǎo),就(jiù)會發現(xiàn)自己無非是在“取數”。業務(wù)人(rén)員(yuán)提了(le)需求,然後把要的數據給提取出來(lái),自己就(jiù)是一(yī)個(gè)流水線工人(rén),沒有一(yī)點成就(jiù)感。

  這(zhè)裏發揮一(yī)下(xià)抽象能(néng)力,就(jiù)可能(néng)把一(yī)些(xiē)重複的“取數”工作(zuò)給解決掉,用機器(qì)代替人(rén)工。所以理(lǐ)解業務(wù),提供自己的思考與抽象,很重要。

數據分(fēn)析師的基本要求

  對數據感興趣:是不是看到一(yī)行行的數字就(jiù)頭大,選擇直接跳(tiào)過?還是願意花些(xiē)時(shí)間(jiān)研究這(zhè)些(xiē)數字背後意味着什(shén)麽?如(rú)果你看蘋果的發布會的話(huà),會看到喬布斯的幻燈片裏出現(xiàn)最多的就(jiù)是數字,賣了(le)多少部,分(fēn)了(le)多少錢(qián),厚度減少到多少毫米之類的,他相信數字簡單明了(le)。

  如(rú)果對數據不感興趣,這(zhè)個(gè)角色一(yī)定不适合你。

  良好(hǎo)(hǎo)的理(lǐ)解和抽象能(néng)力:把業務(wù)人(rén)員(yuán)說(shuō)的隻言片語,抽象為(wèi)明确的數據需求,清楚怎麽從基礎數據中實現(xiàn)出來(lái)。還有把一(yī)些(xiē)重複性的需求,抽象出模式來(lái),用機器(qì)來(lái)替代。

  良好(hǎo)(hǎo)的表達能(néng)力:數據分(fēn)析師有個(gè)天然的優勢,能(néng)夠直接和老闆打交道,這(zhè)就(jiù)要求你能(néng)站(zhàn)在老闆的層面來(lái)表達。把一(yī)堆堆的數據,很好(hǎo)(hǎo)的呈現(xiàn)給業務(wù)人(rén)員(yuán),幫助他們做出正确的決策。

  快(kuài)速動手能(néng)力:業務(wù)人(rén)員(yuán)提的數據需求,巴不得下(xià)一(yī)秒(miǎo)都拿到。

  興趣是可以培養的,既然願意看這(zhè)篇文章,說(shuō)明有興趣。理(lǐ)解、表達、動手能(néng)力,是要有意識的訓練。數據分(fēn)析的專業能(néng)力,是可以通過學習提升的

數據分(fēn)析師要學習的内容

  統計學:我看一(yī)些(xiē)人(rén)推薦了(le)不少統計學的專業書籍,直接把人(rén)吓跑了(le)。我自己就(jiù)大學時(shí)候學過《概率論與數理(lǐ)統計》,其他統計相關(guān)的内容也(yě)沒怎麽看過。對于互聯網的數據分(fēn)析來(lái)說(shuō),并不需要掌握太複雜的統計理(lǐ)論。所以隻要按照本科教材,學一(yī)下(xià)統計學就(jiù)夠了(le)。

  一(yī)是讓你相信統計本身(shēn)是一(yī)門科學,這(zhè)不是星座算(suàn)命。

  二是在研究數據時(shí),知道一(yī)些(xiē)特征是負責統計學規律的。我在剛參加工作(zuò)時(shí),看到百度知道過億的用戶訪問,但(dàn)每天訪問的量波動不超過3%,感覺太神奇了(le)。

  編程能(néng)力:學會一(yī)門編程語言,會讓你處理(lǐ)數據的效率大大提升。如(rú)果你隻會在Excel上(shàng)複制粘貼,動手能(néng)力是不可能(néng)快(kuài)的。我比較推薦Python,上(shàng)手比較快(kuài),寫起來(lái)比較優雅。

  數據庫:數據分(fēn)析師經常和數據庫打交道,不掌握數據庫的使用可不行。學會如(rú)何建表和使用SQL語言進行數據處理(lǐ),可以說(shuō)是必不可少的技能(néng)。

  數據倉庫:許多人(rén)分(fēn)不清楚數據庫和數據倉庫的差異,簡單來(lái)說(shuō),數據倉庫記錄了(le)所有曆史數據,專門設計為(wèi)方便數據分(fēn)析人(rén)員(yuán)高效使用的。 

  數據分(fēn)析方法:對于互聯網數據分(fēn)析人(rén)員(yuán)來(lái)說(shuō),可以看一(yī)下(xià)《精益創業》和《精益數據分(fēn)析》,掌握常用的數據分(fēn)析方法,然後再根據自己公司的産品調整,靈活組合。

  數據分(fēn)析工具:SAS、Matlab、SPSS這(zhè)些(xiē)工具經常有人(rén)推薦,我要說(shuō)的是在互聯網公司一(yī)般都用不上(shàng)。

  做可視(shì)化(huà)的Tableau,統計分(fēn)析的友盟、百度統計,還有像我們神策分(fēn)析等。

  這(zhè)些(xiē)工具本身(shēn)不一(yī)定能(néng)滿足你的所有需求,但(dàn)會讓數據分(fēn)析變的更高效。我自己整理(lǐ)過一(yī)個(gè)豆瓣書列,有興趣的可以看看:數據分(fēn)析師豆列。上(shàng)面的内容學習後,隻能(néng)說(shuō)成為(wèi)一(yī)名合格的數據分(fēn)析師。

  要成為(wèi)高級數據分(fēn)析師的話(huà),一(yī)方面是要強化(huà)對業務(wù)的理(lǐ)解,最好(hǎo)(hǎo)是做到通過數據分(fēn)析幫助公司決策方向,或者說(shuō)促進企業快(kuài)速增長。另一(yī)方面,要加強機器(qì)學習/數據挖掘的專業知識學習,将機器(qì)學習成為(wèi)數據分(fēn)析的手段。比如(rú)預測用戶的流失,對用戶進行自動分(fēn)類等。你能(néng)提供的價值就(jiù)大不相同了(le)。最後,要強調的是,數據分(fēn)析師是一(yī)個(gè)實踐的職位,要在實際項目中不斷的訓練,才能(néng)成為(wèi)高手

上(shàng)條新(xīn)聞:十大IT工作(zuò)和工程

服務(wù)項目

維保運維服務(wù)

信息系統集成服務(wù)

機房(fáng)搬遷服務(wù)

 
 
 
QQ 在線客服
QQ 在線客服
 
電話(huà):
0531-88818533
客服QQ
2061058957
1905215487