大牛數據分(fēn)析師養成日記
作(zuò)者:admin  來(lái)源:36大數據  發表時(shí)間(jiān):2016-5-17  點擊:3562

  最近接到一(yī)個(gè)職業訪談的邀請,要給對數據分(fēn)析感興趣的新(xīn)人(rén)Y(目前在知名電商(shāng)從事(shì)系統開發和維護)一(yī)些(xiē)建議(yì),才突然發現(xiàn)自己在這(zhè)個(gè)領域打滾了(le)一(yī)段時(shí)間(jiān),一(yī)陣感歎後,寫下(xià)自己的一(yī)些(xiē)體(tǐ)會,盡管不全面,但(dàn)或許能(néng)夠給新(xīn)人(rén)一(yī)些(xiē)借鑒。如(rú)有不妥地方,請各位數據大牛輕拍。

  一(yī)、數據分(fēn)析師有哪些(xiē)要求?

  1、理(lǐ)論要求及對數字的敏感性,包括統計知識、市(shì)場(chǎng)研究、模型原理(lǐ)等。

  2、工具使用,包括挖掘工具、數據庫、常用辦公軟件(excel、PPT、word、腦圖)等。

  3、業務(wù)理(lǐ)解能(néng)力和對商(shāng)業的敏感性。對商(shāng)業及産品要有深刻的理(lǐ)解,因為(wèi)數據分(fēn)析的出發點就(jiù)是要解決商(shāng)業的問題,隻有理(lǐ)解了(le)商(shāng)業問題,才能(néng)轉換成數據分(fēn)析的問題,從而滿足部門的要求。

  4、彙報(bào)和圖表展現(xiàn)能(néng)力。這(zhè)是臨門一(yī)腳,做得再好(hǎo)(hǎo)的分(fēn)析模型,如(rú)果不能(néng)很好(hǎo)(hǎo)地展示給領導和客戶,成效就(jiù)大打折扣,也(yě)會影響到數據分(fēn)析師的職業晉升。

  二、請把數據分(fēn)析作(zuò)為(wèi)一(yī)種能(néng)力來(lái)培養

  從廣義來(lái)說(shuō),現(xiàn)在大多數的工作(zuò)都需要用到分(fēn)析能(néng)力,特别是數據化(huà)運營理(lǐ)念深入的今天,像BAT這(zhè)樣的公司強調全員(yuán)參與數據化(huà)運營,所以,把它作(zuò)為(wèi)一(yī)種能(néng)力培訓,将會讓你終生(shēng)受益。

  三、從數據分(fēn)析的四個(gè)步驟來(lái)看清數據分(fēn)析師需具備的能(néng)力和知識:

  數據分(fēn)析的四個(gè)步驟(這(zhè)有别于數據挖掘流程:商(shāng)業理(lǐ)解、數據理(lǐ)解、數據準備、模型搭建、模型評估、模型部署),是從更宏觀地展示數據分(fēn)析的過程:獲取數據、處理(lǐ)數據、分(fēn)析數據、呈現(xiàn)數據。

  (一(yī))獲取數據

  獲取數據的前提是對商(shāng)業問題的理(lǐ)解,把商(shāng)業問題轉化(huà)成數據問題,要通過現(xiàn)象發現(xiàn)本質,确定從哪些(xiē)緯度來(lái)分(fēn)析問題,界定問題後,進行數據的采集。此環節,需要數據分(fēn)析師具備結構化(huà)的思維和對商(shāng)業問題的理(lǐ)解能(néng)力。

  推薦書籍:《金(jīn)字塔原理(lǐ)》、麥肯錫三部曲:《麥肯錫意識》、《麥肯錫工具》、《麥肯錫方法》

  工具:思維導圖、mindmanager軟件

  (二)處理(lǐ)數據

  一(yī)個(gè)數據分(fēn)析項目,通常數據處理(lǐ)時(shí)間(jiān)占70%以上(shàng),使用先進的工具有利于提升效率,所以盡量學習最新(xīn)最有效的處理(lǐ)工具,以下(xià)介紹的是最傳統的,但(dàn)卻很有效率的工具:

  Excel:日常在做通報(bào)、報(bào)告和抽樣分(fēn)析中經常用到,其圖表功能(néng)很強大,處理(lǐ)10萬級别的數據很輕松。

  UltraEdit:文本工具,比TXT工具好(hǎo)(hǎo)用,打開和運行速度都比較快(kuài)。

  ACCESS:桌面數據庫,主要是用于日常的抽樣分(fēn)析(做全量統計分(fēn)析,消耗資源和時(shí)間(jiān)較多,通常分(fēn)析師會随機抽取部分(fēn)數據進行分(fēn)析),使用SQL語言,處理(lǐ)100萬級别的數據還是很快(kuài)捷。

  Orcle、SQLsever:處理(lǐ)千萬級别的數據需要用到這(zhè)兩類數據庫。

  當然,在自己能(néng)力和時(shí)間(jiān)允許的情況下(xià),學習新(xīn)流行的分(fēn)布式數據庫及提升自身(shēn)的編程能(néng)力,對未來(lái)的職業發展也(yě)有很大幫助。

  分(fēn)析軟件主要推薦:

  SPSS系列:老牌的統計分(fēn)析軟件,SPSSStatistics(偏統計功能(néng)、市(shì)場(chǎng)研究)、SPSSModeler(偏數據挖掘),不用編程,易學。

  SAS:老牌經典挖掘軟件,需要編程。

  R:開源軟件,新(xīn)流行,對非結構化(huà)數據處理(lǐ)效率上(shàng)更高,需編程。

  随着文本挖掘技術進一(yī)步發展,對非結構化(huà)數據的分(fēn)析需求也(yě)越來(lái)越大,需要進一(yī)步關(guān)注文本挖掘工具的使用。

  (三)分(fēn)析數據

  分(fēn)析數據,需要用到各類的模型,包括關(guān)聯規則、聚類、分(fēn)類、預測模型等,其中一(yī)個(gè)最重要的思想是對比,任何的數據需要在參照系下(xià)進行對比,結論才有意義。

  推薦的書籍:

  1、《數據挖掘與數據化(huà)運營實戰,思路(lù)、方法、技巧與應用》,盧輝着,機械出版社。這(zhè)本書是近年國内寫得最好(hǎo)(hǎo)的,務(wù)必把它當作(zuò)聖經一(yī)樣來(lái)讀。

  2、《誰說(shuō)菜鳥不會數據分(fēn)析(入門篇)》和《誰說(shuō)菜鳥不會數據分(fēn)析(工具篇)》,張文霖等編着。屬于入門級的書,适合初學者。

  3、《統計學》第五版,賈俊平等編着,中國人(rén)民(mín)大學出版社。比較好(hǎo)(hǎo)的一(yī)本統計學的書。

  4、《數據挖掘導論》完整版,[美]Pang-NingTan等着,範明等翻譯,人(rén)民(mín)郵電出版社。

  5、《數據挖掘概念與技術》,JiaweiHan等着,範明等翻譯,機械工業出版社。這(zhè)本書相對難一(yī)些(xiē)。

  6、《市(shì)場(chǎng)研究定量分(fēn)析方法與應用》,簡明等編着,中國人(rén)民(mín)大學出版社。

  7、《問卷統計分(fēn)析實務(wù)—SPSS操作(zuò)與應用》,吳明隆着,重慶大學出版社。在市(shì)場(chǎng)調查領域比較出名的一(yī)本書,對問卷調查數據分(fēn)析講解比較詳細。

  (四)呈現(xiàn)數據

  該部分(fēn)需要把數據結果進行有效的呈現(xiàn)和演講彙報(bào),需要用到金(jīn)字塔原理(lǐ)、圖表及PPT、word的呈現(xiàn),培養良好(hǎo)(hǎo)的演講能(néng)力。

  推薦書籍:

  1、《說(shuō)服力讓你的PPT會說(shuō)話(huà)》,張志等編着,人(rén)民(mín)郵電出版社。

  2、《别告訴我你懂ppt》加強版,李治着,北京大學出版社。

  3、《用圖表說(shuō)話(huà)》,基恩。澤拉茲尼着,馬曉路(lù)等翻譯,清華大學出版社。

  (五)其他的知識結構

  數據分(fēn)析師除了(le)具備數學知識外,還要具備市(shì)場(chǎng)研究、營銷管理(lǐ)、心理(lǐ)學、行為(wèi)學、産品運營、互聯網、大數據等方面的知識,需要構建完整廣泛的知識體(tǐ)系,才能(néng)支撐解決日常遇到的不同類型的商(shāng)業問題。

  推薦書籍:

  1、《消費者行為(wèi)學》第10版,希夫曼等人(rén)着,江林等翻譯,中國人(rén)民(mín)大學出版社,現(xiàn)在應該更新(xīn)到更高的版本。

  2、《怪誕行為(wèi)學》升級版,艾瑞裏着,趙德亮等翻譯,中信出版社

  3、《營銷管理(lǐ)》,科特勒等着,梅清豪翻譯,格緻出版社和上(shàng)海人(rén)民(mín)出版社聯合出版

  4、《互聯網思維—獨孤九劍》,趙大偉主編,機械出版社

5、《大數據時(shí)代—生(shēng)活、工作(zuò)與思維的大變革》,舍恩伯格等着,周濤等翻譯,浙江人(rén)民(mín)出版社

  四、關(guān)于數據分(fēn)析師的職業發展:

  1、數據分(fēn)析師通常分(fēn)兩類,分(fēn)工不同,但(dàn)各有優勢。

  一(yī)類是在專門的挖掘團隊裏面從事(shì)數據挖掘和分(fēn)析工作(zuò)的。如(rú)果你能(néng)在這(zhè)類專業團隊學習成長,那是幸運的,但(dàn)進入這(zhè)類團隊的門檻較高,需要紮實的數據挖掘知識、挖掘工具應用經驗和編程能(néng)力。該類分(fēn)析師更偏向技術線條,未來(lái)的職業通道可能(néng)走專家的技術路(lù)線。

  另一(yī)類是下(xià)沉到各業務(wù)團隊或者運營部門的數據分(fēn)析師,成為(wèi)業務(wù)團隊的一(yī)員(yuán)。他們工作(zuò)是支撐業務(wù)運營,包括日常業務(wù)的異常監控、客戶和市(shì)場(chǎng)研究、參與産品開發、建立數據模型提升運營效率等。該類型分(fēn)析師偏向産品和運營,可以轉向做運營和産品。

  2、數據分(fēn)析師的理(lǐ)想行業在互聯網,但(dàn)條條大道通羅馬,走合适你的路(lù)線。

  從行業的角度來(lái)看:

  1)互聯網行業是數據分(fēn)析應用最廣的行業,其中的電商(shāng)企業,更是目前最火(huǒ)的,而且企業也(yě)更重視(shì)數據分(fēn)析的價值,是數據分(fēn)析師理(lǐ)想的成長平台。

  2)其次是咨詢公司(比如(rú)專門的數據挖掘公司Teradata、尼爾森等市(shì)場(chǎng)研究公司),他們需要數據分(fēn)析人(rén)才,而且相對來(lái)說(shuō),數據分(fēn)析師在咨詢公司成長的速度更快(kuài),專業也(yě)會更全面。

  3)再次是金(jīn)融行業,比如(rú)銀行和證券等行業,該行業對數據分(fēn)析的依賴需求,越來(lái)越大。

  4)最後是電信行業(中國移動、聯通和電信),它們擁有海量的數據,在嚴峻的競争下(xià),也(yě)越來(lái)越重視(shì)數據分(fēn)析,但(dàn)進入這(zhè)些(xiē)公司的門檻比較高。

  五、什(shén)麽人(rén)适合學習數據分(fēn)析?

  這(zhè)個(gè)問題的答(dá)案跟“什(shén)麽人(rén)适合學功夫”一(yī)樣,毫無疑問,功夫是适合任何人(rén)學習的(排除心術不正的人(rén)),因為(wèi)能(néng)夠強身(shēn)健體(tǐ)。而功夫的成效,要看習武者的修煉深淺。常常有人(rén)争論,是詠春拳厲害,還是散打厲害,其實是颠倒了(le)因果,應該看哪個(gè)人(rén)練習得比較好(hǎo)(hǎo),流派之間(jiān)沒有高低(dī),隻有人(rén)修煉的厚薄。

  實際上(shàng),問題的潛台詞是“什(shén)麽人(rén)學習數據分(fēn)析,會更容易取得成功(比如(rú)職業成功)”,這(zhè)個(gè)要視(shì)乎你的興趣、付出和機遇。但(dàn)要做到出類拔萃,除了(le)上(shàng)面三點,還需要一(yī)點天賦,這(zhè)裏的機遇是指你遇到的職業發展平台、商(shāng)業環境、導師和同事(shì)。

  借用管理(lǐ)大師德魯克的話(huà)“管理(lǐ)是可以習得的”,管理(lǐ)并非是天生(shēng)的,而數據分(fēn)析能(néng)力,也(yě)可以後天提升。或許做到優秀,隻需要你更加的努力+興趣,而這(zhè)個(gè)努力的過程,也(yě)包括你尋找機遇的部分(fēn)。

  六、關(guān)于如(rú)何學習:

  學習方法千萬種,關(guān)鍵是找到适合自己的,最好(hǎo)(hǎo)能(néng)夠結合你的工作(zuò)遇到的問題來(lái)學習。

  1、搜集書籍、案例庫和視(shì)頻,先弄懂理(lǐ)論,然後學會軟件操作(zuò),自己制作(zuò)屬于自己的教程。

  比如(rú),你學習聚類分(fēn)析模型。1)搜集相關(guān)的聚類分(fēn)析模型的書籍、案例和教學視(shì)頻,了(le)解聚類分(fēn)析的原理(lǐ),主要有哪幾種算(suàn)法(劃分(fēn)、層次、密度、網格)、模型适用的範圍和前提、如(rú)何評估模型的精确度等。

  2)自己學會用軟件來(lái)實現(xiàn)。

  3)總結整理(lǐ)成一(yī)份PPT和制作(zuò)操作(zuò)視(shì)頻,成為(wèi)自己的學習教程,不斷完善。

  4)學習到一(yī)定程度後,可以在博客、微信等渠道分(fēn)享,授人(rén)與漁,而自己也(yě)會有所收獲。

  2、關(guān)注名人(rén)、名博、網站(zhàn),多渠道學習。

  1)關(guān)注專業的數據分(fēn)析、咨詢公司網站(zhàn)和論壇,特别強調,統計軟件公司的網站(zhàn)如(rú)SPSS的官網有很多案例庫,值得關(guān)注。

  數據分(fēn)析網:http://www.afenxi.com/中國統計網:http://www.itongji.cn/愛數據網:http://www.lovedata.cn/

  SPSS的案例庫,可在官網上(shàng)搜索各類案例:http://www.ibm.com/developerworks/cn/data/library/techarticle/dm-1108zhangzy/index.html

  另外,你最好(hǎo)(hǎo)建一(yī)個(gè)自己的網址導航目錄,提升你的學習效率

  2)關(guān)注名人(rén)名博,最好(hǎo)(hǎo)能(néng)加他們的微博、微信和微信公衆号,看牛人(rén)的博客和微信等内容,還是能(néng)得到很多引導,這(zhè)個(gè)你懂的。

  如(rú)沈浩老師的博客:http://shenhaolaoshi.blog.sohu.com/數據分(fēn)析網公衆号:afenxi_com數據海洋公衆号:dataplayer“數聚”公衆号:shuju_vip

  3)加入一(yī)些(xiē)有共同愛好(hǎo)(hǎo)的QQ群,互相學習交流。通常群裏有人(rén)會提出一(yī)些(xiē)真實的運營問題,然後大家用不同的方法去解決,對思路(lù)很有啓發。

  4)碎片化(huà)學習,最大化(huà)你的時(shí)間(jiān)價值。為(wèi)了(le)把零散的時(shí)間(jiān)利用起來(lái),通常我會把一(yī)些(xiē)資料上(shàng)載到網盤,在零碎的時(shí)間(jiān)裏通過手機進行視(shì)頻、文檔學習等。目前使用百度雲盤和360網盤。百度雲盤應用比較廣,通常在網絡上(shàng)搜索“關(guān)鍵詞+百度雲”後,搜到結果可以直接保存在雲盤上(shàng),搜索保存速度極大提升。360網盤則空間(jiān)比較大,可以到達40T,同時(shí)有保險箱加密功能(néng),安全性高一(yī)些(xiē)。

  手機上(shàng)安裝一(yī)些(xiē)APP,随時(shí)随地學習。

  七、最後的建議(yì)

  請再次問問自己,是否真的喜歡數據分(fēn)析,能(néng)否忍受處理(lǐ)數據時(shí)的寂寞?如(rú)果是,那就(jiù)開始學習,給你幾條建議(yì)。

  1、把數據分(fēn)析作(zuò)為(wèi)一(yī)種能(néng)力培養,讓自己在現(xiàn)在的團隊中展現(xiàn)出良好(hǎo)(hǎo)的數據分(fēn)析能(néng)力,為(wèi)你以後内部轉崗做好(hǎo)(hǎo)準備。如(rú)果内部轉崗不成,你可以考慮跳(tiào)槽到我之前分(fēn)析的行業中,但(dàn)我強烈建議(yì)你還是需要把系統開發的編程能(néng)力學習好(hǎo)(hǎo),并且對商(shāng)業智能(néng)系統(BI和CRM)有一(yī)定了(le)解,這(zhè)也(yě)許是應聘數據分(fēn)析的優勢。如(rú)果沒有數據分(fēn)析經驗去應聘,相對會難一(yī)些(xiē),用人(rén)單位會考你統計和數據挖掘模型方面的知識,以及工具使用情況。

  2、在公司裏找一(yī)些(xiē)有共同愛好(hǎo)(hǎo)的同事(shì)一(yī)起學習數據分(fēn)析,平時(shí)多請教數據分(fēn)析做得好(hǎo)(hǎo)的同事(shì),它山之石,可以攻玉。

  3、紮實學好(hǎo)(hǎo)一(yī)、兩門數據挖掘軟件,基于你有編程的基礎,建議(yì)你可以學SAS或者R,同時(shí)輔助學習SPSSModeler。如(rú)果沒編程基礎或者希望短期能(néng)夠取得成效,那也(yě)可以先學習SPSS。SAS+SPSS,基本能(néng)夠滿足很大部分(fēn)企業的需求,三者都會,那更好(hǎo)(hǎo)。

  4、要了(le)解公司是如(rú)何運營,産品是如(rú)何開發的,如(rú)何做客戶研究鎖定客戶需求,如(rú)何做産品營銷,這(zhè)些(xiē)需要不斷工作(zuò)積累和廣泛的閱讀。

  5、開始學習時(shí),先讀幾本有趣的數據分(fēn)析類的書,然後系統學習一(yī)下(xià)統計知識(建議(yì)教材用《統計學》第五版,賈俊平等編着),接着網上(shàng)快(kuài)速搜集軟件操作(zuò)視(shì)頻和案例,然後逐個(gè)分(fēn)析模型進行學習和總結歸納,學習最好(hǎo)(hǎo)能(néng)夠結合實際工作(zuò)中的問題進行。

  6、學習到一(yī)定程度時(shí),參加一(yī)些(xiē)數據分(fēn)析師的職業認證,進一(yī)步梳理(lǐ)知識結構,同時(shí)認識一(yī)些(xiē)志同道合的朋(péng)友和老師,也(yě)是對你有很大幫助。

  希望你能(néng)夠成為(wèi)你想成為(wèi)的人(rén)!(責編:pingxiaoli)

微信掃一(yī)掃

關(guān)注昊雲訂閱号

服務(wù)項目

維保運維服務(wù)

信息系統集成服務(wù)

機房(fáng)搬遷服務(wù)

 
 
 
QQ 在線客服
QQ 在線客服
 
電話(huà):
0531-88818533
客服QQ
2061058957
1905215487