最近,寫了 Linux C/C++、Java 的學習路線,對于要走這個方向的讀者,看看文章,大致方向不會錯的,在看的過程中,要慢慢培養自己的技術棧:
1、Linux C/C++ 學習路線(已拿騰訊、百度 offer)
2、Java 學習路線
對于 Java 學習路線,上篇文章說到的框架那塊,有些過時了,現在直奔 spring 或 springboot 即可,另外 2 個框架不用學了。
后臺三大主力,C++、Java、Go,Go 語言的學習路線不打算寫了,目前走 Go 方向的人很少,看之后發展如何吧;上次讀者留言,提到了數據分析,對于目前大火的 Python,在數據分析方面,是有一定的優勢的。
數據分析方向的思考
1、
對于 Python,可以從事的方向有:爬蟲、后臺、web、數據分析、算法崗,目前來說,要是選擇 Python 的話,走數據分析、算法崗是比較好的;當然了,Python 最適合的場景就是 AI,要是能直接走算法崗是最佳選擇。
走數據分析的,大部分人本身可能只熟悉 Python,有一部分人是真的喜歡這個方向,有一部分人其實是被動選擇,想找后臺方向,不熟悉 C++、Java、Go,沒法投遞,想找算法崗,對于機器學習十大算法以及算法方向的能力暫時不具備,只能選擇數據分析這么一個崗位了。
對于數據分析,國內招聘的需求崗位遠不如后臺、算法崗多,加上現在 Python 大火,很多人都走的 Python 路線,其競爭非常激烈,對于數據分析崗的技術含量,遠沒有算法崗那么多,要求也沒那么嚴,其薪資待遇也不算高。
數據分析其實很實用,可以通過對大量數據的觀察、分析、得到一定的規律,對于現在的大數據、云計算,尤其是面對海量數據,就需要一些快速處理的方法,數據分析崗位在公司中有一定的重要性,這個方向可以作為走向 AI 算法崗的跳板。
2、
對于技術沒多大追求的,還想踏入互聯網行業的,完全可以選擇走數據分析,數據分析這個方向相對而言,跟業務掛鉤比較大,熟悉了業務背景,還是很好上手的,如果一開始不具備算法崗的能力,也可以從數據分析入手,慢慢轉向算法崗。
我要清醒的告訴大家一點:數據分析的技術含量是比較低的,如果你想長期從事技術方面的工作,還是需要走后臺或者算法崗,很多人投遞這個方向,其實是被動與無奈的選擇(都不知道在工作中,數據分析到底是干啥的),一定要想好自己的職業方向。
如果真的喜歡數據分析,對數據比較敏感,一直從事在這個崗位也是挺好的,關鍵是要做自己喜歡的事情!
數據分析學習路線
數據分析,我在工作中有過簡單的接觸,自己目前入門較淺,根據自己的思考,分享一下我認為的學習路線、資料推薦,其中肯定有不足之處,希望大家在學習的時候,慢慢完善自己的技術棧就好了。
數據分析崗位,簡單理解,就是對于數據的處理、分析,得到結果,所以這個方向需要學習數據分析的 2 個方面:工具 + 方法 (數據處理的工具以及數據處理的常見方法)。
數據分析最完整的流程:數據獲取--->數據存儲--->數據預處理--->數據分析--->數據可視化。
1、基礎
Excel :最基礎的數據處理工具,偏向于運營崗位的數據分析,作為一個數據分析師,Excel 無條件的熟練掌握,對于數據量較少,拿 Excel 進行分析、轉換、運算即可,而且數據分析師很大一部分時間是在與 Excel 在打交道。
SQL:sql 語句的熟練掌握,這就是跟數據庫打交道了,利用 sql 把數據進行提取,分析是很常見的一種方法(說句實話:算法崗也有一部分時間是在寫 sql),不管你從事數據分析、還是算法崗,sql 都非常的重要,因為這是跟數據庫打交道最直接的語句了。
我前面說過,不管你是啥方向,工作中最重要的三項技能,必須非常非常熟練的掌握起來:Linux + Git + Sql。
Python:Python 基礎知識的掌握,主要是 Python 非常擅長處理數據,Python 有很多包、方法都是可以直接調用的,作為一名數據分析師,對于一些復雜的場景,會用腳本語言進行數據分析。
Python 爬蟲:對于這項技術的理解,掌握了會更好,不會也不影響你作為數據分析師的日常工作,數據分析師的主要工作是對于數據的理解、處理,拿到結果;對于 R 語言,也是一門腳本語言,方便處理數據的,有時間可以接觸,學習學習,Python 在這方面的需求是遠大于 R。
數據分析師的基本功:Excel + Sql + Python,加上對于業務的理解,日常需求還是能完成的,對于那些計算機基礎知識,肯定是掌握了更好啊!
2、進階
Python 科學計算:pandas、numpy、scipy 等,pandas 常用于數據的清洗(重復、缺失、異常值等),把這些缺失的數據處理好,才能獲得更加準確的分析;numpy 支持數組和矩陣的運算,提供了大量的數學函數庫;scipy 是一個高級的科學計算庫,很多數學統計的相關函數都在其中。
對于科學計算包pandas、numpy、scipy 等,作為數據分析師的進階是最好要掌握的,花些時間,把這些都得熟悉掌握起來。
概率論及統計知識:
(1)、基本的概念:均值、中位數、眾數、極值等;
(2)、統計量:方差、標準差、顯著性等;
(3)、概率論知識:條件概率、貝葉斯等;
。。。
有了統計學的基本知識,就可以拿上面的量化數據,來描述數據的指標,觀察數據規律,得到一些結論性的總結,以及一些變化趨勢的預估,這塊數據分析做的就是有些技術含量的東西了。
3、拔高
數據分析師的拔高,就是在慢慢的走向機器學習方向,慢慢的轉為算法崗。
特征工程的基礎:如何統計數據特征、選用不同的特征,做模型的優化;
基本的分類算法:決策樹、隨機森林等;
基本的聚類算法、數據挖掘、常見的機器學習算法的了解;
做到這步的話,慢慢就會有數據挖掘、機器學習的感覺,一個優秀的數據分析師,數學功底是扎實的,就是在潛移默化的轉向數據挖掘崗。
4、推薦資料
書籍:
《對比Excel,輕松學習Python數據分析》:易懂易學的好書,強烈推薦!
《利用Python進行數據分析》
《深入淺出統計學》
數據分析工作中
2019 年騰訊暑期實習招聘
看看投遞數據分析方向的比例是多么的嚇人(50:1),崗位少,投遞人多,競爭太激烈了;看看騰訊對于數據分析師要求的技術棧:數學功底 + Python 腳本,基本上就是這些。
當你對于一個崗位,不知道學啥、不知道怎么構建自己技術棧的時候,你就多去官網看看,對于這個方向的要求,會給你指明一個大體的方向,按照著學習、準備、提升自己的技術能力就好。
為啥大部分人都投遞這個方向呢?我上面都說了,無奈與被迫的選擇,如果計算機水平足夠,大部分人還是愿意選擇后臺或者算法崗,多想想,時刻保持獨立思考的能力。
對于大部分數據分析師,在工作中,掌握:Excel + Sql + Python 足夠了,并沒有多大的技術含量,拿的錢相對較少;我這邊工作中接觸的數據分析工程師,主要就是統計數據、效果追蹤、報表可視化展示等。
每家公司的數據分析做的工作是完全不一樣的,有的感覺很無聊,有的還有些技術含量,這取決于你的業務與場景,大廠和小廠的數據分析也有差別,不管咋樣,時刻保持不斷學習的勁頭就好了。
面對新的領域,不在于我是否走這條路線,在于我是否思考、查資料、解決這些問題,能快速的給自己規劃學習路線,這就是能力。
數據分析未來崗位還會增加,看看是否適合自己,認清自己在技術方面的能力,做好選擇。
-
Linux
+關注
關注
87文章
11232瀏覽量
208949 -
JAVA
+關注
關注
19文章
2960瀏覽量
104562 -
數據分析
+關注
關注
2文章
1429瀏覽量
34025
原文標題:數據分析學習路線
文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數據技術】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論