機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)離不開數(shù)學(xué),本文從數(shù)學(xué)基礎(chǔ)的角度入手,推薦了數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)方面的七本參考書以及兩本補充讀物。相信對打好數(shù)學(xué)基礎(chǔ)的相關(guān)人士會有所幫助。
大多數(shù)人學(xué)習(xí)數(shù)據(jù)科學(xué)的人都會把重點放在編程上,實際上編程能力確實是機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)領(lǐng)域的重要技能。但是,要真正精通數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí),必然不能忽視的數(shù)據(jù)科學(xué)背后的數(shù)學(xué)基礎(chǔ)。
出于這個目的,本文介紹了七本在注重打好數(shù)據(jù)科學(xué)的數(shù)學(xué)基礎(chǔ)上的技術(shù)讀物。當(dāng)然,涉及到數(shù)學(xué),往往閱讀體驗可能不會很舒服,但要搞好機(jī)器學(xué)習(xí),數(shù)學(xué)基礎(chǔ)是必須要打牢的,所以努力讀書吧!
先說一說為什么在數(shù)據(jù)科學(xué)學(xué)習(xí)時打好數(shù)學(xué)基礎(chǔ)。
以下是我總結(jié)的幾個原因:
AI領(lǐng)域無時無刻不在迅速變化。Hinton認(rèn)為,我們也許應(yīng)該重新思考反向傳播。掌握牢固的數(shù)學(xué)知識有助于更好地理解AI的演變。一個數(shù)學(xué)基礎(chǔ)深厚的人,對AI的理解和認(rèn)識與其他僅從表面認(rèn)識AI的人有很大的區(qū)別。此外,掌握數(shù)學(xué)知識還能更好地了解AI技術(shù)帶來知識產(chǎn)權(quán)的潛力。最后,了解數(shù)據(jù)科學(xué)背后的數(shù)學(xué)知識,也可以讓人更容易獲得AI和數(shù)據(jù)科學(xué)的高端職位。
此外,作者推薦這幾本書,還有兩點個人原因:
1.作者在牛津大學(xué)教授物聯(lián)網(wǎng)數(shù)據(jù)科學(xué)的課程,也包括一些AI技術(shù)應(yīng)用方面的教學(xué)事務(wù),在教學(xué)過程中涉及到數(shù)學(xué)基礎(chǔ)知識和課程。
2.其次,作者在寫一本書來簡述人工智能,從數(shù)學(xué)的角度入手,目標(biāo)讀者是14到18歲的少年。要深入了解數(shù)學(xué)科學(xué)和人工智能數(shù)學(xué)的數(shù)學(xué)基礎(chǔ),你需要了解四個方面知識:線性代數(shù),概率論,多元微積分和優(yōu)化。目前在高中階段至少會教授這些課程的一部分內(nèi)容。因此,我試圖將高中數(shù)學(xué)與人工智能和數(shù)據(jù)科學(xué)聯(lián)系起來,重點是數(shù)學(xué)建模。
下面進(jìn)入正題:
(1) The Nature Of Statistical Learning Theory《統(tǒng)計學(xué)習(xí)理論的本質(zhì)》
作者:VladimirVapnik
PDF資源:
https://statisticalsupportandresearch.files.wordpress.com/2017/05/vladimir-vapnik-the-nature-of-statistical-learning-springer-2010.pdf
如果說要列一份關(guān)于數(shù)學(xué)的書單,這本書是繞不過去的。本書單中排名第一的就是俄羅斯著名數(shù)學(xué)家VladimirVapnik的《統(tǒng)計學(xué)習(xí)理論的本質(zhì)》。在這份清單中的所有書籍中,Vapnik這本是最不好找的。VladimirVapnik是支持向量機(jī)(SVM)的創(chuàng)始人。他的維基百科頁面中提供了更多關(guān)于他研究成果的介紹。
(2)Pattern Classification(2007-12-24)《模式分類》
作者:RichardODuda
PDF資源:
https://cds.cern.ch/record/683166/files/0471056693_TOC.pdf
就像Vapnik的著作一樣,Duda的著作時另一個時代的另一部經(jīng)典。本書初版于1973年,在二十多年后的2000年才推出第二版,此后一直未再版。時隔近二十年,本書仍然是一個重要資源。本書采用模式識別方法,并涵蓋了廣泛的算法。
(3)
MachineLearning:AnAlgorithmicPerspective,SecondEdition(Chapman&Hall/CrcMachineLearning&PatternRecognition)
《機(jī)器學(xué)習(xí):算法視角》
PDF資源:
https://doc.lagout.org/science/Artificial%20Intelligence/Machine%20learning/Machine%20Learning_%20An%20Algorithmic%20Perspective%20%282nd%20ed.%29%20%5BMarsland%202014-10-08%5D.pdf
這本書現(xiàn)在已經(jīng)出版了第二版。此書第一版是我讀過的最早的書關(guān)于機(jī)器學(xué)習(xí)和算法的著作之一,第二版增加了更多Python代碼。與前兩本書一樣,本書也非常強調(diào)算法。
(4)
TheElementsofStatisticalLearning:DataMining,Inference,andPrediction,SecondEdition
《統(tǒng)計學(xué)習(xí)基礎(chǔ):數(shù)據(jù)挖掘、推理和預(yù)測》(第二版)
作者:TrevorHastie,RobertTibshirani,JeromeFriedman
PDF資源:https://web.stanford.edu/~hastie/Papers/ESLII.pdf
另一本經(jīng)典之作,可以作為參考書。
(5)Pattern Recognition and Machine Learning (Information Science and Statistics)
《模式識別與機(jī)器學(xué)習(xí)(信息科學(xué)與統(tǒng)計)》
作者:ChristopherM.Bishop
PDF資源:http://users.isr.ist.utl.pt/~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf
ChristopherM.Bishop的模式識別和機(jī)器學(xué)習(xí)(信息科學(xué)和統(tǒng)計學(xué))也是一本深入而精心設(shè)計的參考書。
(6)
MachineLearning:TheArtandScienceofAlgorithmsthatMakeSenseofData
作者:PeterFlach
PDF資源:http://www.cs.put.poznan.pl/tpawlak/files/ZMIO/W02.pdf
我喜歡PeterFlach的書,盡管亞馬遜網(wǎng)站上的一些評論說這書寫得太羅嗦,而且代碼量顯得不足。我特別喜歡這本書中的算法分組(邏輯模型,線性模型,概率模型)章節(jié)以及這些主題的整體講述方式。
最后,是我最推薦的一本書:
(7)Deep Learning《深度學(xué)習(xí)》
作者:Goodfellow、Bengio、Corville
相關(guān)資源:https://www.deeplearningbook.org/
如果你在找一本值得逐頁讀完的書,就是它了!這本書既詳細(xì),又有現(xiàn)代感,書中內(nèi)容幾乎涵蓋了你能想到的關(guān)于深度學(xué)習(xí)的一切知識。
補充兩本書:
A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition) by Simon Rogers, Mark Girolami
作者:SimonRogers,MarkGirolami
我覺得這本書并不太適合初學(xué)者,但它仍然是一本好書(特別是第二版)
MachineLearning:AProbabilisticPerspective
作者:KevinMurphy
這本書中評價也很高,但我個人沒有讀過(因此沒有收集)。
寫在最后:
除了最后一本《深度學(xué)習(xí)》之外,我建議其他書不必逐頁閱讀,而是將其作為參考書,根據(jù)需要按相應(yīng)主題閱讀相應(yīng)的書籍。這些書教會了我時刻保持謙遜。無論我們現(xiàn)在知道了多少,掌握了多少知識,都總能在閱讀過程中發(fā)現(xiàn),這個領(lǐng)域原來是如此的龐大和復(fù)雜。
這些書已經(jīng)超越了時間。VladimirVapnik現(xiàn)年已經(jīng)81歲。Duda的著作初版于1973年。我預(yù)計50年以后,這個行業(yè)里的人們?nèi)匀粫喿x這些著作。就像與那些經(jīng)歷了時間考驗的老朋友們重逢一樣。多年之后,也許你會發(fā)現(xiàn),在眼花繚亂的技術(shù)、模型和框架背后,數(shù)學(xué)是永恒的。
-
AI
+關(guān)注
關(guān)注
87文章
30212瀏覽量
268463 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8381瀏覽量
132431 -
數(shù)據(jù)科學(xué)
+關(guān)注
關(guān)注
0文章
165瀏覽量
10046
原文標(biāo)題:【薦書】提升機(jī)器學(xué)習(xí)數(shù)學(xué)基礎(chǔ),這7本書一定要讀(附pdf資源)
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論