掃二維碼與項(xiàng)目經(jīng)理溝通
我們?cè)谖⑿派?4小時(shí)期待你的聲音
解答本文疑問(wèn)/技術(shù)咨詢(xún)/運(yùn)營(yíng)咨詢(xún)/技術(shù)建議/互聯(lián)網(wǎng)交流
學(xué)習(xí)機(jī)器學(xué)習(xí)有很多方法,大多數(shù)人選擇從理論開(kāi)始。

創(chuàng)新互聯(lián)從2013年創(chuàng)立,先為平鄉(xiāng)等服務(wù)建站,平鄉(xiāng)等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢(xún)服務(wù)。為平鄉(xiāng)企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問(wèn)題。
如果你是個(gè)程序員,那么你已經(jīng)掌握了把問(wèn)題拆分成相應(yīng)組成部分及設(shè)計(jì)小項(xiàng)目原型的能力,這些能力能幫助你學(xué)習(xí)新的技術(shù)、類(lèi)庫(kù)和方法。這些對(duì)任何一個(gè)職業(yè)程序員來(lái)說(shuō)都是重要的能力,現(xiàn)在它們也能用在初學(xué)機(jī)器學(xué)習(xí)上。
要想有效地學(xué)習(xí)機(jī)器學(xué)習(xí)你必須學(xué)習(xí)相關(guān)理論,但是你可以利用你的興趣及對(duì)知識(shí)的渴望,來(lái)激勵(lì)你從實(shí)際例子學(xué)起,然后再步入對(duì)算法的數(shù)學(xué)理解。
通過(guò)本文你可以學(xué)習(xí)到程序員初學(xué)機(jī)器學(xué)習(xí)的四種方式。這是給技術(shù)人員設(shè)計(jì)的實(shí)用方法,并以實(shí)驗(yàn)為依據(jù),你需要做調(diào)研并且完成實(shí)驗(yàn)才能建立自己的感性知識(shí)。
這四種方法分別是:
你應(yīng)該通讀一下這些方法的策略,然后選擇你覺(jué)得最適合自己的一個(gè),并且有選擇性地執(zhí)行。
選一個(gè)你喜歡的工具或者類(lèi)庫(kù),然后學(xué)著用好它。
我推薦你從一個(gè)自帶數(shù)據(jù)預(yù)處理工具,機(jī)器學(xué)習(xí)算法并且能呈現(xiàn)結(jié)果的工作平臺(tái)開(kāi)始學(xué)習(xí)。學(xué)習(xí)這樣一個(gè)工作平臺(tái)能讓你更熟悉機(jī)器學(xué)習(xí)從頭到尾的整個(gè)過(guò)程,這比學(xué)習(xí)一個(gè)特定的數(shù)據(jù)處理技術(shù)或者一個(gè)機(jī)器學(xué)習(xí)算法更有價(jià)值。
或者,也許你感興趣的是一個(gè)特定技術(shù)或者一類(lèi)技術(shù)。你可以利用這個(gè)機(jī)會(huì)更深入地學(xué)習(xí)一個(gè)提供這些方法的類(lèi)庫(kù)或工具,掌握了提供這些技術(shù)的類(lèi)庫(kù)能幫助你掌握相應(yīng)的技術(shù)。
一些你可以采取的策略有:
一些值得考慮的工作平臺(tái)有:R, Weka, scikit-learn, waffles, 和 orange.
選一個(gè)數(shù)據(jù)集,然后深入地理解它,發(fā)掘究竟哪類(lèi)算法最適合處理它。
我推薦你選擇一個(gè)中等大小的,內(nèi)存能放下的,可能被很多人研究過(guò)的數(shù)據(jù)集?,F(xiàn)在有很多非常好的包含數(shù)據(jù)的類(lèi)庫(kù),你可以瀏覽它們并且從中選擇。你的目的是嘗試?yán)斫膺@個(gè)數(shù)據(jù)集背后的問(wèn)題,它的結(jié)構(gòu),和哪些種類(lèi)的解決方法最適合這個(gè)問(wèn)題。
用一個(gè)機(jī)器學(xué)習(xí)或者統(tǒng)計(jì)的工作平臺(tái)來(lái)研究這個(gè)數(shù)據(jù)集。這樣你能專(zhuān)心解答關(guān)于這個(gè)數(shù)據(jù)集你要研究的問(wèn)題,而不是分心去學(xué)習(xí)某個(gè)特定的技術(shù)或者如何寫(xiě)代碼來(lái)實(shí)現(xiàn)它。
一些可以幫助你學(xué)習(xí)實(shí)驗(yàn)性的機(jī)器學(xué)習(xí)數(shù)據(jù)集的策略有:
你可以從這些包含高質(zhì)量數(shù)據(jù)集的庫(kù)中選擇: UCI ML Repository,Kaggle 和 data.gov.
選擇一個(gè)算法,深入理解它,發(fā)掘什么樣的參數(shù)設(shè)置在不同數(shù)據(jù)集上都穩(wěn)定。
我推薦你從一個(gè)中等復(fù)雜度的算法開(kāi)始學(xué)起。選一個(gè)已經(jīng)被人充分理解了的,有許多可選的開(kāi)源實(shí)現(xiàn),并且需要你探索的參數(shù)數(shù)目較少的算法。你的目的是建立有關(guān)這個(gè)算法在不同問(wèn)題和不同參數(shù)設(shè)定下表現(xiàn)如何的直覺(jué)。
使用一個(gè)機(jī)器學(xué)習(xí)平臺(tái)或者類(lèi)庫(kù)。這樣能讓你把這個(gè)算法當(dāng)成一個(gè)“系統(tǒng)”,專(zhuān)心研究它的表現(xiàn),而不是分心研究數(shù)學(xué)公式描述或者相關(guān)論文。
一些學(xué)習(xí)你選定的機(jī)器學(xué)習(xí)算法時(shí)可采取的策略有:
你可以學(xué)簡(jiǎn)單點(diǎn),也可以學(xué)復(fù)雜點(diǎn)。想多學(xué)一點(diǎn)的話,你可以探索所謂的啟發(fā)式規(guī)則或經(jīng)驗(yàn)法則來(lái)使用算法,并且以實(shí)驗(yàn)為依據(jù)來(lái)展示它們好不好用,及如果好用的話在什么條件下他們與成功的結(jié)果有關(guān)聯(lián)。
一些你可以考慮學(xué)習(xí)的算法有:最小平方線性回歸,邏輯回歸,K最近鄰分類(lèi)算法,感知器算法。
選一個(gè)算法,然后選一個(gè)編程語(yǔ)言來(lái)實(shí)現(xiàn)它,或者把一個(gè)已有的實(shí)現(xiàn)移植到你選定的編程語(yǔ)言上。
你應(yīng)選擇一個(gè)中等復(fù)雜度的算法來(lái)實(shí)現(xiàn)。我推薦你仔細(xì)研究你想要實(shí)現(xiàn)的算法,或選擇一個(gè)你喜歡的已有實(shí)現(xiàn)然后把它移植到你選定的編程語(yǔ)言。
從頭開(kāi)始實(shí)現(xiàn)一個(gè)算法,是學(xué)習(xí)那些關(guān)于把算法描述轉(zhuǎn)換成一個(gè)可行的系統(tǒng)的過(guò)程中必須要做的無(wú)數(shù)的小決定的好方法。在不同算法上重復(fù)這個(gè)過(guò)程,很快你就能對(duì)讀懂論文和書(shū)里面算法的數(shù)學(xué)描述有感覺(jué)了。
五個(gè)能幫助你從頭開(kāi)始實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法的策略有:
以上四個(gè)策略屬于我稱(chēng)為“小型項(xiàng)目”的方法論。你用這個(gè)方法可以很快建立在技術(shù)領(lǐng)域(比如機(jī)器學(xué)習(xí))方面的實(shí)用技能。大意就是你設(shè)計(jì)并且親手完成解決特定問(wèn)題的小項(xiàng)目。
小型項(xiàng)目在幾個(gè)方面應(yīng)該足夠小,才能保證你能完成它們并且從中學(xué)習(xí),然后好步入到下一個(gè)項(xiàng)目中去。下面是一些你應(yīng)該考慮加在項(xiàng)目上的一些限制:
這些策略的原則是讓你利用你的程序員技能開(kāi)始行動(dòng)。下面是三條幫助你調(diào)整思維模式,有助你開(kāi)始行動(dòng)的小貼士:
下面是這些策略的一句話清晰總結(jié),可以幫助你選擇適合自己的那個(gè)。
選一個(gè)吧!
如果你喜歡這篇自學(xué)策略文章,作者創(chuàng)建了一個(gè)32頁(yè)的有關(guān)學(xué)習(xí)并實(shí)踐應(yīng)用機(jī)器學(xué)習(xí)的PDF指導(dǎo)手冊(cè)。看這里:
小項(xiàng)目方法論:學(xué)習(xí)并實(shí)踐應(yīng)用機(jī)器學(xué)習(xí)
作者還創(chuàng)建了一個(gè)包含90個(gè)項(xiàng)目想法的清單,作為附加福利加在這個(gè)指導(dǎo)里面了。
原文鏈接: Jason Brownlee 翻譯: 伯樂(lè)在線 - XiaoxiaoLi
譯文鏈接: http://blog.jobbole.com/67621/

我們?cè)谖⑿派?4小時(shí)期待你的聲音
解答本文疑問(wèn)/技術(shù)咨詢(xún)/運(yùn)營(yíng)咨詢(xún)/技術(shù)建議/互聯(lián)網(wǎng)交流