除Google、Facebook以外的公司們,該如何打造自己的機器學習團隊?作者給出了自己的建議:小公司,雇用擅長工程和數據的ML人才;中型公司,聘請一位優秀的機器學習研究人員,雇傭更多的機器學習工程師,協同增效,各盡其職;大公司,避免從頭建立自己的機器學習基礎設施,鼓勵工程師掌握機器學習。
最近,來自不同規模、不同行業的朋友一直問我同樣的問題:
“我如何將機器學習應用到我的公司里?”
這些人知道充分利用機會學習的話會得到甜頭。而這里面每個人的困境都是如何將其轉換成現實,如何發揮作用,如何雇用人員并獲得成功。
所以,我根據這些公司不同的業務規模,給予不同的建議:
當你只是個小團隊…
以下是我對處于早期創業階段的公司或非盈利機構關于如何打造機器學習團隊的建議:
對于一家小型的、沒有資金或資金不足的公司來說,在企業內部獲得機器學習專業知識應該是不可能的。但好消息是,許多機器學習從業者都對這種工作感到興奮。
尋找那些關心公司使命的人。在這個規模上,您將依靠您的機器學習從業者實現從數據收集和清理到部署的端到端的一切。
雇用工程和數據專業的人才肯定是小企業的首選。那些已經返回校園或者線上工作的經驗豐富的工程師可以順利完成這些工作。因為目標并非完美,所以要讓系統端到端工作,然后慢慢優化所有步驟。如果是我選擇候選人,我會選擇簡歷里展示了參加一些Kaggle比賽或自我導向的項目,開朗務實的人也是好的選擇。那些希望在構建和測試模型之前將一種模型應用于所有內容,或者想要花費數月優化數據管道的研究人員卻不是合適的人選。
當你已經發展成了一個中型公司…
當那些對機器學習應用程序感興趣的不初創公司或中型企業建立機器ML團隊時,我建議他們采取略微不同的方法。與谷歌不同,你不能雇用很多研究人員,因為你不需要他們來撰寫研究論文。
成功組建團隊的關鍵是聘請一位非常優秀的機器學習研究人員,并讓他與數據工程師合作,以提高他們的工作效率。這樣的人才就像珍貴的寶藏,請不要讓他們編寫代碼,把他們安排在想要學習機器學習的工程師中,實現“王者帶青銅”。
一些公司建立了一個功能性的機器學習小組,而一些公司將機器學習嵌入到團隊中。很多人對此褒貶不一,但我必須實事求是地說,這兩種組織結構都有效。
一個機器學習團隊如何真正幫助人才?這通常是最大的瓶頸。您需要仔細管理團隊,以確保他們正在為公司執行最相關的任務。在整個組織中合理分配機器學習專業知識是很實用的,因為這樣機器學習專家就可以接近最終用戶,但它也會使招聘更加困難。
雇用更多的機器學習工程師而不是機器學習科學家,并且保證分配給他們的任務是匹配適合的,這點至關重要。
通常來講,機器學習團隊進行算法優化的操作通常與商業需求并不相符。如果沒有一個有效的端到端系統,這種錯位可能會長達數月。另一個常見問題是需要更改或更新訓練數據,但在訓練和部署算法之前人們往往不會發現數據需要更新。因此,在更新數據之前,讓端到端系統盡可能快地進行就變得至關重要。
成為大公司后,也有困境…
與很多大公司合作,我一次又一次地看到了相同的錯誤。在這個范圍內,一家公司能夠雇用優質的ML人才,但沒有更多預算與行業巨頭競爭。
Facebook和谷歌的精英團隊正在使用標準的開源模型和架構。最近,我與許多財富500強企業進交談時發現,這些企業正在建立自己的神經網絡架構而不測試是否有必要這樣做。
機器學習研究人員喜歡做研究,而管理者則欺騙自己:研究人員正在構建有價值的IP。事實上,他們并非如此。他們浪費了大量的時間來進行一些重復的事情,而那段時間最好花在最新的尖端模型上。最好從最簡單,最標準的事物和層著手,每增加一部分都應該保證能對算法的性能產生重大影響。
大公司應避免建立自己的機器學習基礎設施。我與之交談的所有科技公司幾乎都在建立自己的定制機器學習堆棧,并且感到非常興奮。使用開源工具比構建和維護自定義基礎架構更具可持續性。
大公司應該培訓他們的工程師進行機器學習。工程師非常渴望學習機器學習,如今的基礎工具使得這個想法變得更容易。在這一點上,我認為培訓工程師學習機器學習比培訓機器學習從業者如何成為優秀的工程師更有效率。無論如何,具有一些機器學習培訓的工程師可以通過多種渠道發揮作用。一些公司正在這樣做,但我很驚訝更多的公司沒有明白這一點。
?
建立機器學習團隊真的值得嗎?
招聘ML團隊既昂貴又需要大量工作。一些公司雇用一支ML團隊,但目的只是為投資者檢查一些設備,這就太浪費資源了。無論公司的規模如何,如果沒有明確的機器學習應用程序,這家公司必然會后悔進行這項投資。所以,組建之前,要問自己的關鍵問題是:
1)我有需要通過機器學習才能解決的問題嗎?
2)我可以獲取相關的培訓數據嗎?
3)我試圖解決的問題對我的業務至關重要嗎?
如果你對所有這些問題回答“是”,那么就可以著手準備了。
-
神經網絡
+關注
關注
42文章
4762瀏覽量
100537 -
機器學習
+關注
關注
66文章
8377瀏覽量
132407
原文標題:不止是Google才能創建機器學習團隊,收下這份創業公司ML團隊寶典
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論