Sataya Nadella 跳著進入會議室,迫切要討論智能。我當時正在華盛頓州雷德蒙德的微軟總部,該公司的 CEO 正在滔滔不絕地描述該公司在更智能的應用和服務上的進展。他告訴我,他每天早晨都會帶上一副 HoloLens,這樣他就能看見投影在墻上的虛擬交互式日歷。 Nadella 說他有點暈。這個系統智能、多產又富有未來感:這是他希望的微軟在他的領導之下所應具備的一切。
Nadella 說無論我們未來在哪里工作,微軟都會在那里占有一席之地。三月,微軟提出了"對話即平臺(conversation as a platform)",這是一個賭注——押注基于聊天的接口將超越應用作為我們使用互聯網的主要方式:尋找信息、購物和獲取各種服務的接口。多虧有了微軟提供的「認知 API」,應用會變的越來越智能,能理解不同的臉、情緒和其他包含在照片和視頻中的信息。
經過近 20 年在機器學習和自然語言處理上的進展,微軟認為自己有了最好的"大腦",能實現一個人工智能驅動的未來。微軟在中國的早期實驗讓其在情感 Bot 上占有領先地位。在幾大巨頭中,微軟第一個發布了一個真正的基于聊天接口的平臺——這是值得在智能手機興起過程中靠邊站的微軟驕傲的一點。
戰略
當然,微軟不是唯一一家正在嘗試為下一代計算建立定義平臺的公司——如果對話最終會變成那個平臺的話。所有主要的技術公司和一群初創公司都在打造人工智能分支,而且常常會有令人印象深刻的結果。但是這里值得一提的是,很難在各大公司的人工智能技術間做比較,甚至幾乎是不可能的。因為很多像谷歌、Facebook 和亞馬遜這樣的公司還沒有公開目前的工作。當被問及他們在做的人工智能有什么區別時,這些高管們總會打馬虎眼。比如谷歌 CEO Sundar Pichai 總會避重就輕地說,我們的人工智能工作已經開展「很長時間」了。
常駐風投公司 Andreessen Horowitz 的未來主義者 Benedict Evans 最近在博客中寫道未來的人工智能還不清晰。「這個領域發展得非常快,很難說哪一塊必然能成為最強大的一支,什么東西將會變成商品,以及最強的差異在哪里。」他寫道,「即便圍繞這些技術的計算機科學大部分都正被發布和開源,但其實施也是不平凡的——這些技術還不一定會成為商品。」
陸奇很高興自己做的事情成為微軟競爭優勢。陸奇是 Nadella 高級領導團隊的十幾位成員之一,負責監督微軟的應用和服務團隊。他還是一個計算機科學博士,名下擁有 20 項專利,在同事之間廣受尊敬。幾分鐘后,我開始理解原因了——他智力超群,說話時不耐煩地敲著腿,好像他在為說得不能跟思考一樣快而感到沮喪。我們見面時,他穿著襪子、涼鞋、短褲和 T 恤——上面印有三個詞:「Make epic shit(做史詩級的玩意兒)」。
陸奇順著移動互聯網第一波浪潮的低潮開始了自己的職業生涯。他說移動設備流量的百分比從來沒有超過臺式電腦,這說明用戶在移動端體驗上受挫了。「我們知道網絡沒有真的在手機上工作,」陸奇說,除了少數幾個大類的應用,用戶不愿意下載其他應用。西雅圖居民可能會被要求下載一個應用程序來檢查他們一年內只乘坐幾次的渡輪的票價——肯定會有更好的模式。「我們的產業界還未建立一個可以釋放整個移動和云的價值的體驗平臺,」陸奇說,「基本上來說,應用還不是恰當的模式。」
代替基于 HTML 的網頁作為接口的應用興起是因為目前來看它是最好的選擇。你不能只是喊著要你想要的東西從互聯網進入你手機,就能讓開發者建立復雜的隱藏管道,并且讓你通過大大的圖形按鈕與它互動。按鈕仍然是完成很多事情的最有效途徑。但是隨著自然語言處理技術上的進展,現在你真的可以只用喊來讓你想要的東從互聯網進到你的手機。陸奇說下一代的「體驗平臺」將從對話那里開始。因為它更自然地適合人類的行為方式。他說:「我們看到一個完整的頻譜:使用語言作為基線,以一種有思想的、有意義的方式使用圖形交互來提升體驗。」
陸奇說一個公司想要贏,就得有五個「關鍵資產」。第一個是「談話畫布(conversation canvas)」,一個人們可以大量交談和發短信的地方。微軟有 Office 軟件、Outlook、Skype 和小娜。第二個是人工智能「大腦」,一個復雜的世界思維模型。微軟說他們自己的人工智能工作可以追溯到 20 年前。第三個是社交圖譜(social graph)的使用權——人們在互聯網上的活動經常涉及到他們的朋友和同事。并非巧合的是,在我遇上陸奇的幾天后,微軟宣布將花 262 億美元收購 LinkedIn 及其 4.33 億注冊用戶。
第四個是一個人工智能運行平臺。微軟有 Windows 和一系列設備,其中值得注意的是 Xbox。最后一個是開發者迫切想在你的平臺上建立的一個網絡,并且會為這項特權付費。引發興趣一直是微軟三月舉辦的 Microsoft Build 開發者大會的首要目標。
個別上看,微軟的每個資產有很強的競爭對手。例如,Facebook 及其一系列消息應用程序可以說是一個更強大的對話平臺,例如;它確實有著最大的社會圖譜。谷歌的「大腦」也許更聰明,它連接著數百萬個安卓設備。但是整體上看,你就能明白微軟為何會如此自信了。「有這五個資產放在一起,」陸奇說,「我相信我們可以引領未來。」
大腦
微軟全面擁抱人工智能始于兩年前的 Code 大會。而三個月前剛剛成為微軟 CEO 的 Nadella 出現在大會講臺上,討論著微軟的未來。在他講話結束時,他展示了 Skype 內部的一個新特征。兩個微軟職員上臺演講,一個用英語,一個用德語,Skype 同聲傳譯了他們的講話,讓他們打破了語言交流障礙。這是一次令人印象深刻的演示,Nadella 宣布了年末它就能變成產品進入市場。
對回到雷德蒙德的 Skype 團隊來說,Nadella 的時間表猶如一枚重磅炸彈。「我太驚訝了,」微軟研究的一位副總 Peter Lee 說。「Satya 真的把我們關進了 Skype Translator 這個監獄中。 」最初,這個團隊有兩個主要的擔心。一個是微軟研究從來沒有承擔過將產品推向市場的任務,研究人員擔心他們少了很多追求科學突破的自由。
另一個擔心是,Nadella 做這個演示的時候,Skype Translator 還不是很好。微軟的語言模型建立在大量正式演講上,比如聯合國的證詞。但是 Skype 需要翻譯的雙向溝通是非常不同的,里面有更多的「口頭語」,像是一個人在一個詞上來回說好幾遍,或者重復某句話。還有「代碼混合」的問題,比如講話的人在一個句子中使用多種語言,這在英語之外的語言中很常見。還有唱歌,顯然,事實證明人們在不斷地互相唱歌時,電腦很難分析歌聲。
「基本上說,沒什么是完成的,」Lee 說。「我們已經做好的只是訓練了我們所有的模型」。但是 Lee 的團隊重整旗鼓,擁護納德拉,于當年十二月發布了預告。明年這個產品就會在市場上廣泛而自由地和大家見面了。Lee 贊賞 Nadella 為「活動家」,他說最終這個項目做得很愉快。「想象一下,當你意識工作沒有一點進展時,你必須以某種方式讓人們重整士氣和排除恐懼,」Lee 說。「當你做到時,你會看到一些讓人驚訝的新東西。」
這感覺并不像在夸張。微軟現在可以在 8 種不同語言之間翻譯對話——總共 56 種不同組合。而且其底層技術已經對翻譯之外的領域產生了影響。你想看到某種令人難以置信地、甚至魔法般有用的 Bot 嗎?微軟正在 beta 測試能記錄商業會議并進行實時轉錄的軟件。這個軟件還能,比如說,在將一個兩人訪談的錄音轉錄下來的同時清晰地將兩個說話人區分開——這可能是所有存在過的記者都想使用的技術。
「我不能向你說明當我們首次實施它時,我們發現我們的員工在使用 Skype Translator 上效果不佳時有多么令人沮喪,」Lee 說,「但現在我們正在攀登這座高峰,我們有了這些語音和翻譯模型,尤其是語音模型——它們好得讓人震驚。」
與此同時,微軟正將人工智能資源大量投入到它的一些壟斷產品中:Windows 和 Office。人工智能的前景之一是它可以預測你的需求——這是 Google Now 的基礎,將交通,天氣和體育比分在你解鎖手機的時候推送給你。
微軟正在研究如何將這種人工智能納入到桌面。負責監督 Cortana 開發的 Marcus Ash 向我展示了一個原型版本的 Windows,該原型版本大量使用了云推理來預測我可能想了解什么。當 Ash 打開開始菜單,一系列建議活動 隨著 Cortana 一起出現:對你有意義的名字,你最近打開過的文檔,常見法語單詞的釋義(用戶即將去法國旅行)。得到允許后,Cortana 會將你的聯系方式,網頁搜索歷史和應用使用情況納入到它的推薦系統中。
并且它會隨著時間段變化——例如,軟件開發者可以提醒用戶他們的應用在早上或是午餐時間很有用。「得到你的允許后,使用你的對話,語境信息的想法,能使你更加高效,讓你覺得一切都在掌控之中,這太令我們興奮了,」Ash 說。「許多用戶體驗的工作都是圍繞著簡化,減少摩擦,并真正展現人工智能的力量來進行的。」
Ash 最喜歡的例子之一叫做「保險」(commitments)。得到你的允許后,Outlook 可以記下事件,比如你的老板叫你在周末前發給她一些東西——如果你沒有回復的話就會自動提醒你。「我的生活相當復雜,我想要忘記不需要記得的事情——特別是郵件,」Ash 說。最近他忘了回復他自己老板的要求,他說,但是 Cortana 及時提醒了他。
當我見到 Office 的市場全球副總裁 Kirk Koenigsbauer 后,我了解到更多這樣的事。他向我展示了許多人工智能使 Office 更易于使用的方式。在 2014 年 9 月,微軟推出了 Delve,一種包含在 Office 365 中的生產效率追蹤應用。該應用分析你花在郵件和會議上的時間,并在你的日歷中高亮出你為了做更多復雜的有意義的工作而延長出來的時間。它告訴你有多少人讀了你發的郵件,以及什么時候讀的。它會提醒你聯系你還沒有發郵件的同事。它甚至可以顯示你對你同事和你自己的郵件的回復時間。
一月,Verge 描述了技術產業對殺手級 Bot 的搜尋。接下來的幾個月中,大大小小的公司加快了發展進程。Facebook 開放了自己的一個 Bot 研發平臺,運行在它的流行的 Messenger 應用上。谷歌宣布 一個在 Allo(一款即將問世的聊天 App)內運行的新智能助手和亞馬遜 Echo 競爭對手 Home。基于聲音輸入的 Echo 吸引了很多開發者,而且據報道已經進入了 300 萬戶家庭,并已經通過它的 API 增加了 1200 項「技能」。
微軟以它在人工智能上的工作為驕傲,它迫切向外界傳遞著這一次想贏的愿望。六月,微軟邀請我來到它的園區采訪 Nadella 的幾個頂尖得力干將。他們正在將人工智能打入公司業務的每個角落。在接下來的兩天里,微軟向我展示了各種各種的應用,這些都是在自然語言處理和機器學習上的進展。
這家公司像以往一樣談論一個大游戲。發現技術的發展走向一直是微軟的歷史本能。但是這家公司在某一次使用這個本能時失手了。 它先于同行看見了智能手機和平板電腦的未來前景。但是蘋果和谷歌還是打敗了微軟。圍繞在微軟在人工智能上的問題很簡單:為什么這一次不一樣了?
在建立 Bot 上微軟獲得的成功已經比美國其他公司多了。但是你可能不會注意到,因為它的成功是從中國開始的。
2016 年 1 月,微軟眾多人工智能產品之一小冰出現在中國東方衛視的早間新聞上,代替了原有的天氣預報員。小冰這個名字的發音與微軟必應「Bing」發音相似,必應是微軟常年失敗的一個搜索引擎。但是這個小冰更加健談。攝像頭切到一個動畫圓上,它徘徊在一個虛擬平臺前。小冰的臉換成了麥克風圖像,用柔軟的女性嗓音播報天氣,甚至回答屏幕邊角上的問題。
如果你想知道為什么微軟如此看好 Bot,小冰就是一個很好的答案。必應的搜索工程主管 Derrick Connell說:「我不會夸張地說我們找到了殺手級 Bot——但是我們已經發現了一個以一種新方式滿足大家對聊天的各種期望的 Bot。」
2014 年,微軟在微信上開通小冰公共號;和微軟的虛擬助手小娜(Cortana)一樣,小冰能回答簡單的問題。但是是以聊天的方式。這個 Bot 對情緒很敏感,能記住你們之前的聊天內容。如果你正在經歷分手,小冰也許能夠查探出來,并會問你還好嗎。
開通三天后,小冰在微信上的聊天累計達 150 萬次。之后小冰在新浪微博上也開通了賬號,后來也成為了十分流行的名人賬號。今天已有 4000 萬人使用小冰,與每個粉絲的平均聊天多達 26 輪。
對 Connell 來說,小冰指明了通向下一代搜索的路。傳統上的網絡查詢會返回到一個有 10 條藍色超鏈接的頁面;完美的對話 Bot 會直接返回到正確的答案。
當然,在中國的成功無法復制到美國。(微軟第一個英語語言機器人實驗 Tay 失敗了。)小冰首次亮相的兩年后,還沒有出現一個操英語的小冰,沒人著急這個事情。但是微軟的高管說,小冰背后的基本架構對公司來說是個巨大的機會。
「這就是現代——你不必成為語音和語言理解專家,」Connell 說,「只要使用我們的工具就行了。用我們的工具去建立自己的品牌 Bot,讓它運行在任何一個平臺上——可以是 Slack ,也可以是Facebook Messenger 。我們希望它能像 Skype 或 Windows 那樣成功。但選擇權在你。」
開發者們恐懼可能會出現 Bot 標準之爭,而微軟的外交卻一反常態。六月微軟在舊金山組織了一場大會,促進 Bot 開發商之間的合作。「我們對 Bot 的互相操作真的很感興趣,我們想有一個 Bot 生態系統,」微軟高級工程師,此次大會(Botness)的組織者 Lili Cheng 說,「它更像是,我們能發現我們能合作解決的問題和挑戰是什么?」
但是微軟希望通過 Botness 大會把自己置于這場 Bot 變革的中心。如果這家公司成功了,它將會在移動時代有一個全新的開始。在該公司的技術的驅動下,Bot 能出現在世界上最流行的消息應用中,讓微軟在這個新世界里有一個有利可圖的立足點。
如果你的機構像許多大的硅谷公司一樣使用谷歌應用,那你就會對 Delve 感到出乎意料。你不需要像一個呆子一樣自己去找這些有用的信息。如果你是一個經理,僅瞟一眼的時間,Delve 就可以告訴你在過去一周你在你的每個雇員身上花了多少時間。這種智能不像普通的人工智能一樣性感,不能預測你所有的需求——但是它今天能被實現,它能運作,并且相比之下,谷歌應用看起來像一灘疏于管照的死水。
搜索令人滿意的機器人六個月后,我仍然看好這個普通的概念。它們采用的交互方式比 1-800 號碼和被遺忘的小商業網站要豐富得多。但是我在 Facebook Messenger 和 Telegram 上看到的東西令我失望:有時它們被認為是使用互聯網的最慢方式。看起來大多機器人的功能僅比 SmarterChild 時代的 AOL 即時通訊機器人多,并且它們通過古董的按鈕圖形界面輸入。目前圍繞機器人和人工智能的討論仍然靠商業利益驅動,而不是消費者對這項服務的需求。
大體上,各公司至今對這個問題的回答都是他們正在想辦法。「像許多高科技一樣,人們假設它現在已經被實現了,」當五月份我問 Facebook 首席技術執行官 Mike Schroepfer 時他回答說。「并且現在有更多技術驟待發展,更多的工作需要做。我認為隨著時間的推移,這個問題會得到改善。」
但是參觀微軟使我想知道我還沒有以錯誤的方式思考這個主題。基于聊天的接口通常都單調乏味。但是機器學***增強了它們,并且已經被應用于你一直在用的工具中了。如果微軟可以普及像 Delve 一樣的智能到它的各個服務中,那么很合理的說,它就可以提供世界上最強大的生產力套裝。即使大量強大的聊天機器人平臺無法實現,這之中也蘊藏了巨大價值。在早期階段,機器人在前臺經常說不出話,這很令人沮喪。但是當它們在后臺運算的時候,有點像在變魔術。
(本文來自機器人e資訊微信號。謝謝作者付出!)
評論
查看更多