人工智能領域的增速放緩,主要體現(xiàn)在AI應用程序的部署增長方面。原計劃23%的數(shù)據(jù)將在2019年被應用部署,而截至目前,只有5%的數(shù)據(jù)被應用部署,增長率明顯低于2018年。很顯然AI正在被某些“因素”拖累,比如相關領域企業(yè)員工缺乏相應的技能、企業(yè)可獲得數(shù)據(jù)的質(zhì)量以及對AI真實優(yōu)勢和用途的了解并不全面。
對于人工智能而言,大數(shù)據(jù)是人工智能研發(fā)的重要基礎。目前人工智能領域的研究細分有很多,包括機器視覺、自然語言處理、深度學習、機器人學、知識表示、自動推理等,研究方式上各有不同,但是數(shù)據(jù)收集、數(shù)據(jù)整理、算法設計、算法訓練等是它們繞不開的研究路徑,人工智能的核心是算法設計,但基礎仍是大數(shù)據(jù)。
而數(shù)據(jù)洞價值察或許仍是“穩(wěn)定”人工智能發(fā)展的重要因素,在細分領域上有著不同體現(xiàn),比如“增強分析”技術在數(shù)據(jù)與分析領域的應用、嵌入式人工智能在物聯(lián)網(wǎng)領域的應用、浮層互動技術在視頻領域的應用等。
“增強分析”的概念最先被Gartner在2017年提出,“增強分析”曾譽為「數(shù)據(jù)與分析市場內(nèi)的下一波顛覆性技術,是數(shù)據(jù)分析的未來」增強分析指的是在傳統(tǒng)分析功能中加入更多的增強功能,這些功能大多是通過人工智能、深度學習等技術來實現(xiàn),可以幫助分析人員對于數(shù)據(jù)進行自動化、精細化、結構化的分析,有利于進行更加精準的模型訓練,從而滿足多種數(shù)據(jù)分析需求。
當前的增強分析功能主要有兩種應用方式,一是幫助專業(yè)的數(shù)據(jù)分析師或數(shù)據(jù)科學家,通過數(shù)據(jù)建模來提升數(shù)據(jù)分析的能力。二是針對普通的用戶,增強分析可以支持他們訪問有效數(shù)據(jù),并對理論和假設情況展開測試與驗證,從而為分析計劃帶來更多自動化動能以及創(chuàng)新洞察力。在增強分析技術實現(xiàn)上主要包含以下三種工具。
1、增強數(shù)據(jù)準備(Augmented Data Preparation):采用機器學習(ML)/人工智能(AI)自動化來擴大和加速數(shù)據(jù)剖析和數(shù)據(jù)質(zhì)量、數(shù)據(jù)協(xié)調(diào)、數(shù)據(jù)建模、數(shù)據(jù)處理、數(shù)據(jù)聚合/推理,元數(shù)據(jù)開發(fā),以及數(shù)據(jù)編目,這種增強趨勢同樣能夠改變數(shù)據(jù)管理的各個方面,包括自動化數(shù)據(jù)集成和數(shù)據(jù)湖管理。
2、應用于分析和商務智能系統(tǒng)的增強分析技術(Augmented Analytics As Part Of Analytics And BI Platforms),該技術使商務用戶和“民間數(shù)據(jù)科學家”(Citizen Data Scientist,指那些能夠進行數(shù)據(jù)建模的非統(tǒng)計分析專業(yè)領域的人)無需建模和編寫算法,就能自動尋找數(shù)據(jù)規(guī)律,將相關結果以可視化的方式表達(比如相關性、例外、集群、連接和預測)。用戶通過可視化和對話界面來研究數(shù)據(jù),采用自然語言問詢技術來查找用戶情境下的最重要數(shù)據(jù)結果。”民間數(shù)據(jù)科學家”可以采用增強分析技術來客觀分析數(shù)據(jù)。
3、增強分析數(shù)據(jù)科學和機器學習(Augmented Data Science And Machine Learning)——采用ML/AI實現(xiàn)數(shù)據(jù)科學和ML/AI建模的自動化,比如特征工程和模型篩選,以及模型運行,模型解釋以及最后的模型校正和管理。增強分析技術的應用,將會降低對高級分析模型操作的技巧性要求。它向民間數(shù)據(jù)科學家和應用開發(fā)者開放了數(shù)據(jù)科學和ML內(nèi)容創(chuàng)造,最終,這些專業(yè)的數(shù)據(jù)科學家擁有更多的時間來聚焦創(chuàng)造性任務以及建立和運行最相關模型。
增強分析在企業(yè)銷售中的應用可以體現(xiàn)在精細化的數(shù)據(jù)洞察方面。過去,我們從銷售報表中可以看到銷售數(shù)據(jù)的上升或下降,通常最直觀的數(shù)據(jù)維度只有價格、產(chǎn)品質(zhì)量、人員因素等,但是這樣的推測并不是完全準確的,「增強分析」的應用可以通過BI工具獲取數(shù)十個甚至上百個維度,不光包括價格、用戶等直觀因素,甚至還包含天氣、環(huán)境、交通等外部因素。其應用的意義就在于通過更多工具分析更多維度,力求找到問題解決的最優(yōu)路徑,對數(shù)據(jù)全面洞察。
Gartner 公司的Julian Sun曾表示,目前的數(shù)據(jù)分析模式多是可視化形式,或者拖拉拽形式做數(shù)據(jù)分析,很有可能會造成另外一種孤島——分析孤島。這個時候用增強分析可以把這樣的增強分析模式放到業(yè)務情景當中,最契合業(yè)務實際做一些業(yè)務針織。
小結:在增強分析領域,數(shù)據(jù)洞察能力集中體現(xiàn)在分析維度會更加全面,那些曾經(jīng)不被大家注意的數(shù)據(jù)可能就是導致“結果”的原因,就像“蝴蝶效應”一樣。
嵌入式人工智能(Embedded artificial intelligence)
通過數(shù)據(jù)洞察帶來的“賦能”效果在物聯(lián)網(wǎng)領域和互聯(lián)網(wǎng)APP產(chǎn)品方面也有體現(xiàn),IDC和Forrester對2020年頂級人工智能的預測中提到,“至少 90% 的新企業(yè) APP 將包含嵌入式人工智能功能。然而真正有顛覆性人工智能主導的 APP 將只占總數(shù)的 10%”。
許多新的APP在前期設計中大都包含或多或少的人工智能功能,對數(shù)據(jù)的獲取和整理的能力有了顯著的提升,便于平臺方對APP的運營。而更深入地嵌入式人工智能應用正在圍繞物聯(lián)網(wǎng)領域展開。
嵌入式人工智能是讓AI算法可以在終端設備上運行的技術概念,更加直觀的理解就是讓手
機、音響、機器人、自動泊車等智能硬件,在不聯(lián)網(wǎng)的情況下獨立完成環(huán)境感知和人機交互等。對于AI工程師而言,將編寫好的程序嵌入到各類智能設備的控制主板中,再測試運行效果,即算法是否能高效地在主板上運行。
因為物聯(lián)網(wǎng)應用要求處理器設計,要提供面向最終用戶和應用程序的解決方案。物聯(lián)網(wǎng)應用的芯片設計強調(diào)功率效率,隨工業(yè)級人工智能技術的應用,越來產(chǎn)生越多的數(shù)字平臺,而下一代工業(yè)數(shù)字平臺的演進,就是讓工業(yè)設施可以在不同的網(wǎng)絡環(huán)境下運轉(zhuǎn),對各類主板芯片的需求隨之增加,研發(fā)集成效果是否優(yōu)異、軟件支撐平臺是否便利,就成為考量一款嵌入式處理器解決方案性能的主要因素。
同時,嵌入式人工智能技術正在解決物聯(lián)網(wǎng)設備所面臨幾個“痛點”問題,包括高延遲和低響應、網(wǎng)絡安全、數(shù)據(jù)隱私問題等。以數(shù)據(jù)隱私為例,物聯(lián)網(wǎng)設備在服務用戶或企業(yè)時,會產(chǎn)生大量的運行數(shù)據(jù),其中會包含一些隱私、機密信息,一旦隱私數(shù)據(jù)泄漏就將給企業(yè)、用戶帶來不同程度的損失。比如家庭物聯(lián)網(wǎng)中的攝像頭、掃地機器人在自動運行中產(chǎn)生的圖片、視頻泄露等,使用戶飽受損失。而嵌入式人工智能技術可以讓設備在非聯(lián)網(wǎng)的情況下獨立運行,一定程度上保證了數(shù)據(jù)的隱私性,另外隨著智能聯(lián)網(wǎng)設備的普及,集成智能設備的硬件終端也將隨之出現(xiàn),可以保證數(shù)據(jù)的“物理隔離”。
嵌入式人工智能也被稱作為邊緣計算技術。首先,智能終端并不是完全需要在云平臺上進行,會給通信傳輸帶來較大壓力,同時未來解決數(shù)據(jù)延遲和安全性等問題,邊緣計算逐漸開始被應用。今年華為發(fā)布了“昇騰910”AI芯片和“麒麟990”5G芯片,其中“昇騰910”是目前單芯片計算密度最大的芯片,計算力遠超國際同類產(chǎn)品。華為表示,將向全球開發(fā)者公布其技術參數(shù),共同打造AI生態(tài),推動AI產(chǎn)業(yè)落地。
小結:在嵌入式人工智能技術領域,數(shù)據(jù)洞察主要體現(xiàn)在對產(chǎn)品或技術的補足方面,讓物聯(lián)網(wǎng)終端設備具備獨立處理數(shù)據(jù)的能力。
浮層互動技術(Embedded interaction)
在視頻領域內(nèi),與浮層互動技術相對應的還有嵌入式互動技術,和嵌入式人工智能的技術實現(xiàn)上有較大差距。奈飛(Netflix)推出的《黑鏡:潘達斯奈基》(下文稱《黑鏡》)互動視頻,就屬于嵌入式互動技術。即,觀眾可以通過“互動點”自由選擇劇情走向。而《黑鏡》90分鐘的視頻時長中包含312個視頻素材和5個不同的結局。通常對視頻內(nèi)容層面的互動,被歸納為嵌入式互動,通常視頻內(nèi)容和互動工具在視頻制作過程中就嵌入到視頻格式之中,通過技術處理改變觀看體驗。
在生活服務、娛樂APP方面,抖音的“以視頻搜視頻”、快手的“AI寵物”、AI視頻廣告都屬于浮層式互動技術。我們通常把“彈幕”歸類為浮層互動技術的初級功能,通常浮層互動技術與視頻內(nèi)容(視頻編輯)沒有必然關聯(lián)性。就像“AI寵物”只是一個具備娛樂、工具屬性的功能,輔助視頻直播、優(yōu)化用戶體驗,但沒有“AI寵物”也并不影響直播的進行。彈幕、云圖廣告、AI寵物等,這些只是輕度的互動功能,更加深入的互動,需要視頻小程序來實現(xiàn)。極鏈科技以自研 VideoAI、VideoOS 為底層操作系統(tǒng),專注消費級視頻AI技術研發(fā)和商業(yè)應用,并持續(xù)投入小程序開發(fā)者生態(tài)的構建。
浮層互動技術的底層原理是“AI視頻識別”,即在不影響視頻播放的前提下,對視頻內(nèi)容的結構化處理。以人工智能技術為底層引擎的視聯(lián)網(wǎng)服務將會給浮層互動帶來更全面的應用場景,給視頻產(chǎn)業(yè)帶來新的增長點。在以下三個方面,視聯(lián)網(wǎng)的人工智能引擎得到了大幅的進步,初步具備了支撐一個產(chǎn)業(yè)的能力。
一是對視頻內(nèi)容信息的理解更加全面,即視頻標注維度越來越豐富。過去,在人工智能識別方面只有面部識別滿足商業(yè)化標準,但隨著近些年算力、算法、數(shù)據(jù)的的優(yōu)化、積累,人工智能已經(jīng)可以識別視頻中的人臉、物體、場景、品牌、動作、表情、事件、地標等多個類別和不同標簽維度。并且算力成本逐漸降低,使得浮層互動可以給視頻帶來更多的商業(yè)化應用。
二是對知識圖譜的構建更加完善,即數(shù)據(jù)的整理分類更具人腦思維邏輯。人們對視頻結構化數(shù)據(jù)的理解更深入,推動了知識圖譜的價值體現(xiàn)。一方面,知識圖譜的豐富性可以推動AI識別效率的提升,基于信息間的相互關聯(lián)性,可以減少識別所需的訓練樣本。另一方面,知識圖譜的完善有利于視頻商業(yè)價值的挖掘,例如在AI廣告方面除了選擇較好的廣告點位之外,還可以通過文字、表情、音樂等方面排除負面場景,從而提高廣告的投放質(zhì)量。
三是逐漸具備構建數(shù)據(jù)業(yè)務中臺的能力,包括服務視頻平臺、小程序開發(fā)平臺、廣告主操作平臺等多種數(shù)據(jù)業(yè)務中臺。比如計算資源優(yōu)先級處理和數(shù)據(jù)資源管理,以及數(shù)據(jù)調(diào)度等,讓視頻平臺方可以清晰且實時掌控視頻數(shù)據(jù)表現(xiàn)的綜合圖譜等。
浮層互動技術的應用,不僅要依托視頻內(nèi)容數(shù)據(jù),還需要深入理解消費者的視頻觀看習慣,從潛在需求出發(fā)滿足用戶需求,優(yōu)化小程序及其他相關功能的調(diào)用方式,以達到視頻內(nèi)容價值放大的效果。
隨著AI技術應用越來越廣泛,各種產(chǎn)業(yè)數(shù)據(jù)以“倍數(shù)”形式增長。大多數(shù)企業(yè)已經(jīng)意識到了數(shù)據(jù)中所隱藏的價值,但是還不具備挖掘數(shù)據(jù)價值的能力,所以導致了當前企業(yè)會花大的代價存儲數(shù)據(jù),而無法標注數(shù)據(jù)讓其產(chǎn)生價值的尷尬局面。因此,數(shù)據(jù)價值的洞察仍是未來人工智能領域發(fā)展的內(nèi)核。
評論
查看更多