企業需要了解圖像識別、語音識別、聊天機器人、自然語言生成、情感分析如何改變其業務的運營方式。
人工智能技術正在將其自身融入業務的各個方面。重要的一些人工智能技術包括圖像識別、語音識別、聊天機器人、自然語言生成和情感分析。
需要明確的是,每種類型的人工智能技術都代表廣泛的類別,通常包括數十個甚至數百個基礎組件。反過來,通常將這些組件重組為更復雜的應用程序,為企業創造價值。
例如,百貨商店人工智能機器人可以在工作中使用圖像識別、視頻和語音識別技術。圖像識別軟件將使其能夠檢查貨架上庫存的位置、價格和數量;視頻將幫助其避免遇到任何障礙,并確定其在商店中的位置;語音識別組件將使其能夠引導和娛樂客戶。
為了取得這種成就,這些業務中的人工智能技術通常結合了針對整個任務的特定部分量身定制的各種算法和技術。它們包括符號處理、統計分析、神經網絡等等。
以下是對五種人工智能技術的深入闡述,這些技術隨著時間的推移而發展,從而極大地改變了企業處理、分析和生成數據的方式。
1.圖像識別
企業使用圖像識別的各種方式包括:在工廠生產線上進行自動檢查,在保險中生成損壞估計,在圖像中識別物體,對人員進行計數,控制制造過程,檢測諸如顧客進入商店等事件以及生成真實世界的模型。
人工智能技術必須找到一種方法,采用各種人工智能算法可以處理的數字來描述世界。在視覺方面,研究人員發現了如何將一張圖片劃分成一個像素網格,這樣每個像素都可以表示為一個數字。在早期,采用一個數字來描述每個像素的亮度。后來,人們發現可以用三個或更多的數字來描述每個像素中不同顏色的亮度。
20世紀60年代,研究人員開始探索如何使用原始形式的光學字符識別(OCR)技術的軟件圖像識別功能來識別數字文檔中的字符。其他研究人員開始探索基于圖像的場景解釋技術,試圖從二維圖像重建三維圖像。多年來,這些技術已成為機器視覺行業工具包的一部分。
后來,研究人員發現可以將圖像識別組織為一個分層過程,以使其更易于解釋日益復雜的現象。例如,黑色和白色像素可能被識別為線條和曲線,而線條和波浪形又被識別為數字的一部分。訓練算法來學習基于這些曲線圖案而不是每個像素的亮度來解釋字符的方法要容易得多。類似地,更容易根據圖像是否包含兩只眼睛和適當形狀的耳朵來確定圖像是否是貓,而不是根據每個像素中顏色的原始亮度來確定。
這種處理方式有望推進圖像識別領域。然而直到2012年左右,隨著AlexNet(一種設計用于支持圖像識別的八層卷積神經網絡)的發展,研究人員才發現如何擴大這個過程以識別成千上萬種不同類型的物體。
諸如AlexNet之類的深度學習技術的優點在于,該模型可以自動學習以不需要人類以編程方式指定每個步驟的方式來執行各種圖像識別任務。研究人員指出了如何將神經網絡應用于不同類型的問題,該功能也促進了深度學習在其他類型的應用程序中的使用。
如今,圖像識別用于識別貨架上的產品、圖片或視頻中的人物,生產流水線上的缺陷以及自動駕駛汽車在街道上遇到的物體。隨著冠狀病毒疫情的出現,很多企業正在開發應用程序以監視社交距離的規則。
對于企業領導者來說,一個關鍵的見解是,通常有可能通過在應用程序中使用多種類型的圖像識別來創造更多的價值。例如,智能文檔處理和文檔智能結合了一組人工智能技術,其中包括自然語言處理和機器學習,以捕獲難以識別的格式中的數據并將其分類。與光學字符識別(OCR)結合使用,智能文檔處理可以分析文檔的視覺布局,以確定哪個部分代表產品、發票金額或銷售條款,并將該信息提供給其他業務應用程序。
值得注意的是,企業中大多數圖像識別應用程序都是高度場景相關的。供應商和研究人員經常宣傳新的圖像識別改進,例如在識別腫瘤方面擊敗了醫學專家的軟件。但是在實踐中,僅當圖像以正確的角度捕獲時,人工智能才可以使用一組特定的設備來處理這些放射線圖像,而人類則善于分析從許多不同角度捕獲的各種圖像。
研究人員還發現,在這些圖像識別應用程序的一些實現中也潛藏著偏見。為了減少偏見,專家建議對這些應用程序進行數據訓練,這些數據代表將要處理的特定類型的圖像。
2.語音識別
需要多種算法將語音轉換為文本并準備進行數字處理。盡管語音識別系統變得越來越好,但是即使是當今最好的語音識別系統也仍然容易出錯,因此在安全關鍵型應用(例如醫療數據捕獲)中需要進行一些驗證。
貝爾實驗室的研究人員于1952年開發了首個用于識別單個數字的語音識別系統。到1962年,IBM公司推出了Shoebox機器,該機器可以理解16個單詞。到1980年代中期,研究人員開始使用統計技術(例如隱馬爾可夫模型)來開發可以理解2萬個單詞的應用程序,但其單詞之間會有停頓。第一款消費者聽寫產品Dragon Dictate于1990年發布,可以根據語音自動鍵入文字。然后,AT&T公司推出了一種語音識別應用程序,該程序無需人工即可路由呼叫。這些早期的系統或者具有適合特定環境的小型詞匯表,需要由單個聲音進行大量訓練。
研究人員從2010年開始發現了將深度神經網絡應用于語音識別的方法。這一增長的主要推動力之一是需要找到更好的方法來代表不同類型智能音箱的聲音特征。這要求探索出更好的方法,將原始音頻數據轉換為人類習慣于收聽的獨特聲音(稱為音素)(例如,“汽車”一詞中的“c”)。
研究人員還將基本的語音識別結果與更好的場景結合起來,以區分同音異義詞(bear/bare)。云計算服務現在提供了各種核心的語音轉文本服務,開發人員隨后將其融入各種企業工作流程中。
基本的語音識別功能通過云計算服務(如微軟Cortana、谷歌Now和蘋果Siri)嵌入到現代智能手機和電腦中。亞馬遜公司利用語音識別技術推出了一種新的方式,通過Alexa語音服務在智能手機之外連接互聯網。這些服務通常在云平臺中完成繁重的工作。最近,谷歌公司通過開發更有效的算法來提高標準,這些算法可以在其Pixel手機上本地運行語音識別應用程序。
語音識別技術在企業中的使用正在增加。一些供應商還開始開發用于自動記錄電話會議和現場會議的應用程序,以達到合規目的或更好地記錄決策過程。自動化語音識別還可以幫助監視呼叫中心的活動,以確保工作人員遵循正確的程序,從而使管理人員不必聽到每個呼叫。語音識別應用程序也正用于為國際旅行者自動進行語言翻譯。這項人工智能技術的其他商業應用包括家庭自動化、視頻游戲交互以及將視頻編入索引的自動隱藏式字幕。
3.聊天機器人
對話式人工智能技術允許應用程序以自然的方式與人類交互。第一個聊天機器人Eliza于1964~1966年在MIT人工智能實驗室開發。最早的聊天機器人在詞匯量和可以允許的交互類型方面受到限制。這些應用程序使用決策樹,該決策樹根據查詢或用戶對問題的答案沿各種路徑進行操作。在20世紀80年代到90年代,這些技術擴展到了自動電話應用程序,在其中,通過使用IVR技術的撥號音響應或簡單詞匯來控制交互。
最近,由于用于解釋和響應文本查詢的更好的自然語言處理技術,以及與其他服務的更好集成,使得企業能夠更容易地自動設置能夠響應常見問題的聊天機器人,聊天機器人的應用程序激增,接受命令或自定義對給定用戶的響應。最近聊天機器人可應用程序的一個關鍵見解是開發用于表示用戶意圖和適當響應的應用程序編程框架。
面向外部的聊天機器人可以幫助實現客戶交互的許多方面的自動化。它們還允許企業以一種更具吸引力的方式跨各種社交媒體渠道(例如Facebook)進行推廣。
企業的應用程序開發和部署方面已經看到了使用聊天機器人技術的爆炸式增長,該技術將聊天機器人與可自動配置應用程序和基礎設施并生成報告的操作工具結合在一起。聊天機器人集成使團隊可以記錄其流程,從而更輕松地應對重復出現的問題,或者確定過去特定流程的執行方式。
聊天機器人工具開始進入業務的其他方面,以幫助記錄部門內部或部門之間的各種通信,特別是隨著越來越多的公司采用Slack和Microsoft Teams等消息傳遞應用程序。財務部門可以使用聊天機器人來生成和跟蹤重要業務指標的狀態。銷售團隊可以使用聊天機器人收集有關關鍵客戶的數據。
聊天機器人還可以幫助促進其他類型的內部交互。例如,員工可能會詢問人力資源聊天機器人,以詢問有關其福利狀態的問題或要求休假。企業還使用聊天機器人來自動化與IT系統管理的交互,以處理簡單問題或自動分類更復雜的問題。
4.自然語言的產生
隨著數據量的增長,可能很難為員工或客戶確定正確的信息優先級。自然語言生成(NLG)應用程序可以幫助查找、組織和總結給定用戶的最適當見解。
根據業務用例的不同,這種人工智能技術有不同的風格。自然語言生成開始作為商業智能和分析應用程序的前端添加,作為Gartner公司創造的一個新的應用程序類別的一部分。這些技術結合了解釋純文本查詢和生成純英語分析的適當摘要的能力。例如,美國航空航天局(USAA)構建了一個自然語言生成(NLG)應用程序,以改進它向商業用戶提供的關于不同保險產品銷售情況的答案。
這種人工智能技術的另一個特點是改進了向用戶展示產品信息的方式。在這些類型的應用程序中,自然語言生成引擎可以根據用戶的偏好自定義產品的描述。例如,可能會向更多的技術用戶深入介紹諸如新手機耳機之類的產品的技術特性,而會向注重時尚的買家提供有關其外觀和感覺的審美描述。自然語言生成(NLG)還可以幫助改善將內容翻譯到新市場的方式。
Trulia公司正在使用自然語言生成(NLG)自動生成用于房地產列表的社區描述。自然語言生成(NLG)還被用于為美聯社制作基本的新聞文章。Esquire Singapore公司甚至精心制作了一本特刊,里面刊載了人工智能應用的故事。然而,這項人工智能技術還處于起步階段,專家提醒企業和醫療等關鍵任務應用需要新型的質量控制。
盡管如此,企業仍可能會受益于自然語言處理框架的各種最新改進。新的自然語言處理指標正在出現,以幫助企業評估給定框架的效用并改善自然語言生成(NLG)應用程序的這些實現。
5.情緒分析
人們在撰寫有關事件、品牌、政客和其他事物的文章時,通常會表達出不同的情感類型和強度。情緒分析領域始于20世紀50年代,當時市場營銷人員分析了書面文件的語氣。但這是一個非常人工的過程。不過,現在幾乎每個人都在社交媒體、博客、新聞評論、評論、支持論壇和與公司的通信中留下了情感的數字痕跡。
包括自然語言處理、機器學習和統計在內的各種人工智能技術都用于分析這些數字足跡的情感基調。這些工具有助于跟蹤產品或服務的更改如何影響客戶,而無需直接詢問人們。它也有助于密切關注競爭對手的產品和活動。
情緒分析的另一個用例可以識別所謂的品牌影響者,從而使企業與個人建立更牢固的關系,他們可以就如何改善服務或產品提供更好的建議。
情緒分析還可以幫助確定有關客戶或潛在客戶可能感興趣的事物的重要趨勢,以便企業可以改善其當前產品或創建新產品以滿足這些需求。企業還可以使用情緒分析來確定其品牌可能受損的特定原因,例如等待時間長、質量差或構思不佳。
企業在內部也在業務中使用這項人工智能技術來幫助理解和提高員工的士氣和福利。在這個用例中,情緒分析可以分析員工的職位,以幫助理解重要的問題或管理人員的變化可能對他們產生的影響。
更復雜的情感分析應用程序使用人工智能來理解聲音和面部表情所傳達的情感。該分析可以幫助識別支持電話期間的情緒變化,或評估顧客對商店貨架上新產品的看法。Netflix甚至嘗試使用面部表情情感分析來改進電影預告片。然而,一些研究人員警告說,情緒分析的這些應用可能會受到可靠性、特異性和概括性問題的影響。
責任編輯:tzh
-
機器人
+關注
關注
210文章
28205瀏覽量
206536 -
圖像識別
+關注
關注
9文章
519瀏覽量
38239 -
人工智能
+關注
關注
1791文章
46859瀏覽量
237584
發布評論請先 登錄
相關推薦
評論