精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

三問AI手機:什么意圖?怎么識別?何種框架?

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2024-08-21 17:45 ? 次閱讀

wKgaombFt0eAHuGiAAl7lPiTCKs883.jpg

早在幾個月前,就有媒體同行問我:AI手機到底是什么?跟智能手機有什么本質的不同?

試想一下,如果經常跟科技企業、技術趨勢打交道的媒體人、分析師都對何謂AI手機云里霧里,更別提門店銷售和消費者了。

2024被認為是AI手機元年,但今天走進線下門店,會發現店員和用戶都對手機里的AI有啥不一樣,感知并不明顯。

移動互聯網時代,我們常說手機是人“肢體”的延伸,可以讓我們的“手”觸及更遠的地方,“看”到更廣闊的事物。到了AI時代,手機是“大腦”的延伸,心念一動、言出法隨,手機會根據我們的使用習慣和意圖,主動提供有價值的服務。

所以,AI手機區別于智能機的一個更高階、更本質的能力,就是“意圖識別”。

目前,蘋果陣營、華為鴻蒙陣營、榮耀OV安卓陣營,都將意圖識別作為重點。

蘋果CEO庫克在AI系統“Apple Intelligence”的發布會上重點強調,在“蘋果智能(Apple Intelligence)”的支持下,Siri具備了精準識別用戶真正意圖的能力。

而安卓和鴻蒙用戶,恐怕對此并不陌生。

華榮OV等國產手機廠商早就上線了相應能力。榮耀在2023開發者大會上帶來了行業首個基于AI意圖識別的人機交互(IUI)操作系統——MagicOS 8.0;華為在HDC 2024上提出Harmony Intelligence,使得小藝能力大幅提升,能夠理解并預測用戶需求,并通過意圖框架與合作伙伴應用場景整合。

OV雖然沒有明確推出意圖框架等平臺,但也用行動參與其中。將大模型融入系統的底層設計中,升級OriginOS、BlueOS,來實現復雜的意圖識別和推理決策。

那么用戶又該迷惑了,各家都在說“意圖識別”,到底有啥不一樣呢?

“意圖”是人心中所想,帶有模糊和不確定性,“識別”結果也就有了很大的自由闡釋空間,廠商如何避免自說自話,把“手機懂你”這件事落在實處?

就要依靠一個操作系統級的全局意圖感知、理解、決策技術體系。

我們不妨把“意圖識別框架”這一新概念詳細拆分開,看看每一個環節的準入門檻是什么。

wKgaombFt0iASQcmAAJGPZz7Whc620.jpg

意圖識別的第一步,當然是搞清楚什么是用戶的“意圖”,也就是手機廠商所說的“懂你”。

但“意圖”并不是什么新概念。

早在互聯網時代,意圖識別就被應用于搜索引擎、廣告推薦等場景。比如用戶在搜索框輸入“抓娃娃”,底層的檢索策略要識別到這是電影需求,再去電影的數據庫里檢索,如果電影意圖識別失敗,返回的搜索結果中,根本沒有《抓娃娃》電影相關內容,或者要翻好幾頁才顯示,都會導致很糟糕的用戶體驗。所以,意圖識別很早是科技企業研究的對象。

那么,AI手機所謂的“意圖識別”,有啥特殊呢?

特殊在于,要游過深海。

今天手機所承載的“意圖”,有兩個特點:

一是范圍廣。一個動作或詞語可能對應多個意圖。現代消費電子設備的激增,帶來了豐富多樣的功能和服務,幾乎涵蓋了我們生活的方方面面,終端設備的多元、服務的多樣,經常會出現多種意圖,比如輸入“長城”,可能是景點、電影或者汽車,這就使手機的意圖識別更難做。

二是隱蔽性。傳統意圖識別可以根據用戶給出的query詞來進行判斷,屬于相對明確的“顯性意圖”,但日常使用手機時,還有大量隱性意圖,比如眼睛注視手機屏幕,可能是想看時間、看新消息通知或日程計劃;遺忘了出行計劃,可實際上航班時間應該重點關注……這些是用戶真實需要,但自己很少意識到或清晰表達出來的“隱性意圖”,由于無法被清晰表達,難以轉譯成計算機語言,自然也就難以滿足。

wKgZombFt0mASdMjAABGui_SUNI579.jpg

這些多且隱蔽的意圖,構成了一片“意識深海”,需要手機廠商跋涉而過,找到一條最短路徑。

由此,我們不難明確,AI手機意圖識別的意義:

首先是化繁為簡。通過洞察用戶真正的需求,簡化獲取服務的步驟。

比如榮耀的“任意門”功能,帶來了行業首個基于意圖識別的人機交互,只需一拖不到1秒即可完成以往8步10秒的操作流程。當用戶收到一條信息,復制之后,系統會自動分析語義并提煉關鍵內容,預判接下來的需求和操作,自動一步直達備忘錄、地圖等應用。華為智慧搜索支持“一鍵場景直達”、OPPO的ColorOS 14系統中的“流體云”功能,能預測用戶行為,自動接入相應的使用場景……這些都簡化了操作步驟。

其次,多想一步。通過隱性意圖的識別和滿足,帶來超出用戶期望的驚喜體驗,構建差異化優勢。

華為曾在一次分享會中提到,HarmonyOS意圖框架可以通過長時間的學習訓練,把人們自己都感覺不到的規律串聯起來,并通過端側的本地學習完成本地學習推薦,從而完成“超預期”的智慧搜索服務體驗。

接下來,可以主動服務。比用戶多想一步,就能將服務化被動為主動,更快更恰當地送到用戶的眼前指尖。

目前,鴻蒙系統的場景化入口,就可以根據意圖判斷,將不同服務融入實際場景中,比如搭乘飛機,航班信息會優先顯示在實時狀態欄,榮耀Magic Live也有類似的主動服務,在觀影、聽歌、走進地鐵站等場景中,提前將取票、聽歌偏好、地鐵碼等原子化服務進行推送。

基于意圖識別的人機交互,讓你最需要的服務,涉過意識的深海。

wKgZombFt0qARAszAAHzAZbb15c100.jpg

洞察到了用戶的意圖,就能將服務精準送達嗎?其實還要穿過一片AI的叢林。

有一個職場段子,老板讓秘書定一個航班,最低段位的秘書,就只會看那一班,而最高段位的,還會提供多個航班選擇,還考慮到出差需求,也把當地的住宿、餐飲等都提前查好備選。

如果讓手機AI來應聘做你的助理,你希望是哪一個段位呢?

最高段位的AI助理,要真正理解你說的話背后的真實意圖,并真正完成你想要的任務,其實要拆分為幾個步驟。

步驟一:充分感知。一個優秀的助理,并非“胡子眉毛一把抓”,什么事情都要提前安排,而是結合上下文背景和情境,來對用戶的潛在意圖進行判斷。所以,充分感知場景和情境,就非常必要了。

蘋果高級副總裁Craig曾表示,Apple Intelligence的真正獨特之處是能理解個人情境。能夠根據你的個人數據,你現在打開的頁面等背景,來理解需求。

比蘋果更早一些,榮耀在2016年第一代Magic上首發Magic Live智慧系統,就能夠自動感知判斷。

wKgaombFt0uAM2DLAABXjKB9NjY072.jpg

步驟二:分析判斷。

有了上下文背景,怎么推斷多個意圖的重要性和優先級呢?這就涉及語義理解了。目前,檢索、問答等任務,由于用戶有明確的檢索詞,利用大模型的自然語言理解能力,已經可以很好地推斷用戶到底想干什么。

其中比較具有代表性的是Apple Intelligence蘋果智能+ GPT-4o大模型的方案。基于Apple Intelligence,蘋果為Siri引入了多模態交互能力,可以從輸入的自然語言中精準地進行用戶意圖識別,將任務拆分為多個任務,作為生成回答的基石。

wKgZombFt0uAUcNlAADZEiQZWvc277.jpg

步驟三:精準執行。

我們可以把每一個服務和功能,想象成一個個智能體,每個智能體只有孤立的識別和輸出能力,要完成用戶需要的復雜任務,需要對這些智能體進行精巧地、自動化地調取和編排,才能在意圖判斷之后,做出最恰當的執行反饋。

OPPO與IDC聯合發布的《AI手機白皮書》中提到,成熟的AI手機系統要內嵌用戶定義的專屬智能體,不斷理解用戶習慣,自學習、直覺化。

在VDC開發者大會的一場技術論壇中,vivo的技術人員也透露,作為業內首個推出手機大模型(藍心大模型)的廠商,他們很早就開始研究agent,對手機原生化服務組件的拆分很細、編排恰當。

這樣看,從意圖到服務之間,還要經過數據(感知)、算法(分析)、智能體(執行)的一片AI森林,只有具備完整AI技術體系的廠商,才能順利跑通。

wKgaombFt0yAZ6U1AAJY4hU4hYQ695.jpg

從上述意圖識別的拆解中不難感受到,AI手機想做的“以人為中心”的主動服務,跨設備的數據流轉(全場景感知),跨應用的服務觸達,以及全局安全,是必不可少的。

如何將各層級、各終端、各系統、各應用都整合在一起?

意圖框架,就是關鍵紐帶,具備操作系統平臺級的能力,可以讓AI貫穿從數據到服務的完整鏈路,帶來意圖識別的能力飛躍。

目前,榮耀、華為、蘋果都推出了自己的框架或平臺。

其中,Magic?Live智慧引擎是基于場景感知、用戶理解和意圖決策三大核心能力的平臺型AI解決方案,形成了一個能夠銜接各種軌跡和能力的“大腦”,實現了從單意圖到多意圖關聯的精準意圖判斷。

蘋果也采用了“榮耀模式”,App Intent意圖框架包含了自學習引擎,實時學習用戶行為,并根據時間和空間信息,提供個性化服務。

華為HarmonyOS的意圖框架,則構建全局意圖范式,基于鴻蒙系統的跨端互聯協作優勢,實現多維系統感知,結合AI大模型、AI推理框架、端云協同等計算處理能力,將需求傳遞給服務方,拉起/執行更恰當的服務。

總結一下榮耀、華為、蘋果的意圖框架,就是具備“地基”的能力。

為了更好的意圖理解,三家都進行了深度的技術搭建,實現了操作系統級別、跨終端的意圖感知、理解,只有深入到系統層面,才能真正重構手機AI體驗。

同時,意圖識別會涉及敏感數據的采集、共享和流動,在隱私安全方面,無論是一貫以隱私保護著稱的蘋果,還是榮耀的MagicGuard和MagicRing信任環,華為HarmonyOS NEXT的原生安全,都說明唯有平臺級的AI能力,能在釋放智慧的同時,守住安全的防線。

說到這里,你是不是有點疑惑,既然意圖識別這么難、需要改造和創新的地方這么多,效果也不是一時半會兒能體現出來的,主打一個“誰用誰知道”,要不還是先躺平算了。

確實,意圖識別的每一關都不好過,但這正是競爭白熱化、同質化的手機市場,廠商突圍的關鍵。

更何況,AI手機應該是消費電子市場最大的一個新蛋糕,華榮OV等一批國內廠商又早已“上桌”,只要攻克一些技術難關,就能成功分到大蛋糕,何樂而不為呢?

意圖識別框架上,正在醞釀一場從“以手機為中心”到“以人為中心”的交互之變,AI手機才剛剛萌芽。

wKgaombFt02AdwTjAAHYqZl45Ro270.jpg

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 框架
    +關注

    關注

    0

    文章

    396

    瀏覽量

    17208
  • AI
    AI
    +關注

    關注

    87

    文章

    28461

    瀏覽量

    265733
收藏 人收藏

    評論

    相關推薦

    基于迅為RK3588開發板的AI圖像識別方案

    迅為RK3568/RK3588開發板AI識別演示方案包括 01_官方模型測試 02_人臉識別 03_口罩檢測 04_工地防護 05_撲克牌識別 06_手掌關鍵點檢測 07_人臉特征點
    發表于 08-13 11:26

    中國AI長卷(二):框架立基

    AI框架可以看到,更強的產業化能力,就是中國AI的底色
    的頭像 發表于 07-24 12:27 ?2389次閱讀
    中國<b class='flag-5'>AI</b>長卷(二):<b class='flag-5'>框架</b>立基

    ai大模型和ai框架的關系是什么

    AI大模型和AI框架是人工智能領域中兩個重要的概念,它們之間的關系密切且復雜。 AI大模型的定義和特點 AI大模型是指具有大量參數的深度學習
    的頭像 發表于 07-16 10:07 ?3.7w次閱讀

    AI大模型與AI框架的關系

    在探討AI大模型與AI框架的關系時,我們首先需要明確兩者的基本概念及其在人工智能領域中的角色。AI大模型通常指的是具有極大規模、高度復雜性和強大能力的人工智能系統,它們能夠處理復雜的任
    的頭像 發表于 07-15 11:42 ?515次閱讀

    CubeIDE生成的代碼框架會卡在MX_X_CUBE_AI_Process()函數中是怎么回事?

    當我將網絡模型部署到STM32F407VGT6中時,CubeIDE生成的代碼框架會卡在MX_X_CUBE_AI_Process()函數中是怎么回事?CUbeAI庫的版本是9.0。期待您的回復,謝謝
    發表于 05-30 06:11

    玩轉大模型 企業AI著陸新正解 神州AI原生賦能平臺正式發布

    智能未來的坦途。 ? 神州學——打造“一站式”AI原生賦能平臺 面對TOB業務復雜性和多樣性,神州學致力給出“一站式”解決問題的方式,將AI原生的場景賦能、知識治理、模型訓練與管理
    的頭像 發表于 05-15 16:41 ?225次閱讀
    玩轉大模型 企業<b class='flag-5'>AI</b>著陸新正解 神州<b class='flag-5'>問</b>學<b class='flag-5'>AI</b>原生賦能平臺正式發布

    李未可科技正式推出WAKE-AI多模態AI大模型

    文本生成、語言理解、圖像識別及視頻生成等多模態交互能力。 ? 該大模型圍繞 GPS 軌跡+視覺+語音打造新一代 LLM-Based的自然交互,同時多模態問答技術的加持,能實現所見即所、所即所得的精準服務。此外,融合了人類
    發表于 04-18 17:01 ?448次閱讀
    李未可科技正式推出WAKE-<b class='flag-5'>AI</b>多模態<b class='flag-5'>AI</b>大模型

    開發者手機 AI - 目標識別 demo

    Lite的API接口實現主要功能; Mindspore Lite為Openharmony AI推理框架,為上層應用提供統一的AI推理接口,可以完成在手機等端側設備中的模型推理過程;
    發表于 04-11 16:14

    數據語料庫、算法框架和算力芯片在AI大模型中的作用和影響

    數據語料庫、算法框架和算力芯片的確是影響AI大模型發展的大重要因素。
    的頭像 發表于 03-01 09:42 ?641次閱讀

    愛立信發布基于AI意圖驅動運營方案

    日前,愛立信宣布:在其托管服務交付平臺——愛立信運營引擎(Ericsson Operations Engine)中,嵌入了基于AI賦能的意圖驅動運營方案,為消費者和企業用戶提供差異化優質5G服務。
    的頭像 發表于 02-21 09:15 ?4779次閱讀

    榮耀發布MagicOS 8.0,首次實現意圖識別人機交互

    在科技圈掀起一股熱潮的榮耀正式發布了其自主研發的全新操作系統——MagicOS 8.0,并賦予其一個富有魔法的中文名字:魔法OS 8.0。這款新操作系統憑借其獨創的平臺級AI使能的意圖識別人機交互,重新定義了智能終端的交互方式。
    的頭像 發表于 01-12 14:50 ?719次閱讀

    AI視覺識別有哪些工業應用

    AI視覺識別涵蓋多種應用,如人臉識別、目標檢測和識別、圖像分割、行為識別、視頻分析等。本篇就簡單介紹一下
    的頭像 發表于 11-27 18:05 ?935次閱讀
    <b class='flag-5'>AI</b>視覺<b class='flag-5'>識別</b>有哪些工業應用

    【KV260視覺入門套件試用體驗】Vitis AI Library體驗之OCR識別

    Vitis AI Runtime,Vitis AI Library 有很多已經封裝好的神經網絡接口,直接拿來用即可。 OCR識別基于Vitis AI Library 的ocr_pt模型
    發表于 10-16 23:25

    【KV260視覺入門套件試用體驗】六、VITis AI車牌檢測&amp;車牌識別

    了廣泛應用 、車牌檢測和車牌識別 3.1、車牌檢測 #include #include #include #include #include #include #include
    發表于 09-26 16:28

    OpenHarmony AI框架開發指導

    ,ClientInfo,AlgorithmInfo,DataInfo的數據結構 具體開發過程可參考喚醒詞識別SDK開發示例 2、開發插件 AI引擎框架規定了一套算法插件接入規范,各插件需實現規定接口以實現獲取插件版本
    發表于 09-19 18:54