精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

“AI視頻通話”產品化的三條路

腦極體 ? 來源: 腦極體 ? 作者: 腦極體 ? 2024-10-17 09:13 ? 次閱讀

wKgaomcP5f2AOYjwAAnfIkAz9HY162.jpg

“做AI產品經理太難了。”近期腦極體的同事參加了一場開發者大會,一位產品經理向我們坦言:“AI時代,做產品的方法論沒變,但以往熟悉的東西幾乎都被清零了。”

用戶需求被清零了,大模型到底能用來做什么,用戶自己是不清楚的,需求是空白的,需求調研、產品定義,就要花費好幾個月的時間。

好不容易定義好了,基礎模型的一個更新,就有可能將前期所做的工作、功能規劃等推倒重來。

“比如GPT-4o出現之后,語音對話的能力是我們完全意想不到的,就又得把產品開發過程再來一遍……”

而縱觀一年多來推陳出新的數百個大模型,GPT-4o可以說是產品化程度非常高的一個了。

wKgZomcP5f2AUSYDAABr0doA8JI811.jpg

比如OpenAI發布會上展示的“AI視頻通話”,使用戶與AI進行實時的、跟真人對話一樣自然的視頻交流。國內模型廠商也很快推出了類似的AI視頻通話功能,不少媒體和用戶都表示“體驗炸裂”。

但半年時間過去,發現在最初的震驚與新鮮感過后,在真正的軟件生態里,還是沒有看到“AI視頻通話”被大規模、高頻率地用起來,更別提激活用戶的付費欲望了。為什么會這樣?

我們就從“AI視頻通話”說開去,聊聊AI產品化、商業化到底要經過哪些磨礪。

wKgaomcP5f6ACYcUAAJNgLuXPck977.jpg

鉆石原礦被開采出來,其實并不璀璨奪目,是經由工匠們的切割打磨,被鑲嵌成鉆石首飾,包裝為“愛情象征”,才走進大眾消費市場,價值實現了百倍千倍攀升。

類GPT-4o大模型就類似于原礦,作為“交互天花板”,潛在商業價值很大,但必須經過產品化的精細打磨與包裝,才能被大眾用戶廣泛接受,實現其真正的價值和應用潛力。

而基于類GPT-4o所誕生的“AI視頻通話”,雖然向產品化邁進了一步,但依然屬于原型的基礎能力。

盡管OpenAI、智譜等模廠已經針對“AI視頻通話”這一應用,打磨了諸如響應速度、具體用例等產品側的細節,并融入到ChatGPT、智譜清言APP等產品當中。但作為一種軟件應用來說,這種與通用場景相結合的落地模式,還是比較粗陋。

首先,需求過于寬泛。

AI視頻通話,技術上相當于讓AI擁有“眼睛”和“嘴”,具備察言觀色、跟真人對話的能力。這很容易就讓人想到AI陪伴,人與AI談天說地、談情說愛。

直接將AI視頻通話能力嫁接在聊天機器人上,本質依然是AI聊天,能力升級,但無法解決chatbot商業價值低的核心問題。

AI視頻聊天,用戶容錯率高,不在乎AI偶爾犯錯或出現幻覺,這也意味著對基礎模型能力要求不嚴苛,無法在技術層面拉開差距。曾經的智能音箱大戰、智能助手紅海,也會在AI視頻聊天領域出現,并且由于聊天并不能幫助用戶完成具體任務或解決問題,用戶還得自己琢磨在視頻里跟AI聊什么,沒一會兒就只能跟AI面面相覷,難以帶來確定性的產品滿足和持久粘性,新鮮感過后就會流失。

而一些直接用途,想要普遍應用,也有大量細節仍待填充。

比如基于AI視頻通話的無障礙功能,是一個非常直接的落地場景。AI視頻通話,可以將設備攝像頭作為“眼睛”,幫助人去理解物理世界,這對視障人群豈不是很友好?

但實際上,大模型APP的視頻通話功能,是無法直接被視障人群用起來的,還有大量的產品細節需要考慮。比如我們曾體驗過實時圖像識別,AI只能認出“面前有兩張卡”,但哪張是公交卡,哪張是銀行卡,是無法準確識別的,這就需要基于視障群體出行接觸的高頻物體,進行針對性地精調。

而且,在飛機、高鐵、地鐵等弱網、無網環境下,也要保證視障人群與AI視頻通話的實時性,就需要純端側運行的多模態大模型,將模型做小、計算效率做高。

產品設計層面,還有大量的細節,還等待著填充,才能轉化為用戶可以方便使用的產品和服務。

可以看到,沒有更細致的產品化,盡管“AI視頻通話”這一基礎能力很厲害,卻不知道能用來干什么,很可能導致技術找不到市場,倒在了產品化變現的黎明到來之前。

這個“至暗時刻”會發生嗎?

欣慰的是,我們發現 “AI視頻通話”能力,已經開始向行業輸送了,意味著這座AI基礎能力的“原礦”,終于開始被打磨成晶光四射的鉆石。

我們就從“原礦”流向的應用領域,來分享幾個“AI視頻通話”的產品化方向。

wKgZomcP5f-ASZ5sAAIRCq2qfR8957.jpg

大模型怎么落地?智能體是方向。

智能體怎么服務?+AI視頻通話事半功倍。

如今,手機軟件承載著我們日常的絕大多數服務,在各個應用中來回跳轉、操作是非常繁瑣的。

今年以來,榮耀、vivo等廠商都在基于智能體打造一系列創新功能體驗,比如“一句話點奶茶”“一句話訂餐廳”等。用戶只需要向手機助手發出指令,手機智能體會自動理解需求、拆解任務步驟、調取相關功能,一站到底地完成任務。

Agent手機就很好地解決了數字服務鏈路長、操作繁瑣的問題,但新的問題又來了,那就是智能體還需要“看得懂”“能交流”。

舉個例子,在外賣小程序下單時,遇到廣告是常態,這時候需要智能體agent執行準確的操作,比如“點擊關閉”“跳過”等,來推進到下一步。如果智能體無法識別相關內容,必須用戶自己動手操作,那整個鏈路就被打斷了,用戶體驗會非常不好。有跟智能助手通過文字prompt交流的功夫,用戶自己就能點開程序完成下單了。

Agent手機+視頻通話,就能用戶體驗更進一步。

比起打字的繁瑣、語音尷尬癥,在人機對話時,像跟真人面對面交流一樣,通過語音對話完成下單,更符合直覺,也更有被服務的舒適感。對話之后,大模型對視頻畫面進行實時分析,指導智能體來自動執行,整個體驗會從頭到尾絲滑無感。

wKgaomcP5f-AfO-hAACIzvedjH8747.jpg

目前,國內終端廠商在端側智能體方面走得是更快的。腦極體在VDC 2024大會上了解到,藍河操作系統增添了視覺感知能力,讓系統像人類一樣“聽得懂”“看得清”。智能體能夠模擬人類的智能,助力操作系統像人一樣進行溝通、執行智能任務。

如果說,智能體可以讓人成為數字服務的最小參與者,那么在智能體手機中打磨的AI視頻通話,則讓人機交互朝著更理想、更符合直覺的體驗靠近,讓數字生活管家走進現實。

wKgZomcP5gCAH77sAAJain53t2Y560.jpg

將AI視頻通話功能集成到垂直應用軟件中,可以變成擬人化的垂域專家,提供更專業的服務,解決更具體的問題,從而激活用戶的付費意愿和模型API經濟。

目前,OpenAI為GPT-4o預設了十幾個場景,清言視頻通話API上線智譜開放平臺時,也列出了智能硬件VR眼鏡)、教育培訓AI私教、文旅場景AI向導、具身智能等落地方向。通過將AI視頻通話API開放出來,鼓勵開發者在產品中集成“AI視頻通話”功能。

wKgaomcP5gGAAd8iAAS0jUTg9fE461.jpg

9月24日,多鄰國(Duolingo)在第六屆全球分享大會上,推出了 AI 視頻通話(Video Call)。Duolingo Max 用戶可以與多鄰國的角色 Lily(拽姐)進行視頻通話,進行個性化的互動練習。在對話中,AI會根據用戶的語言水平靈活調整內容。

學習語言最難的就是高頻使用環境和開口說話的心理障礙,通過AI視頻通話提供實時的對話機會,可以讓小白初學者也能自信開口,進行有效聯系。據說,多鄰國的這一新功能接入了OpenAI的高級語音API功能。

wKgZomcP5gGAcEKNAADs3-8z5AQ814.jpg

國內頭部社交軟件Soul,也上線了AI聊天機器人“AI茍蛋”,可以主動跟用戶找話題,并且年底將開啟AI陪聊機器人的視頻通話服務。不同于泛泛聊天,Soul主打的是靈魂交友,平臺用戶傾向于開展深層交流,探討深度話題,尋求心靈共鳴。

在這種較為成熟的社區氛圍下,用戶在使用AI視頻通話的預期、內容也是較為明確的,不會出現不知道聊什么的情況。

各行各業都存在大量需要互動的場景,可以跟“AI視頻通話”相結合提供擬人化體驗。但用戶能否由此對應用和AI視頻通話產生黏性,還需要行業伙伴把使用門檻降到最低,這不僅需要行業擁有產品開發的能力與意愿,能夠洞察缺口與機遇,也需要模廠的生態支持。

wKgaomcP5gKAK5b4AAINByWuuXo804.jpg

從哆啦A夢到阿童木、賈維斯、Her,這些讓人類感覺友好溫暖的AI,都是擬人化的。也許說明,我們更愿意跟更像人類的AI打交道,而不是冰冷無形的機器。

一位智能機器從業者告訴我們,一開始設計的新車只有虛擬的語音助手,用戶上車之后覺得跟空氣說話很尷尬,激活率不高,所以設計了一個帶有屏幕的車載控件,可以跟車主打招呼、有表情,車主很喜歡跟它對話,逢年過節還會為它買各種裝飾物,把它當作用車場景中的家庭一員。

從這個思路看,AI視頻通話其實可以被加入各種硬件當中,與用戶展開真人一般的對話,從而成為情感共同體,由此衍生的商業空間也非常充裕。

透過AI視頻通話,相信大家能夠感受到,無論是AI企業或普通大眾,對于AI產品化的需求越來越實質。

模型技術只是能力,是原型,而遠不到普遍可用的階段。唯有通過產品化的細致打磨,AI這座商業富礦,才能真正顯露出鉆石般的光芒。

wKgaomcP5gOAIDl0AAHt8CWDx2M229.jpg

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30106

    瀏覽量

    268398
收藏 人收藏

    評論

    相關推薦

    TIKOOL太酷信息-數字矩陣內部通話系統

    控制、多基站IP互聯、遠程通話、遠程Tally、有線無線互控融合燈功能特點。支持上千全雙工通話,通過后臺管理軟件任意靈活分配,打破國外同類產品壟斷,從技術研發到批量生產完成自主國產
    發表于 11-16 15:15 ?0次下載

    AI 大模型行業應用:企業如何走出一智能蛻變之路?

    隨著 chatGPT 的橫空問世,我們對于人工智能在日常生活中的應用場景逐漸了解,無論是搜索、問答、文生圖還是文生視頻都出現了很多創意,甚至 AI 還可以做詩,輸入一指令,就可以讓它當場賦詩一首
    的頭像 發表于 09-27 18:16 ?595次閱讀

    視頻3--場景自動AI助手

    AI
    草帽王路飛
    發布于 :2024年07月22日 11:16:13

    視頻2--場景自動AI助手

    AI
    草帽王路飛
    發布于 :2024年07月22日 11:15:34

    THS8136三路10位180 MSPS圖形和視頻DAC數據表

    電子發燒友網站提供《THS8136三路10位180 MSPS圖形和視頻DAC數據表.pdf》資料免費下載
    發表于 07-09 09:28 ?0次下載
    THS8136<b class='flag-5'>三路</b>10位180 MSPS圖形和<b class='flag-5'>視頻</b>DAC數據表

    DigiKey 推出《數字城市》第 4 季視頻系列,聚焦人工智能

    全球供應品類豐富、發貨快速的現貨技術元器件和自動產品領先商業分銷商?DigiKey,日前宣布推出《數字城市》視頻系列第 4 季《智能世界中的 A
    發表于 07-02 15:32 ?882次閱讀
     DigiKey 推出《數字<b class='flag-5'>化</b>城市》第 4 季<b class='flag-5'>視頻</b>系列,聚焦人工智能

    聚焦AI技術引領,智象未來全面賦能圖片及視頻內容生產

    當前,AIGC浪潮不斷席卷各行各業,隨著其技術的不斷釋放,全新行業價值正在顯現,AI技術也在從產業應用向社會應用轉變,深刻影響著產品創新、內容創作及商業模式的發展。聚焦技術引領,智
    的頭像 發表于 06-24 13:36 ?286次閱讀
    聚焦<b class='flag-5'>AI</b>技術引領,智象未來全面賦能圖片及<b class='flag-5'>視頻</b>內容生產

    大模型產品化,不過是支舞

    AI產品化的答案,才是AI商業的起點
    的頭像 發表于 06-13 09:27 ?1890次閱讀
    大模型<b class='flag-5'>產品化</b>,不過是<b class='flag-5'>三</b>支舞

    HDMI音視頻采集與H.264編碼?體采集卡LCC260數據手冊

    LCC260是靈卡技術研發的?款HDMI音視頻采集與H.264編碼?體的采集卡。其輸入接口HDMI最高支持1920x1080p@60fps視頻輸入,輸出接口采用USB2.0,可同時輸出兩
    發表于 04-12 14:38 ?1次下載

    具有三條 100mA 通道的低 EMI 汽車 LED驅動器TPS61193-Q1數據表

    電子發燒友網站提供《具有三條 100mA 通道的低 EMI 汽車 LED驅動器TPS61193-Q1數據表.pdf》資料免費下載
    發表于 04-09 14:40 ?0次下載
    具有<b class='flag-5'>三條</b> 100mA 通道的低 EMI 汽車 LED驅動器TPS61193-Q1數據表

    鴻蒙開發實戰【通話管理】

    通話管理模塊主要管理CS(Circuit Switch,電路交換)、IMS(IP Multimedia Subsystem,IP多媒體子系統)和OTT(over the top,OTT解決方案)種類型的通話,負責申請
    的頭像 發表于 03-14 20:10 ?389次閱讀
    鴻蒙開發實戰【<b class='flag-5'>通話</b>管理】

    Stability AI與Morph AI共同推出一體AI視頻創作工具

    近日,業界領先的AI技術公司Stability AI與中國AI創業公司Morph AI達成重要合作。雙方宣布共同推出一款革新性的all-in-one(一體式)
    的頭像 發表于 03-05 10:44 ?839次閱讀

    KS-PXIE6352三路DVI/HDMI視頻源板介紹

    電子發燒友網站提供《KS-PXIE6352三路DVI/HDMI視頻源板介紹.pdf》資料免費下載
    發表于 03-04 10:05 ?0次下載

    關于ADV7180三路CVBS輸入時的使用問題

    使用ADV7180做三路CVBS輸入,現在視頻已有清晰輸出,請教如下問題: 1,輸出視頻中,紅色與藍色顯示正好反了(與實物輸入對比),請問是那個寄存器控制色彩顯示? 2,如果三路CVB
    發表于 12-05 06:57

    學習臺燈|AI攝像頭學習機_支持視頻通話方案

    學習臺燈|AI攝像頭學習機_支持視頻通話方案。采用聯發科MTK平臺解決方案,內置12nm四核Cortex-A53處理器,提供高效的性能支持。它配備了10.1英寸的高清屏幕,分辨率為1920*2000
    的頭像 發表于 11-28 18:26 ?930次閱讀
    學習臺燈|<b class='flag-5'>AI</b>攝像頭學習機_支持<b class='flag-5'>視頻</b><b class='flag-5'>通話</b>方案