近日,美國(guó)著名人工智能研發(fā)機(jī)構(gòu)OpenAI正式宣布,自本周二(2022年7月30日)起,面向部分ChatGPT Plus用戶(hù)推出嶄新的GPT-4o語(yǔ)音模式產(chǎn)品。
據(jù)OpenAI詳細(xì)闡述,這款高級(jí)語(yǔ)音模式具備高度的實(shí)時(shí)性和互動(dòng)性,支持用戶(hù)隨時(shí)隨地打斷對(duì)話(huà)過(guò)程,并且能夠敏銳察覺(jué)并反應(yīng)出用戶(hù)的情緒變化。實(shí)際上,實(shí)時(shí)交互及對(duì)話(huà)中斷兩大技術(shù)難題一直是語(yǔ)音助手領(lǐng)域面臨的挑戰(zhàn)。
早在今年五月份,OpenAI便成功推出了全新升級(jí)版的大型語(yǔ)言模型GPT-4o,并同步展示了其語(yǔ)音模式的強(qiáng)大功能。原本計(jì)劃在六月底逐步向廣大用戶(hù)開(kāi)放此項(xiàng)服務(wù),然而經(jīng)過(guò)慎重考慮,OpenAI最終決定將其發(fā)布日期延至七月。預(yù)計(jì)在今年秋季,語(yǔ)音模式將全面覆蓋到所有ChatGPT Plus用戶(hù)群體中。
OpenAI在本周二明確指出:“我們采取逐步推廣策略,以便能夠密切關(guān)注用戶(hù)的使用體驗(yàn),并依據(jù)實(shí)際反饋持續(xù)提升模型的性能以及安全性。”此外,該公司還透露正在積極推進(jìn)五月份發(fā)布會(huì)上展示的視頻和屏幕分享功能的研發(fā)工作。至于這些功能的具體上線(xiàn)時(shí)間,目前尚無(wú)確切消息。
因此,在語(yǔ)音模式的初始階段,其功能可能相對(duì)較為單一。舉例來(lái)說(shuō),ChatGPT將暫時(shí)無(wú)法運(yùn)用計(jì)算機(jī)視覺(jué)功能,這項(xiàng)技術(shù)可以使聊天機(jī)器人借助智能手機(jī)的攝像頭,為用戶(hù)的舞蹈動(dòng)作提供語(yǔ)音反饋。
現(xiàn)階段,GPT-4o語(yǔ)音模式已經(jīng)配備了四種預(yù)設(shè)聲音——Juniper、Breeze、Cove和Ember,這些聲音均由經(jīng)驗(yàn)豐富的付費(fèi)配音演員精心打造而成。
值得一提的是,之前ChatGPT中的一位名為Sky的女性配音曾因與好萊塢巨星斯嘉麗·約翰遜的聲線(xiàn)極為相似而備受爭(zhēng)議。在接獲約翰遜團(tuán)隊(duì)的律師函之后,OpenAI不得不暫停使用Sky語(yǔ)音。
此外,OpenAI還特別強(qiáng)調(diào),他們已經(jīng)引入了全新的過(guò)濾機(jī)制,旨在確保軟件能夠準(zhǔn)確識(shí)別并拒絕任何試圖生成受版權(quán)保護(hù)的音樂(lè)或其他音頻內(nèi)容的請(qǐng)求。對(duì)于AI企業(yè)而言,如何規(guī)避潛在的法律風(fēng)險(xiǎn)已然成為必須高度重視的問(wèn)題。
-
語(yǔ)音
+關(guān)注
關(guān)注
3文章
377瀏覽量
37789 -
OpenAI
+關(guān)注
關(guān)注
9文章
961瀏覽量
6197 -
ChatGPT
+關(guān)注
關(guān)注
28文章
1513瀏覽量
6442
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論