国产精品三级久久_国产亚洲成人日韩_西西人体在线视频播放_亚洲欧洲日韩5388_看永久免费无卡无码A级毛片_最新中文字幕在线2024_日本午夜高清视频_在线观看自拍少妇精品_最新国产精品无码

早在大語(yǔ)言模型如GPT-3.5等的興起和被日漸廣泛的采用之前，教育行業(yè)已經(jīng)在AI輔助教學(xué)領(lǐng)域有過(guò)各種各樣的嘗試。在教育行業(yè)，人工智能技術(shù)的采用幫助教育行業(yè)更好地實(shí)現(xiàn)教學(xué)目標(biāo)，提高教學(xué)質(zhì)量、學(xué)習(xí)效率、學(xué)習(xí)體驗(yàn)、學(xué)習(xí)成果。例如，人工智能技術(shù)可以幫助教師更好地管理課堂，更好地識(shí)別學(xué)生的學(xué)習(xí)需求，更好地提供個(gè)性化的學(xué)習(xí)內(nèi)容，更好地評(píng)估學(xué)生的學(xué)習(xí)成果，更好地提供學(xué)習(xí)支持。此外，人工智能技術(shù)還可以幫助教育行業(yè)更好地實(shí)現(xiàn)自動(dòng)化，提高教育行業(yè)的效率和效果?？傊?，人工智能技術(shù)在教育行業(yè)的采用將會(huì)帶來(lái)巨大的變化，為教育行業(yè)帶來(lái)更多的發(fā)展機(jī)遇。

亞馬遜云科技也一直致力于提供更方便快捷，功能更強(qiáng)大的AI服務(wù)來(lái)支持教育行業(yè)客戶的技術(shù)創(chuàng)新和業(yè)務(wù)創(chuàng)新。特別是Amazon Transcribe、Amazon Polly、Amazon Textract、Amazon Translate、Amazon Personalize、Amazon Rekognition、Amazon SageMaker等產(chǎn)品分別從自然語(yǔ)言處理、圖形圖像處理、模型研發(fā)部署等方面為教育行業(yè)提供了強(qiáng)有力的技術(shù)支持。

本文結(jié)合Amazon Transcribe、Amazon Polly，以及OpenAI的大語(yǔ)言模型和D-ID.com公司的2D數(shù)字人生成技術(shù)，介紹實(shí)現(xiàn)一個(gè)演示用的可語(yǔ)音對(duì)話的智能2D數(shù)字人設(shè)計(jì)的服務(wù)和具體的實(shí)現(xiàn)過(guò)程。

方案架構(gòu)

為了能在一個(gè)統(tǒng)一的用戶界面呈現(xiàn)語(yǔ)音輸入、語(yǔ)音輸出，以及2D數(shù)字人視頻播放的整體效果，本方案選擇Gradio框架實(shí)現(xiàn)WebUI的功能。呈現(xiàn)的WebUI如下：

用戶可以通過(guò)直接輸入文字內(nèi)容或者使用麥克風(fēng)輸入語(yǔ)音，文字內(nèi)容會(huì)使用Langchain附加上一定的上下文后送給OpenAI的GPT接口調(diào)用，語(yǔ)音輸入會(huì)先調(diào)用Amazon Transcribe服務(wù)進(jìn)行語(yǔ)音到文字的轉(zhuǎn)換。經(jīng)過(guò)GPT接口返回的文字內(nèi)容，會(huì)調(diào)用AWS Polly形成語(yǔ)音文件，同時(shí)語(yǔ)音文件會(huì)作為D-ID.com提供的API渲染出2D的動(dòng)態(tài)視頻在前端自動(dòng)展示和播放。

本方案中語(yǔ)音輸入，語(yǔ)音輸出，文字響應(yīng)生成，以及數(shù)字人視頻生成的功能都可以做自由的組合和替換。特別是對(duì)于OpenAI接口的調(diào)用可以置換為對(duì)自部署的大語(yǔ)言模型的調(diào)用，同時(shí)2D數(shù)字人視頻的生成也可以考慮其他類似服務(wù)，如Heygen等。

具體實(shí)現(xiàn)

語(yǔ)音輸入部分

Amazon Transcribe支持實(shí)時(shí)轉(zhuǎn)錄語(yǔ)音（流式傳輸），也可以轉(zhuǎn)錄Amazon S3存儲(chǔ)桶中的語(yǔ)音文件（批處理）。Transcribe支持多達(dá)幾十種的不同國(guó)家的語(yǔ)言。

Transcribe的實(shí)時(shí)轉(zhuǎn)錄能力非常的強(qiáng)大，處理流數(shù)據(jù)的同時(shí)，不斷的利用之前的上下文進(jìn)行結(jié)果的實(shí)時(shí)矯正，可以通過(guò)下面這個(gè)截圖看到Transcribe實(shí)時(shí)轉(zhuǎn)錄輸出的效果：

應(yīng)答內(nèi)容生成部分

在本方案里，應(yīng)答內(nèi)容的生成借助Langchain這個(gè)開源框架，調(diào)用基于OpenAI的coversation接口，同時(shí)使用memory庫(kù)對(duì)對(duì)話的上下文做了5輪保存。在實(shí)際的客戶場(chǎng)景里，可以考慮更豐富的方式來(lái)規(guī)范回復(fù)的內(nèi)容的有效性和客觀性。

比如可以使用Langchain的對(duì)話模版來(lái)對(duì)大模型的角色進(jìn)行預(yù)設(shè)，或者使用Amazon Kendra，Amazon Opensearch這樣的知識(shí)庫(kù)構(gòu)建和檢索引擎，來(lái)進(jìn)一步限制大模型應(yīng)答的內(nèi)容范圍。

語(yǔ)音輸出部分

Amazon Polly可以將文本轉(zhuǎn)化為逼真的語(yǔ)音。它支持多種語(yǔ)言并且包含各種逼真的聲音模擬，也包含中文普通話語(yǔ)音的模擬。

可以構(gòu)建支持語(yǔ)音并能用于各種位置的應(yīng)用程序，并選擇適合客戶的聲音。Amazon Polly也支持語(yǔ)音合成標(biāo)記語(yǔ)言（SSML），它是一種基于XML的W3C標(biāo)準(zhǔn)標(biāo)記語(yǔ)言，適用于語(yǔ)音合成應(yīng)用程序，且支持使用通用SSML標(biāo)簽進(jìn)行斷句、重音和語(yǔ)調(diào)。自定義Amazon SSML標(biāo)簽提供了獨(dú)特的選項(xiàng)，例如，能夠以新聞播音員說(shuō)話風(fēng)格發(fā)出某些聲音。這種靈活性能夠幫助您創(chuàng)建逼真的語(yǔ)音，從而吸引并維持聽眾的注意力。

在本方案中，可以使用Polly的實(shí)時(shí)語(yǔ)音生成接口，使用了中文普通話發(fā)音的VoiceID：Zhiyu，同時(shí)對(duì)特定的字符的發(fā)音做了定制化，這也是Polly一個(gè)非常有用的功能（Lexion）。

2D數(shù)字人視頻的生成部分

這里可以使用一個(gè)外部第三方的SaaS服務(wù)。該服務(wù)由D-ID.com公司提供，對(duì)應(yīng)的API可以直接接收文本輸入和一張人臉圖片來(lái)生成對(duì)應(yīng)的動(dòng)態(tài)播報(bào)視頻，也可以接受語(yǔ)音文件加圖片作為輸入。

當(dāng)你輸入文本的時(shí)候，該API接口可以選擇制定AWS的Polly服務(wù)中的不同的Voice ID來(lái)自動(dòng)為你合成語(yǔ)音。

在本方案中，想體現(xiàn)中文的語(yǔ)音輸出的效果，但是D-ID的API接口中暫時(shí)無(wú)法直接為中文文本指定中文的Voice ID。所以選擇了先用Polly的API生成語(yǔ)音，再把語(yǔ)音和圖片傳送給D-ID的接口生成視頻。

總結(jié)

今年是AIGC爆發(fā)的一年，也是教育行業(yè)所在的客戶看到行業(yè)拐點(diǎn)的一年。在這個(gè)關(guān)鍵的歷史性節(jié)點(diǎn)上，亞馬遜云科技愿意和客戶一起面對(duì)這些新的機(jī)會(huì)和挑戰(zhàn)，以客戶的需求為導(dǎo)向，幫助客戶抓住AI浪潮帶來(lái)的紅利。

目前除了本文展示的2D數(shù)字人的方案，亞馬遜云科技也可以幫助客戶提供基于3D數(shù)字人或者其他3D數(shù)字形象的直播，互動(dòng)等方案。同時(shí)亞馬遜云科技也會(huì)引入更多的技術(shù)合作伙伴如躍遷引擎來(lái)豐富整個(gè)數(shù)字人，數(shù)字形象直播、點(diǎn)播、互動(dòng)等場(chǎng)景的解決方案，助力更多的教育行業(yè)客戶加速AI技術(shù)的采用和落地。

原發(fā)標(biāo)題：近實(shí)時(shí)智能應(yīng)答 2D 數(shù)字人搭建

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
30131

瀏覽量
268410
人工智能

人工智能

+關(guān)注

關(guān)注
1791

文章
46853

瀏覽量
237550
亞馬遜

亞馬遜

+關(guān)注

關(guān)注
8

文章
2624

瀏覽量
83189
數(shù)字人

數(shù)字人

+關(guān)注

關(guān)注
0

文章
119

瀏覽量
1989

評(píng)論

相關(guān)推薦

老子云：移動(dòng)實(shí)物數(shù)字化智能時(shí)代來(lái)臨！

時(shí)代的來(lái)臨。1.強(qiáng)大的壓縮技術(shù)為什么老子云技術(shù)深受行業(yè)人士期待？特別是設(shè)計(jì)、3D游戲建模行業(yè)，眸瑞科技研發(fā)——老子云技術(shù)，兩個(gè)自動(dòng)化（

發(fā)表于 04-17 10:10

AI賦能教育 ROOBO“童秘”平臺(tái)及布丁迷你豆同期發(fā)布

揭開了童秘兒童智能平臺(tái)（以下簡(jiǎn)稱“童秘”）的神秘面紗。在兒童教育機(jī)器人業(yè)務(wù)量越來(lái)越大的同時(shí)，童秘從ROS.AI中孕育出來(lái)。該平臺(tái)能夠?yàn)閮和?b class='flag-5'>教育機(jī)器人

發(fā)表于 08-05 09:27

筷捷SaaS云平臺(tái)：助力企業(yè)上云，賦能數(shù)字經(jīng)濟(jì)

特色產(chǎn)業(yè)園區(qū)項(xiàng)目。并且，筷捷的年用戶量正保持30%以上的增速發(fā)展。　　筷捷，助力企業(yè)上云，賦能數(shù)字經(jīng)濟(jì)?！　EC筷捷產(chǎn)品介紹：　　云辦公S

發(fā)表于 08-28 13:54

如何同時(shí)獲取2d圖像序列和相應(yīng)的3d點(diǎn)云？

如何同時(shí)獲取2d圖像序列和相應(yīng)的3d點(diǎn)云？以上來(lái)自于谷歌翻譯以下為原文How to obtain the sequence of 2d image and corresponding

發(fā)表于 11-13 11:25

天使賦能，科技智造：華秋第八屆硬創(chuàng)賽與亞馬遜云科技達(dá)成戰(zhàn)略合作

、技術(shù)領(lǐng)先、服務(wù)豐富、應(yīng)用廣泛而享譽(yù)業(yè)界。亞馬遜云科技可以支持幾乎云上任意工作負(fù)載。亞馬遜云科技目前提供超過(guò) 200 項(xiàng)全功能的服務(wù)，涵蓋計(jì)

發(fā)表于 07-01 15:33

基于VxWorks操作系統(tǒng)的WiWindML 2D顯示方案

基于VxWorks操作系統(tǒng)有多種2D 顯示的解決方案，但由于種種原因，僅介紹基于VxWorks操作系統(tǒng)的WindML 2D顯示解決方案，并著重討論了WindML的體系結(jié)構(gòu)，且介紹了

發(fā)表于 12-16 14:26 ?10次下載

基于VxWorks操作系統(tǒng)的WindML 2D顯示方案

基于VxWorks操作系統(tǒng)有多種2D 顯示的解決方案，但由于種種原因，僅介紹基于VxWorks操作系統(tǒng)的WindML 2D顯示解決方案，并著重討論了WindML的體系結(jié)構(gòu)，且介紹了

發(fā)表于 12-05 16:35 ?14次下載

云知聲31日召開系統(tǒng)發(fā)布會(huì)，為AI 教育機(jī)器人全面賦能

云知聲經(jīng)過(guò)多年在 AI 教育機(jī)器人市場(chǎng)上的深耕細(xì)作，順應(yīng)行業(yè)發(fā)展態(tài)勢(shì)所打造的面向智能教育機(jī)器

發(fā)表于 08-08 08:38 ?2381次閱讀

RoboCup 2D機(jī)器人足球仿真的智能算法的應(yīng)用研究說(shuō)明

在Robocup仿真比賽中，Agent的動(dòng)作技能是仿真足球比賽的基礎(chǔ)。本文詳細(xì)分析了robocup 2D機(jī)器人足球仿真中射門技能存在的問題，論述了智能算法在機(jī)器人足球

發(fā)表于 11-07 17:31 ?4次下載

AI為客服行業(yè)賦能更好的發(fā)展

　智能客服行業(yè)作為人工智能技術(shù)較早實(shí)現(xiàn)商業(yè)化落地的領(lǐng)域，吸引了眾多企業(yè)爭(zhēng)相布局。從傳統(tǒng)通訊廠商，到SaaS云服務(wù)商、再到機(jī)器人客服公司，各類

發(fā)表于 11-08 11:19 ?3193次閱讀

機(jī)智云生活電器智能化解決方案

云物聯(lián)網(wǎng)副總裁邢雁受邀出席本次活動(dòng)，并將進(jìn)行《亞馬遜云科技生態(tài)賦能機(jī)智云AIoT

發(fā)表于 08-02 10:45 ?1427次閱讀

教育上云論云桌面對(duì)教育行業(yè)格局的影響

一定程度的影響，不可否認(rèn),云技術(shù)已成功賦能金融、電商、工業(yè)互聯(lián)、醫(yī)療健康等行業(yè)，而我們教育數(shù)字化

發(fā)表于 10-16 15:40 ?918次閱讀

機(jī)智云水族設(shè)備智能化解決方案，攜手亞馬遜助力企業(yè)駕“云”出海

科技智能硬件出海群英匯在深圳舉辦，專注為不同行業(yè)挖掘更多智能硬件出海新思路新機(jī)遇，持續(xù)加速各行業(yè)海外業(yè)務(wù)的創(chuàng)新增長(zhǎng)。機(jī)智

發(fā)表于 11-25 13:10 ?721次閱讀

亞馬遜云科技助力沐瞳應(yīng)用生成式AI技術(shù)打造卓越游戲體驗(yàn) 賦能業(yè)務(wù)決策

北京2024年2月21日?/美通社/ -- 亞馬遜云科技宣布，上海沐瞳科技有限公司（以下簡(jiǎn)稱"沐瞳"）應(yīng)用亞馬遜云科技Amazon Bedr

發(fā)表于 02-22 09:25 ?401次閱讀

SOLIDWORKS教育版2024：2D工程圖的新云端之旅

隨著數(shù)字化和云計(jì)算技術(shù)的飛速發(fā)展，SOLIDWORKS為工程設(shè)計(jì)領(lǐng)域的也起到了不少的作用，不斷推陳出新，為用戶提供更有效、更便捷的工程設(shè)計(jì)解決方案

發(fā)表于 02-29 15:50 ?547次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

亞馬遜云科技智能2D數(shù)字人方案為教育行業(yè)賦能

評(píng)論

老子云：移動(dòng)實(shí)物數(shù)字化智能時(shí)代來(lái)臨！

AI賦能教育 ROOBO“童秘”平臺(tái)及布丁迷你豆同期發(fā)布

筷捷SaaS云平臺(tái)：助力企業(yè)上云，賦能數(shù)字經(jīng)濟(jì)

如何同時(shí)獲取2d圖像序列和相應(yīng)的3d點(diǎn)云？

天使賦能，科技智造：華秋第八屆硬創(chuàng)賽與亞馬遜云科技達(dá)成戰(zhàn)略合作

基于VxWorks操作系統(tǒng)的WiWindML 2D顯示方案

基于VxWorks操作系統(tǒng)的WindML 2D顯示方案

云知聲31日召開系統(tǒng)發(fā)布會(huì)，為AI 教育機(jī)器人全面賦能

RoboCup 2D機(jī)器人足球仿真的智能算法的應(yīng)用研究說(shuō)明

AI為客服行業(yè)賦能更好的發(fā)展

機(jī)智云生活電器智能化解決方案

教育上云論云桌面對(duì)教育行業(yè)格局的影響

機(jī)智云水族設(shè)備智能化解決方案，攜手亞馬遜助力企業(yè)駕“云”出海

亞馬遜云科技助力沐瞳應(yīng)用生成式AI技術(shù)打造卓越游戲體驗(yàn) 賦能業(yè)務(wù)決策

SOLIDWORKS教育版2024：2D工程圖的新云端之旅