精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

HuggingGPT在線演示驚艷亮相

jf_8lIj6kO1 ? 來源:新智元 ? 2023-04-10 10:15 ? 次閱讀

【導(dǎo)讀】浙大&微軟推出的HuggingGPT爆火之后,剛剛開放了demo,急不可待的網(wǎng)友自己上手體驗了一番。

最強組合HuggingFace+ChatGPT=「賈維斯」現(xiàn)在開放demo了。

f1276df6-d739-11ed-bfe3-dac502259ad0.png

前段時間,浙大&微軟發(fā)布了一個大模型協(xié)作系統(tǒng)HuggingGPT直接爆火。 研究者提出了用ChatGPT作為控制器,連接HuggingFace社區(qū)中的各種AI模型,完成多模態(tài)復(fù)雜任務(wù)。 整個過程,只需要做的是:用自然語言將你的需求輸出。 英偉達科學(xué)家稱,這是我本周讀到的最有意思的論文。它的思想非常接近我之前說的「Everything App」,即萬物皆App,被AI直接讀取信息

f1593c28-d739-11ed-bfe3-dac502259ad0.png

上手體驗

現(xiàn)在,HuggingGPT增加了Gradio演示。

f17839c0-d739-11ed-bfe3-dac502259ad0.png

項目地址:https://github.com/microsoft/JARVIS 有網(wǎng)友便上手體驗了一番,先來「識別圖上有幾個人」?

f18c8f60-d739-11ed-bfe3-dac502259ad0.png

HuggingGPT根據(jù)推理結(jié)果,得出圖片中有2個人正在街道上行走。 具體過程如下: 首先使用圖像到文本模型nlpconnect/vit-gpt2-image-captioning進行圖像描述,生成的文本「2個女人在有火車的街道上行走」。 接著,使用了目標檢測模型facebook/detrresnet 50來檢測圖片中的人數(shù)。模型檢測出7個物體,2個人。 再使用視覺問題回答模型dandelin/vilt-b32-finetuned-vqa得出結(jié)果。最后,系統(tǒng)提供了詳細的響應(yīng)和用于解答問題的模型信息。

f1f0da1a-d739-11ed-bfe3-dac502259ad0.png

另外,讓它理解「我愛你」這句話的情感,并將其翻譯成泰米爾語(Tami?)。 HuggingGPT調(diào)用了以下模型: 首先,使用了模型「dslim/bert-base-NER」對文本「l love you」進行情感分類,是「浪漫」。 然后,使用「ChatGPT」將文本翻譯成泰米爾語,即「Nan unnai kadalikiren」。 在推理結(jié)果中沒有生成的圖片、音頻視頻文件。

f21945ae-d739-11ed-bfe3-dac502259ad0.png

轉(zhuǎn)錄MP3文件時,HuggingGPT卻失敗了。網(wǎng)友表示,「不確定這是否是我的輸入文件的問題。」

f239b596-d739-11ed-bfe3-dac502259ad0.gif

再來看看圖像生成的能力。 輸入「一只貓?zhí)琛箞D像上添加文字「I LOVE YOU」作為疊加層。 HuggingGPT首先使用了「runwayml/stable-diffusion-1-5」模型根據(jù)給定的文本生成「跳舞的貓」的圖片。 然后,使用同一個模型根據(jù)給定的文本生成了「I LOVE YOU」的圖片。 最后,將2個圖片合并在一起,輸出如下圖:

f271e1be-d739-11ed-bfe3-dac502259ad0.png

賈維斯照進現(xiàn)實

項目公開沒幾天,賈維斯已經(jīng)在GitHub上收獲了12.5k星,以及811個fork。

f2c6a51e-d739-11ed-bfe3-dac502259ad0.png

研究者指出解決大型語言模型(LLMs)當前的問題,可能是邁向AGI的第一步,也是關(guān)鍵的一步。

因為當前大型語言模型的技術(shù)仍然存在著一些缺陷,因此在構(gòu)建 AGI 系統(tǒng)的道路上面臨著一些緊迫的挑戰(zhàn)。

為了處理復(fù)雜的人工智能任務(wù),LLMs應(yīng)該能夠與外部模型協(xié)調(diào),以利用它們的能力。 因此,關(guān)鍵點在于如何選擇合適的中間件來橋接LLMs和AI模型。 在這篇研究論文中,研究者提出在HuggingGPT中語言是通用的接口。其工作流程主要分為四步:

f46640d2-d739-11ed-bfe3-dac502259ad0.png

論文地址:https://arxiv.org/pdf/2303.17580.pdf 首先是任務(wù)規(guī)劃,ChatGPT解析用戶請求,將其分解為多個任務(wù),并根據(jù)其知識規(guī)劃任務(wù)順序和依賴關(guān)系。 接著,進行模型選擇。LLM根據(jù)HuggingFace中的模型描述將解析后的任務(wù)分配給專家模型。 然后執(zhí)行任務(wù)。專家模型在推理端點上執(zhí)行分配的任務(wù),并將執(zhí)行信息和推理結(jié)果記錄到LLM中。 最后是響應(yīng)生成。LLM總結(jié)執(zhí)行過程日志和推理結(jié)果,并將摘要返回給用戶。

f4847c46-d739-11ed-bfe3-dac502259ad0.png

假如給出這樣一個請求:

請生成一個女孩正在看書的圖片,她的姿勢與example.jpg中的男孩相同。然后請用你的聲音描述新圖片。

可以看到HuggingGPT是如何將它拆解為6個子任務(wù),并分別選定模型執(zhí)行得到最終結(jié)果的。

f49d67a6-d739-11ed-bfe3-dac502259ad0.png

通過將AI模型描述納入提示中,ChatGPT可以被視為管理人工智能模型的大腦。因此,這一方法可以讓ChatGPT能夠調(diào)用外部模型,來解決實際任務(wù)。 簡單來講,HuggingGPT是一個協(xié)作系統(tǒng),并非是大模型。 它的作用就是連接ChatGPT和HuggingFace,進而處理不同模態(tài)的輸入,并解決眾多復(fù)雜的人工智能任務(wù)。 所以,HuggingFace社區(qū)中的每個AI模型,在HuggingGPT庫中都有相應(yīng)的模型描述,并將其融合到提示中以建立與ChatGPT的連接。 隨后,HuggingGPT將ChatGPT作為大腦來確定問題的答案。 到目前為止,HuggingGPT已經(jīng)圍繞ChatGPT在HuggingFace上集成了數(shù)百個模型,涵蓋了文本分類、目標檢測、語義分割、圖像生成、問答、文本到語音、文本到視頻等24個任務(wù)。 實驗結(jié)果證明,HuggingGPT可以在各種形式的復(fù)雜任務(wù)上表現(xiàn)出良好的性能。

網(wǎng)友熱評

有網(wǎng)友稱,HuggingGPT類似于微軟此前提出的Visual ChatGPT,似乎他們把最初的想法擴展到了一組龐大的預(yù)訓(xùn)練模型上。

f4d99d2a-d739-11ed-bfe3-dac502259ad0.png

Visual ChatGPT是直接基于ChatGPT構(gòu)建,并向其注入了許多可視化模型(VFMs)。文中提出了Prompt Manage。 在PM的幫助下,ChatGPT可以利用這些VFMs,并以迭代的方式接收其反饋,直到滿足用戶的要求或達到結(jié)束條件。

f50ac79c-d739-11ed-bfe3-dac502259ad0.png

還有網(wǎng)友認為,這個想法確實與ChatGPT插件非常相似。以LLM為中心進行語義理解和任務(wù)規(guī)劃,可以無限提升LLM的能力邊界。通過將LLM與其他功能或領(lǐng)域?qū)<蚁嘟Y(jié)合,我們可以創(chuàng)建更強大、更靈活的 AI 系統(tǒng),能夠更好地適應(yīng)各種任務(wù)和需求。

f52ab804-d739-11ed-bfe3-dac502259ad0.png

這就是我一直以來對AGI的看法,人工智能模型能夠理解復(fù)雜任務(wù),然后將較小的任務(wù)分派給其他更專業(yè)的AI模型。

f53daa4a-d739-11ed-bfe3-dac502259ad0.png

就像大腦一樣,它也有不同的部分來完成特定的任務(wù),聽起來很符合邏輯。

f561ce0c-d739-11ed-bfe3-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30189

    瀏覽量

    268444
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3175

    瀏覽量

    48721
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1548

    瀏覽量

    7504

原文標題:炫到爆炸!HuggingGPT在線演示驚艷亮相,網(wǎng)友親測圖像生成絕了

文章出處:【微信號:玩轉(zhuǎn)VS Code,微信公眾號:玩轉(zhuǎn)VS Code】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    鼎陽科技亮相2024德國慕尼黑電子展

    2024年德國慕尼黑electronica電子展于近日在德國慕尼黑盛大開幕。作為全球領(lǐng)先的通用電子測試測量儀器制造商,鼎陽科技攜眾多創(chuàng)新產(chǎn)品驚艷亮相,向全球展示了公司卓越實力與前沿技術(shù)。
    的頭像 發(fā)表于 11-18 09:38 ?153次閱讀

    聯(lián)誠發(fā)LED屏驚艷亮相土耳其廣告展

    近日,第25屆國際廣告業(yè)和數(shù)字印刷技術(shù)博覽會(簡稱 Sign Istanbul )在土耳其伊斯坦布爾隆重舉行。聯(lián)誠發(fā)攜多款創(chuàng)新LED顯示產(chǎn)品及多領(lǐng)域的應(yīng)用解決方案驚艷亮相,為全球客戶打造沉浸式視覺盛宴,展會現(xiàn)場人流絡(luò)繹不絕,熱鬧非凡。
    的頭像 發(fā)表于 11-04 17:47 ?364次閱讀

    KM振動在線監(jiān)測系統(tǒng)助力設(shè)備煥新升級#振動在線監(jiān)測#振動監(jiān)測#在線監(jiān)測

    在線監(jiān)測
    KM預(yù)測性維護專家
    發(fā)布于 :2024年10月23日 14:59:48

    揚帆出海!九章云極DataCanvas公司驚艷亮相迪拜GITEX Global 2024

    近日,第44屆GITEXGLOBAL展會(GITEXGLOBAL2024)及全球領(lǐng)先的創(chuàng)業(yè)與投資盛會ExpandNorthStar2024在迪拜盛大啟幕。九章云極DataCanvas公司驚艷亮相盛會
    的頭像 發(fā)表于 10-18 17:08 ?238次閱讀
    揚帆出海!九章云極DataCanvas公司<b class='flag-5'>驚艷</b><b class='flag-5'>亮相</b>迪拜GITEX Global 2024

    KMPHM振動在線監(jiān)測助力企業(yè)輕裝上陣#振動在線監(jiān)測 #在線監(jiān)測 #振動監(jiān)測

    在線監(jiān)測
    KM預(yù)測性維護專家
    發(fā)布于 :2024年09月29日 15:17:03

    巍泰技術(shù)攜多款創(chuàng)新產(chǎn)品驚艷亮相 2024 第二十二屆物聯(lián)網(wǎng)展

    8月28-30日,為期三天的IOTE2024第二十二屆國際物聯(lián)網(wǎng)展在深圳國際會展中心圓滿落幕。在這場精彩紛呈的科技盛宴中,巍泰技術(shù)攜多款創(chuàng)新產(chǎn)品驚艷亮相,以其卓越的技術(shù)實力和創(chuàng)新的產(chǎn)品解決方案,成為
    的頭像 發(fā)表于 09-11 15:11 ?341次閱讀
    巍泰技術(shù)攜多款創(chuàng)新產(chǎn)品<b class='flag-5'>驚艷</b><b class='flag-5'>亮相</b> 2024 第二十二屆物聯(lián)網(wǎng)展

    折疊屏旗艦榮耀Magic V3將攜其突破性設(shè)計驚艷亮相

    科技的盛宴將于7月12日拉開帷幕,屆時,備受期待的全新一代折疊屏旗艦——榮耀Magic V3,將攜其突破性設(shè)計驚艷亮相,并提前展示了其外觀設(shè)計上的獨特魅力。
    的頭像 發(fā)表于 07-08 17:13 ?654次閱讀

    億緯鋰能亮相EUROBIKE 2024歐洲自行車展

    7月3-7日,EUROBIKE 2024歐洲自行車展于德國法蘭克福會展中心盛大舉行,億緯鋰能以輕型動力全場景方案再度驚艷亮相
    的頭像 發(fā)表于 07-08 16:13 ?686次閱讀

    桿塔傾斜在線監(jiān)測

    在線監(jiān)測
    jf_96960730
    發(fā)布于 :2024年07月02日 14:38:06

    納雷科技攜全新交通流量統(tǒng)計毫米波雷達產(chǎn)品驚艷亮相中國高速公路展

    3月28-29日,納雷科技攜全新交通流量統(tǒng)計毫米波雷達產(chǎn)品驚艷亮相,為高速公路的數(shù)智化建設(shè)注入了強大的動力。本次展會吸引了大量客戶駐足參觀,共同見證納雷科技在交通科技領(lǐng)域的創(chuàng)新實力。
    的頭像 發(fā)表于 04-01 10:05 ?614次閱讀
    納雷科技攜全新交通流量統(tǒng)計毫米波雷達產(chǎn)品<b class='flag-5'>驚艷</b><b class='flag-5'>亮相</b>中國高速公路展

    哪吒汽車攜暢銷車型NETA V-II驚艷亮相曼谷國際車展

    哪吒汽車攜暢銷車型NETA V-II驚艷亮相曼谷國際車展
    的頭像 發(fā)表于 03-28 10:11 ?385次閱讀
    哪吒汽車攜暢銷車型NETA V-II<b class='flag-5'>驚艷</b><b class='flag-5'>亮相</b>曼谷國際車展

    Quicktron快倉攜自主研發(fā)的混合揀選方案QuickBin+亮相美國MODEX

    近日,北美地區(qū)最大的物料搬運、供應(yīng)鏈設(shè)備及技術(shù)型展覽會之一美國亞特蘭大物流展MODEX隆重召開,今年Quicktron快倉攜自主研發(fā)的混合揀選方案QuickBin+驚艷亮相
    的頭像 發(fā)表于 03-19 10:17 ?529次閱讀

    京東方攜前沿顯示技術(shù)驚艷亮相MWC 2024

    2月26日至29日,備受全球矚目的世界移動通信大會(MWC2024)在西班牙巴塞羅那盛大開幕。此次盛會,BOE(京東方)攜手多家全球一線品牌合作伙伴驚艷亮相,帶來了搭載其柔性O(shè)LED、3D顯示、VR顯示等尖端顯示技術(shù)的10余款創(chuàng)新消費電子產(chǎn)品,包括手機、平板、筆記本電腦和
    的頭像 發(fā)表于 03-03 15:51 ?1167次閱讀

    3i CES首秀驚艷亮相,全球首款智能凈地站好評如潮

    科技成果。 3i CES首秀驚艷亮相,全球首款智能凈地站好評如潮 在這場科技與創(chuàng)新的盛宴中,高端科技家電品牌3i跨越重洋,首次亮相CES,攜一系列創(chuàng)新產(chǎn)品重磅登場,這不僅是一次國際展會的參與,更是3i 全球市場拓展之旅的起點,標
    的頭像 發(fā)表于 01-11 22:11 ?345次閱讀
    3i CES首秀<b class='flag-5'>驚艷</b><b class='flag-5'>亮相</b>,全球首款智能凈地站好評如潮

    利爾達驚艷亮相2023浙江服務(wù)貿(mào)易(泰國)物聯(lián)網(wǎng)展

    832149)攜多款明星產(chǎn)品驚艷亮相,展示了公司在物聯(lián)網(wǎng)及5G領(lǐng)域的技術(shù)布局與優(yōu)秀成果。近年來,浙江企業(yè)在物聯(lián)網(wǎng)技術(shù)領(lǐng)域開創(chuàng)了一系列行業(yè)領(lǐng)先的代表性成果,本次赴現(xiàn)場參展的
    的頭像 發(fā)表于 12-01 08:14 ?521次閱讀
    利爾達<b class='flag-5'>驚艷</b><b class='flag-5'>亮相</b>2023浙江服務(wù)貿(mào)易(泰國)物聯(lián)網(wǎng)展