精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

全新 NVIDIA NeMo Retriever微服務(wù)大幅提升LLM的準(zhǔn)確性和吞吐量

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-07-26 11:13 ? 次閱讀

企業(yè)能夠通過提供檢索增強(qiáng)生成功能的生產(chǎn)就緒型 NVIDIA NIM 推理微服務(wù),充分挖掘業(yè)務(wù)數(shù)據(jù)的價(jià)值。這些微服務(wù)現(xiàn)已集成到 Cohesity、DataStax、NetApp 和 Snowflake 平臺(tái)中。

如果缺乏準(zhǔn)確性,生成式 AI 應(yīng)用不但無法產(chǎn)生價(jià)值,有時(shí)甚至還會(huì)產(chǎn)生負(fù)價(jià)值。而準(zhǔn)確性的根源在于數(shù)據(jù)。

為幫助開發(fā)者高效獲取最佳的專有數(shù)據(jù),以便為他們的 AI 應(yīng)用生成知識(shí)淵博的回答,NVIDIA 宣布推出四項(xiàng)全新的 NVIDIA NeMo Retriever NIM 推理微服務(wù)。

Llama 3.1 模型集也同期發(fā)布。當(dāng)與適用于該模型集的 NVIDIA NIM 推理微服務(wù)相結(jié)合時(shí),NeMo Retriever NIM 推理微服務(wù)不僅能夠使企業(yè)擴(kuò)展到代理式 AI 工作流(在此工作流中,AI 應(yīng)用可以在最少的干預(yù)或監(jiān)督下準(zhǔn)確運(yùn)行),還能夠提供極為精準(zhǔn)的檢索增強(qiáng)生成(RAG)。

通過 NeMo Retriever,企業(yè)可以將自定義模型與各種業(yè)務(wù)數(shù)據(jù)無縫連接,并使用 RAG 為 AI 應(yīng)用作出高度準(zhǔn)確的回答。這套生產(chǎn)就緒型微服務(wù)實(shí)際上為創(chuàng)建高度準(zhǔn)確的 AI 應(yīng)用提供了非常精準(zhǔn)的信息檢索功能。

例如當(dāng)開發(fā)者創(chuàng)建 AI 智能體和客服聊天機(jī)器人、分析安全漏洞或從復(fù)雜的供應(yīng)鏈信息中提取洞察時(shí),NeMo Retriever 能夠大幅提高模型的準(zhǔn)確性和吞吐量。

NIM 推理微服務(wù)實(shí)現(xiàn)了高性能、易于使用的企業(yè)級(jí)推理。開發(fā)者能夠使用 NeMo Retriever NIM 微服務(wù)并充分利用自己的數(shù)據(jù),來獲得這一切。

已正式發(fā)布的全新 NeMo Retriever 向量化和重排序 NIM 微服務(wù)如下:

NV-EmbedQA-E5-v5:一個(gè)常用社區(qū)基礎(chǔ)向量化模型,針對(duì)文本問答檢索進(jìn)行了優(yōu)化

NV-EmbedQA-Mistral7B-v2:一個(gè)常用多語言社區(qū)基礎(chǔ)模型,針對(duì)文本向量化功能進(jìn)行了微調(diào),以實(shí)現(xiàn)高度準(zhǔn)確的問答

Snowflake-Arctic-Embed-L:一個(gè)經(jīng)過優(yōu)化的社區(qū)模型

NV-RerankQA-Mistral4B-v3:一個(gè)常用社區(qū)基礎(chǔ)模型,針對(duì)文本重排功能進(jìn)行了微調(diào),以實(shí)現(xiàn)高度準(zhǔn)確的問答

這些模型加入到 NIM 微服務(wù)集中,可通過 NVIDIA API 目錄輕松訪問。

向量化和重排序模型

NeMo Retriever NIM 微服務(wù)包含兩種模型——向量化和重排序模型,以及確保透明度和可靠性的開放式和商業(yè)化服務(wù)。

2b24405a-4a67-11ef-b8af-92fbcf53809c.png

RAG 管線示例:使用了適用于 Llama 3.1 的 NVIDIA NIM 微服務(wù)以及適用于客服 AI 聊天機(jī)器人應(yīng)用的 NeMo Retriever 向量化和重排序 NIM 微服務(wù)

向量化模型在將文本、圖像、圖表和視頻等各種數(shù)據(jù)轉(zhuǎn)化為數(shù)字向量,并存儲(chǔ)在向量數(shù)據(jù)庫中的同時(shí),獲取其含義和細(xì)微差別。與傳統(tǒng)的大語言模型(LLM)相比,向量化模型速度更快且計(jì)算成本更低。

重排序模型可獲取數(shù)據(jù)和查詢,隨后根據(jù)數(shù)據(jù)與查詢的相關(guān)性對(duì)數(shù)據(jù)進(jìn)行評(píng)分。與向量化模型相比,這類模型雖然計(jì)算復(fù)雜且速度較慢,但能大幅提高準(zhǔn)確性。

NeMo Retriever 提供了兩全其美的解決方案。開發(fā)者可以充分利用 NeMo Retriever 建立一個(gè)能夠給企業(yè)提供最有用、最準(zhǔn)確結(jié)果的流程。該流程先通過向量化 NIM 檢索巨大的數(shù)據(jù)網(wǎng),然后使用重排序 NIM 篩選結(jié)果的相關(guān)性。

通過 NeMo Retriever,開發(fā)者能夠使用先進(jìn)的開源商業(yè)模型,構(gòu)建極為精準(zhǔn)的文本問答檢索管線。與其他模型相比,NeMo Retriever NIM 微服務(wù)在企業(yè)問答中提供的不準(zhǔn)確答案減少了 30%。

2b430cba-4a67-11ef-b8af-92fbcf53809c.png

NeMo Retriever 向量化 NIM 和向量化 + 重排序 NIM 微服務(wù)性能與詞法搜索和替代向量的對(duì)比。

熱門用例

無論是 RAG 和 AI 智能體解決方案,還是數(shù)據(jù)驅(qū)動(dòng)的分析,NeMo Retriever 都能夠?yàn)楦鞣N AI 應(yīng)用提供助力。

這套微服務(wù)可用于創(chuàng)建能夠作出準(zhǔn)確、情境感知響應(yīng)的智能聊天機(jī)器人、幫助分析海量數(shù)據(jù)以識(shí)別安全漏洞、從復(fù)雜的供應(yīng)鏈信息中提取洞察等。它們還能勝任許多其他任務(wù),比如幫助 AI 賦能的零售業(yè)購物顧問提供自然、個(gè)性化的購物體驗(yàn)。

針對(duì)這些用例的 NVIDIA AI 工作流為開發(fā)生成式 AI 賦能的技術(shù)提供了一個(gè)簡(jiǎn)單且能夠獲得支持的起點(diǎn)。

數(shù)十家 NVIDIA 數(shù)據(jù)平臺(tái)合作伙伴正在使用 NeMo Retriever NIM 微服務(wù)提高其 AI 模型的準(zhǔn)確性和吞吐量。

DataStax 在其 Astra DB 和超融合平臺(tái)中集成了 NeMo Retriever 向量化 NIM 微服務(wù),使企業(yè)能夠?yàn)榭蛻籼峁?zhǔn)確的、經(jīng)過生成式 AI 增強(qiáng)的 RAG 功能,并加快產(chǎn)品上市時(shí)間。

Cohesity 將在其 AI 產(chǎn)品 Cohesity Gaia 中集成 NVIDIA NeMo Retriever 微服務(wù),以便幫助客戶通過 RAG 將自己的數(shù)據(jù)用于驅(qū)動(dòng)富有洞察力和變革性的生成式 AI 應(yīng)用。

Kinetica 將使用 NVIDIA NeMo Retriever 開發(fā) LLM 智能體。這些智能體能夠通過自然語言與復(fù)雜的網(wǎng)絡(luò)進(jìn)行交互,從而對(duì)中斷或漏洞作出更快的響應(yīng),將洞察轉(zhuǎn)化為即時(shí)行動(dòng)。

NetApp 正在與 NVIDIA 合作,將 NeMo Retriever 微服務(wù)連接到其智能數(shù)據(jù)基礎(chǔ)設(shè)施上的 EB 級(jí)數(shù)據(jù)。所有 NetApp ONTAP 客戶都將能夠“與他們的數(shù)據(jù)無縫對(duì)話”,在不影響數(shù)據(jù)安全或隱私的情況下獲得專屬的業(yè)務(wù)洞察。

NVIDIA 全球系統(tǒng)集成商合作伙伴包括埃森哲、德勤、Infosys、LTTS、Tata Consultancy Services、Tech Mahindra 和 Wipro 等,以及服務(wù)交付合作伙伴 Data Monsters、EXLService (愛爾蘭) Limited、Latentview、Quantiphi、Slalom、SoftServe 和 Tredence 正在開發(fā)各種服務(wù),幫助企業(yè)將 NeMo Retriever NIM 微服務(wù)添加到他們的 AI 管線中。

與其他 NIM 微服務(wù)一起使用

NeMo Retriever NIM 微服務(wù)可與 NVIDIA Riva NIM 微服務(wù)一起使用。后者為各行各業(yè)的語音 AI 應(yīng)用提供強(qiáng)大助力,增強(qiáng)了客戶服務(wù)并且讓數(shù)字人變得栩栩如生。

即將以 Riva NIM 微服務(wù)形式推出的新模型包括:適用于文本轉(zhuǎn)語音應(yīng)用的 FastPitch 和 HiFi-GAN;適用于多語言神經(jīng)機(jī)器翻譯的 Megatron;以及適用于自動(dòng)語音識(shí)別的破紀(jì)錄 NVIDIA Parakeet 系列模型。

NVIDIA NIM 微服務(wù)既可以組合使用,也可以單獨(dú)使用,為開發(fā)者提供構(gòu)建 AI 應(yīng)用的模塊化方法。這些微服務(wù)還可以在云端、本地或混合環(huán)境中與社區(qū)模型、NVIDIA 模型或用戶自定義模型集成,為開發(fā)者帶來了更大的靈活性。

NVIDIA NIM 微服務(wù)現(xiàn)在可在 ai.nvidia.com 上獲取。企業(yè)可通過 NVIDIA AI Enterprise 軟件平臺(tái)使用 NIM 將 AI 應(yīng)用部署到生產(chǎn)中。

NIM 微服務(wù)可在客戶首選的加速基礎(chǔ)設(shè)施上運(yùn)行,包括亞馬遜科技、谷歌云、Microsoft Azure 和 Oracle Cloud Infrastructure 的云實(shí)例,以及思科、戴爾科技、慧與、聯(lián)想和 Supermicro 等全球服務(wù)器制造合作伙伴的 NVIDIA 認(rèn)證系統(tǒng)。

NVIDIA 開發(fā)者計(jì)劃會(huì)員很快將能夠免費(fèi)使用 NIM,以在他們首選的基礎(chǔ)設(shè)施上進(jìn)行研究、開發(fā)和測(cè)試。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    28191

    瀏覽量

    206505
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4935

    瀏覽量

    102806
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30106

    瀏覽量

    268398
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    0

    文章

    272

    瀏覽量

    305

原文標(biāo)題:上吧,AI!全新 NVIDIA NeMo Retriever 微服務(wù)大幅提升 LLM 的準(zhǔn)確性和吞吐量

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    全新NVIDIA NIM微服務(wù)實(shí)現(xiàn)突破進(jìn)展

    全新 NVIDIA NIM 微服務(wù)實(shí)現(xiàn)突破進(jìn)展,可助力氣象技術(shù)公司開發(fā)和部署 AI 模型,實(shí)現(xiàn)對(duì)降雪、結(jié)冰和冰雹的預(yù)測(cè)。
    的頭像 發(fā)表于 11-21 10:07 ?111次閱讀

    日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新

    日本領(lǐng)先企業(yè)和大學(xué)正在使用 NVIDIA NeMo、NIM 微服務(wù)NVIDIA Isaac 加速 AI 創(chuàng)新。
    的頭像 發(fā)表于 11-19 14:34 ?165次閱讀

    如何提升ASR模型的準(zhǔn)確性

    提升ASR(Automatic Speech Recognition,自動(dòng)語音識(shí)別)模型的準(zhǔn)確性是語音識(shí)別技術(shù)領(lǐng)域的核心挑戰(zhàn)之一。以下是一些提升ASR模型準(zhǔn)確性的關(guān)鍵方法: 一、優(yōu)化數(shù)
    的頭像 發(fā)表于 11-18 15:14 ?299次閱讀

    TMS320VC5510 HPI吞吐量和優(yōu)化

    電子發(fā)燒友網(wǎng)站提供《TMS320VC5510 HPI吞吐量和優(yōu)化.pdf》資料免費(fèi)下載
    發(fā)表于 10-16 09:35 ?0次下載
    TMS320VC5510 HPI<b class='flag-5'>吞吐量</b>和優(yōu)化

    TMS320C6474模塊吞吐量

    電子發(fā)燒友網(wǎng)站提供《TMS320C6474模塊吞吐量.pdf》資料免費(fèi)下載
    發(fā)表于 10-15 13:52 ?0次下載
    TMS320C6474模塊<b class='flag-5'>吞吐量</b>

    NVIDIA NIM微服務(wù)帶來巨大優(yōu)勢(shì)

    服務(wù)通過熱門 AI 模型為數(shù)百萬開發(fā)者帶來高達(dá) 5 倍的 token 效率提升,使他們能夠立即訪問在 NVIDIA DGX Cloud 上運(yùn)行的 NIM 微服務(wù)
    的頭像 發(fā)表于 08-23 15:20 ?442次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)NVIDIA NIM 推理微服務(wù)
    的頭像 發(fā)表于 07-25 09:48 ?668次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    Retriever 微服務(wù),以實(shí)現(xiàn)準(zhǔn)確響應(yīng) 埃森哲率先使用新服務(wù),為客戶創(chuàng)建自定義 Llama 3.1 模型;Aramco、ATT 和優(yōu)步。 ? Llama 3.1 多語種大語言模型
    發(fā)表于 07-24 09:39 ?681次閱讀
    <b class='flag-5'>NVIDIA</b> AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    求助,關(guān)于使用iperf測(cè)量mesh節(jié)點(diǎn)吞吐量問題求解

    輸出,只能手動(dòng)ctrl+]退出,服務(wù)端收數(shù)據(jù)這邊吞吐量歸零,正常走完iperf測(cè)試時(shí)間(我設(shè)定的15s)后出現(xiàn)W (897098) iperf: tcp server recv error, error
    發(fā)表于 07-23 06:59

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會(huì) AI 平臺(tái)與 NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱 Embedding 全置于 GPU 上進(jìn)行
    的頭像 發(fā)表于 04-20 09:39 ?642次閱讀

    如何提高CYBT-243053-02吞吐量

    你好我們一直在使用“EZ-Serial Firmware: v1.4.13.13 Sep 22 2023 10:24:41”測(cè)試“CYBT-243053-02”,我們得到的吞吐量比 PUART 高
    發(fā)表于 02-27 06:56

    利用NVIDIA產(chǎn)品技術(shù)組合提升用戶體驗(yàn)

    UTalk-Doc 將用戶指令識(shí)別服務(wù)吞吐量提升了 5 倍,單個(gè)請(qǐng)求響應(yīng)時(shí)間縮減了三分之一,大幅提升
    的頭像 發(fā)表于 01-17 09:30 ?653次閱讀

    NVIDIA 通過企業(yè)級(jí)生成式 AI 微服務(wù)為聊天機(jī)器人、AI 助手和摘要工具帶來商業(yè)智能

    微服務(wù),支持企業(yè)將自定義大語言模型與企業(yè)數(shù)據(jù)相連接,使其 AI 應(yīng)用能夠提供高度準(zhǔn)確的響應(yīng)。 NVIDIA NeMo Retriever
    的頭像 發(fā)表于 11-29 21:05 ?591次閱讀

    NVIDIA 通過企業(yè)級(jí)生成式 AI 微服務(wù) 為聊天機(jī)器人、AI 助手和摘要工具帶來商業(yè)智能

    。 ? NVIDIA NeMo? RetrieverNVIDIA NeMo(一個(gè)用于構(gòu)建、自定義和部署生成式 AI 模型的框架和工具系
    發(fā)表于 11-29 14:37 ?267次閱讀
    <b class='flag-5'>NVIDIA</b> 通過企業(yè)級(jí)生成式 AI <b class='flag-5'>微服務(wù)</b> 為聊天機(jī)器人、AI 助手和摘要工具帶來商業(yè)智能

    影響ATE電源系統(tǒng)吞吐量的關(guān)鍵因素

    從串行設(shè)備測(cè)試改變?yōu)椴⑿性O(shè)備測(cè)試可以顯著地增加測(cè)試系統(tǒng)吞吐量。測(cè)試執(zhí)行活動(dòng)的大部分可能涉及使用DC電源設(shè)置條件和進(jìn)行測(cè)量。配置測(cè)試系統(tǒng),使其能夠使用多個(gè)直流電源同時(shí)對(duì)多個(gè)設(shè)備執(zhí)行測(cè)試,是顯著提高測(cè)試吞吐量的一種經(jīng)濟(jì)有效的方法。
    發(fā)表于 11-29 12:36 ?362次閱讀
    影響ATE電源系統(tǒng)<b class='flag-5'>吞吐量</b>的關(guān)鍵因素