国产免费人成视频在线观看|99热这里只有国产精品9|在线观看av片永久免费|一一级毛片国产一级毛片

作者:

Whitney Foster OpenVINO產(chǎn)品專家

Yury Gorbachev 英特爾院士 OpenVINO 產(chǎn)品架構(gòu)師

翻譯:

武卓博士英特爾OpenVINO軟件布道師

在過去的一年里，大語言模型（LLM）徹底改變了文本處理，為文本摘要、重寫、文檔分析等提供了解決方案。然而，我們每天與之交互的數(shù)據(jù)不僅僅是文本，而是多模態(tài)的，包括視頻、音頻和圖像。多模態(tài)的存在非常普遍，事實(shí)上在安全、監(jiān)控或醫(yī)療保健等某些領(lǐng)域至關(guān)重要。它代表了從處理文本到處理不同輸入和生成不同形式輸出的重大演變。例如，多模態(tài)模型可以接收長視頻，并以圖像或音頻片段的形式輸出關(guān)鍵信息。

為了滿足多模態(tài) AI 的需求，OpenVINO2024.5 引入了新的流水線，使開發(fā)者能夠輕松部署處理語音、圖像和視頻以及文本的解決方案。讓我們探討一下這些新功能是如何工作的，以及如何從今天開始使用它們。

OpenVINO 2024.5 中的

主要多模態(tài) AI 流水線

文生圖

通過文生圖流水線（Text2ImagePipeline），利用擴(kuò)散模型，比如 Stable Diffusion 以及 Stable Diffusion XL 模型，從輸入的文本提示詞中生成圖像。

輸出示例：從一個描述性的文本提示詞生成一張現(xiàn)實(shí)圖像。

語音到文本轉(zhuǎn)換

通過 WhisperPipeline 利用 Whisper 模型家族，將語音音頻轉(zhuǎn)換成文字。

使用場景示例：轉(zhuǎn)錄訪談或播客，以實(shí)現(xiàn)高效的文檔記錄。

視覺語言處理

用諸如 LLaVA 以及 miniCPMV 的視覺語言模型（VLMs）通過 VLMPipeline 處理圖像。

應(yīng)用示例：用文本描述注釋和分析醫(yī)學(xué)圖像。

提升部署效率

流水線支持 C++ 以及 Python，以實(shí)現(xiàn)更靈活的集成。

模型可以使用 optimum-intel 由 Hugging Face 導(dǎo)出并利用神經(jīng)網(wǎng)絡(luò)壓縮框架（NNCF）壓縮。為獲得最優(yōu)性能，將模型壓縮至 INT4 格式。

預(yù)覽版特性：這些功能正在預(yù)覽支持中。其它經(jīng)過驗(yàn)證的模型和流水線優(yōu)化正在進(jìn)行中。查看我們的 GitHub 文檔以獲取更新。有關(guān)支持的模型和流水線的最新列表，您可以在此處查看我們的 Github 存儲庫。

在流水線中支持 LoRA 適配器

大模型的訓(xùn)練異常困難且所需資源密集。LoRA 適配器允許使用很少的資源快速有效地微調(diào)模型。這使您可以根據(jù)新的圖像生成風(fēng)格或特定領(lǐng)域的任務(wù)自定義流行的 AI 模型，而無需重新訓(xùn)練整個模型，AI 社區(qū)中有許多預(yù)制的適配器和庫可供您直接使用。

OpenVINO 2024.5 引入了預(yù)覽版功能為文本和圖像生成模型加載 LoRA 適配器，而無需在編譯前將這些適配器融合到主模型中。可以為同一模型加載多個 LoRA 適配器，并根據(jù)目標(biāo)場景在每次生成調(diào)用的運(yùn)行時在這些適配器之間動態(tài)切換。

例如，可以通過具有多個自定義 LoRA 的文生圖流水線 Text2ImagePipeline 編譯模型，然后選擇在運(yùn)行時應(yīng)用哪種樣式的圖像，而無需重新編譯模型。這種定制化的切換對性能的影響是有較小的，我們正在努力進(jìn)一步完善它。

以下是我們提供的 LLM 流水線的基本 LoRA 使用代碼片段。您可以在我們的倉庫中找到 python 的完整示例和類似示例。

using namespace ov::genai;
//path to adapter (safetensors file)
Adapter adapter(adapter_path);
// compile pipeline and register all required adapters during compilation
LLMPipeline pipe(models_path, device, adapters(adapter));  
//Generate with LoRA adapter and alpha set to 0.75
std::cout << pipe.generate(prompt, max_new_tokens(100), adapters(adapter, 0.75));
//Now, generate without LoRA adapter
std::cout << pipe.generate(prompt, max_new_tokens(100), adapters());

通過推測性解碼獲得高效文本生成

推測性解碼已被證明可以通過使用兩個模型而不是一個模型來提高生成性能。簡而言之，一個非常小的草稿模型會生成文本，并由一個全尺寸的文本生成模型定期進(jìn)行校正。

從 2024.5 版本開始，通過一個推測性解碼的算法實(shí)現(xiàn)，開發(fā)者可以在大語言模型流水線 LLMPipeline 中使用兩個模型。這意味著在創(chuàng)建流水線的時候，開發(fā)者可以給它傳遞附加的草稿模型。以下是一段簡化后的代碼片段：

//compiling pipeline with draft model and configuration for generation options
ov::LLMPipeline pipe(    
 main_model_path,    
 main_device,     
 ov::draft_model(draft_model_path, draft_device),    
 ov::scheduler_config(scheduler_config));


//running generation
pipe.generate(prompt, config);

你可以在我們的樣例倉庫這里找到 python 示例以及全部示例。

當(dāng)在 AI PC 中運(yùn)行一個應(yīng)用的時候，有許多推理選項(xiàng)可用。比如，草稿模型和主模型可以都運(yùn)行在集成顯卡上，或者以組合的方式運(yùn)行在 CPU 以及集成顯卡上。根據(jù)草稿模型和主模型的模型大小以及部署的限制，不同的組合方式效率會更高。我們發(fā)現(xiàn)，在 CPU 上運(yùn)行草稿模型以及在集成顯卡上運(yùn)行主模型提供了最具性能的生成方式。

草稿模型并非廣泛適用于所有公共模型，典型的限制是草稿模型的訓(xùn)練方式應(yīng)與大模型相似；至少，分詞器應(yīng)該匹配。

我們已經(jīng)與英特爾研究院一起，通過使用一項(xiàng)叫做 FastDraft 的新技術(shù)，研發(fā)了幾個高效的小型草稿模型，這里有詳細(xì)的論文描述。

Phi-3.5 以及 Llama 的高效的草稿模型（Phi-3.5草稿模型大小50MB）已經(jīng)放在我們在 Hugging Face 的模型倉庫中，可以從那里下載快照。

在英特爾 NPU 上支持 LLM

我們的 GitHub 上有很多關(guān)于英特爾NPU 上支持 LLM 的請求，現(xiàn)在， Llama 3 8B、Llama 2 7B、Mistral-v0.2-7B、Qwen2-7B-Instruct 和 Phi-3 Mini 的文本生成模型均被添加了這一支持。

現(xiàn)在，當(dāng)您通過 OpenVINO GenAI API 大語言模型流水線 LLMPipeline文檔鏈接編譯模型時，您可以將 NPU 指定為目標(biāo)設(shè)備。如果 NPU 存在于系統(tǒng)中，底層代碼將為 NPU 編譯模型，后續(xù)調(diào)用將通過 NPU 運(yùn)行時堆棧運(yùn)行。

使用 NPU 時，目前的建議是使用 Channel-Wise 壓縮算法壓縮模型。這在性能方面更有效率。您可以在我們的文檔中找到如何操作。

致謝！

時光飛快！又到了一年的年末，我們想對所有貢獻(xiàn)者和 OpenVINO 社區(qū)的持續(xù)支持表示感謝。您的貢獻(xiàn)和反饋幫助我們共同推進(jìn)了 OpenVINO 的發(fā)展之旅。我們期待在2025年一起揭開下一步的面紗！

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

英特爾

英特爾

+關(guān)注

關(guān)注
60

文章
9886

瀏覽量
171528
流水線

流水線

+關(guān)注

關(guān)注
0

文章
120

瀏覽量
25621
AI

AI

+關(guān)注

關(guān)注
87

文章
30146

瀏覽量
268421
OpenVINO

OpenVINO

+關(guān)注

關(guān)注
0

文章
89

瀏覽量
182

原文標(biāo)題：OpenVINO? 2024.5 新發(fā)布：使用流水線簡易部署多模態(tài) AI

文章出處：【微信號：英特爾物聯(lián)網(wǎng)，微信公眾號：英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

Cadence_16.5的新功能

ALLEGRO16.6的新功能，希望對你有用。

發(fā)表于 11-15 10:19

Cadence/OrCAD PSpice 16.6新功能介紹

介紹了版本16.6的新功能。主要有：learning pspice等

發(fā)表于 07-02 11:33

諾基亞N78下新功能

N78終于入手 SHOW下新功能

發(fā)表于 05-05 14:32

Cadence Allegro 17.4新功能

發(fā)表于 10-28 21:19

AWTK Designer 1.0.2有哪些新功能

為不斷提升用戶體驗(yàn)，本次Designer 1.0.2增加了自定義控件和插件管理以及其他許多新功能，并對現(xiàn)有功能進(jìn)行了優(yōu)化，讓我們一起來看看這些很酷的新功能吧！

發(fā)表于 03-04 08:27

LTspice IV有什么新功能？

LTspice IV有什么新功能？

發(fā)表于 05-27 09:38 ?2次下載

LTspice IV有什么新功能？

LTspice IV有什么新功能？

發(fā)表于 05-27 11:46 ?0次下載

LTspice IV有什么新功能？

LTspice IV有什么新功能？

發(fā)表于 05-27 12:20 ?2次下載

LTspice IV有什么新功能？

LTspice IV有什么新功能？

發(fā)表于 05-27 12:26 ?0次下載

LTspice IV有什么新功能？

LTspice IV有什么新功能？

發(fā)表于 05-27 12:28 ?0次下載

LTspice IV有什么新功能？

LTspice IV有什么新功能？

發(fā)表于 05-27 12:52 ?2次下載

LTspice IV有什么新功能？

LTspice IV有什么新功能？

發(fā)表于 05-27 13:18 ?1次下載

鴻蒙系統(tǒng)有什么新功能

鴻蒙系統(tǒng)有什么新功能？在前段時間，華為正式發(fā)布了鴻蒙系統(tǒng)，鴻蒙系統(tǒng)勾起了許多小伙伴的好奇心，那么應(yīng)該有很多人好奇鴻蒙系統(tǒng)有什么新功能，那么鴻蒙系統(tǒng)有什么新功能呢？下面小編告訴大家鴻蒙系統(tǒng)有什么

發(fā)表于 07-06 16:22 ?7233次閱讀

蘋果13有哪些新功能

蘋果13有哪些新功能？

發(fā)表于 09-04 16:54 ?8063次閱讀

OpenVINO? C# API詳解與演示

OpenVINO C# API 支持 NuGet 程序包安裝方式，這與 OpenVINO C++ 庫的安裝過程相比，更加簡單。如果使用 Visual Studio 開發(fā) AI 項(xiàng)目，則可以通過 NuGet 程序包管理功能直接安裝

發(fā)表于 10-13 16:39 ?724次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

淺析OpenVINO 2024.5的新功能

評論

Cadence_16.5的新功能

Cadence/OrCAD PSpice 16.6新功能介紹

諾基亞N78下新功能

Cadence Allegro 17.4新功能

AWTK Designer 1.0.2有哪些新功能

LTspice IV有什么新功能？

LTspice IV有什么新功能？

LTspice IV有什么新功能？

LTspice IV有什么新功能？

LTspice IV有什么新功能？

LTspice IV有什么新功能？

LTspice IV有什么新功能？

鴻蒙系統(tǒng)有什么新功能

蘋果13有哪些新功能

OpenVINO? C# API詳解與演示