,亚洲欧美日韩国产成人精品影院,亚洲国产欧美日韩精品一区二区三区,久久亚洲国产成人影院,久久国产成人亚洲精品影院老金,九九精品成人免费国产片,国产精品成人综合网,国产成人一区二区三区,国产成...

英特爾酷睿 Ultra處理器是英特爾公司推出的一個高端處理器品牌，其第一代產品基于Mete or Lake架構，使用Intel 4制程，單顆芯片封裝了 CPU、GPU(Intel Arc Graphics)和 NPU(Intel AI Boost)，具有卓越的AI性能。

本文將詳細介紹使用OpenVINO工具套件在英特爾酷睿Ultra處理器上實現對YOLOv8模型的INT8量化和部署。

第一步：環境搭建

首先，請下載并安裝最新版的NPU和顯卡驅動：

NPU 驅動：https://www.intel.cn/content/www/cn/zh/download/794734/intel-npu-driver-windows.html

顯卡驅動：

https://www.intel.cn/content/www/cn/zh/download/785597/intel-arc-iris-xe-graphics-windows.html

然后，請下載并安裝Anaconda，然后創建并激活名為npu的虛擬環境：（下載鏈接：https://www.anaconda.com/download）

conda create -n npu python=3.11    #創建虛擬環境
conda activate npu           #激活虛擬環境
python -m pip install --upgrade pip  #升級pip到最新版本

最后，請安裝openvino、nncf、onnx和ultralytics：

pip install openvino nncf onnx ultralytics

第二步：導出yolov8s模型并實現INT8量化

使用yolo命令導出yolov8s.onnx模型：

yolo export model=yolov8s.pt format=onnx

使用ovc命令導出OpenVINO格式，FP16精度的yolov8s模型

ovc yolov8s.onnx

使用benchmark_app程序依次測試FP16精度的yolov8s模型在CPU，GPU和NPU上的AI推理性能，結果如下圖所示：

benchmark_app -m yolov8s.xml -d CPU  #此處依次換為GPU，NPU

用NNCF實現yolov8s模型的INT8量化

NNCF全稱Neural Network Compression Framework，是一個實現神經網絡訓練后量化(post-training quantization)和訓練期間壓縮(Training-Time Compression)的開源工具包，如下圖所示，通過對神經網絡權重的量化和壓縮以最低精度損失的方式實現推理計算的優化和加速。

NNCF提供的量化和壓縮算法

在上述量化和壓縮算法中，訓練后INT8量化(Post-Training INT8 Quantization)是在工程實踐中應用最廣泛的，它無需重新訓練或微調模型，就能實現模型權重的INT8量化，在獲得顯著的性能提升的同時，僅有極低的精度損失，而且使用簡便。

用NNCF實現YOLOv8s模型INT8量化的范例代碼yolov8_PTQ_INT8.py，如下所示：

import torch, nncf
import openvino as ov 
from torchvision import datasets, transforms
# Specify the path of model and dataset
model_dir = r"yolov8s.xml"
dataset = r"val_dataset"
# Instantiate your uncompressed model
model = ov.Core().read_model(model_dir)
# Provide validation part of the dataset to collect statistics needed for the compression algorithm
val_dataset = datasets.ImageFolder(dataset, transform=transforms.Compose([transforms.ToTensor(),transforms.Resize([640, 640])]))
dataset_loader = torch.utils.data.DataLoader(val_dataset, batch_size=1)
# Step 1: Initialize transformation function
def transform_fn(data_item):
  images, _ = data_item
  return images.numpy()
# Step 2: Initialize NNCF Dataset
calibration_dataset = nncf.Dataset(dataset_loader, transform_fn)
# Step 3: Run the quantization pipeline
quantized_model = nncf.quantize(model, calibration_dataset)
# Step 4: Save the INT8 quantized model
ov.save_model(quantized_model, "yolov8s_int8.xml")

運行yolov8_PTQ_INT8.py，執行結果如下所示：

使用benchmark_app程序依次測試INT8精度的yolov8s模型在CPU，GPU和NPU上的AI推理性能，結果如下圖所示：

benchmark_app -m yolov8s_int8.xml -d CPU  #此處依次換為GPU，NPU

從上圖可以看出，yolov8s模型經過INT8量化后，相比FP16精度模型，無論在Latency還是Throughput上，都有明顯提升。

第三步：編寫YOLOv8推理程序

yolov8目標檢測模型使用letterbox算法對輸入圖像進行保持原始寬高比的放縮，據此，yolov8目標檢測模型的預處理函數實現，如下所示：

from ultralytics.data.augment import LetterBox
# 實例化LetterBox
letterbox = LetterBox()
# 預處理函數
def preprocess_image(image: np.ndarray, target_size=(640, 640))->np.ndarray:
  image = letterbox(image)  #YOLOv8用letterbox按保持圖像原始寬高比方式放縮圖像
  blob = cv2.dnn.blobFromImage(image, scalefactor=1 / 255, size=target_size, swapRB=True)
  return blob

yolov8目標檢測模型的后處理函數首先用非極大值抑制non_max_suppression()算法去除冗余候選框，然后根據letterbox的放縮方式，用scale_boxes()函數將檢測框的坐標點還原到原始圖像上，如下所示：

# 后處理函數: 從推理結果[1,84,8400]的張量中拆解出：檢測框，置信度和類別
def postprocess(pred_boxes, input_hw, orig_img, min_conf_threshold = 0.25, 
         nms_iou_threshold = 0.7, agnosting_nms = False, max_detections = 300):
  # 用非極大值抑制non_max_suppression()算法去除冗余候選框
  nms_kwargs = {"agnostic": agnosting_nms, "max_det":max_detections}
  pred = ops.non_max_suppression(
    torch.from_numpy(pred_boxes),
    min_conf_threshold,
    nms_iou_threshold,
    nc=80,
    **nms_kwargs
  )[0]
  # 用scale_boxes()函數將檢測框的坐標點還原到原始圖像上
  shape = orig_img.shape
  pred[:, :4] = ops.scale_boxes(input_hw, pred[:, :4], shape).round()
  
  return pred

完整代碼詳細參見：yolov8_infer_ov.py，其運行結果如下所示：

總結

英特爾酷睿 Ultra處理器內置了CPU、GPU和NPU，相比之前，無論是能耗比、顯卡性能還是AI性能，都有顯著提升；通過OpenVINO和NNCF，可以方便快捷實現AI模型的優化和INT量化，以及本地化部署，獲得非常不錯的端側AI推理性能。

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

處理器

處理器

+關注

關注
68

文章
19159

瀏覽量
229112
英特爾

英特爾

+關注

關注
60

文章
9880

瀏覽量
171480
GPU芯片

GPU芯片

+關注

關注
1

文章
303

瀏覽量
5781
OpenVINO

OpenVINO

+關注

關注
0

文章
87

瀏覽量
181

原文標題：在英特爾? 酷睿? Ultra處理器上優化和部署YOLOv8模型 | 開發者實戰

文章出處：【微信號：英特爾物聯網，微信公眾號：英特爾物聯網】歡迎添加關注！文章轉載請注明出處。

英特爾發布酷睿Ultra 200S系列臺式機處理器

近日，英特爾正式推出了酷睿Ultra 200S系列處理器家族，為臺式機平臺帶來了全新的AI PC功能。此次發布的

發表于 10-11 17:36 ?459次閱讀

選擇英特爾? 酷睿? 處理器家族，開啟智能計算新時代

在數字化轉型加速的時代，計算性能的提升已成為每個用戶的核心訴求。無論是職場精英、游戲玩家、內容創作者，還是家庭娛樂愛好者， 英特爾? 酷睿? 處理器家族憑借卓越的性能與智能

發表于 09-18 10:39 ?8811次閱讀

選擇<b class='flag-5'>英特爾</b>? <b class='flag-5'>酷</b><b class='flag-5'>睿</b>? <b class='flag-5'>處理器</b>家族，開啟智能計算新時代

英特爾酷睿Ultra 200V系列處理器發布

英特爾近日隆重推出了其革命性的酷睿Ultra 200V系列處理器，這一全新x86處理器家族以超高

發表于 09-10 16:44 ?510次閱讀

如何將Llama3.1模型部署在英特爾酷睿Ultra處理器

本文從搭建環境開始，一步一步幫助讀者實現只用五行代碼便可將Llama3.1模型部署在英特爾 酷睿

發表于 07-26 09:51 ?1944次閱讀

如何將Llama3.1<b class='flag-5'>模型</b><b class='flag-5'>部署</b><b class='flag-5'>在</b><b class='flag-5'>英特爾</b><b class='flag-5'>酷</b><b class='flag-5'>睿</b><b class='flag-5'>Ultra</b><b class='flag-5'>處理器</b>

英特爾酷睿Ultra處理器出貨量預計飆升

英特爾中國區董事長王銳近日透露，英特爾酷睿Ultra處理器自問世以來，已經

發表于 06-20 09:23 ?713次閱讀

已有超過500款AI模型在英特爾酷睿Ultra處理器上得以優化運行

近日，英特爾宣布在全新英特爾 酷睿 Ultra處理器

發表于 05-11 09:31 ?678次閱讀

英特爾酷睿Ultra處理器突破500個AI模型優化

英特爾在最新推出的英特爾? 酷睿? Ultra處理器

發表于 05-09 11:18 ?737次閱讀

英特爾二季度對酷睿Ultra處理器供應受限

英特爾首席執行官帕特·基辛格在最新的財報電話會議上透露，受晶圓級封裝產能限制，二季度酷睿Ultra

發表于 05-06 11:04 ?634次閱讀

英特爾推出面向邊緣市場的酷睿 / 酷睿 Ultra 處理器PS系列

其中，酷睿Ultra處理器PS系列即為Meteor Lake PS，提供45瓦 and 15瓦兩個功率選項。主打款為英特爾

發表于 04-09 16:45 ?972次閱讀

英特爾Arrow Lake處理器更名酷睿Ultra

@金豬升級包強調Arrow Lake處理器不太可能被稱為15代酷睿，更有可能會被冠名為“酷睿Ultra

發表于 03-04 16:45 ?1360次閱讀

5G網絡優化處理器和AI PC搶鏡 英特爾攜三大重磅產品線亮相MWC24

此次在MWC24上，英特爾帶來三大旗艦產品線：一、用于網絡工作負載的未來Granite Rapids-D和Sierra Forest處理器；二、幫助運營商變現其邊緣

發表于 02-29 15:16 ?4285次閱讀

康佳特推出搭載全新英特爾?酷睿? Ultra 處理器的COM Express緊湊型模塊

新一代用于邊緣計算的AI計算 ? ? 2023/12/20 中國上海 * * * 全球領先的嵌入式和邊緣計算技術供應商德國康佳特近日推出搭載英特爾?酷睿?Ultra

發表于 12-20 17:03 ?892次閱讀

AI 無處不在，英特爾酷睿Ultra 和第五代英特爾至強可擴展處理器正式發布

英特爾 ?酷睿?Ultra處理器和第五代英特爾 ? 至強 ? 可擴展

發表于 12-16 16:05 ?679次閱讀

英特爾發布酷睿Ultra和第五代至強可擴展處理器

戰略的發布，以及英特爾 酷睿 Ultra處理器和第五代英特爾 至強可擴展

發表于 12-16 15:23 ?1250次閱讀

英特爾發布新一代移動端處理器——酷睿Ultra系列

　在12月7日的聯想集團“AI PC 產業創新論壇”上，英特爾中國區技術總經理高宇透露，新一代酷睿 Ul

發表于 12-14 17:14 ?1773次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

在英特爾酷睿Ultra處理器上優化和部署YOLOv8模型

評論

英特爾發布酷睿Ultra 200S系列臺式機處理器

選擇英特爾? 酷睿? 處理器家族，開啟智能計算新時代

英特爾酷睿Ultra 200V系列處理器發布

如何將Llama3.1模型部署在英特爾酷睿Ultra處理器

英特爾酷睿Ultra處理器出貨量預計飆升

已有超過500款AI模型在英特爾酷睿Ultra處理器上得以優化運行

英特爾酷睿Ultra處理器突破500個AI模型優化

英特爾二季度對酷睿Ultra處理器供應受限

英特爾推出面向邊緣市場的酷睿 / 酷睿 Ultra 處理器PS系列

英特爾Arrow Lake處理器更名酷睿Ultra

5G網絡優化處理器和AI PC搶鏡英特爾攜三大重磅產品線亮相MWC24

康佳特推出搭載全新英特爾?酷睿? Ultra 處理器的COM Express緊湊型模塊

AI 無處不在，英特爾酷睿Ultra 和第五代英特爾至強可擴展處理器正式發布

英特爾發布酷睿Ultra和第五代至強可擴展處理器

英特爾發布新一代移動端處理器——酷睿Ultra系列