[《PyTorch 2.5重磅更新:性能優化+新特性》]中的一個新特性就是:正式支持在英特爾^?^獨立顯卡上訓練模型!
PyTorch 2.5 |
---|
獨立顯卡類型 |
Intel^?^數據中心GPU Max系列 |
Intel^?^Arc?系列 |
本文將在Intel^?^Core? Ultra 7 155H自帶的Arc?集成顯卡上展示使用Pytorch2.5搭建并訓練AI模型的全流程。
一 ,搭建開發環境
首先,請安裝顯卡驅動,參考指南:
https://dgpu-docs.intel.com/driver/client/overview.html
然后,**請下載并安裝Anaconda,**鏈接↓↓
https://www.anaconda.com/download
并用下面的命令創建并激活名為pytorch_arc的虛擬環境:
conda create -n pytorch_arc python=3.11 #創建虛擬環境
conda activate pytorch_arc #激活虛擬環境
python -m pip install --upgrade pip #升級pip到最新版本
接著,安裝Pytorch XPU版;
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/xpu
滑動查看更多
最后,執行命令,驗證安裝。看到返回結果為“True”,證明環境搭建成功!
>> > import torch
>> > torch.xpu.is_available()
二 ,訓練ResNet模型
執行下載的訓練代碼,實現在Intel^?^ Arc?集成顯卡上訓練ResNet50模型。代碼下載鏈接:
https://gitee.com/Pauntech/Pytorch-2.5
import torch
import torchvision
LR = 0.001
DOWNLOAD = True
DATA = "datasets/cifar10/"
transform = torchvision.transforms.Compose(
[
torchvision.transforms.Resize((224, 224)),
torchvision.transforms.ToTensor(),
torchvision.transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)),
]
)
train_dataset = torchvision.datasets.CIFAR10(
root=DATA,
train=True,
transform=transform,
download=DOWNLOAD,
)
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=128)
train_len = len(train_loader)
model = torchvision.models.resnet50()
criterion = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(model.parameters(), lr=LR, momentum=0.9)
model.train()
model = model.to("xpu")
criterion = criterion.to("xpu")
print(f"Initiating training")
for batch_idx, (data, target) in enumerate(train_loader):
data = data.to("xpu")
target = target.to("xpu")
optimizer.zero_grad()
output = model(data)
loss = criterion(output, target)
loss.backward()
optimizer.step()
if (batch_idx + 1) % 10 == 0:
iteration_loss = loss.item()
print(f"Iteration [{batch_idx+1}/{train_len}], Loss: {iteration_loss:.4f}")
torch.save(
{
"model_state_dict": model.state_dict(),
"optimizer_state_dict": optimizer.state_dict(),
},
"checkpoint.pth",
)
print("Execution finished")
三 ,總結
使用[PyTorch]在英特爾獨立顯卡上訓練模型將為AI行業新增計算硬件選擇!
審核編輯 黃宇
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
英特爾
+關注
關注
60文章
9900瀏覽量
171548 -
顯卡
+關注
關注
16文章
2424瀏覽量
67477 -
pytorch
+關注
關注
2文章
803瀏覽量
13152
發布評論請先 登錄
相關推薦
支持140億參數AI模型,229TOPS!英特爾重磅發布第一代車載獨立顯卡
英特爾院士、英特爾公司副總裁、汽車事業部總經理Jack Weast指出,在今年的CES上,英特爾發布了第一代AI增強型軟件定義車載SoC。8月8日,英特爾正式推出首款
英特爾發布第一代車載銳炫獨立顯卡
英特爾震撼發布其第一代車載英特爾銳炫獨立顯卡,標志著智能座艙技術邁入全新階段。這款顯卡平臺算力高達229TOPS,不僅
從運動員到開發者: 英特爾以開放式AI系統應對多重挑戰
打造的生成式AI(GenAI)檢索增強生成(RAG)解決方案。該成果深度展示了英特爾如何通過基于英特爾?至強?處理器和英特爾??Gaudi AI加速器的開放式AI系統及平臺,幫助開發者
網友成功在Arm架構平臺運行英特爾銳炫A750顯卡
值得注意的是,英特爾獨立顯卡源于核心顯卡,因此在長期使用的“i915”Linux系統內核驅動中,積累了許多與x86架構緊密相關的特性。
華擎推出AI QuickSet軟件,支持英特爾銳炫Arc A系列顯卡
今日,華擎宣布將AI QuickSet軟件工具擴展至英特爾銳炫Arc A系列顯卡,使其能夠便捷地安裝Stable Diffusion web UI OpenVINO,結合英特爾OpenVINO套件,充分發揮Arc
英特爾下代銳炫ARC顯卡明年或難問世?
據了解,英特爾 ARC 銳炫系列 DG3 獨立顯卡將使用 Xe2-HPG 架構,代號為 Battlemage,旨在替代 2022 年發布的 Alchemist 系列 DG2 獨立
英特爾開發套件『哪吒』在Java環境實現ADAS道路識別演示 | 開發者實戰
本文使用來自OpenModelZoo的預訓練的road-segmentation-adas-0001模型。ADAS代表高級駕駛輔助服務。該模型識別四個類別:背景、道路、路緣和標記。硬件環境此文使用了英特爾開發套件家族里的『哪吒』
英特爾Battlemage顯卡僅支持UHBR10模式,不再支持DisplayPort UHBR20
據報道,英特爾近日發布多項補丁,顯示其Battlemage顯卡(DG2/Alchemist的后續產品)最高支援到DisplayPort UHBR13.5。
英特爾面向AI PC軟件開發者與硬件供應商新增助力計劃
英特爾公司近日宣布“AI PC加速計劃”再添兩項人工智能(AI)新舉措,即新增“AI PC開發者計劃”,并吸納獨立硬件供應商(IHV)加入“AI PC加速計劃”。
【轉載】英特爾開發套件“哪吒”快速部署YoloV8 on Java | 開發者實戰
OpenVINO 工具套件基于OneAPI開發,可以加快高性能計算機視覺和深度學習應用開發速度的工具套件,適用于從邊緣到云的各種英特爾計算平臺上,幫助用戶更快地將更準確的真實世界數據的AI推理結果
評論