起因

最近在修改上一個同事加載和預處理數(shù)據(jù)的代碼，原版的代碼使用tf1.4.1寫的，數(shù)據(jù)加載也是完全就是for循環(huán)讀取+預處理，每讀入并預處理好一個batch就返回丟給模型訓練，如此往復，我覺得速度實在太慢了，而且我新寫的代碼都是基于pytorch，雖然預處理的過程很復雜，我還是下決心自己改寫。

用pytorch加載預處理數(shù)據(jù)，最常用的就是torch.utils.data.Dataset和torch.utils.data.DataLoader組合起來，把數(shù)據(jù)預處理都在Dataset里寫好，再在DataLoader里設定batch_size, shuffle等參數(shù)去加載數(shù)據(jù)，網(wǎng)上的教程非常多，這里我就不展開講了。

過程

現(xiàn)在我已經(jīng)獲得了train_loader和test_loader，可以從它們里面每次讀取一個batch出來訓練，可照理說加載Dataset時占用了大量內(nèi)存是正常的，因為數(shù)據(jù)都預加載好了，就只需要用DataLoader讀取就行了，但在訓練的過程中，內(nèi)存不應該隨著訓練而逐漸增加。我眼睜睜看著內(nèi)存占用從8、9個g，逐漸漲到了25個g，程序最終因為占滿內(nèi)存而崩潰。檢查了半天自己的代碼都沒找出問題所在，后來用memory_profiler查看內(nèi)存占用情況，發(fā)現(xiàn)問題主要出現(xiàn)在這一行代碼：actual_labels += list(correctness)，correctness的類型是torch.FloatTensor，actual_labels是python原生的list。

pred和correctness是同類型同長度的tensor，在將其轉(zhuǎn)換為list再添加到已有的list中時，占用的內(nèi)存相差了約5個Mb，于是我將上面代碼改寫為：

問題解決了！

為什么下面的代碼就沒事，上面直接將Tensor轉(zhuǎn)為list就會發(fā)生這種奇怪的現(xiàn)象？我去github和知乎看到了遇到類似問題的issue與文章，下面是鏈接

https://github.com/pytorch/pytorch/issues/13246
https://zhuanlan.zhihu.com/p/86286137
https://github.com/pytorch/pytorch/issues/17499

結(jié)論

目前得到的結(jié)論大概是python list的design有問題，導致了這種情況發(fā)生，pytorch團隊雖然竭力修復，但他們表示因為這是python設計的缺陷，超出了他們的能力范圍，上面第一個issue主要是針對DataLoader里num_workers>0時會導致內(nèi)存泄漏，里面也提到了list與tensor互轉(zhuǎn)亦會發(fā)生內(nèi)存泄漏，這個issue已經(jīng)一年多了還沒能close。

因此，在使用pytorch時，應該盡力避免list的使用，一定不能讓tensor和list直接互相轉(zhuǎn)換，如果一定要做，應該將tensor從cuda轉(zhuǎn)到cpu上，轉(zhuǎn)為numpy.array，最后轉(zhuǎn)為list，反之亦然。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

代碼

代碼

+關(guān)注

關(guān)注
30

文章
4751

瀏覽量
68359
for循環(huán)

for循環(huán)

+關(guān)注

關(guān)注
0

文章
61

瀏覽量
2493
pytorch

pytorch

+關(guān)注

關(guān)注
2

文章
803

瀏覽量
13150

Pytorch模型訓練實用PDF教程【中文】

？模型部分？還是優(yōu)化器？只有這樣不斷的通過可視化診斷你的模型，不斷的對癥下藥，才能訓練出一個較滿意的模型。本教程內(nèi)容及結(jié)構(gòu)：本教程內(nèi)容主要為在 PyTorch 中訓練一個模型所可能涉及到的方法及函數(shù)，并且

發(fā)表于 12-21 09:18

Pytorch自動求導示例

Pytorch自動微分的幾個例子

發(fā)表于 08-09 11:56

Pytorch入門之的基本操作

Pytorch入門之基本操作

發(fā)表于 05-22 17:15

PyTorch如何入門

PyTorch 入門實戰(zhàn)（一）——Tensor

發(fā)表于 06-01 09:58

PyTorch10的基礎教程

PyTorch 10 基礎教程（4）：訓練分類器

發(fā)表于 06-05 17:42

Pytorch AI語音助手

想做一個Pytorch AI語音助手，有沒有好的思路呀？

發(fā)表于 03-06 13:00

如何安裝TensorFlow2 Pytorch？

如何安裝TensorFlow2 Pytorch？

發(fā)表于 03-07 07:32

如何往星光2板子里裝pytorch？

如題,想先gpu版本的pytorch只安裝cpu版本的pytorch,pytorch官網(wǎng)提供了基于conda和pip兩種安裝方式。因為咱是risc架構(gòu)沒對應的conda，而使用pip安裝提示也沒有

發(fā)表于 09-12 06:30

pytorch模型轉(zhuǎn)換需要注意的事項有哪些？

什么是JIT（torch.jit）？答：JIT（Just-In-Time）是一組編譯工具，用于彌合PyTorch研究與生產(chǎn)之間的差距。它允許創(chuàng)建可以在不依賴Python解釋器的情況下運行的模型

發(fā)表于 09-18 08:05

基于PyTorch的深度學習入門教程之PyTorch簡單知識

本文參考PyTorch官網(wǎng)的教程，分為五個基本模塊來介紹PyTorch。為了避免文章過長，這五個模塊分別在五篇博文中介紹。 Part1：PyTorch簡單知識 Part2：PyTorch

發(fā)表于 02-16 15:20 ?2230次閱讀

PyTorch1.8和Tensorflow2.5該如何選擇？

發(fā)布。而 PyTorch 則由 Facebook 的團隊開發(fā)，并于 2017 年在 GitHub 上開源。為了充分發(fā)揮不同機器學習框架的優(yōu)勢，許多機器

發(fā)表于 07-09 10:33 ?1490次閱讀

那些年在pytorch上踩過的坑

今天又發(fā)現(xiàn)了一個pytorch的小坑，給大家分享一下。手上兩份同一模型的代碼，一份用tensorflow寫的，另一份是我拿pytorch寫的，模型架構(gòu)一模一樣，預處理數(shù)據(jù)的邏輯也一模一樣，測試發(fā)現(xiàn)模型推理的速度也差不多。一份預處理代碼是為

發(fā)表于 02-22 14:18 ?1029次閱讀

tensorflow和pytorch哪個更簡單?

PyTorch更簡單。選擇TensorFlow還是PyTorch取決于您的具體需求和偏好。如果您需要一個易于使用、靈活且具有強大社區(qū)支持的框架，PyTorch可能是一個更好的選擇。如果您需要一個在

發(fā)表于 07-05 09:45 ?787次閱讀

PCB板上過孔太多如何解決

PCB板上過孔太多是一個在電子設計中常見的問題，它可能由多種因素引起，如設計不合理、走線復雜、信號需求等。解決PCB板上過孔太多的問題，需要從設計、布局、走線以及與制造廠商的溝通等多個方面入手。

發(fā)表于 07-16 15:25 ?2758次閱讀

pytorch怎么在pycharm中運行

第一部分：PyTorch和PyCharm的安裝 1.1 安裝PyTorch PyTorch是一個開源的機器學習庫，用于構(gòu)建和訓練神經(jīng)網(wǎng)絡。要在PyCharm中使用PyTorch，首先需

發(fā)表于 08-01 16:22 ?1254次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

那些年在pytorch上過的當

起因

過程

結(jié)論

評論

Pytorch模型訓練實用PDF教程【中文】

Pytorch自動求導示例

Pytorch入門之的基本操作

PyTorch如何入門

PyTorch10的基礎教程

Pytorch AI語音助手

如何安裝TensorFlow2 Pytorch？

如何往星光2板子里裝pytorch？

pytorch模型轉(zhuǎn)換需要注意的事項有哪些？

基于PyTorch的深度學習入門教程之PyTorch簡單知識

PyTorch1.8和Tensorflow2.5該如何選擇？

那些年在pytorch上踩過的坑

tensorflow和pytorch哪個更簡單?

PCB板上過孔太多如何解決

pytorch怎么在pycharm中運行