模型介紹
EDSR模型,全稱為enhanced deep super-resolution network(增強的深度學習超分辨率重建網絡)。該模型可以對指定圖片進行超分辨率操作,提高清晰度。
而MDSR是多尺度的超分模型,可以一次輸出不同scale的圖片,相比EDSR,可以在相同的性能下,減少很多的參數。
EDSR模型結構如下:
MDSR模型結構如下:
本期內容將會帶領大家學習如何利用TPU-MLIR實現EDSR模型到MDSR模型的轉換。
模型導出與轉換
基本流程為將原項目與模型下載后導出為onnx模型。再利用TPU-MLIR工具將onnx模型轉換為bmodel模型。
目錄結構安排如下,其中dataset文件夾中是量化所用的DIV2K數據集,image文件夾下是測試圖片,model文件夾中是待轉換的onnx模型。
.
├──dataset
│├──x2
│├──x3
│└──x4
├──image
└──model
├──EDSR_x2.onnx
├──EDSR_x3.onnx
├──EDSR_x4.onnx
├──MDSR_x2.onnx
├──MDSR_x3.onnx
└──MDSR_x4.onnx
以下命令均在TPU-MLIR的docker環境內進行。
進入EDSR-transform目錄
設置參數
scale=4
size=100
echoscale=${scale}size=${size}
mkdirworkspace_x${scale}&&cdworkspace_x${scale}
- 模型轉換和量化
#算子轉換、圖優化
model_transform.py\
--model_nameEDSR_x${scale}\
--model_def../model/EDSR_x${scale}.onnx\
--input_shapes[[1,3,${size},${size}]]\
--keep_aspect_ratio\
--pixel_formatrgb\
--test_input../image/0901x${scale}.png\
--test_resultEDSR_x${scale}_outputs.npz\
--mlirEDSR_x${scale}.mlir
#建立校準表
run_calibration.pyEDSR_x${scale}.mlir\
--dataset../dataset/X${scale}\
--input_num50\
-oEDSR_x${scale}_cali_table
#多層優化和轉換bmodel
##轉換INT8模型
model_deploy.py\
--mlirEDSR_x${scale}.mlir\
--quantizeINT8\
--calibration_tableEDSR_x${scale}_cali_table\
--chipbm1684x\
--test_inputEDSR_x${scale}_in_f32.npz\
--test_referenceEDSR_x${scale}_outputs.npz\
--tolerance0.85,0.45\
--modelEDSR_x${scale}_1684x_int8_sym.bmodel
##轉換FP16模型
model_deploy.py\
--mlirEDSR_x${scale}.mlir\
--quantizeF16\
--chipbm1684x\
--test_inputEDSR_x${scale}_in_f32.npz\
--test_referenceEDSR_x${scale}_top_outputs.npz\
--modelEDSR_x${scale}_1684x_f32_sym.bmodel
##轉換FP32模型
model_deploy.py\
--mlirEDSR_x${scale}.mlir\
--quantizeF32\
--chipbm1684x\
--test_inputEDSR_x${scale}_in_f32.npz\
--test_referenceEDSR_x${scale}_top_outputs.npz\
--modelEDSR_x${scale}_1684x_f32_sym.bmodel
#將以上所有EDSR改為MDSR即可轉換MDSR模型
轉換結果評估
評估過程說明
- 配置好BM1684X平臺,上傳并解壓本項目EDSR-BM1684x.zip,同時下載benchmark數據集,確保benchmark與EDSR文件夾在同一目錄內。進入EDSR/python目錄下,運行以下命令:
####predictonbm1684x
formodelin{EDSR,MDSR};do
forscalein{2,3,4};do
echo-------------------------------------dataset=Set14-------------scale=${scale}-------------------------------------
cmd="pythonrun_opencv_crop.py--input../../benchmark/Set14/LR_bicubic/X${scale}\
--outputresults/${model}_Set14_x${scale}_int8\
--bmodel../models/BM1684X/${model}_x${scale}/${model}_x${scale}_1684x_int8_sym.bmodel"
echo">>>Running:${cmd}"
$cmd
done
done
- 推理結果保存在EDSR/python/results中,更改不同bmodel參數以使用不同bmodel
- 評估結果方法
####安裝評估模型
pipinstalllpips
評估主要代碼(eval.py)如下
...
fori,srinenumerate(sr_list):
hr=Path(args.hr_path)/(sr.stem.split('x')[0]+sr.suffix)
ifnothr.exists():
logging.error(f'{sr}:{hr}doesnotexist')
hr_list.append(None)
continue
hr_list.append(hr)
sr_img=Image.open(sr).convert('RGB')
hr_img=Image.open(hr).convert('RGB')
ifhr_img.size!=sr_img.size:
logging.info(f'croppinghr_imgfrom{hr_img.size}to{sr_img.size}')
#hr_img=hr_img.resize(sr_img.size,resample=Image.Resampling.BICUBIC)
hr_img=hr_img.crop((0,0,sr_img.size[0],sr_img.size[1]))
sr_img=np.array(sr_img)
hr_img=np.array(hr_img)
lpi=calculate_lpips(sr_img,hr_img,border=args.scale)
sr_img_y=rgb2ycbcr(sr_img,only_y=True)
hr_img_y=rgb2ycbcr(hr_img,only_y=True)
#sr_img_y=sr_img
#hr_img_y=hr_img
psnr=calculate_psnr(sr_img_y,hr_img_y,border=args.scale)
ssim=calculate_ssim(sr_img_y,hr_img_y,border=args.scale)
...
####evaluateonbm1684x
scale=(234)
formodelin{EDSR,MDSR};do
foriin"${!scale[@]}";do
echo-------------scale=${scale[$i]}-----------------
cmd="pythoneval.py--hr_path../../benchmark/Set14/HR--sr_pathresults/${model}_Set14_x${scale[$i]}_int8--scale${scale[$i]}"
echo">>>Running:${cmd}"
$cmd
done
done
- 評價結果保存在results/*/result.log里
- 若是想測試自己的圖片,請將圖片放入image目錄下然后運行以下命令,結果保存在results/image里。更改bmodel模型來更換模型與超分倍率
pythonrun_opencv_crop.py--input../image\
--outputresults/image\
--bmodel../models/BM1684X/EDSR_x2_1684x_int8_sym.bmodel
評價代碼如下
pythoneval.py--sr_pathresults/image--hr_path../image--scale{sacle}
評估結果
精度測試方法
測試數據集采用Set14數據集,指標采用與原論文一致的PSNR+SSIM指標來衡量圖像質量。因為我們在模型固定輸入大小的情況下,對原圖進行裁切,超分,拼合的形式達到動態輸入的效果,所以有的精度指標在測試中不僅不會降低反而會升高。同時又由于不同放大倍數的模型輸入大小和模型參數不一樣,推理時間的比例也會發生變化。
fp32結果
fp32
fp16結果
fp16
int8結果
int8
精度對比
precise
性能對比
precise
結論
本次轉換了EDSR和MDSR超分辨率模型,分別實現了fp32, fp16, int8多種精度模型轉換, TPU-MLIR對這兩個模型支持較好,轉換過程中比較順利。從最終評估結果上看,這兩個超分模型對推理的數值精度不敏感,經過量化后,相關指標損失較少,甚至有些指標還會提升。另外,在BM1684X的平臺上,INT8推理時間最短,故在部署時,推薦使用量化后的INT8模型部署。
-
模型
+關注
關注
1文章
3172瀏覽量
48714 -
TPU
+關注
關注
0文章
138瀏覽量
20698 -
深度學習
+關注
關注
73文章
5492瀏覽量
120978
發布評論請先 登錄
相關推薦
評論