據(jù)最新消息,自 AMD 去年 12 月份公布 ROCm 6.0 以來,已經(jīng)開始積極籌備 6.1 版的發(fā)布,以提高與英偉達(dá)(NVIDIA)CUDA 競(jìng)爭(zhēng)的核心實(shí)力。
在此期間,AMD 頻繁向GitHub公共倉(cāng)庫推送有關(guān) ROCm 6.1 的最新開發(fā)進(jìn)展,透露出不久后有可能正式上線新版本的意圖。
據(jù)悉,此次 ROCm 6.1 主要的突破在于其升級(jí)至全新版本的 MIPOpen 3.1;新增了使用AI進(jìn)行參數(shù)預(yù)測(cè)的 conv_hip_igemm_group_fwd_xdlops 求解器;解決了當(dāng)前版本的眾多 BUG,以及引入了新的求解器算法。
此外,該系列還努力提升了系統(tǒng)性能,尤其是優(yōu)化了MIGraphX功能,包含但不限于加入對(duì)FP8精度的支持,以及增加更多運(yùn)算符等,同時(shí)更新了針對(duì) Whisper / Llama-2 / Stable Diffusion 2.1 的文檔示例,以及提供新的ONNX示例,以便更好地適應(yīng) GEMM 的BLAS自動(dòng)調(diào)整。
更重要的是,為了改善在Microsoft Windows 環(huán)境下運(yùn)行 MIGraphX的效率,AMD特別推出了全新的“hipother”資源庫。
值得一提的是,HIP 技術(shù)是AMD專有的C++運(yùn)行時(shí)API和內(nèi)核語言,適配可移植的AMD/NVIDIA GPU應(yīng)用程序,而HIPIFY 工具則能協(xié)助將CUDA源碼便捷地轉(zhuǎn)化成HIP腳本。
-
amd
+關(guān)注
關(guān)注
25文章
5441瀏覽量
133934 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3743瀏覽量
90831 -
求解器
+關(guān)注
關(guān)注
0文章
77瀏覽量
4513
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論