資料介紹
?深入理解某個應用的數據訪問方式,可以充分利用處理器潛在架構中的存儲器和系統資源,從而開發可擴展的并行應用。
基于單核結構的嵌入式處理器越來越不能滿足日益增長的嵌入式多媒體處理應用方面的要求,多核嵌入式結構已成為解決這一問題的有效途徑,同時也為如何開發充分利用多核結構的應用軟件帶來挑戰。目前,需要將編譯技術和開發工具更多的結合起來,才能使多核結構的應用獲得成功。而大多數并行軟件都是通過手工轉換方式將順序程序轉換為并行程序來實現的。由于缺乏具有多核意識的開發工具,使得軟件難以進行性能評估。因此,如果沒有預先有效可靠的工程規劃,將不得不面對應用軟件的效率低下,以及延遲產品上市時間等問題。
軟件框架為多核應用軟件的開發提供了一個很好的起點,可以幫助縮短開發時間。本文將詳細說明嵌入式多媒體應用軟件的設計框架,同時,本文的數據流模型也可擴展到許多其它應用中。該框架綜合了多媒體應用軟件固有的數據并行結構,還說明了如何通過有效使用潛在架構來有效管理數據流。
在設計并行軟件的過程中有兩大挑戰:一是開發一個有效的并行算法,二是有效利用存儲器,如DMA(直接存儲訪問)通道和互連網絡等共享資源。在這過程中,順序運行的應用程序的性能可根據可用處理器核的數目進行擴展。
通常實現應用程序的并行處理有多種方法。有些應用程序表現為固有的并行,而有的則具有相當復雜且不規則的數據存取模式。但總的來講,科學應用程序和多媒體應用程序的并行通常易于實現,因為它們的數據存取模式比那些控制類應用程序相對容易預測。本文重點討論針對多媒體算法的并行技術,這類算法需要很高的處理開銷,且常用于嵌入式系統應用中。
多媒體應用程序中存在數據的并行級別。一組數據幀和數據幀中的一個宏塊之間的并行粒度有很大差別。通常來講,粒度越小,在共享單元——例如處理器核和DMA通道——之間所需的同步級別越高。粒度越小,并行程度也就越高,而網絡通信量也越小。相反,大的粒度則要求較低的同步性,但也使網絡通信量增大。因此,基于應用的不同類型和系統需求,軟件框架也定義了不同的并行級別。
需要說明的是,對可擴展并行軟件的開發還依賴于對互連網絡、分級存儲器體系,以及外設/DMA資源的有效利用。系統嚴格的低功耗和低成本的需求對所有這些要素都會構成約束。多核環境下的設計要求改革資源的有效利用方式。本文介紹了幾種在ADI公司的Blackfin ADSP-BF561雙核處理器上對資源進行有效管理的方法。
多媒體數據流分析
為了實現數據并行,需要在數據流中找到這樣一個或一組數據塊:能夠獨立處理并將結果饋送給另外的處理部件。獨立的數據塊可以降低同步開銷并簡化并行算法。要找到這種數據塊,重要的是要清楚數據流模式,或者一個應用的數據存取模式。
對于大多數多媒體應用,可以將數據存取模式看成是2-D(空間域)和3-D(時間域)操作模式。在2-D模式中,獨立的數據塊被限制在單個數據幀內,而在3-D模式中,獨立數據塊可以跨越多幀。在空間域中,可以將幀劃分用N個連續行和視頻幀宏塊組成的片段,而在時間域中,可以對數據流進一步細分到幀級或圖片組(GOP)級。
采用片段或宏塊的數據存取模式的算法對同步性要求很高,但需要較少的網絡傳輸量,這是因為分級的存儲器體系只需存儲圖像數據的一部分。對于幀或圖片組類型的數據訪問模式,分級的存儲器體系則需要存儲大量數據,但對同步性的要求則相對低得多。這是因為系統的并行粒度增大了的緣故。圖1說明了多媒體應用軟件中的并行級別,同時對四個級別中相關的同步性和網絡通信量做了對比。
圖2說明了ADSP-BF561的結構,該結構的組成中包括獨立的指令和數據存儲器,分別屬于兩個處理器核專有。該結構還包括共享的L2存儲器和外部存儲器,用戶利用可配置的仲裁方案將所有的外圍設備和DMA資源連接到任一處理器核上。ADSP-BF561 有兩個DMA處理器,每個都由兩組MDMA(存儲器-DMA)通路組成。L2存儲器和每個處理器核之間都通過獨立的總線連接,而外部存儲器和兩個處理器核之間則由一條共享總線連接。
基于單核結構的嵌入式處理器越來越不能滿足日益增長的嵌入式多媒體處理應用方面的要求,多核嵌入式結構已成為解決這一問題的有效途徑,同時也為如何開發充分利用多核結構的應用軟件帶來挑戰。目前,需要將編譯技術和開發工具更多的結合起來,才能使多核結構的應用獲得成功。而大多數并行軟件都是通過手工轉換方式將順序程序轉換為并行程序來實現的。由于缺乏具有多核意識的開發工具,使得軟件難以進行性能評估。因此,如果沒有預先有效可靠的工程規劃,將不得不面對應用軟件的效率低下,以及延遲產品上市時間等問題。
軟件框架為多核應用軟件的開發提供了一個很好的起點,可以幫助縮短開發時間。本文將詳細說明嵌入式多媒體應用軟件的設計框架,同時,本文的數據流模型也可擴展到許多其它應用中。該框架綜合了多媒體應用軟件固有的數據并行結構,還說明了如何通過有效使用潛在架構來有效管理數據流。
在設計并行軟件的過程中有兩大挑戰:一是開發一個有效的并行算法,二是有效利用存儲器,如DMA(直接存儲訪問)通道和互連網絡等共享資源。在這過程中,順序運行的應用程序的性能可根據可用處理器核的數目進行擴展。
通常實現應用程序的并行處理有多種方法。有些應用程序表現為固有的并行,而有的則具有相當復雜且不規則的數據存取模式。但總的來講,科學應用程序和多媒體應用程序的并行通常易于實現,因為它們的數據存取模式比那些控制類應用程序相對容易預測。本文重點討論針對多媒體算法的并行技術,這類算法需要很高的處理開銷,且常用于嵌入式系統應用中。
多媒體應用程序中存在數據的并行級別。一組數據幀和數據幀中的一個宏塊之間的并行粒度有很大差別。通常來講,粒度越小,在共享單元——例如處理器核和DMA通道——之間所需的同步級別越高。粒度越小,并行程度也就越高,而網絡通信量也越小。相反,大的粒度則要求較低的同步性,但也使網絡通信量增大。因此,基于應用的不同類型和系統需求,軟件框架也定義了不同的并行級別。
需要說明的是,對可擴展并行軟件的開發還依賴于對互連網絡、分級存儲器體系,以及外設/DMA資源的有效利用。系統嚴格的低功耗和低成本的需求對所有這些要素都會構成約束。多核環境下的設計要求改革資源的有效利用方式。本文介紹了幾種在ADI公司的Blackfin ADSP-BF561雙核處理器上對資源進行有效管理的方法。
多媒體數據流分析
為了實現數據并行,需要在數據流中找到這樣一個或一組數據塊:能夠獨立處理并將結果饋送給另外的處理部件。獨立的數據塊可以降低同步開銷并簡化并行算法。要找到這種數據塊,重要的是要清楚數據流模式,或者一個應用的數據存取模式。
對于大多數多媒體應用,可以將數據存取模式看成是2-D(空間域)和3-D(時間域)操作模式。在2-D模式中,獨立的數據塊被限制在單個數據幀內,而在3-D模式中,獨立數據塊可以跨越多幀。在空間域中,可以將幀劃分用N個連續行和視頻幀宏塊組成的片段,而在時間域中,可以對數據流進一步細分到幀級或圖片組(GOP)級。
采用片段或宏塊的數據存取模式的算法對同步性要求很高,但需要較少的網絡傳輸量,這是因為分級的存儲器體系只需存儲圖像數據的一部分。對于幀或圖片組類型的數據訪問模式,分級的存儲器體系則需要存儲大量數據,但對同步性的要求則相對低得多。這是因為系統的并行粒度增大了的緣故。圖1說明了多媒體應用軟件中的并行級別,同時對四個級別中相關的同步性和網絡通信量做了對比。
圖2說明了ADSP-BF561的結構,該結構的組成中包括獨立的指令和數據存儲器,分別屬于兩個處理器核專有。該結構還包括共享的L2存儲器和外部存儲器,用戶利用可配置的仲裁方案將所有的外圍設備和DMA資源連接到任一處理器核上。ADSP-BF561 有兩個DMA處理器,每個都由兩組MDMA(存儲器-DMA)通路組成。L2存儲器和每個處理器核之間都通過獨立的總線連接,而外部存儲器和兩個處理器核之間則由一條共享總線連接。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- ADSP-BF561:Blackfin嵌入式對稱多處理器數據手冊
- Blackfin雙核嵌入式處理器
- 嵌入式教程之嵌入式實時操作系統RTEMS的詳細資料介紹 27次下載
- 嵌入式處理系統4_多DSP系統入 8次下載
- 面向異構多處理器設備的自適應命令解釋系統 0次下載
- 嵌入式多媒體多核應用軟件設計解析 0次下載
- 嵌入式RISC微處理器核設計研究
- 嵌入式多媒體應用的多核編程框架 29次下載
- 為嵌入式系統選擇合適的多處理器 28次下載
- 嵌入式異構多處理器系統中的通信實現 47次下載
- 嵌入式處理器選型 64次下載
- 用多處理器系統級芯片解決手機的多媒體任務需求 82次下載
- 雙內核嵌入式處理器OMAP5910及其在3G的多媒體應用
- 多處理器分組實時調度算法
- 嵌入式多媒體視頻安全系統設計
- 什么是嵌入式微處理器?嵌入式微處理器有哪些? 729次閱讀
- 嵌入式微處理器的原理和應用 588次閱讀
- 嵌入式處理器簡介和種類 794次閱讀
- 基于多處理器系統的串行通信方式研究 1927次閱讀
- 基于處理器PXA255和Linux操作系統實現多媒體終端對視頻應用的設計 2981次閱讀
- 基于全志A20 1.2GHz雙核處理器的多媒體發布系統 5398次閱讀
- 嵌入式處理器的種類有哪些 2w次閱讀
- 關于嵌入式處理器的在線調試方法 1153次閱讀
- Intel嵌入式處理器的相關基礎知識 1203次閱讀
- 嵌入式應用框架EAF詳解 2699次閱讀
- 液晶顯示屏設計方案:基于Nios嵌入式軟核處理器 1081次閱讀
- 基于SoPC 技術的片上嵌入式Nios Ⅱ軟核六處理器系統 987次閱讀
- 嵌入式處理器匯總_常見的嵌入式處理器對比分析 1.4w次閱讀
- 詳析32位嵌入式處理器與8位處理器應用開發的三大不同 1155次閱讀
- 32位嵌入式處理器與8位處理器應用開發的區別 1528次閱讀
下載排行
本周
- 1TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 2開關電源基礎知識
- 5.73 MB | 6次下載 | 免費
- 3100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 4嵌入式linux-聊天程序設計
- 0.60 MB | 3次下載 | 免費
- 5基于FPGA的光纖通信系統的設計與實現
- 0.61 MB | 2次下載 | 免費
- 6基于FPGA的C8051F單片機開發板設計
- 0.70 MB | 2次下載 | 免費
- 751單片機窗簾控制器仿真程序
- 1.93 MB | 2次下載 | 免費
- 8基于51單片機的RGB調色燈程序仿真
- 0.86 MB | 2次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應用800例(新編版)
- 0.00 MB | 33564次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關電源設計實例指南
- 未知 | 21548次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數字電路基礎pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅動電路設計》 溫德爾著
- 0.00 MB | 6653次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537796次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191185次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183278次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論
查看更多