多維數(shù)據(jù)庫(kù)可以簡(jiǎn)單地理解為:將數(shù)據(jù)存放在一個(gè)n維數(shù)組中,而不是像關(guān)系數(shù)據(jù)庫(kù)那樣以記錄的形式存放。因此它存在大量稀疏矩陣,人們可以通過多維視圖來觀察數(shù)據(jù)。
多維數(shù)據(jù)庫(kù)是指將數(shù)據(jù)存放在一個(gè)門維數(shù)組中,而不是像關(guān)系數(shù)據(jù)庫(kù)那樣以記錄的形式存放。因此它存在大量稀疏矩陣,人們可以通過多維視圖來觀察數(shù)據(jù)。多維數(shù)據(jù)庫(kù)增加了一個(gè)時(shí)間維,與關(guān)系數(shù)據(jù)庫(kù)相比,它的優(yōu)勢(shì)在于可以提高數(shù)據(jù)處理速度,加快反應(yīng)時(shí)間,提高查詢效率。
1. 多維數(shù)據(jù)庫(kù)簡(jiǎn)介
多維數(shù)據(jù)庫(kù)(Multi Dimesional Database,MDD)可以簡(jiǎn)單地理解為:將數(shù)據(jù)存放在一個(gè)n維數(shù)組中,而不是像關(guān)系數(shù)據(jù)庫(kù)那樣以記錄的形式存放。因此它存在大量稀疏矩陣,人們可以通過多維視圖來觀察數(shù)據(jù)。多維數(shù)據(jù)庫(kù)增加了一個(gè)時(shí)間維,與關(guān)系數(shù)據(jù)庫(kù)相比,它的優(yōu)勢(shì)在于可以提高數(shù)據(jù)處理速度,加快反應(yīng)時(shí)間,提高查詢效率。MDD的信息是以數(shù)組形式存放的,所以它可以在不影響索引的情況下更新數(shù)據(jù)。因此MDD非常適合于讀寫應(yīng)用。
1.1. 關(guān)系數(shù)據(jù)庫(kù)存在的問題
利用SQL進(jìn)行關(guān)系數(shù)據(jù)庫(kù)查詢的局限性:
1) 查詢因需要“join”多個(gè)表而變得比較煩瑣 ,查詢語(yǔ)句(SQL) 不好編程;
2) 數(shù)據(jù)處理的開銷往往因關(guān)系型數(shù)據(jù)庫(kù)要訪問復(fù)雜數(shù)據(jù)而變得很大。
關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)本身局限性:
1) 數(shù)據(jù)模型上的限制
關(guān)系數(shù)據(jù)庫(kù)所采用的兩維表數(shù)據(jù)模型,不能有效地處理在大多數(shù)事務(wù)處理應(yīng)用中,典型存在的多維數(shù)據(jù)。其不可避免的結(jié)果是,在復(fù)雜方式下,相互作用表的數(shù)量激增,而且還不能很好地提供模擬現(xiàn)實(shí)數(shù)據(jù)關(guān)系的模型。關(guān)系數(shù)據(jù)庫(kù)由于其所用數(shù)據(jù)模型較多,還可能造成存儲(chǔ)空間的海量增加和大量浪費(fèi),并且會(huì)導(dǎo)致系統(tǒng)的響應(yīng)性能不斷下降。而且,在現(xiàn)實(shí)數(shù)據(jù)中,有許多類型是關(guān)系數(shù)據(jù)庫(kù)不能較好地處理的 。
2) 性能上的限制
為靜態(tài)應(yīng)用例如報(bào)表生成,而設(shè)計(jì)的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),并沒有經(jīng)過針對(duì)高效事務(wù)處理而進(jìn)行的優(yōu)化過程。其結(jié)果往往是某些關(guān)系型數(shù)據(jù)庫(kù)產(chǎn)品,在對(duì)GUI和Web的事務(wù)處理過程中,沒有達(dá)到預(yù)期的效果。除非增加更多的硬件投資,但這并不能從根本上解決問題。
用關(guān)系數(shù)據(jù)庫(kù)的兩維表數(shù)據(jù)模型,可以處理在大多數(shù)事務(wù)處理應(yīng)用中的典型多維數(shù)據(jù),但其結(jié)果往往是建立和使用大量的數(shù)據(jù)表格,仍很難建立起能模擬現(xiàn)實(shí)世界的數(shù)據(jù)模型。并且在數(shù)據(jù)需要作報(bào)表輸出時(shí),又要反過來將已分散設(shè)置的大量的兩維數(shù)據(jù)表,再利用索引等技術(shù)進(jìn)行表的連接后,才能找到全部所需的數(shù)據(jù),而這又勢(shì)必影響到應(yīng)用系統(tǒng)的響應(yīng)速度。
3) 擴(kuò)展伸縮性上的限制
關(guān)系數(shù)據(jù)庫(kù)技術(shù)在有效支持應(yīng)用和數(shù)據(jù)復(fù)雜性上的能力是受限制的。關(guān)系數(shù)據(jù)庫(kù)原先依據(jù)的規(guī)范化設(shè)計(jì)方法,對(duì)于復(fù)雜事務(wù)處理數(shù)據(jù)庫(kù)系統(tǒng)的設(shè)計(jì)和性能優(yōu)化來說,已經(jīng)無能為力。此外,高昂的開發(fā)和維護(hù)費(fèi)用也讓企業(yè)難以承受。
4) 關(guān)系數(shù)據(jù)庫(kù)的檢索策略,如復(fù)合索引和并發(fā)鎖定技術(shù),在使用上會(huì)造成復(fù)雜性和局限性。
1.2. 多維數(shù)據(jù)庫(kù)的相關(guān)定義
維(Dimension):是人們觀察數(shù)據(jù)的特定角度,是考慮問題時(shí)的一類屬性,屬性集合構(gòu)成一個(gè)維(時(shí)間維、地理維等)。
維的層次(Level):人們觀察數(shù)據(jù)的某個(gè)特定角度(即某個(gè)維)還可以存在細(xì)節(jié)程度不同的各個(gè)描述方面(時(shí)間維:日期、月份、季度、年)。
維的成員(Member):維的一個(gè)取值,是數(shù)據(jù)項(xiàng)在某維中位置的描述。(“某年某月某日”是在時(shí)間維上位置的描述)。
度量(Measure):多維數(shù)組的取值。(2000年1月,上海,筆記本電腦,0000)。
OLAP的基本多維分析操作有鉆取(Drill-up和Drill-down)、切片(Slice)和切塊(Dice)、以及旋轉(zhuǎn)(Pivot)等。
鉆取:是改變維的層次,變換分析的粒度。它包括向下鉆取(Drill-down)和向上鉆取(Drill-up)/上卷(Roll-up)。Drill-up是在某一維上將低層次的細(xì)節(jié)數(shù)據(jù)概括到高層次的匯總數(shù)據(jù),或者減少維數(shù);而Drill-down則相反,它從匯總數(shù)據(jù)深入到細(xì)節(jié)數(shù)據(jù)進(jìn)行觀察或增加新維。
切片和切塊:是在一部分維上選定值后,關(guān)心度量數(shù)據(jù)在剩余維上的分布。如果剩余的維只有兩個(gè),則是切片;如果有三個(gè)或以上,則是切塊。
旋轉(zhuǎn):是變換維的方向,即在表格中重新安排維的放置(例如行列互換)。
1.3. 多維數(shù)據(jù)庫(kù)的特點(diǎn)
后關(guān)系型數(shù)據(jù)庫(kù)的主要特征是將多維處理和面向?qū)ο蠹夹g(shù)結(jié)合到關(guān)系數(shù)據(jù)庫(kù)上。這種數(shù)據(jù)庫(kù)使用強(qiáng)大而靈活的對(duì)象技術(shù),將經(jīng)過處理的多維數(shù)據(jù)模型的速度和可調(diào)整性結(jié)合起來。由于它獨(dú)有的可兼容性,對(duì)于開發(fā)高性能的交換處理應(yīng)用程序來說,后關(guān)系型數(shù)據(jù)庫(kù)非常理想。在后關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)中,采用了更現(xiàn)代化的多維模型,作為數(shù)據(jù)庫(kù)引擎。并且,這種以稀疏數(shù)組 為基礎(chǔ)的獨(dú)特的多維數(shù)據(jù)庫(kù)架構(gòu),是從已成為國(guó)際標(biāo)準(zhǔn)的數(shù)據(jù)庫(kù)語(yǔ)言基礎(chǔ)上繼承和發(fā)展的,是已積累了實(shí)踐經(jīng)驗(yàn)的先進(jìn)而可靠的技術(shù)。
多維數(shù)據(jù)模型能使數(shù)據(jù)建模更加簡(jiǎn)單,因?yàn)殚_發(fā)人員能夠方便地用它來描述出復(fù)雜的現(xiàn)實(shí)世界結(jié)構(gòu),而不必忽略現(xiàn)實(shí)世界的問題,或把問題強(qiáng)行表現(xiàn)成技術(shù)上能夠處理的形態(tài),而且多維數(shù)據(jù)模型使執(zhí)行復(fù)雜處理的時(shí)間大大縮短。例如開發(fā)一個(gè)服裝連鎖店信息管理系統(tǒng)時(shí),如果用關(guān)系數(shù)據(jù)庫(kù),就需要建立許多表,一張表用來說明每種款式所具有的顏色和尺寸,另一張表用來建立服裝和供應(yīng)商之間的映射,并表示它是否已被賣出,此外還需要建一些表來表示價(jià)格變化、各店的庫(kù)存等等。每成交一筆生意,所有這些表都需要修改,很快這些關(guān)系數(shù)據(jù)庫(kù)就會(huì)變得笨重而緩慢。而在多維數(shù)據(jù)模型中,可以將這些數(shù)據(jù)看做是存在于一個(gè)“立方體”中,這個(gè)“立方體”有足夠多的“面”,以便對(duì)數(shù)據(jù)進(jìn)行完全分類,如款式、顏色、價(jià)格、庫(kù)存等等都能夠立刻互相映射,獲取數(shù)據(jù)極其迅速,而且由于清除了冗余的數(shù)據(jù),多維數(shù)據(jù)庫(kù)非常簡(jiǎn)單,不僅好用,而且更經(jīng)濟(jì)。
2. 現(xiàn)有多維數(shù)據(jù)庫(kù)相關(guān)分類
現(xiàn)有的多維數(shù)據(jù)庫(kù)主要分為“純”多維數(shù)據(jù)庫(kù)和“準(zhǔn)”多維數(shù)據(jù)庫(kù),前者以cache這種不依附與關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)種類為主,后者主要是依附于關(guān)系數(shù)據(jù)庫(kù),在其之上提取數(shù)據(jù)生成多維數(shù)據(jù)表便于進(jìn)行統(tǒng)計(jì)和分析。
現(xiàn)有的準(zhǔn)多維數(shù)據(jù)庫(kù)大多是基于關(guān)系數(shù)據(jù)庫(kù)為基礎(chǔ),在關(guān)系數(shù)據(jù)庫(kù)提供數(shù)據(jù)的基礎(chǔ)上建立多維數(shù)據(jù),便于查詢和分析。主要包括以下幾個(gè):基于Oracle的ORACLE EXPRESS SERVER,基于SQL Server的Microsoft SQL Server Analysis Services,基于DB2的OLAP Server以及Hyperion Essbase 數(shù)據(jù)庫(kù)。
2.1. Cache數(shù)據(jù)庫(kù)
Caché 數(shù)據(jù)庫(kù)是一種面向?qū)ο蟮亩嗑S數(shù)據(jù)庫(kù),同時(shí)支持SQL的訪問方式。在數(shù)據(jù)庫(kù)的劃分上,超越關(guān)系數(shù)據(jù)庫(kù)被稱為第三代,后關(guān)系型數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)有以下特點(diǎn):
1、速度快。Cache數(shù)據(jù)庫(kù)在同等條件下查詢相同數(shù)據(jù)比Oracle等普通數(shù)據(jù)庫(kù)要快。Cache是基于普通關(guān)系型數(shù)據(jù)庫(kù)如:Oracle, SQL server, Sybase等的基礎(chǔ)之上并有所改進(jìn)而產(chǎn)生的。Caché在性能上可以和內(nèi)存數(shù)據(jù)庫(kù)比美,在一臺(tái)筆記本上可以實(shí)現(xiàn)每秒數(shù)萬條的插入速度。Caché獨(dú)特的動(dòng)態(tài)的位圖索引技術(shù) 可以實(shí)現(xiàn)數(shù)據(jù)庫(kù)在更新的同時(shí)做查詢和分析,而不影響使用性能。
2、使用簡(jiǎn)單。Cache數(shù)據(jù)庫(kù)支持標(biāo)準(zhǔn)SQL語(yǔ)句,因此不太熟悉M語(yǔ)言 的用戶依然可以輕易對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行操作。
3、接口容易。Cache數(shù)據(jù)庫(kù)支持ODBC標(biāo)準(zhǔn)接口,因此在與其他系統(tǒng)進(jìn)行數(shù)據(jù)交換時(shí)非常容易。同時(shí)Cache亦可以將數(shù)據(jù)輸出成文本文件格式以供其它系統(tǒng)訪問調(diào)用。
4、真正的3層結(jié)構(gòu)。Cache數(shù)據(jù)庫(kù)能夠真正意義上實(shí)現(xiàn)3層結(jié)構(gòu),實(shí)現(xiàn)真正的分布式服務(wù)。升級(jí)擴(kuò)容方便。正因?yàn)橛缮鲜龇植际?層結(jié)構(gòu),所以當(dāng)醫(yī)院需要增加客戶端PC或醫(yī)院進(jìn)行擴(kuò)大規(guī)模時(shí),不需要重新購(gòu)買或更新主服務(wù)器,只需要適當(dāng)增加二級(jí)服務(wù)器的數(shù)量即可,二級(jí)服務(wù)器相對(duì)來說要比主服務(wù)器要便宜許多,因此,醫(yī)院可節(jié)約資金減少重復(fù)投資。
5、對(duì)象型編輯。Cache數(shù)據(jù)庫(kù)是真正的對(duì)象型數(shù)據(jù)庫(kù),開發(fā)時(shí)用戶可直接用數(shù)據(jù)庫(kù)定義自己想要的對(duì)象,然后再在其它開發(fā)工具中調(diào)用該對(duì)象的方法和屬性即可完成開發(fā)工作,非常方便。支持遠(yuǎn)程映射和鏡像。Cache數(shù)據(jù)庫(kù)支持遠(yuǎn)程的映射和鏡像,比如在不同城市之間,或在同一城市的不同區(qū)域之間,Cache可以進(jìn)行鏡像(Mapping),使不同區(qū)域的Cache數(shù)據(jù)庫(kù)同步聯(lián)系起來,雖然在不同區(qū)域,但大家使用起來就像共用一個(gè)數(shù)據(jù)庫(kù)。
6、靈活性。基于Caché數(shù)據(jù)庫(kù)的應(yīng)用軟件不僅可以不經(jīng)修改便能在多種操作系統(tǒng)平臺(tái)上(如Windos98/NT、各種UNIX和Linux環(huán)境下運(yùn)行,也可以隨意布署運(yùn)行在兩層或三層的C/S結(jié)構(gòu)即客戶機(jī)/服務(wù)器環(huán)境中,或者B/S結(jié)構(gòu)即瀏覽器/服務(wù)器環(huán)境中。而且應(yīng)用服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)器的數(shù)量是在運(yùn)行中是隨意可以增加擴(kuò)充而不影響運(yùn)行。
7、支持WEB開發(fā)。Cache 數(shù)據(jù)庫(kù)提供自帶的Web開發(fā)工具,使用維護(hù)非常方便,符合當(dāng)今軟件業(yè)發(fā)展的趨勢(shì)。
8、價(jià)格便宜。Cache數(shù)據(jù)庫(kù)的價(jià)格比Oracle要便宜許多。
這種數(shù)據(jù)庫(kù)已經(jīng)超越了傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)的局限,在Internet或Client/Server環(huán)境下任務(wù)關(guān)鍵和突發(fā)大負(fù)載的情況下,Caché具有獨(dú)特超群的高響應(yīng)速率特性、高度靈活的可伸縮性能、高強(qiáng)度聯(lián)機(jī)處理能力。
在InterSystems 全球業(yè)務(wù)里,有50%是醫(yī)療行業(yè),30%在金融業(yè)、另外20%在船務(wù)、飯店管理、會(huì)議系統(tǒng)等方面。所有這些行業(yè)都有一個(gè)共同點(diǎn),都需一個(gè)龐大的數(shù)據(jù)庫(kù),數(shù)據(jù)需要很快更新。國(guó)外的成功案例已經(jīng)有許多,如:美國(guó)十大醫(yī)院、三大醫(yī)療衛(wèi)生實(shí)驗(yàn)機(jī)構(gòu)、全球最大的在線證券交易公司、美林投資集團(tuán)、美國(guó)國(guó)防部等均采用了Caché數(shù)據(jù)庫(kù);國(guó)內(nèi)目前也有一些應(yīng)用,但主要限于醫(yī)療行業(yè),如:北京安貞醫(yī)院、福州軍區(qū)總醫(yī)院和哈爾濱醫(yī)科大學(xué)第一附屬醫(yī)院等。在美國(guó)和歐洲的HIS系統(tǒng)中,CACHE數(shù)據(jù)庫(kù)所占的比例是最大的,被醫(yī)療界公認(rèn)為首選數(shù)據(jù)庫(kù)。
2.2. Microsoft SQL Server Analysis Services
SQL Server 2008 Analysis Services工具,實(shí)現(xiàn)了多維分析數(shù)據(jù)庫(kù)的構(gòu)建,同時(shí)提供了管理工具與用戶訪問軟件。它使用了一種稱為“Block Computation(分塊計(jì)算)”的技術(shù),存儲(chǔ)模式使得分區(qū)的聚合和其源數(shù)據(jù)的復(fù)本以多維結(jié)構(gòu)存儲(chǔ)在分析服務(wù)器計(jì)算機(jī)上。利用了多維數(shù)據(jù)集的稀缺性,僅處理非 NULL 數(shù)據(jù),以提高查詢效率。更加適合于頻繁使用的多維數(shù)據(jù)集中的分區(qū)和對(duì)快速查詢響應(yīng)的需要。能夠極大地提高查詢效率,因此可以更細(xì)的粒度進(jìn)行分析。Analysis Services 中的數(shù)據(jù)挖掘算法提供了這種預(yù)測(cè)分析能力,而 SQL Server 2008 Analysis Services 改善了數(shù)據(jù)挖掘算法,可以實(shí)現(xiàn)更全面的分析。
SQL Server 2008 Analysis Services 新引進(jìn)了一套創(chuàng)新的 Best Practice Design Alerts(最佳實(shí)踐設(shè)計(jì)警報(bào)),可在開發(fā)流程的早期階段對(duì)潛在的設(shè)計(jì)問題自動(dòng)發(fā)出通知,這會(huì)減少由于設(shè)計(jì)錯(cuò)誤導(dǎo)致的時(shí)間浪費(fèi),并有利于實(shí)施更快的開發(fā)流程。SQL Server 2008 Analysis Services 利用新的、改進(jìn)的多維數(shù)據(jù)集、維度和屬性設(shè)計(jì)器,進(jìn)一步提高了開發(fā)人員的工作效率。Analysis Services 可以進(jìn)行縮放,以支持許多規(guī)模達(dá)到兆兆字節(jié)并且服務(wù)于數(shù)千名用戶的數(shù)據(jù)庫(kù)。SQL Server 2008 Analysis Services 提供了與數(shù)據(jù)庫(kù)引擎所用的類似的 Dynamic Management Views(動(dòng)態(tài)管理視圖)。這些特性提供了實(shí)時(shí)的企業(yè)系統(tǒng)信息,用于監(jiān)視、分析和進(jìn)行性能調(diào)整。SQL Server 2008 Analysis Services 之后,新的備份存儲(chǔ)子系統(tǒng)會(huì)使備份時(shí)間隨著數(shù)據(jù)庫(kù)大小的增加僅按線性增長(zhǎng)。
Analysis Services 10.0 OLE DB 訪問接口 (msolap100.dll) 是應(yīng)用程序與 Microsoft Analysis Services 進(jìn)行交互的接口。ADOMD.NET 是用于與 Microsoft SQL Server Analysis Services 進(jìn)行通信的 Microsoft .NET Framework 數(shù)據(jù)訪問接口。
2.3. Oracle Express Server
Oracle Express Server是一個(gè)先進(jìn)的計(jì)算機(jī)引擎和數(shù)據(jù)高速緩存。它使用多維模型,多維模型最能反應(yīng)用戶對(duì)其業(yè)務(wù)的思考方法,將電子表格的行和列擴(kuò)展三維或者更多的維。維可以是時(shí)間、產(chǎn)品、產(chǎn)品系列、地區(qū),用戶分析的對(duì)象可以是像單位銷售額這樣的綜合數(shù)據(jù)。對(duì)于多維模型的查詢是很迅速的。這些查詢是對(duì)數(shù)組中的某一部分的算術(shù)計(jì)算。因此,這個(gè)數(shù)組支持最大、最復(fù)雜的OLAP應(yīng)用。
Express Server能夠存儲(chǔ)和管理多維數(shù)組,或者通過一種只需很少、甚至不需索引的復(fù)雜的多維高速緩存方案,提供直接面向關(guān)系的分析。Oracle Express Server不僅支持多維模型,而且具有分析、預(yù)測(cè)、建模,以及對(duì)進(jìn)行假設(shè)分析的能力。具有用于數(shù)學(xué)、財(cái)務(wù)、統(tǒng)計(jì)和時(shí)間序列管理等方面的內(nèi)置功能。具有伸縮性、強(qiáng)健性和基于應(yīng)用的特性,支持多個(gè)用戶,并且為大型庫(kù)實(shí)現(xiàn)完整性控制。靈活的數(shù)據(jù)組織方式,數(shù)據(jù)可以存放在Express Server內(nèi),也可直接在RDB上使用,有內(nèi)建的分析函數(shù)和4GL用戶自己定制查詢。
Oracle Express Server是先進(jìn)的多維計(jì)算引擎,是進(jìn)行OLAP分析的基礎(chǔ)。Express Server的最新版本是6.3,這個(gè)版本在處理能力、分析功能等多方面有重大改進(jìn)。
1. 處理能力的提高:Express Server 6.3展示了OLAP 服務(wù)器最快的計(jì)算能力和查詢性能。Express Server 6.3引入了很多新特性,可以極大提高Express Server對(duì)大數(shù)據(jù)量和大的并發(fā)用戶數(shù)的支持。
2. 更快的匯總計(jì)算:Express Server 6.3引入了全新的匯總計(jì)算管理機(jī)制。新的匯總機(jī)制允許定制匯總方法,并且可以顯著降低裝載和匯總計(jì)算的時(shí)間。
3. 分析功能的提高:新引入的統(tǒng)計(jì)分析函數(shù)將使Express Server 6.3的分析能力顯著提高。
4. 預(yù)測(cè)功能的提高:新的預(yù)測(cè)系統(tǒng)將提供數(shù)據(jù)抽樣和基于數(shù)據(jù)模式推薦最佳預(yù)測(cè)方法的能力。
5. 基于Web的管理工具:Express Server 的管理將由新的Express Instance Manger統(tǒng)一進(jìn)行,Express Instance Manger是基于Java的應(yīng)用,可以和Oracle Enterprise Manager集成。這使DBA可通過Oracle Enterprise Manager的Java窗口或Browser對(duì)NT或UNIX上的多維數(shù)據(jù)庫(kù)進(jìn)行管理。
6. Oracle Express 對(duì)Web技術(shù)的支持:Express Server 的一個(gè)重要發(fā)展策略是支持Internet計(jì)算,這也是Express產(chǎn)品領(lǐng)先于同類產(chǎn)品的一個(gè)重要方面。DBA可通過Oracle Enterprise Manager的Java窗口或Browser對(duì)NT或UNIX上的多維數(shù)據(jù)庫(kù)進(jìn)行管理。Express Server 從6.0版本開始增加了Express Web Agent選項(xiàng),使基于Express Server的OLAP應(yīng)用擁有了Web公布能力
7. 支持各種關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng)的集成。
2.4. DB2 OLAP Server
IBM公司提供了一套基于可視數(shù)據(jù)倉(cāng)庫(kù)的商業(yè)智能(BI)解決方案,包括:Visual Warehouse(VW)、Essbase/DB2 OLAP Server 5.0、IBM DB2 UDB,以及來自第三方的前端數(shù)據(jù)展現(xiàn)工具(如BO)和數(shù)據(jù)挖掘工具(如SAS)。其中,VW是一個(gè)功能很強(qiáng)的集成環(huán)境,既可用于數(shù)據(jù)倉(cāng)庫(kù)建模和元數(shù)據(jù)管理,又可用于數(shù)據(jù)抽取、轉(zhuǎn)換、裝載和調(diào)度。Essbase/DB2 OLAP Server支持“維”的定義和數(shù)據(jù)裝載。Essbase/DB2 OLAP Server不是ROLAP(Relational OLAP)服務(wù)器,而是一個(gè)(ROLAP和MOLAP)混合的HOLAP服務(wù)器,在Essbase完成數(shù)據(jù)裝載后,數(shù)據(jù)存放在系統(tǒng)指定的DB2 UDB數(shù)據(jù)庫(kù)中。
嚴(yán)格說來,IBM自己并沒有提供完整的數(shù)據(jù)倉(cāng)庫(kù)解決方案,該公司采取的是合作伙伴戰(zhàn)略。例如,它的前端數(shù)據(jù)展現(xiàn)工具可以是Business Objects的BO、Lotus的Approach、Cognos的Impromptu或IBM的Query Management Facility;多維分析工具支持Arbor Software的Essbase和IBM(與Arbor聯(lián)合開發(fā))的DB2 OLAP服務(wù)器;統(tǒng)計(jì)分析工具采用SAS系統(tǒng)。
IBM DB2 OLAP Server把Hyperion Essbase的OLAP引擎和DB2的關(guān)系數(shù)據(jù)庫(kù)集成在一起。,與Essbase API完全兼容,數(shù)據(jù)用星型模型存放在關(guān)系數(shù)據(jù)庫(kù)DB2中。
2.5. Hyperion Essbase
Hyperion Essbase是一個(gè)聯(lián)機(jī)分析處理(OLAP)服務(wù)器,使用一個(gè)多維模型從一系列數(shù)據(jù)源中提取數(shù)據(jù),計(jì)算后對(duì)它們加以綜合,然后提供對(duì)結(jié)果的快速訪問。是一個(gè)多維數(shù)據(jù)庫(kù)服務(wù)器,可以創(chuàng)建“塊存儲(chǔ)”或“聚合存儲(chǔ)”數(shù)據(jù)庫(kù),前者用于需要進(jìn)行讀/寫訪問的小型、高密度的數(shù)據(jù)集,后者用于具有很多維度和只讀訪問的稀疏、銷售分析類型的應(yīng)用程序。
Essbase是BI軟件hyperion的多維數(shù)據(jù)庫(kù),目前已更新至11版本。 它不同于通常意義上的關(guān)系數(shù)據(jù)庫(kù),Essbase把數(shù)據(jù)按“塊”劃分,每個(gè)數(shù)據(jù)塊會(huì)定義不同的維度。其中Essbase有7個(gè)默認(rèn)維度,并可以自行定義13個(gè)用戶維度。 7個(gè)默認(rèn)維度為科目、期間、年份、情景、貨幣、版本、實(shí)體。
Essbase的特點(diǎn):
1、 高性能:快速地查詢響應(yīng)
2、 計(jì)算/分析能力
聚合
無限制的跨維計(jì)算能力
場(chǎng)景假設(shè)分析
分?jǐn)?/p>
趨勢(shì)分析/回歸分析
決策樹/神經(jīng)網(wǎng)絡(luò)/關(guān)聯(lián)分析
財(cái)務(wù)智能/貨幣轉(zhuǎn)換
數(shù)學(xué)函數(shù)
預(yù)測(cè)
Hyperion Essbase現(xiàn)狀:以服務(wù)器為中心的分布式體系結(jié)構(gòu)–有超過100個(gè)的應(yīng)用程序;有300多個(gè)用Essbase作為平臺(tái)的開發(fā)商;具有幾百個(gè)計(jì)算公式,支持多種計(jì)算;用戶可以自己構(gòu)件復(fù)雜的查詢;快速的響應(yīng)時(shí)間,支持多用戶同時(shí)讀寫;有30多個(gè)前端工具可供選擇;支持多種財(cái)務(wù)標(biāo)準(zhǔn);能與ERP或其他數(shù)據(jù)源集成;全球用戶超過1500家
3. 簡(jiǎn)要比較
綜合以上5種多維數(shù)據(jù)庫(kù)的比較如下:
作為醫(yī)療界公認(rèn)為首選數(shù)據(jù)庫(kù),Cache數(shù)據(jù)庫(kù)的優(yōu)點(diǎn)較多,如具有較快的查詢速度,使用簡(jiǎn)單和靈活性等特點(diǎn),適合在開發(fā)階段直接使用,由于采用直接插入數(shù)據(jù)的形式,所以對(duì)已有未用Cache的老產(chǎn)品不太適合,數(shù)據(jù)的遷移性不太好。
作為微軟在多維數(shù)據(jù)上應(yīng)用的典型產(chǎn)品,Analysis Services具有較好的查詢和分析性能,并且由于Sql Server的廣泛應(yīng)用,使得Analysis Services有較多的應(yīng)用。Sql Server 2008對(duì)Analysis Services做出了一些改進(jìn),進(jìn)一步提高了查詢效率和分析能力。在數(shù)據(jù)源方面適用于多種數(shù)據(jù)源,但是該系統(tǒng)的應(yīng)用環(huán)境只是windows,不能用于Linux系統(tǒng)上。
Oracle支持關(guān)系數(shù)據(jù)存儲(chǔ)和多維數(shù)據(jù)存儲(chǔ),利用Oracle Express Server實(shí)現(xiàn)多維數(shù)據(jù)的存儲(chǔ),在Express Server 6.3公布之前,Oracle Express Server 的技術(shù)更新的太慢,占用的內(nèi)存很大,影響了其應(yīng)用。Express Server 6.3提高了處理能力和分析能力,但是提高的程度有待于驗(yàn)證。
DB2 OLAP Server是一個(gè)ROLAP和MOLAP混合的HOLAP服務(wù)器,在Essbase完成數(shù)據(jù)裝載后,數(shù)據(jù)存放在系統(tǒng)指定的DB2 UDB數(shù)據(jù)庫(kù)中。對(duì)Essbase的API完全兼容。主要應(yīng)用在DB2的數(shù)據(jù)庫(kù)之上。
Hyperion Essbase是多維數(shù)據(jù)庫(kù)服務(wù)器,支持從廣泛的數(shù)據(jù)源提取數(shù)據(jù),但與 Oracle OLAP 將數(shù)據(jù)存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)引擎外不同,它通常將數(shù)據(jù)存儲(chǔ)在自己的專用服務(wù)器上,從而具有較快的查詢響應(yīng)以及計(jì)算分析能力。
考慮現(xiàn)在應(yīng)用的數(shù)據(jù)庫(kù)為Oracle數(shù)據(jù)庫(kù),盡管cache數(shù)據(jù)庫(kù)和DB2 OLAP Server性能較高,但短時(shí)間內(nèi)使用這兩種產(chǎn)品的可能性不大,現(xiàn)有數(shù)據(jù)庫(kù)數(shù)據(jù)不能快速順利的移植或者應(yīng)用到Cache數(shù)據(jù)庫(kù),DB2 OLAP Server會(huì)依托于Hyperion Essbase數(shù)據(jù)庫(kù),與現(xiàn)用的Oracle數(shù)據(jù)庫(kù)同時(shí)使用會(huì)有些累贅。所以暫時(shí)選擇以下三種策略。
策略1:Oracle + Oracle Express Server
策略2:Oracle + Hyperion Essbase
策略3:Oracle + SQL Server Analysis Service
綜合比較上述三種策略如下:?
表1:三種策略比較
-
多維數(shù)據(jù)
+關(guān)注
關(guān)注
0文章
6瀏覽量
6559 -
多維數(shù)據(jù)庫(kù)
+關(guān)注
關(guān)注
0文章
2瀏覽量
1458
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論