国产美女激情作爱网站_日韩久久无码毛片_色播艾小青国产专区在线播放_我不卡成人免费观看_狼狼鲁色在线视频播放_亚洲AⅤ永久无码天堂影院_国产精品第15页_嫩草影院懂你的影院_国产精品免费无码二区

【導(dǎo)讀】 如今分布式存儲產(chǎn)品眾多令人眼花繚亂，如何選型？要根據(jù)其背后的核心架構(gòu)來分析它本來的原貌，然后才能決定其是否適合我們的具體場景。

【作者】 趙海

1 引言

目前市面上各個廠家的分布式存儲產(chǎn)品五花八門，但是如果透過產(chǎn)品本身的包裝看到其背后的核心技術(shù)體系，基本上會分為兩種架構(gòu)，一種是有中心架構(gòu)的分布式文件系統(tǒng)架構(gòu)，以GFS、HDFS為代表；另外一種是完全無中心的分布式存儲架構(gòu)，以Ceph、Swift、GlusterFS為代表。對具體分布式存儲產(chǎn)品選型的時候，要根據(jù)其背后的核心架構(gòu)來分析它本來的原貌，然后才能決定其是否適合我們的具體場景。

2 主流分布式存儲技術(shù)對比分析

2.1 GFS & HDFS

GFS和HDFS都是基于文件系統(tǒng)實現(xiàn)的分布式存儲系統(tǒng)；都是有中心的分布式架構(gòu) （圖2.1）；通過對中心節(jié)點元數(shù)據(jù)的索引查詢得到數(shù)據(jù)地址空間，然后再去數(shù)據(jù)節(jié)點上查詢數(shù)據(jù)本身的機(jī)制來完成數(shù)據(jù)的讀寫；都是基于文件數(shù)據(jù)存儲場景設(shè)計的架構(gòu) ；都是適合順序?qū)懭腠樞蜃x取，對隨機(jī)讀寫不友好。

圖2.1 中心化的分布式存儲架構(gòu)

接下來，我們來看GFS和HDFS都有哪些具體特性，我們應(yīng)該如何應(yīng)用？

GFS是一種適合大文件，尤其是GB級別的大文件存儲場景的分布式存儲系統(tǒng)。
GFS非常適合對數(shù)據(jù)訪問延遲不敏感的搜索引擎服務(wù)。
GFS是一種有中心節(jié)點的分布式架構(gòu)，Master節(jié)點是單一的集中管理節(jié)點，既是高可用的瓶頸，也是可能出現(xiàn)性能問題的瓶頸。
GFS可以通過緩存一部分Metadata到Client節(jié)點，減少Client與Master的交互。
GFS的Master節(jié)點上的Operation log和Checkpoint文件需要通過復(fù)制方式保留多個副本，來保障元數(shù)據(jù)以及中心管理功能的高可用性。

相對于GFS來說，我們來看HDFS做了哪些區(qū)別？

HDFS的默認(rèn)最小存儲單元為128M，比GFS的64M更大。
HDFS不支持文件并發(fā)寫，對于單個文件它僅允許有一個寫或者追加請求。
HDFS從2.0版本之后支持兩個管理節(jié)點（NameNode），主備切換可以做到分鐘級別。
HDFS 更適合單次寫多次讀的大文件流式讀取的場景。
HDFS不支持對已寫文件的更新操作，僅支持對它的追加操作。

2.2 GlusterFS

GlusterFS雖然是基于文件系統(tǒng)的分布式存儲技術(shù)，但是它與GFS/HDFS有本質(zhì)的區(qū)別，它是去中心化的無中心分布式架構(gòu)（圖2.2）；它是通過對文件全目錄的DHT算法計算得到相應(yīng)的Brike地址，從而實現(xiàn)對數(shù)據(jù)的讀寫；它與Ceph/Swift的架構(gòu)區(qū)別在于它沒有集中收集保存集群拓?fù)浣Y(jié)構(gòu)信息的存儲區(qū)，因此在做計算的時候，需要遍歷整個卷的Brike信息。

圖2.2 Gluster FS

接下來，我們來看GlusterFS都有哪些具體特性，我們應(yīng)該如何應(yīng)用？

GlusterFS是采用無中心對稱式架構(gòu)，沒有專用的元數(shù)據(jù)服務(wù)器，也就不存在元數(shù)據(jù)服務(wù)器瓶頸。元數(shù)據(jù)存在于文件的屬性和擴(kuò)展屬性中。
GlusterFS可以提供Raid0、Raid1、Raid1+0等多種類型存儲卷類型。
GlusterFS采用數(shù)據(jù)最終一致性算法，只要有一個副本寫完就可以Commit。
GlusterFS默認(rèn)會將文件切分為128KB的切片，然后分布于卷對應(yīng)的所有Brike當(dāng)中。所以從其設(shè)計初衷來看，更適合大文件并發(fā)的場景。
GlusterFS 采用的DHT算法不具備良好的穩(wěn)定性，一旦存儲節(jié)點發(fā)生增減變化，勢必影響卷下面所有Brike的數(shù)據(jù)進(jìn)行再平衡操作，開銷比較大。
Gluster FS文件目錄利用擴(kuò)展屬性記錄子卷的中brick的hash分布范圍，每個brick的范圍均不重疊。遍歷目錄時，需要獲取每個文件的屬性和擴(kuò)展屬性進(jìn)行聚合，當(dāng)目錄文件較多時，遍歷效率很差。

2.3 Ceph & Swift

我們知道，相對于文件系統(tǒng)的中心架構(gòu)分布式存儲技術(shù)，Ceph&Swift都是去中心化的無中心分布式架構(gòu)（圖2.3）；他們底層都是對象存儲技術(shù)；他們都是通過對對象的哈希算法得到相應(yīng)的Bucket&Node地址，從而實現(xiàn)對數(shù)據(jù)的讀寫。

圖2.3 去中心化的分布式存儲架構(gòu)

接下來，我們來看Ceph和Swift都有哪些具體特性，我們應(yīng)該如何應(yīng)用？

Ceph是一種統(tǒng)一了三種接口的統(tǒng)一存儲平臺，上層應(yīng)用支持Object、Block、File 。
Ceph采用Crush算法完成數(shù)據(jù)分布計算，通過Tree的邏輯對象數(shù)據(jù)結(jié)構(gòu)自然實現(xiàn)故障隔離副本位置計算，通過將Bucket內(nèi)節(jié)點的組織結(jié)構(gòu)，集群結(jié)構(gòu)變化導(dǎo)致的數(shù)據(jù)遷移量最小。
Ceph保持?jǐn)?shù)據(jù)強(qiáng)一致性算法，數(shù)據(jù)的所有副本都寫入并返回才算寫事務(wù)的完成，寫的效率會差一些，所以更適合寫少讀多的場景。
對象保存的最小單元為4M，相比GFS&HDFS而言，適合一些小的非結(jié)構(gòu)化數(shù)據(jù)存儲。

雖然底層都是對象存儲，相對于Ceph來說，Swift又有哪些獨特的特性呢？

Swift只保障數(shù)據(jù)的最終一致性，寫完2個副本后即可Commit，這就導(dǎo)致讀操作需要進(jìn)行副本的對比校驗，讀的效率相對較低。
Swift采用一致性哈希算法完成數(shù)據(jù)分布計算，通過首次計算對象針對邏輯對象（Zone）的映射實現(xiàn)數(shù)據(jù)副本的故障隔離分布，然后通過哈希一致性算法完成對象在Bucket當(dāng)中的分布計算，采用Ring環(huán)結(jié)構(gòu)組織Bucket節(jié)點組織，數(shù)據(jù)分布不如Ceph均勻。
Swift 需要借助Proxy節(jié)點完成對數(shù)據(jù)的訪問，不同于通過客戶端直接訪問數(shù)據(jù)節(jié)點，相對數(shù)據(jù)的訪問效率來講，比Ceph要差一些。

總結(jié)來看，由于Swift需要通過Proxy節(jié)點完成與數(shù)據(jù)節(jié)點的交互，雖然Proxy節(jié)點可以負(fù)載均衡，但是畢竟經(jīng)歷了中間層，在并發(fā)量較大而且小文件操作量比較的場景下，Ceph的性能表現(xiàn)會優(yōu)秀一些。為了說明我們從原理層面的判斷，接下來借助ICCLAB&SPLAB的性能測試結(jié)果來說明。

表1 Ceph集群配置

[Node1 - MON]	[Node2 - OSD]	[Node2 - OSD]
[HDD1: OS]	[HDD1: OS]	[HDD1: OS]
[HDD2: not used]	[HDD2: osd.0 - xfs]	[HDD2: osd.2 - xfs]
[HDD3: not used]	[HDD3: osd.1 - xfs]	[HDD3: osd.3 - xfs]
[HDD4: not used]	[HDD4: journal]	[HDD4: journal]

表2 Swift集群配置

[Node1 - Proxy]	[Node2 - Storage]	[Node2 - Storage]
[HDD1: OS]	[HDD1: OS]	[HDD1: OS]
[HDD2: not used]	[HDD2: dev1 - xfs]	[HDD2: dev3 - xfs]
[HDD3: not used]	[HDD3: dev2 - xfs]	[HDD3: dev4 - xfs]
[HDD4: not used]	[HDD4: not used]	[HDD4: not used]

以上是測試本身對于Ceph和Swift的節(jié)點及物理對象配置信息，從表的對比，基本可以看出物理硬件配置都是相同的，只不過在Swift的配置當(dāng)中還需要配置Container相關(guān)邏輯對象。

{x}count{y}kb，x表示Swift集群當(dāng)中設(shè)置的Container數(shù)量，y表示進(jìn)行壓力測試所用的數(shù)據(jù)大小。從圖中表現(xiàn)出來的性能趨勢分析：

Container的數(shù)量越多，Swift的讀寫性能會相對差一些；
在4K-128K數(shù)據(jù)大小的范圍內(nèi)，Ceph和Swift的讀性能表現(xiàn)都是最佳的；
在4K-64K數(shù)據(jù)大小范圍內(nèi)，Ceph的讀性能幾乎是Swift的2-3倍，但是寫的性能相差不是非常大。

Ceph_{x}Swift{x},x表示并發(fā)數(shù)量。從圖中表現(xiàn)出來的性能趨勢分析：

對于并發(fā)讀操作，Ceph的表現(xiàn)上明顯優(yōu)于Swift，無論是穩(wěn)定性還是IOPS指標(biāo)；
對于并發(fā)寫操作，Ceph的并發(fā)量越高其性能表現(xiàn)越接近Swift，并發(fā)量越少其性能表現(xiàn)會明顯遜色于Swift。
對于并發(fā)讀寫操作的性能穩(wěn)定性上，Ceph遠(yuǎn)勝于Swift。

3 結(jié)語

通過對主流分布式存儲技術(shù)的各項特性分析梳理之后，我們基本上可以得出以下若干結(jié)論：

GFS/HDFS還是適合特定大文件應(yīng)用的分布式文件存儲系統(tǒng)（搜索、大數(shù)據(jù)...）；
GlusterFS是可以代替NAS的通用分布式文件系統(tǒng)存儲技術(shù)，可配置性較強(qiáng)；
Ceph是平衡各個維度之后相對比較寬容的統(tǒng)一分布式存儲技術(shù)；
分布式存儲技術(shù)終究不適合應(yīng)用到熱點比較集中的關(guān)系型數(shù)據(jù)庫的存儲卷場景上。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

分布式存儲

分布式存儲

+關(guān)注

關(guān)注
4

文章
170

瀏覽量
19502
HDFS

HDFS

+關(guān)注

關(guān)注
1

文章
30

瀏覽量
9570
GFS

GFS

+關(guān)注

關(guān)注
0

文章
5

瀏覽量
2149

分布式發(fā)電技術(shù)與微型電網(wǎng)

幾種分布式發(fā)電簡介2.分布式發(fā)電與配電網(wǎng)互聯(lián)問題3.微型電網(wǎng)技術(shù)4.分布式發(fā)電（電源）技術(shù)應(yīng)用的障礙和瓶頸5.

發(fā)表于 03-11 13:37

主流CAN收發(fā)器性能對比分析哪個最好？

主流CAN收發(fā)器性能對比分析哪個最好？

發(fā)表于 05-20 06:14

主流的三種RF方案及其優(yōu)缺點對比分析

主流的三種RF方案及其優(yōu)缺點對比分析RF IC的主要性能是什么？

發(fā)表于 05-25 06:34

幾款主流的Python開發(fā)板對比分析哪個好？

Python在國內(nèi)逐漸崛起和被追捧的原因？用Python可以做什么？幾款主流的Python開發(fā)板對比分析哪個好？

發(fā)表于 10-26 07:06

7大主流單片機(jī)優(yōu)缺點對比分析哪個好？

7大主流單片機(jī)優(yōu)缺點對比分析哪個好？

發(fā)表于 11-02 08:27

常見的分布式供電技術(shù)有哪些？

　　分布式供電技術(shù)是指將發(fā)電設(shè)備建設(shè)在用戶或供電系統(tǒng)端，將發(fā)電與負(fù)荷直接相連，通過局部供電的方式滿足用戶的電力需求。其主要特點是將傳統(tǒng)的集中式供電方式改為分散式供電方式，不僅既有大型電站向小型

發(fā)表于 04-10 16:28

實例分析分布式數(shù)據(jù)存儲協(xié)議對比

關(guān)于一致性為什么需要Paxos或Quorum算法？分布式系統(tǒng)實現(xiàn)數(shù)據(jù)存儲，是通過多份數(shù)據(jù)副本來保證可靠，假設(shè)部分節(jié)點訪問數(shù)據(jù)失敗，還有其他節(jié)點提供一致的數(shù)據(jù)返回給用戶。對數(shù)據(jù)存儲而言，怎樣保證副本

發(fā)表于 09-30 11:06 ?0次下載

深度解讀分布式存儲技術(shù)之分布式剪枝系統(tǒng)

分布式文件系統(tǒng)存儲目標(biāo)以非結(jié)構(gòu)化數(shù)據(jù)為主，但在實際應(yīng)用中，存在大量的結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)存儲需求。分布式鍵值系統(tǒng)是一種有別于我們所熟悉的分布式

發(fā)表于 10-27 09:25 ?1828次閱讀

什么是分布式存儲技術(shù)？有哪些應(yīng)用？

分布式存儲概念與目前常見的集中式存儲技術(shù)不同，分布式存儲技

發(fā)表于 11-17 09:26 ?2.3w次閱讀

淺談分布式塊存儲的元數(shù)據(jù)服務(wù)設(shè)計

一般來說，我們根據(jù)存儲的訪問接口以及應(yīng)用場景，把分布式存儲分為三種類型，包括分布式塊存儲，分布式

發(fā)表于 05-31 07:36 ?4927次閱讀

分布式存儲技術(shù)有哪些

本視頻主要詳細(xì)介紹了分布式存儲技術(shù)有哪些，分別是元數(shù)據(jù)管理、系統(tǒng)彈性擴(kuò)展技術(shù)、存儲層級內(nèi)的優(yōu)化技術(shù)

發(fā)表于 01-04 16:39 ?1.6w次閱讀

主流分布式存儲技術(shù)的對比分析與應(yīng)用

隨著數(shù)字化轉(zhuǎn)型的深入，海量數(shù)據(jù)對存儲提出了新的要求。傳統(tǒng)存儲雖然有技術(shù)成熟、性能良好、可用性高等優(yōu)點，但面對海量數(shù)據(jù)，其缺點也越來越明顯：如擴(kuò)展性差、成本高等。為了克服上述缺點，滿足海量數(shù)據(jù)的

發(fā)表于 07-13 15:52 ?3641次閱讀

AFS，GFS ，QKFile主流分布式存儲文件系統(tǒng)

主流的3種分布式存儲文件系統(tǒng) 存儲架構(gòu)分兩種，一種是傳統(tǒng)存儲陣列架構(gòu)，另一種就是本文將要重點介紹的分布式

發(fā)表于 08-02 11:04 ?3495次閱讀

盤點分布式存儲系統(tǒng)的主流框架

整個大數(shù)據(jù)處理的體系，按我的理解可以分為兩個部分，一個是分布式存儲系統(tǒng)、另一個是分布式計算框架。分布式存儲系統(tǒng)

發(fā)表于 08-06 09:07 ?2635次閱讀

分布式存儲的7個特征

什么是分布式存儲呢？如果一個存儲系統(tǒng)，不管是對象、塊、文件、kv、log、olap、oltp，只要對所管理的數(shù)據(jù)做了Partitioning&Replication，不管姿勢對不對，其實

發(fā)表于 07-18 14:17 ?1069次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

主流分布式存儲技術(shù)對比分析

1 引言

2 主流分布式存儲技術(shù)對比分析

2.1 GFS & HDFS

2.2 GlusterFS

2.3 Ceph & Swift

3 結(jié)語

評論

分布式發(fā)電技術(shù)與微型電網(wǎng)

主流CAN收發(fā)器性能對比分析哪個最好？

主流的三種RF方案及其優(yōu)缺點對比分析

幾款主流的Python開發(fā)板對比分析哪個好？

7大主流單片機(jī)優(yōu)缺點對比分析哪個好？

常見的分布式供電技術(shù)有哪些？

實例分析分布式數(shù)據(jù)存儲協(xié)議對比

深度解讀分布式存儲技術(shù)之分布式剪枝系統(tǒng)

什么是分布式存儲技術(shù)？有哪些應(yīng)用？

淺談分布式塊存儲的元數(shù)據(jù)服務(wù)設(shè)計

分布式存儲技術(shù)有哪些

主流分布式存儲技術(shù)的對比分析與應(yīng)用

AFS，GFS ，QKFile主流分布式存儲文件系統(tǒng)

盤點分布式存儲系統(tǒng)的主流框架

分布式存儲的7個特征