為工業(yè)應(yīng)用選擇閃存設(shè)備或固態(tài)驅(qū)動(dòng)器 (SSD) 非常復(fù)雜。價(jià)格性能比較幾乎沒(méi)有用,因?yàn)樾枨篁?qū)動(dòng)的性能定義取決于許多因素。
對(duì)于標(biāo)準(zhǔn) IT 應(yīng)用程序,每 GB 價(jià)格是購(gòu)買(mǎi)閃存的絕佳標(biāo)準(zhǔn)。在某些情況下,還會(huì)考慮寫(xiě)入和讀取速度。但是,如果您需要用于工業(yè)應(yīng)用的閃存設(shè)備,或者需要用于戶(hù)外電信應(yīng)用的存儲(chǔ)卡,那么您的優(yōu)先級(jí)將有所不同。如果通常情況下,容量不是真正的問(wèn)題,那么穩(wěn)健性和耐用性肯定是問(wèn)題。持久性(即閃存介質(zhì)壽命)和保留(即保存數(shù)據(jù)的持久性)是復(fù)雜的問(wèn)題。存儲(chǔ)介質(zhì)固件和架構(gòu)都在這里發(fā)揮作用,應(yīng)用程序的性質(zhì)也是如此。數(shù)據(jù)將如何寫(xiě)入?還是更強(qiáng)調(diào)閱讀?如果您對(duì)閃存有特殊要求,那么您需要確切知道要問(wèn)哪些問(wèn)題。
背景:衰老的跡象
通常,NAND 閃存設(shè)備的單元只允許有限數(shù)量的刪除。這是因?yàn)槊看萎a(chǎn)生隧道效應(yīng)時(shí),通常阻止電子從浮柵流出的氧化層由于熄滅電壓而積累了高能電子。因此,閾值電壓會(huì)隨時(shí)間變化,最終導(dǎo)致單元不再可讀(圖 1)。
【圖1 | 老化電池:電子在隧道氧化層中積累,導(dǎo)致閾值電壓逐漸變化。隧道氧化層中的裂縫會(huì)引起泄漏電流路徑,從而使電荷流出。讀取錯(cuò)誤增加到塊成為需要淘汰的“壞塊”的程度。]
老化的另一個(gè)影響是在氧化層中形成導(dǎo)電路徑,導(dǎo)致電池逐漸失去電荷——隨之而來(lái)的是保持位。這種效應(yīng)會(huì)因暴露在高溫下而加速,特別是在允許的編程/擦除 (P/E) 循環(huán)次數(shù)減少的情況下更容易發(fā)生,從而導(dǎo)致保留率急劇下降。因此,雖然新的單級(jí)和多級(jí)單元(SLC 和 MLC)NAND 都可靠地提供了 10 年的保留時(shí)間,但在其使用壽命結(jié)束時(shí),這一數(shù)字下降到只有一年。但是對(duì)于 MLC NAND,這一點(diǎn)在 3,000 個(gè) P/E 周期后達(dá)到,而 SLC 在 100,000 個(gè)之后達(dá)到。這就解釋了為什么 SLC 是復(fù)雜應(yīng)用的首選解決方案,以及為什么低成本三級(jí)單元 (TLC) NAND 芯片不能用于長(zhǎng)期存儲(chǔ)。要使用這種技術(shù)在每個(gè)單元中寫(xiě)入 3 位,您需要八個(gè)不同的電荷狀態(tài),這就是退化很快變得明顯的原因。在 TLC 中,最初的一年保留水平僅在 500 個(gè) P/E 周期后下降到三個(gè)月。
緩解措施
使用各種機(jī)制減輕對(duì)芯片的物理?yè)p壞的影響。考慮到當(dāng)一個(gè)單元發(fā)生故障時(shí),需要將整個(gè)塊標(biāo)記為“壞”,磨損均衡確保所有物理存儲(chǔ)地址都經(jīng)歷相同的使用級(jí)別。但讀取錯(cuò)誤不僅僅是磨損。每次寫(xiě)入數(shù)據(jù)時(shí),已編程單元周?chē)膯卧紩?huì)承受壓力(即它們變得更有活力)——這種現(xiàn)象稱(chēng)為“編程干擾”。隨著時(shí)間的推移,單元電壓閾值會(huì)增加,從而導(dǎo)致讀取錯(cuò)誤——一旦相關(guān)塊被擦除,這些錯(cuò)誤就會(huì)得到修復(fù)。閱讀還會(huì)導(dǎo)致一種稱(chēng)為“閱讀干擾”的壓力形式,相鄰的頁(yè)面會(huì)累積電荷。由于涉及的電壓相對(duì)較低,這種影響遠(yuǎn)沒(méi)有寫(xiě)入那么明顯——但讀取容易出現(xiàn)位錯(cuò)誤,必須通過(guò)糾錯(cuò)碼 (ECC) 進(jìn)行糾正,并通過(guò)刪除相關(guān)塊來(lái)修復(fù)。有趣的是,這種效果在重復(fù)讀取相同數(shù)據(jù)的應(yīng)用程序中尤為明顯。這意味著即使在只讀存儲(chǔ)器中,也需要?jiǎng)h除塊并重復(fù)寫(xiě)入頁(yè)面以糾正錯(cuò)誤。
如何測(cè)量 SSD 的耐用性
制造商使用兩個(gè)指標(biāo)來(lái)衡量閃存設(shè)備的壽命:寫(xiě)入的兆字節(jié)數(shù) (TBW) 和每天的驅(qū)動(dòng)器寫(xiě)入數(shù) (DWPD)。TBW表示SSD生命周期內(nèi)可以寫(xiě)入的數(shù)據(jù)總量,而DWPD表示保修期內(nèi)每天可以寫(xiě)入的數(shù)據(jù)量。這些基準(zhǔn)的問(wèn)題在于它們極其復(fù)雜,用戶(hù)別無(wú)選擇,只能依賴(lài)制造商的規(guī)格。此外,在為給定的應(yīng)用程序選擇正確的數(shù)據(jù)介質(zhì)時(shí),這些規(guī)范的實(shí)際相關(guān)性尚不清楚,因?yàn)楂@得的數(shù)字很大程度上取決于測(cè)試工作量。例如,Swissbit 480 GBP SSD 的測(cè)試得出 1360、912 或 140 TBW 的使用壽命,具體取決于所使用的測(cè)量方法。最顯著的結(jié)果是通過(guò)測(cè)量順序?qū)懭雭?lái)實(shí)現(xiàn)的。第二個(gè)值(912)由客戶(hù)工作負(fù)載產(chǎn)生,而第三個(gè)值(140)來(lái)自企業(yè)工作負(fù)載。兩種負(fù)載測(cè)試均構(gòu)成 JEDEC 標(biāo)準(zhǔn)。客戶(hù)端工作負(fù)載基于計(jì)算機(jī)用戶(hù)的行為,并且主要生成順序訪(fǎng)問(wèn)。另一方面,企業(yè)工作負(fù)載模擬多用戶(hù)環(huán)境中服務(wù)器的性能,生成高達(dá) 80% 的隨機(jī)訪(fǎng)問(wèn)。
雖然理論上這些標(biāo)準(zhǔn)應(yīng)該允許可比性,但問(wèn)題是許多制造商根本沒(méi)有指明底層工作負(fù)載,而是將他們的產(chǎn)品信息基于順序?qū)懭胫怠6遥缡纠?,后者?duì)于企業(yè)工作負(fù)載可能相差十倍,因此在涉及顯著且未明確指定的高耐久性值時(shí)需要格外小心。
寫(xiě)放大系數(shù) (WAF) 降低
邏輯到物理映射系統(tǒng)、ECC 和稱(chēng)為垃圾收集的清除塊的過(guò)程都是理解和排序閃存功能和性能的相關(guān)機(jī)制。該領(lǐng)域的一個(gè)關(guān)鍵術(shù)語(yǔ)是寫(xiě)入放大系數(shù)或 WAF,它是來(lái)自主機(jī)的用戶(hù)數(shù)據(jù)與寫(xiě)入閃存設(shè)備的實(shí)際數(shù)據(jù)量之間的比率。降低 WAF(閃存控制器效率的一項(xiàng)指標(biāo))是提高 SSD 耐用性的關(guān)鍵。影響 WAF 的工作負(fù)載因素包括順序訪(fǎng)問(wèn)和順序訪(fǎng)問(wèn)以及隨機(jī)訪(fǎng)問(wèn)之間的差異,或者數(shù)據(jù)塊大小相對(duì)于頁(yè)面和塊大小的差異。必須滿(mǎn)足兩個(gè)基本條件:頁(yè)面需要一個(gè)接一個(gè)地寫(xiě)入,塊需要作為一個(gè)整體刪除。在標(biāo)準(zhǔn)過(guò)程中,邏輯地址和物理地址之間的映射關(guān)系到塊。這對(duì)于順序數(shù)據(jù)非常有效,因?yàn)榻o定塊的頁(yè)面可以順序?qū)懭?。這種機(jī)制的一個(gè)例子是連續(xù)積累的視頻數(shù)據(jù)。然而,對(duì)于隨機(jī)數(shù)據(jù),頁(yè)面被寫(xiě)入許多不同的塊中,因此頁(yè)面的每次內(nèi)部覆蓋都需要?jiǎng)h除整個(gè)塊。這會(huì)導(dǎo)致更高的 WAF 和縮短的使用壽命。因此,基于頁(yè)面的映射更適合非順序數(shù)據(jù)。換句話(huà)說(shuō),固件確保來(lái)自不同來(lái)源的數(shù)據(jù)可以順序?qū)懭雴蝹€(gè)塊的頁(yè)面。這減少了刪除的數(shù)量,從而延長(zhǎng)了生命周期并提高了寫(xiě)入性能。
【圖2 | 對(duì)比測(cè)試:與常規(guī)產(chǎn)品相比,F(xiàn)-60 durabit 更耐用,WAF 更低。這是通過(guò) DRAM 中的 FTL 和更大的過(guò)度配置來(lái)實(shí)現(xiàn)的。]
增加 WAF 的另一個(gè)因素是內(nèi)存使用量。存儲(chǔ)在閃存設(shè)備上的數(shù)據(jù)越多,固件需要從一個(gè)地方移動(dòng)到另一個(gè)地方的比特就越多。基于頁(yè)面的映射在這里也很有利。制造商還有另一種稱(chēng)為過(guò)度配置的調(diào)整機(jī)制(即,閃存設(shè)備的空間僅保留用于后臺(tái)活動(dòng))可供他們使用。SSD 的 7%(千兆字節(jié)數(shù)字的二進(jìn)制和十進(jìn)制值之間的差異)通常用于此目的。但是為過(guò)度配置保留 12% 而不是 7% 是非常有效的。例如,從 MLC NAND 芯片派生的兩個(gè)相同 SSD 的耐久性比較(即企業(yè)工作負(fù)載的 TBW)表明,60 GB Swissbit F-60 durabit 達(dá)到了 6。價(jià)值比同一公司的 64 位 F-50 設(shè)備高 6 倍。事實(shí)上,240 GB 和 265 GB 版本的價(jià)值高出 10 倍。
結(jié)論和要問(wèn)的九個(gè)關(guān)鍵問(wèn)題
SLC 閃存器件在許多方面都是工業(yè)應(yīng)用以及斷電保護(hù)的最可靠的解決方案。然而,在許多情況下,高端 MLC 閃存介質(zhì)同樣適用于此類(lèi)用途。除了機(jī)械性能達(dá)到軍用標(biāo)準(zhǔn)外,在尋找 SSD 解決方案時(shí),還應(yīng)特別注意制造商在減少 WAF 和通過(guò)固件延長(zhǎng)產(chǎn)品壽命方面付出的努力。發(fā)揮作用的其他因素是“數(shù)據(jù)維護(hù)管理”措施,以更好地保留,不要忘記經(jīng)過(guò)精心挑選的模塊的長(zhǎng)期可用性,以適應(yīng)給定的應(yīng)用程序。
應(yīng)用要求決定了您在選擇 SSD 時(shí)需要特別注意哪些因素。根據(jù)要求,Swissbit 為其客戶(hù)提供 Lifetime Monitor,這是一種通過(guò)分析讀取和寫(xiě)入來(lái)計(jì)算給定 SSD 耐用性的工具。如前所述,即使價(jià)格不是決定性因素,了解您是否真的需要貴 8 倍的 SSD 或 MLC 是否足以滿(mǎn)足您的目的也很有用。
為工業(yè)應(yīng)用選擇閃存器件時(shí)要問(wèn)的關(guān)鍵問(wèn)題:
我對(duì)振動(dòng)、阻力和溫度范圍有特定的物理要求嗎?–工業(yè)閃存設(shè)備應(yīng)通過(guò)應(yīng)用適當(dāng)?shù)蔫b定程序,能夠證明高質(zhì)量的材料特性和良好的生產(chǎn)和加工。
內(nèi)存是否長(zhǎng)時(shí)間暴露在高溫下?–因?yàn)楦邷貢?huì)更快地削弱cell的可讀性,所以應(yīng)該選擇具有數(shù)據(jù)保護(hù)功能的產(chǎn)品,定期刷新數(shù)據(jù)。
是否打算在數(shù)據(jù)載體上長(zhǎng)期寫(xiě)入和存儲(chǔ)大量數(shù)據(jù)?–如果是,則應(yīng)選擇 SLC 產(chǎn)品。
應(yīng)用程序是否主要需要讀取訪(fǎng)問(wèn)權(quán)限?–如果是,則應(yīng)選擇具有數(shù)據(jù)護(hù)理功能的產(chǎn)品,該產(chǎn)品會(huì)定期刷新數(shù)據(jù)。
應(yīng)用程序是否主要需要寫(xiě)入功能?–然后具有基于塊的映射的產(chǎn)品適用于順序?qū)懭牍δ?。?duì)于隨機(jī)請(qǐng)求,應(yīng)選擇具有基于頁(yè)面映射的產(chǎn)品。
內(nèi)存容量是否被充分利用?–對(duì)于密集使用的應(yīng)用程序,控制器需要內(nèi)部操作空間,并且過(guò)度配置可以延長(zhǎng)耐用性。
提供商為 TBW 或 DWPD 指定了哪些工作負(fù)載?–數(shù)據(jù)載體的比較只能通過(guò)工作量基準(zhǔn)的指示來(lái)實(shí)現(xiàn)。
是否需要更高級(jí)別的數(shù)據(jù)丟失保護(hù)?–對(duì)于特別關(guān)鍵的應(yīng)用,數(shù)據(jù)維護(hù)管理和電源故障保護(hù)是必不可少的。
幾年后,該介質(zhì)是否仍然可用?–制造商應(yīng)保證長(zhǎng)期可用性,以便無(wú)需重新認(rèn)證即可更換內(nèi)存存儲(chǔ)。
審核編輯:郭婷
評(píng)論
查看更多