超越“降額” 值得現代工程師參考的可靠性概念
“可靠性”這個詞匯對于不同的人士來說可能有著不同意義,但廣泛來講,底線往往在于成本。可靠性能夠滿足人的期望,它可能基于廣告宣傳、技術規格或合同,也可能與工程師以外的很多人士息息相關。例如在社會經濟學的層面上,我們的生態系統以道德及倫理為基礎。雖然工程師必須遵守雇主定下的行為標準,但是從個人品德的立場而言,道德規范可能比經濟效益更加重要。歷史常常告訴我們,任何文明都不能單憑經濟基礎而持久。完整的可靠性概念才是關鍵所在。
隨著人們逐漸關注到產品制造和棄置對環境帶來的影響,消費者的目光也由最低采購成本轉移到最低擁有成本。無金錢或環境處罰而頻繁更換低質量產品的年代已經一去不復返。相反,講求可靠性的設計在今天的價值生態系統中變得尤為重要。
故障模式與機制
要達到令人滿意的可靠性,便需要對故障模式與機制有充分的理解。故障模式說明了一個零件如何失效,也就是造成故障的“應力”。故障機制反映了零件的強度如何在不同的應力下被減弱。透過故障模式分析,我們可以歸納出故障的成因,從而改善產品的可靠性;明白了故障的機制后,我們又懂得選擇合適的鑒定試驗去驗證某項應用的可靠性。
故障模式的分類如下:
* 電氣性
* 災難性(破壞性)
* 功能性 – 元件不能夠提供正確的輸出數據或信號
* 參量性 – 電流或電壓超出允許誤差
* 編程 – 非揮發性記憶體元件不能夠做出正常響應
* 時序 – 例如由于傳播延遲、讀/寫時間、升降時間及建立時間不符合規格而造成故障
* 機械性 – 例如引線受損、封裝破裂、污染
* 外觀 – 例如標記難以辨認
* 行政管理 – 例如產品、數量、封裝、方向、日期和代碼出現錯誤
故障機制的分類如下:
* 物理故障
* 與時間有關的介質擊穿
* 負偏壓溫度不穩定
* 電子漂移
* 熱載流子注入
* 輻射故障 (反應器、空間)
* 中子
* Beta粒子
* 伽馬
分析和預測
可用信息能夠估算出故障概率,卻無法提供實際故障數據,這是實施可靠性工程的一大挑戰。一般來說,用上幾千小時去測試一個裝置的做法是不切實際的,所以我們通常無法得到一個元件或系統在實際壽命中的測試數據。新產品的可靠性數據往往等于零,然而這并不代表有關產品永遠不會出現故障。雖然以更高溫度加快壽命測試或許能提供恰如其分的實驗數據,不過該實驗前提包括了活化能量恒久不變的假設,而在實際情況下,它是電壓和溫度的一個函數 (圖1)。這限制了加快的壽命測試在預測可靠性方面的準確度。因此,現場故障的監察及反饋對提高產品可靠性的預測能力十分重要。
圖1
圖2
圖2顯示了在某時段內的累積故障。這個概念在常用的產品故障曲線 (又稱浴盆曲線) 中得到進一步的展示 (圖3)。有關曲線包含3個清晰的區段,每個區段都包含了若干有可能造成故障的因素,也牽涉某些人士。他們可以因為某些行動而影響了客戶對可靠性的理解。
第1個區段描述了裝置的失敗率。只要在生產裝置中進行若干測試,就可以把故障率降低到一個在實際運行中可以接受的水平。第2個區段描述了實際工作壽命中有可能出現的隨機故障。它們與時間無關,有關裝置也不會預先替換,一般都會在發生故障時才會被替換。第3個區段顯示了裝置的壽命接近終結而開始出現損耗。假如不加以替換,有一半產品都會在壽命中期開始失效。
圖3
可靠性組合
故障率 (可靠性的一種指標) 已不單單與電氣或熱應力有關,同時也與硬件、軟件/邏輯及傳輸媒體相互影響。降額是指在制造廠商針對環境或使用情況而定出的最大限制下對元件施加應力的做法,而該做法已不再是加強可靠性的良方妙法。它只是在最廣泛的程度上有條不紊控制產品質量的一種要素。
這方面的最大挑戰,是只能夠在同一段時間內一個元件降額;而且由于制造廠商的數據冊逐漸變成了只提供“最低定義”的責任文件,設計員必須在元件中內置額外的緩沖 – 這不但增加了成本,還有可能降低產品的性能表現。
高可靠性產品 (軍事及宇航) 一般都會使用獨立鑒定的零件。不過,這樣不但增加了成本,也拖長了產品推出市場的時間。假如基于可靠性和質量來設計產品,無疑是更經濟實惠的方法。針對可靠性的設計必須對故障模式有充分了解,同時選擇成本最少的硬件冗余、軟件控制及傳輸媒體組合,從而達到甚至超越可靠性目標。產品鑒定包括了解故障機制,并且設計出一套完善的鑒定計劃,務求在限定的成本和時間內,對有關可靠性的預測作出精確的驗證。
針對可靠性的設計
可靠性設計是指通過平衡硬件、固件和軟件分配,務求以最低成本實現理想的可靠性表現。工程師應該緊記,硬件的可靠性是在元件壽命終結時的一個時間函數,軟件的可靠性則是一個成本函數。軟件一般都沒有耗損機制。
假如要以最少成本、在最短時間內達到預期的可靠性目標,就必須充分利用設計分析、故障模擬和工程判斷的重要資料。強大的設計技術包括為易受損元件提供冗余,同時意識到每個元件的可靠性都與整體可靠性密不可分。合適的話,可以利用硬件或軟件把監察與控制功能加入元件設計中,為元件提供周全的應力保護。
靈巧的工程設計還會考慮到終端應用環境的設計決定。比方說,一枚導彈與一臺洗衣機的設計需求顯然有著天壤之別。導彈要在短時間內發揮強大的性能;相反,洗衣機卻需要針對數以百計的運行周期提供最完美的耐久性。兩者的需求在根本上截然不同。
可靠性的增長
圖4
如圖4所示,每個產品壽命周期都包含不同階段的轉變,由原型到開發,再由開發到生產,過程中的可靠性會不斷增長。換句話說,每項設計在其壽命周期中,可靠性都會增加,而成本則會下降。這反映了可靠性的增長不單是設計工程師的責任而已。
事實上,隨著可靠性在價值生態系統中的角色日趨重要,不論是從事技術、管理、物流或面向客戶的人員,都有責任讓可靠性持續增長 (圖5)。
圖5