精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何處理復雜的靜默數據損壞問題

新思科技 ? 來源:新思科技 ? 2024-11-21 18:01 ? 次閱讀

在本系列的第一篇文章中,我們探討了靜默數據損壞(Silent Data Corruption,SDC)的定義及其對當前計算數據狀況的影響。為此,我們再次邀請了谷歌的首席工程師Rama Govindaraju和微軟的硬件架構合伙人Robert S. Chappell共同探討解決這一棘手問題的可行方案。

回顧一下,靜默數據損壞是指受影響的CPU在處理數據時無意中引發錯誤。這些錯誤可能會長時間潛伏而不被發現,進而悄無聲息地破壞整個數據集。

隨著計算機處理能力的飛速提升,尤其是伴隨內存密集型人工智能AI)及其他前沿技術的廣泛應用,SDC的風險日益加劇,可能導致大量數據的損壞,進而引發難以預估且影響深遠的問題。

SDC問題亟待解決,那我們應該如何應對呢?

處理復雜的靜默數據損壞問題

當前,SDC的成因尚未明確,且解決方案尚處于初級階段。

SDC所面臨的一大挑戰是決策者未投入充足資源來根本性地解決該問題,而僅僅是在癥狀顯現時采取臨時緩解措施?!斑@要花多少錢?”是常見的反對理由,通常也是SDC未得到根本解決的原因,畢竟定期執行掃描以及改進芯片制造工藝等諸多措施的成本過高。

最終,成本問題成為了開發實際解決方案的絆腳石。如果成本過高,為什么還要去研究解決方案呢?但這正是悖論所在:如果開發出了解決方案,就可以進一步研究降低成本和擴大應用的方法。

解決SDC的責任不應僅落在芯片開發者身上,制造商以及更廣泛的利益相關方也應參與其中。即使現有的每個芯片都完美無瑕,SDC問題仍然會發生。然而,芯片生命周期的每一個環節都可能存在相關的解決方案,且或將對此發揮積極作用。

如今,制造商缺乏應對SDC的動力。如果客戶收到有故障或缺陷的芯片,通常只需退換即可。這種做法雖然可行,但并未從根本上解決問題。如果激勵機制發生改變,相應的行為模式也會隨之變化。例如,如果芯片開發者可以向制造商證明某個芯片存在缺陷,而制造商必須為此支付50倍于芯片成本的賠償,那么制造商就會更自覺地采取預防措施。

此外,早期的篩查和測試有助于盡早發現SDC,從而留出補救時間。就比如您汽車上的傳感器。許多傳感器并不是汽車正常運行所必需的,而是用于提醒用戶可能存在的問題。

在芯片領域,某些故障可能隱藏了一兩年之久,等到發現時往往為時已晚。芯片中的傳感器可以發出預警或警告,雖然這只是權宜之計,但可以在過渡階段提供有效幫助。

解決SDC面臨的一大難題在于,解決方案需要廣泛覆蓋。具體來說,真正有效的解決方案應涵蓋芯片開發者、供應商、云和數據管理者及其他相關方等等所有環節。

有望解決靜默數據損壞的工具和方法

解決SDC的另一難點在于我們對其發生機制和原因知之甚少。不知彼,不知己,每戰必貽。因此,我們需要更多能夠廣泛共享、分析和研究的數據。此外,行業也應允許并鼓勵研究人員和開發者聚焦于SDC問題。

識別數據中的異常點、采取糾正措施、診斷癥狀、關注時間延遲或數據泄漏等警示跡象,以及其他許多診斷選項,將有助于揭開SDC的神秘面紗。然后,通過調整策略,我們也許能夠找到解決方案。然而,這些舉措仍未能在開發階段如期落地,所以迫切需要集結各方力量共同攻關。

我們可以借鑒網絡安全等相關行業以及食品和消費品等領域,建立一系列的管理標準,規定安全可靠的產品必須達到的特定條件。在計算機組件領域,類似的框架必定有助于推動解決方案的發展。

在工具箱中,還有一個工具目前尚未得到充分利用,那就是人工智能(AI)和機器學習(ML)算法。在診斷方面,定期篩查并不完美。一項篩查可以運行10次,但可能會得到5次陽性結果和5次陰性結果。故障容易被遺漏,而即便能夠識別出某些癥狀,但通常也難以確定故障的根本原因或具體機制。

AI或ML或許能夠提供幫助。理論上,當SDC的早期跡象達到某些條件時,算法能夠發出警報。但這種方法也并不理想,因為訓練這些模型需要大量數據,進而需要綜合處理數據,而且用于AI訓練的數據集必須具備高度的目的性。這個方法雖然很有潛能,但仍處于早期階段。

毫無疑問,這一問題規模巨大,構成了根本性威脅,需要我們攜手應對。芯片開發者、制造商、軟件和硬件工程師、供應商以及任何涉及計算機數據的人員等等各個領域的利益相關者,都需要共同合作并認真對待SDC問題。在此過程中,教育扮演著重要角色,我們希望類似本博客系列的資源有助于闡明為什么必須采取行動來解決靜默數據損壞,并說服決策者落實措施。

解決問題的第一步是承認問題的存在。對于靜默數據損壞,我們已經意識到問題的存在,現在是采取行動的時候了。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6572

    瀏覽量

    103963
  • 谷歌
    +關注

    關注

    27

    文章

    6142

    瀏覽量

    105114
  • 計算機
    +關注

    關注

    19

    文章

    7430

    瀏覽量

    87732
  • 人工智能
    +關注

    關注

    1791

    文章

    46896

    瀏覽量

    237657
  • 新思科技
    +關注

    關注

    5

    文章

    789

    瀏覽量

    50309

原文標題:對話谷歌和微軟,為什么靜默數據損壞(SDC)問題需要高度重視?(下)

文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    TPA3116D2 BTL模式下,導致喇叭損壞的原因嗎?如何處理呢?

    rock music時,瞬時Vpeak高達25V以上。 11/5之前的寫的Vp-p不對,是瞬時Vpeak電壓 請問這是導致喇叭損壞的原因嗎?如何處理呢? 輸入電壓13.72V,輸出瞬時Vpeak為何可以達到25V以上?
    發表于 10-18 06:26

    使用tlc2274空腳要如何處理?

    使用 tlc2274 空腳要如何處理
    發表于 09-19 07:49

    請問比較器不用的引腳如何處理比較好?

    想請問一下,比較器不用的引腳如何處理比較好 前段時間看了一個國外比較老的板子,他將比較器不用引腳處理成如下, 總感覺有點怪怪的,請專家給點意見,如何處理比較好
    發表于 08-12 07:40

    ESP8266如何處理去抖動?

    有沒有辦法在智能插頭中處理去抖動鍵? 我的意思是為了節省成本,添加 debounce 代碼更好,如果在硬件方面有一些想法會更好。 有人有一些與這種去抖動相關的解決方案嗎? 或者有人曾經應用添加開關并測量這個ESP8266如何處理去抖動?
    發表于 07-08 08:23

    不使用wifi和藍牙的話,天線引腳LNA_IN如何處理?

    不使用wifi和藍牙的話,天線引腳LNA_IN,如何處理? 接地,還是懸空? 謝謝
    發表于 07-01 06:10

    請問ESP32C3串口收數據多于120個字節如何處理?

    請教一個問題,我現在用ESP32C3收數據,串口最大接收120字節就進入事件了,請問ESP32C3串口收數據多于120個字節如何處理。 例如,當我發送一個長度為236個字節的數據時,會
    發表于 06-06 08:02

    串口接收不等長的數據何處理的呢?

    串口是一個很重要的通信方式,但是要用好串口并不是那么簡單,比如如何接收不等長的數據等。你們是如何處理的呢?大家來說說你們的做法。
    發表于 05-15 08:02

    播放avi視頻時,音頻數據該如何處理啊 ?

    請教下,播放 avi 視頻時,音頻數據該如何處理啊 ???
    發表于 05-06 07:56

    使用STM32F3系列芯片用AD的DMA多通道采集時是如何處理采集數據的?

    請問,各位在使用STM32F3系列芯片用AD的DMA多通道采集時是如何處理采集數據的,。。,我再每次DMA采集完畢的中斷函數中關中斷,處理完AD采樣再定時開啟,有人這樣用嗎?但是采集的數據
    發表于 04-26 06:59

    變壓器運行中常見的異常現象應如何處理呢?

    變壓器運行中常見的異常現象應如何處理?
    的頭像 發表于 03-08 09:19 ?585次閱讀
    變壓器運行中常見的異?,F象應如<b class='flag-5'>何處理</b>呢?

    導熱油管道漏油應該如何處理

    電子發燒友網站提供《導熱油管道漏油應該如何處理.docx》資料免費下載
    發表于 03-06 15:41 ?0次下載

    減速機滲油問題如何處理

    電子發燒友網站提供《減速機滲油問題如何處理.docx》資料免費下載
    發表于 03-05 09:18 ?2次下載

    示波器如何處理有噪聲的信號

    示波器如何處理有噪聲的信號? 示波器是一種用于測量和顯示電信號的設備,可以幫助工程師和科學家分析和診斷電路故障。然而,在實際的測量中,信號往往會受到各種噪聲的干擾,這可能會導致測量結果的失真和不準
    的頭像 發表于 12-21 15:37 ?1029次閱讀

    何處理MOS管小電流發熱?

    何處理MOS管小電流發熱?
    的頭像 發表于 12-07 15:13 ?586次閱讀
    如<b class='flag-5'>何處理</b>MOS管小電流發熱?

    什么是串擾?該如何處理它?

    什么是串擾?該如何處理它?
    的頭像 發表于 12-05 16:39 ?800次閱讀
    什么是串擾?該如<b class='flag-5'>何處理</b>它?