提高芯片通訊速度的可行性方法

想要提高芯片之間的通訊速度，應該怎么做呢？傳統的思路是優化芯片之間的通信接口。

谷歌發布了CloudTPU測試版，以及GoogleKubernetesEngine的GPU。比如谷歌云服務中心使用的AI芯片TPU，就專門在每塊芯片上都專門設計了4個用來做芯片之間通信的接口，但是這種思路有一個天花板，就是如今的接口技術，芯片之間的通信技術，達到每秒鐘幾百甚至上千GB，就已經接近極限了，再要提升，技術上可能會非常困難，這里要額外提一句，每秒鐘幾百GB的速度，聽起來還是挺快的，但對于云計算中心而言，依然會成為制約整個系統運算性能的關鍵因素，那還有什么別的辦法可以繼續提高數據傳輸速度呢？

這里就要說到Cerebras這家公司的“巨無霸”芯片了，它的思路就是把很多塊小芯片合在一起，做成一塊大芯片，這樣原來需要很多芯片之間相互通信的任務，就可以在芯片內部進行數據傳輸了。要知道，芯片在自己內部傳輸數據的速度，是遠遠高于芯片之間通信的速度的，這就如同，我們左腦跟右腦互相溝通的速度，肯定比我們跟別人溝通說話的速度要快，事實上，按照這家公司披露的數據，這塊芯片內部通信網絡的速度，可以達到1000PB每秒，是目前最快的芯片之間的通信接口速度的10萬倍。如果未來超級計算機，都使用這種“巨無霸”芯片，那就能夠很好的解決芯片間通信速度。

這個制約運算速度的瓶頸對整體性能的制約影響，那既然把計算芯片做大有那么多的好處，為什么以前就沒人做呢，事實上，不是沒人做，而是這件事太難了，還沒有人能做到，為什么這么說呢，問題的關鍵就在“可靠性”三個字上，眾所周知，所有的芯片都是在一塊圓形的硅片上，經過非常精細的半導體工藝加工而成的，在加工的過程中，難免會有一些加工缺陷和誤差，導致硅片上局部失效。在過去，一片硅片上通常會切割出幾百塊小芯片，而這些局部工藝的誤差，頂多也就是影響其中一部分芯片，我們只需要把剩下的部分完好無損的挑出來，就可以到市場上銷售了。

看到這里你可能已經明白了，既然加工過程中，難免會出現一些工藝缺陷，那一塊芯片的面積越大，上面出現缺陷的概率就越大。所以想要成功的把它制造出來的難度也就越高，像這次發布的“巨無霸”芯片，面積是過去芯片的50多倍，對于工藝可靠性的要求理論上也就提高了50多個量級，這么高的可靠性要求，在過去是很難做到的，這也就是，在過去很少有這種超大型芯片的原因。
責任編輯人：CC

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴