問:如果一個和尚挑水喝,兩個和尚抬水喝,三個和尚沒水喝,那么眾人拾柴一定火焰高嗎?
多線程一定能提高程序性能嗎?在計算機科學中,這個問題的標準答案是“it depends”,看情況。
計算機中的一切設計都是為了更加高效地利用硬件資源,包括:CPU、內存、IO等,我們一樣一樣來了解一下。
多線程與CPU
多線程與CPU是程序員了解得最多的,我們知道多線程的目的之一在于充分利用多核,但這里有個前提就是你要處理的任務真的能拆分成獨立的子任務。 舉個例子,如果你想求一個數組所有元素的和,那么這個任務就可以拆分成為兩個獨立的子任務:任務A計算前一半數組元素的和,任務B計算后一半數組元素的和,然后任務A和任務B分別交給兩個線程來執行。 如果是在多核系統下,這類多線程并行處理將顯著提高程序性能,但這種使用多線程充分利用多核帶來的性能提升是有上限的。 道理很簡單,這就好比蓋房子,蓋房子算是個不大不小的工程,讓一個人來完成也不是不可以,但再來六七個人顯然能加快工程速度,但是再來成百上千工人來蓋一棟房子可能速度反而會變慢,畢竟資源是有限的(可用的工具等),人一多需要用在協調上的時間就會變多,多線程也是同樣的道理,當線程數量超過某個臨界點時,操作系統就開始忙不過來了(頻繁調度切換),我稱之為三個和尚沒水喝現象。 但如果系統是單核的,那么這種任務拆分則不會有什么效果,因為不管創建多少線程,真正工作的CPU只有一個。 當然也有可能我們根本就不能對任務進行拆分,像計算斐波那契數列這類問題,如果不能計算出f(n-1)與f(n-2)的解,那么根本就沒有辦法計算出當前問題f(n)的解,被拆分的兩個任務A和B有前后依賴關系,這時多線程就沒有用武之地了。 還有一種可能,就是問題規模非常小,如果這個數組是有幾百幾千個元素,那么這時使用多線程意義不大,這時使用多線程帶來的收益不足以抵消掉多線程帶來的性能開銷。 ?
多線程與IO
多線程一定能提升程序的IO性能嗎?答案顯然不是的。 最簡單的場景是這樣的,你的程序需要從一個速度極慢的網絡鏈接上讀寫數據,在這種情況下,一個線程很可能就足以應付得過來,創建多個線程反而可能對程序性能有損。 相同的情況也會出現在磁盤上,一個線程可能就已經將磁盤打滿,這時創建多個線程去讀寫文件顯然不能加快程序的處理速度。 而在服務器端,程序員也使用多線程加快程序處理速度,在這里,一個典型的問題是阻塞式網絡IO會導致調用線程被掛起而暫停運行,此時最簡單的方法就是創建多個線程,每個線程處理一個請求,但隨著請求的增多,創建的線程也會越來越多,此時三個和尚沒水喝現象開始出現,IO多路復用技術可以很好地解決這一問題。 當然,如果你的場景是IO會阻塞住處理線程,那么此時創建兩個線程,一個負責處理數據,一個負責等待IO,那么這顯然會提高程序性能。
多線程與內存
內存其實和磁盤一樣,也是有讀寫帶寬上限的,但我們的程序一般都不會達到內存讀寫帶寬上限,這并不是瓶頸。 瓶頸在于多線程共享的內存資源(數據)以及多核系統的cache一致性問題。 一般來說,對于多線程共享資源通常需要互斥訪問,然而為加快內存讀寫速度,現代處理器中都有cache系統(L1、L2、L3),每個核心都有自己的cache,這些cache會緩存內存數據,也就是說一份數據可能會同時存在于內存以及各個核心的cache中,這就會帶來經典的數據一致性問題:某個核心修改了cache中的數據后需要將其同步給其他核心,這就要求cache系統中必須有能確保一致性的協議,否則程序可能會讀取到錯誤的(過期的)數據。 然而這種同步是有性能損耗的,多個線程頻繁操作同一個變量可能導致處理器cache系統需要頻繁在各個核心之間進行同步,極端情況下多線程程序性能甚至比單線程要差。 因此多線程之間能不共享數據就不要共享,如果一定要共享,那么就盡量將其控制在最小范圍,讀寫頻次控制到最少。
-
cpu
+關注
關注
68文章
10829瀏覽量
211183 -
計算機
+關注
關注
19文章
7430瀏覽量
87733 -
內存
+關注
關注
8文章
3004瀏覽量
73900 -
多線程
+關注
關注
0文章
277瀏覽量
19923
原文標題:多線程一定能優化程序性能嗎?
文章出處:【微信號:良許Linux,微信公眾號:良許Linux】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論