強類型語言
強類型語言也稱為強類型定義語言。是一種總是強制類型定義的語言,要求變量的使用要嚴格符合定義,所有變量都必須先定義后使用。
java、.NET、C++等都是強制類型定義的。也就是說,一旦一個變量被指定了某個數據類型,如果不經過強制轉換,那么它就永遠是這個數據類型了。
例如你有一個整數,如果不顯式地進行轉換,你不能將其視為一個字符串。
與其相對應的是弱類型語言:數據類型可以被忽略的語言。它與強類型定義語言相反, 一個變量可以賦不同數據類型的值。
弱類型語言
弱類型語言也稱為弱類型定義語言。與強類型定義相反。像vb,php等就屬于弱類型語言·
一種類型可以被忽略的語言,與強類型定義相反。VBScript是弱類型定義的。在VBScript中,可以將字符串‘12’和整數3進行連接得到字符串‘123’,然后可以把它看成整數123,而不需要顯示轉換。
但其實它們的類型沒有改變,VB只是在判斷出一個表達式含有不同類型的變量之后,自動在這些變量前加了一個clong()或(int)()這樣的轉換函數而已。能做到這一點其實是歸功于VB的編譯器的智能化而已,這并非是VB語言本身的長處或短處。
強類型語言和弱類型語言的區別
編譯型和解釋型
我們先看看編譯型,其實它和匯編語言是一樣的:也是有一個負責翻譯的程序來對我們的源代碼進行轉換,生成相對應的可執行代碼。這個過程說得專業一點,就稱為編譯(Compile),而負責編譯的程序自然就稱為編譯器(Compiler)。如果我們寫的程序代碼都包含在一個源文件中,那么通常編譯之后就會直接生成一個可執行文件,我們就可以直接運行了。但對于一個比較復雜的項目,為了方便管理,我們通常把代碼分散在各個源文件中,作為不同的模塊來組織。這時編譯各個文件時就會生成目標文件(Object file)而不是前面說的可執行文件。一般一個源文件的編譯都會對應一個目標文件。這些目標文件里的內容基本上已經是可執行代碼了,但由于只是整個項目的一部分,所以我們還不能直接運行。待所有的源文件的編譯都大功告成,我們就可以最后把這些半成品的目標文件“打包”成一個可執行文件了,這個工作由另一個程序負責完成,由于此過程好像是把包含可執行代碼的目標文件連接裝配起來,所以又稱為鏈接(Link),而負責鏈接的程序就叫……就叫鏈接程序(Linker)。鏈接程序除了鏈接目標文件外,可能還有各種資源,像圖標文件啊、聲音文件啊什么的,還要負責去除目標文件之間的冗余重復代碼,等等,所以……也是挺累的。鏈接完成之后,一般就可以得到我們想要的可執行文件了。
上面我們大概地介紹了編譯型語言的特點,現在再看看解釋型。噢,從字面上看,“編譯”和“解釋”的確都有“翻譯”的意思,它們的區別則在于翻譯的時機安排不大一樣。打個比方:假如你打算閱讀一本外文書,而你不知道這門外語,那么你可以找一名翻譯,給他足夠的時間讓他從頭到尾把整本書翻譯好,然后把書的母語版交給你閱讀;或者,你也立刻讓這名翻譯輔助你閱讀,讓他一句一句給你翻譯,如果你想往回看某個章節,他也得重新給你翻譯。
兩種方式,前者就相當于我們剛才所說的編譯型:一次把所有的代碼轉換成機器語言,然后寫成可執行文件;而后者就相當于我們要說的解釋型:在程序運行的前一刻,還只有源程序而沒有可執行程序;而程序每執行到源程序的某一條指令,則會有一個稱之為解釋程序的外殼程序將源代碼轉換成二進制代碼以供執行,總言之,就是不斷地解釋、執行、解釋、執行……所以,解釋型程序是離不開解釋程序的。像早期的BASIC就是一門經典的解釋型語言,要執行BASIC程序,就得進入BASIC環境,然后才能加載程序源文件、運行。解釋型程序中,由于程序總是以源代碼的形式出現,因此只要有相應的解釋器,移植幾乎不成問題。編譯型程序雖然源代碼也可以移植,但前提是必須針對不同的系統分別進行編譯,對于復雜的工程來說,的確是一件不小的時間消耗,況且很可能一些細節的地方還是要修改源代碼。而且,解釋型程序省卻了編譯的步驟,修改調試也非常方便,編輯完畢之后即可立即運行,不必像編譯型程序一樣每次進行小小改動都要耐心等待漫長的Compiling…Linking…這樣的編譯鏈接過程。不過凡事有利有弊,由于解釋型程序是將編譯的過程放到執行過程中,這就決定了解釋型程序注定要比編譯型慢上一大截,像幾百倍的速度差距也是不足為奇的。
編譯型與解釋型,兩者各有利弊。前者由于程序執行速度快,同等條件下對系統要求較低,因此像開發操作系統、大型應用程序、數據庫系統等時都采用它,像C/C++、Pascal/Object Pascal(Delphi)、VB等基本都可視為編譯語言,而一些網頁腳本、服務器腳本及輔助開發接口這樣的對速度要求不高、對不同系統平臺間的兼容性有一定要求的程序則通常使用解釋性語言,如Java、JavaScript、VBScript、Perl、Python等等。
但既然編譯型與解釋型各有優缺點又相互對立,所以一批新興的語言都有把兩者折衷起來的趨勢,例如Java語言雖然比較接近解釋型語言的特征,但在執行之前已經預先進行一次預編譯,生成的代碼是介于機器碼和Java源代碼之間的中介代碼,運行的時候則由JVM(Java的虛擬機平臺,可視為解釋器)解釋執行。它既保留了源代碼的高抽象、可移植的特點,又已經完成了對源代碼的大部分預編譯工作,所以執行起來比“純解釋型”程序要快許多。而像VB6(或者以前版本)、C#這樣的語言,雖然表面上看生成的是.exe可執行程序文件,但VB6編譯之后實際生成的也是一種中介碼,只不過編譯器在前面安插了一段自動調用某個外部解釋器的代碼(該解釋程序獨立于用戶編寫的程序,存放于系統的某個DLL文件中,所有以VB6編譯生成的可執行程序都要用到它),以解釋執行實際的程序體。C#(以及其它.net的語言編譯器)則是生成.net目標代碼,實際執行時則由.net解釋系統(就像JVM一樣,也是一個虛擬機平臺)進行執行。當然.net目標代碼已經相當“低級”,比較接近機器語言了,所以仍將其視為編譯語言,而且其可移植程度也沒有Java號稱的這么強大,Java號稱是“一次編譯,到處執行”,而.net則是“一次編碼,到處編譯”。呵呵,當然這些都是題外話了。總之,隨著設計技術與硬件的不斷發展,編譯型與解釋型兩種方式的界限正在不斷變得模糊。
動態語言和靜態語言
通常我們所說的動態語言、靜態語言是指動態類型語言和靜態類型語言。
(1)動態類型語言:動態類型語言是指在運行期間才去做數據類型檢查的語言,也就是說,在用動態類型的語言編程時,永遠也不用給任何變量指定數據類型,該語言會在你第一次賦值給變量時,在內部將數據類型記錄下來。Python和Ruby就是一種典型的動態類型語言,其他的各種腳本語言如VBScript也多少屬于動態類型語言。
(2)靜態類型語言:靜態類型語言與動態類型語言剛好相反,它的數據類型是在編譯其間檢查的,也就是說在寫程序時要聲明所有變量的數據類型,C/C++是靜態類型語言的典型代表,其他的靜態類型語言還有C#、JAVA等。
對于動態語言與靜態語言的區分,套用一句流行的話就是:Static typing when possible, dynamictyping when needed。
強類型定義語言和弱類型定義語言
(1)強類型定義語言:強制數據類型定義的語言。也就是說,一旦一個變量被指定了某個數據類型,如果不經過強制轉換,那么它就永遠是這個數據類型了。舉個例子:如果你定義了一個整型變量a,那么程序根本不可能將a當作字符串類型處理。強類型定義語言是類型安全的語言。
(2)弱類型定義語言:數據類型可以被忽略的語言。它與強類型定義語言相反, 一個變量可以賦不同數據類型的值。
強類型定義語言在速度上可能略遜色于弱類型定義語言,但是強類型定義語言帶來的嚴謹性能夠有效的避免許多錯誤。另外,“這門語言是不是動態語言”與“這門語言是否類型安全”之間是完全沒有聯系的!
例如:Python是動態語言,是強類型定義語言(類型安全的語言); VBScript是動態語言,是弱類型定義語言(類型不安全的語言);JAVA是靜態語言,是強類型定義語言(類型安全的語言)。
靜態類型定義語言
一種在編譯時,數據類型是固定的語言。大多數靜態類型定義語言強制這一點,它要求你在使用所有變量之前要聲明它們的數據類型。Java和C是靜態類型定義語言。
動態類型定義語言
一種在執行期間才去發現數據類型的語言,與靜態類型定義相反。VBScript和Python是動態類型定義的,因為它們是在第一次給一個變量賦值的時候找出它的類型的。
強類型定義語言
一種總是強制類型定義的語言。Java和Python是強制類型定義的。如果你有一個整數,如果不顯示地進行轉換,你不能將其視為一個字符串。
弱類型定義語言
一種類型可以被忽略的語言,與強類型定義相反。VBScript是弱類型定義的。在VBScript中,可以將字符串‘12’和整數3進行連接得到字符串‘123’,然后可以把它看成整數123,而不需要顯示轉換。但其實它們的類型沒有改變,VB只是在判斷出一個表達式含有不同類型的變量之后,自動在這些變量前加了一個clong()或(int)()這樣的轉換函數而已。能做到這一點其實是歸功于VB的編譯器的智能化而已,這并非是VB語言本身的長處或短處。
結論:
靜態是類型編譯時判斷;動態是類型運行時判斷;強類型是類型獨立,不輕易轉化;弱類型是類型不嚴格區分,一般是只要大小放得下,就可以轉化。這種是匯編級的觀點。面向對象的觀點并非這樣的,對象并不是大小差不多就是類型兼容,而是關鍵的接口要相同才叫類型兼容。
動態語言并非是弱類型,這是不等價的。恰好的,一般動態語言都是強類型語言,因為都是遵照面向對象的觀點來設計對象的。
動態語言的劣勢很明顯,就是缺少開發環境,運行效率差,當然語言設計上也不完美(靜態語言何止千萬,但c++也就一個)。
優勢也很明顯,就是編寫容易,層次高,接近自然語義。動態類型語言效率低下的原因,不在于變量的類型是動態的,而在于對象的方法是動態聯編的,在這一點上動態類型語言和Java沒什么不同。
靜態類型語言的優勢究竟是什么?
觀點一:靜態類型語言因為類型強制聲明,所以IDE可以做到很好的代碼感知能力,因為有IDE的撐腰,所以開發大型系統,復雜系統比較有保障。
對于像Java來說,IDEA/Eclipse確實在代碼感知能力上面已經非常強了,這無疑能夠增加對大型系統復雜系統的掌控能力。但是除了Java擁有這么強的IDE武器之外,似乎其他語言從來沒有這么強的IDE。C#的VisualStudio在GUI開發方面和Wizard方面很強,但是代碼感知能力上和Eclipse差的不是一點半點。至于VisualC++根本就是一個編譯器而已,羞于提及Visual這個字眼。更不要說那么多C/C++開發人員都是操起vi吭哧吭哧寫了幾十萬行代碼呢。特別是像LinuxKernel這種幾百萬行代碼,也就是用vi寫出來的阿,夠復雜,夠大型,夠長生命周期的吧。
觀點二:靜態語言相對比較封閉的特點,使得第三方開發包對代碼的侵害性可以降到很低。動態語言在這點上表現的就比較差,我想大家都有過從網上下載某個JS包,然后放到項目代碼里發生沖突的經歷
也就是說靜態類型語言可以保障package的命名空間分割,從而避免命名沖突,代碼的良好隔離性。但是這個觀點也缺乏說服力。
靜態類型語言中C,VB都缺乏良好的命名空間分割,容易產生沖突,但是并沒有影響他們做出來的系統就不夠大,不夠復雜。
而Visual C++開發的DLL版本沖突也是臭名昭著的,似乎C++的命名空間沒有給它帶來很大的幫助。
而動態類型語言中Ruby/Python/Perl都有比較好的命名空間,特別是Python和Perl,例如CPAN上面的第三方庫成噸成噸的,也從來沒有聽說什么沖突的問題。
誠然像PHP,JavaScript這樣缺乏命名空間的動態語言很容易出現問題,但是這似乎是因為他們缺乏OO機制導致的,而不是因為他們動態類型導致的吧?
說到大型系統,復雜業務邏輯系統,Google公司很多東西都是用python開發的,這也證明了動態類型語言并非不能做大型的復雜的系統。其實我個人認為:
動態類型語言,特別是高級動態類型語言,反而能夠讓人們不需要分心去考慮程序編程問題,而集中精力思考業務邏輯實現,即思考過程即實現過程,用DSL描述問題的過程就是編程的過程,這方面像UnixShell,ruby,SQL,甚至PHP都是相應領域當之無愧的DSL語言。而顯然靜態類型語言基本都不滿足這個要求。
那靜態類型語言的優勢究竟是什么呢?我認為就是執行效率非常高。所以但凡需要關注執行性能的地方就得用靜態類型語言。其他方面似乎沒有什么特別的優勢。
給你來個例子把
弱類型語言vbs:
a=1
b=a+“1”+“a” //結果是11a,這里 a 成了字符串
c=a+1 //結果是2 ,這里a則是數字型
強類型語言:c#
int a=2
string b=a.ToString()+“1”+“a”
int c=a+1
看到了嗎?區分大小寫,需要實現申明類型外,一個重要的區別是,弱類型的語言的東西沒有明顯的類型,他能隨著環境的不同,自動變換類型
而強類型則沒這樣的規定,不同類型間的操作有嚴格定義,只有相同類型的變量才能操作,雖然系統也有一定的默認轉換,當絕沒有弱類型那么隨便
ps:弱類型代碼簡單,但因為變量沒有確定的類型,所以容易出錯!強類型代碼復雜(比如:轉換日期顯示格式 (convert.toDatetime(“2007-1-1 08:08:08”)).ToString(“yyyy-MM-dd”),呵呵你可以看到這種寫法相當麻煩),但因為有嚴格定義所以不容易出錯
評論
查看更多