java 常量池靜態(tài)變量詳解
Java中的常量池,實際上分為兩種形態(tài):靜態(tài)常量池和運行時常量池。
所謂靜態(tài)常量池,即*.class文件中的常量池,class文件中的常量池不僅僅包含字符串(數(shù)字)字面量,還包含類、方法的信息,占用class文件絕大部分空間。
而運行時常量池,則是jvm虛擬機在完成類裝載操作后,將class文件中的常量池載入到內(nèi)存中,并保存在方法區(qū)中,我們常說的常量池,就是指方法區(qū)中的運行時常量池。
接下來我們引用一些網(wǎng)絡上流行的常量池例子,然后借以講解。
Strings1 = “Hello”; Strings2 = “Hello”; Strings3 = “Hel”+ “l(fā)o”; Strings4 = “Hel”+ newString(“l(fā)o”); Strings5 = newString( “Hello”); Strings6 = s5.intern(); Strings7 = “H”; Strings8 =“ello”; Strings9 = s7 + s8; System.out.println(s1 == s2); // trueSystem.out.println(s1 == s3);// trueSystem.out.println(s1 == s4); // falseSystem.out.println(s1 == s9); // falseSystem.out.println(s4 == s5); // falseSystem.out.println(s1 == s6); // trueJava學習交流QQ群: 589809992我們一起學Java!
首先說明一點,在java 中,直接使用==操作符,比較的是兩個字符串的引用地址,并不是比較內(nèi)容,比較內(nèi)容請用String.equals()。
s1 == s2這個非常好理解,s1、s2在賦值時,均使用的字符串字面量,說白話點,就是直接把字符串寫死,在編譯期間,這種字面量會直接放入class文件的常量池中,從而實現(xiàn)復用,載入運行時常量池后,s1、s2指向的是同一個內(nèi)存地址,所以相等。
s1 == s3這個地方有個坑,s3雖然是動態(tài)拼接出來的字符串,但是所有參與拼接的部分都是已知的字面量,在編譯期間,這種拼接會被優(yōu)化,編譯器直接幫你拼好,因此String s3 = “Hel” + “l(fā)o”;在class文件中被優(yōu)化成String s3 = “Hello”;,所以s1 == s3成立。
s1 == s4當然不相等,s4雖然也是拼接出來的,但new String(“l(fā)o”)這部分不是已知字面量,是一個不可預料的部分,編譯器不會優(yōu)化,必須等到運行時才可以確定結果,結合字符串不變定理,鬼知道s4被分配到哪去了,所以地址肯定不同。配上一張簡圖理清思路:
s1 == s9也不相等,道理差不多,雖然s7、s8在賦值的時候使用的字符串字面量,但是拼接成s9的時候,s7、s8作為兩個變量,都是不可預料的,編譯器畢竟是編譯器,不可能當解釋器用,所以不做優(yōu)化,等到運行時,s7、s8拼接成的新字符串,在堆中地址不確定,不可能與方法區(qū)常量池中的s1地址相同。
s4 == s5已經(jīng)不用解釋了,絕對不相等,二者都在堆中,但地址不同。
s1 == s6這兩個相等完全歸功于intern方法,s5在堆中,內(nèi)容為Hello ,intern方法會嘗試將Hello字符串添加到常量池中,并返回其在常量池中的地址,因為常量池中已經(jīng)有了Hello字符串,所以intern方法直接返回地址;而s1在編譯期就已經(jīng)指向常量池了,因此s1和s6指向同一地址,相等。
至此,我們可以得出三個非常重要的結論:
必須要關注編譯期的行為,才能更好的理解常量池。
運行時常量池中的常量,基本來源于各個class文件中的常量池。
程序運行時,除非手動向常量池中添加常量(比如調(diào)用intern方法),否則jvm不會自動添加常量到常量池。
以上所講僅涉及字符串常量池,實際上還有整型常量池、浮點型常量池等等,但都大同小異,只不過數(shù)值類型的常量池不可以手動添加常量,程序啟動時常量池中的常量就已經(jīng)確定了,比如整型常量池中的常量范圍:-128~127,只有這個范圍的數(shù)字可以用到常量池。
實踐
說了這么多理論,接下來讓我們觸摸一下真正的常量池。
前文提到過,class文件中存在一個靜態(tài)常量池,這個常量池是由編譯器生成的,用來存儲java源文件中的字面量(本文僅僅關注字面量),假設我們有如下java代碼:
1Strings = “hi”;
為了方便起見,就這么簡單,沒錯!將代碼編譯成class文件后,用winhex打開二進制格式的class文件。如圖:
簡單講解一下class文件的結構,開頭的4個字節(jié)是class文件魔數(shù),用來標識這是一個class文件,說白話點就是文件頭,既:CA FE BA BE。
緊接著4個字節(jié)是java的版本號,這里的版本號是34,因為筆者是用jdk8編譯的,版本號的高低和jdk版本的高低相對應,高版本可以兼容低版本,但低版本無法執(zhí)行高版本。所以,如果哪天讀者想知道別人的class文件是用什么jdk版本編譯的,就可以看這4個字節(jié)。
接下來就是常量池入口,入口處用2個字節(jié)標識常量池常量數(shù)量,本例中數(shù)值為00 1A,翻譯成十進制是26,也就是有25個常量,其中第0個常量是特殊值,所以只有25個常量。
常量池中存放了各種類型的常量,他們都有自己的類型,并且都有自己的存儲規(guī)范,本文只關注字符串常量,字符串常量以01開頭(1個字節(jié)),接著用2個字節(jié)記錄字符串長度,然后就是字符串實際內(nèi)容。本例中為:01 00 02 68 69。
接下來再說說運行時常量池,由于運行時常量池在方法區(qū)中,我們可以通過jvm參數(shù):-XX:PermSize、-XX:MaxPermSize來設置方法區(qū)大小,從而間接限制常量池大小。
假設jvm啟動參數(shù)為:-XX:PermSize=2M -XX:MaxPermSize=2M,然后運行如下代碼:
//保持引用,防止自動垃圾回收List《String》list=newArrayList 《String》(); int i =0; while(true){ //通過intern方法向常量池中手動添加常量list.add( String.valueOf(i ++) .intern()); }
程序立刻會拋出:Exception in thread “main” java.lang.outOfMemoryError: PermGen space異常。PermGen space正是方法區(qū),足以說明常量池在方法區(qū)中。
在jdk8中,移除了方法區(qū),轉而用Metaspace區(qū)域替代,所以我們需要使用新的jvm參數(shù):-XX:MaxMetaspaceSize=2M,依然運行如上代碼,拋出:java.lang.OutOfMemoryError: Metaspace異常。同理說明運行時常量池是劃分在Metaspace區(qū)域中。具體關于Metaspace區(qū)域的知識,請讀者自行搜索。
本文所有代碼均在jdk7、jdk8下測試通過,其他版本jdk可能會略有差異,請讀者自行探索。
參考文獻:《深入理解java虛擬機———jvm高級特性與最佳實踐》
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%