java 漢字幾個字節
java中,只要是字符,不管是數字還是英文還是漢字,都占2個字節,都是一個char。
char c1 = '中'; char c2 = 'A'; char c3 = '1';
確切說,Unicode編碼是指一類編碼的統稱,而非某個具體編碼。utf-8跟unicode是不一樣的。
以utf8為例,utf8是一個變長編碼標準,可以以1~4個字節表示一個字符,而中文占3個字節,ascII字符占1個字節。
因為java是以unicode作為編碼方式的。unicode是一個定長的編碼標準,每個字符都是2個字節,也就是1個char類型的空間。
擴展知識:
Unicode是一個編碼方案,Unicode 是為了解決傳統的字符編碼方案的局限而產生的,它為每種語言中的每個字符設定了統一并且唯一的二進制編碼,以滿足跨語言、跨平臺進行文本轉換、處理的要求。Unicode 編碼共有三種具體實現,分別為utf-8,utf-16,utf-32,其中utf-8占用一到四個字節,utf-16占用二或四個字節,utf-32占用四個字節。目前Unicode 碼在全球范圍的信息交換領域均有廣泛的應用。
php中文網,大量的免費Java入門教程,歡迎在線學習!