創(chuàng)新互聯GO教程:Go語言字符類型（byte和rune）

字符串中的每一個元素叫做“字符”，在遍歷或者單個獲取字符串元素時可以獲得字符。

Go語言的字符有以下兩種：

一種是 uint8 類型，或者叫 byte 型，代表了 ASCII 碼的一個字符。
另一種是 rune 類型，代表一個 UTF-8 字符，當需要處理中文、日文或者其他復合字符時，則需要用到 rune 類型。rune 類型等價于 int32 類型。

byte 類型是 uint8 的別名，對于只占用 1 個字節(jié)的傳統(tǒng) ASCII 編碼的字符來說，完全沒有問題，例如 var ch byte = 'A'，字符使用單引號括起來。

在 ASCII 碼表中，A 的值是 65，使用 16 進制表示則為 41，所以下面的寫法是等效的：

var ch byte = 65 或 var ch byte = '\x41' //（\x 總是緊跟著長度為 2 的 16 進制數）

另外一種可能的寫法是
\后面緊跟著長度為 3 的八進制數，例如 \377。

Go語言同樣支持 Unicode（UTF-8），因此字符同樣稱為 Unicode 代碼點或者 runes，并在內存中使用 int 來表示。在文檔中，一般使用格式 U+hhhh 來表示，其中 h 表示一個 16 進制數。

在書寫 Unicode 字符時，需要在 16 進制數之前加上前綴
\u或者
\U。因為 Unicode 至少占用 2 個字節(jié)，所以我們使用 int16 或者 int 類型來表示。如果需要使用到 4 字節(jié)，則使用
\u前綴，如果需要使用到 8 個字節(jié)，則使用
\U前綴。

var ch int = '\u0041'
var ch2 int = '\u03B2'
var ch3 int = '\U00101234'
fmt.Printf("%d - %d - %d\n", ch, ch2, ch3) // integer
fmt.Printf("%c - %c - %c\n", ch, ch2, ch3) // character
fmt.Printf("%X - %X - %X\n", ch, ch2, ch3) // UTF-8 bytes
fmt.Printf("%U - %U - %U", ch, ch2, ch3)   // UTF-8 code point

輸出：

65 - 946 - 1053236
A - β - r
41 - 3B2 - 101234
U+0041 - U+03B2 - U+101234

格式化說明符
%c用于表示字符，當和字符配合使用時，
%v或
%d會輸出用于表示該字符的整數，
%U 輸出格式為 U+hhhh 的字符串。

Unicode 包中內置了一些用于測試字符的函數，這些函數的返回值都是一個布爾值，如下所示（其中 ch 代表字符）：

判斷是否為字母：unicode.IsLetter(ch)
判斷是否為數字：unicode.IsDigit(ch)
判斷是否為空白符號：unicode.IsSpace(ch)

UTF-8 和 Unicode 有何區(qū)別？

Unicode 與 ASCII 類似，都是一種字符集。

字符集為每個字符分配一個唯一的 ID，我們使用到的所有字符在 Unicode 字符集中都有一個唯一的 ID，例如上面例子中的 a 在 Unicode 與 ASCII 中的編碼都是 97。漢字“你”在 Unicode 中的編碼為 20320，在不同國家的字符集中，字符所對應的 ID 也會不同。而無論任何情況下，Unicode 中的字符的 ID 都是不會變化的。

UTF-8 是編碼規(guī)則，將 Unicode 中字符的 ID 以某種方式進行編碼，UTF-8 的是一種變長編碼規(guī)則，從 1 到 4 個字節(jié)不等。編碼規(guī)則如下：

0xxxxxx 表示文字符號 0～127，兼容 ASCII 字符集。
從 128 到 0x10ffff 表示其他字符。

根據這個規(guī)則，拉丁文語系的字符編碼一般情況下每個字符占用一個字節(jié)，而中文每個字符占用 3 個字節(jié)。

廣義的 Unicode 指的是一個標準，它定義了字符集及編碼規(guī)則，即 Unicode 字符集和 UTF-8、UTF-16 編碼等。

網站名稱：創(chuàng)新互聯GO教程:Go語言字符類型（byte和rune）
文章來源：http://uogjgqi.cn/article/cddjecg.html

掃二維碼與項目經理溝通

我們在微信上24小時期待你的聲音

解答本文疑問/技術咨詢/運營咨詢/技術建議/互聯網交流

av激情亚洲男人的天堂国语,日韩欧美精品一中文字幕,无码av一区二区三区无码,国产又色又爽又刺激的a片,国产又色又爽又刺激的a片

創(chuàng)新互聯GO教程:Go語言字符類型（byte和rune）

UTF-8 和 Unicode 有何區(qū)別？

掃二維碼與項目經理溝通

其他資訊

行業(yè)動態(tài)

企業(yè)網站建設的重要性！

服務項目

網站建設

移動端/APP

微信/小程序

技術支持

其它服務

更多服務項目

聯系吧在百度地圖上找到我們

電話：13518219792

av激情亚洲男人的天堂国语,日韩欧美精品一中文字幕,无码av一区二区三区无码,国产又色又爽又刺激的a片,国产又色又爽又刺激的a片

創(chuàng)新互聯GO教程:Go語言字符類型（byte和rune）

UTF-8 和 Unicode 有何區(qū)別？

掃二維碼與項目經理溝通

其他資訊

行業(yè)動態(tài)

企業(yè)網站建設的重要性！

服務項目

網站建設

移動端/APP

微信/小程序

技術支持

其它服務

更多服務項目

聯系吧 在百度地圖上找到我們

電話：13518219792

企業(yè)網站建設的重要性！

聯系吧在百度地圖上找到我們