zoukankan      html  css  js  c++  java
  • Go语言中byte类型和rune类型(五)

    本篇内容本来准备在上一篇写的,想了想还是拆开写。

    go语言中字符串需要使用用双引号,而单引号用来表示单个的字符,字符也是组成字符串的元素。go语言的字符有两种:

    1. uint8类型,或者叫 byte 型,代表了ASCII码的一个字符。
    2. rune类型,代表一个 UTF-8字符

    ASCII编码是1个字节,而UTF-8是可变长的编码,当要表示中文等非ASCll编码的字符时,需要使用UTF-8编码来保证不会乱码。

    举个例子,来遍历打印一个字符串,当使用byte类型时:

    func main() {
        str:="hello 世界"
        for i:=0;i<len(str);i++{
            fmt.Printf("%c",str[i]) // hello ä¸ç
        }
    }

    上面结果,英文字符正确打印,但中文乱码。是因为UTF8编码下一个中文汉字由3~4个字节组成,而字符串是由byte字节组成,所以长度也是byte字符长度,这样遍历时遇到中文就乱码了。

    遇到这种带中文的字符串,可以使用go提供的另一个方法来遍历:

    func main() {
        str:="hello 世界"
        for _,r:=range str{
            fmt.Printf("%c",r) // hello 世界
        }
    }

    使用range,其实是使用rune类型来编码的,rune类型用来表示utf8字符,一个rune字符由一个或多个byte组成。

    修改字符串

    所谓对字符串的修改其实不是对字符串本身的修改,而是复制字符串,同时修改值,即重新分配来内存。

    在go中修改字符串,需要先将字符串转化成数组,[]byte 或 []rune,然后再转换成 string型。

    对于全是ASCII编码的字符串:

    func main() {
        str:="abc"
        s2:=[]byte(str)
        s2[0]='b'
        fmt.Println(string(s2)) //bbc
    }

    对于包含非ASCII编码的字符串:

    func main() {
        str:="白猫"
        s2:=[]rune(str)
        s2[0]='黑'
        fmt.Println(string(s2)) //黑猫
    }

    上面使用到的 string(),表示强制类型转换,转换为字符串。

    本篇主要介绍 byte 和 rune 两种类型的字符,涉及到的for循环和强制类型转换可以简单了解下,有编程基础的很容易懂。

  • 相关阅读:
    bzoj1615 [Usaco2008 Mar]The Loathesome Hay Baler麻烦的干草打包机
    bzoj3402 [Usaco2009 Open]Hide and Seek 捉迷藏
    CF B. Planning The Expedition
    Codeforces ~ 1009C ~ Annoying Present (贪心)
    Codeforces Round#498(Div.3)D. Two Strings Swaps
    牛客Another Distinct Values
    牛客多校第四场 G Maximum Mode
    可持化永久树 的 STL ( rope )
    KMP算法 (字符串的匹配)
    求(3+开根5) N次方的整数部分最后3位
  • 原文地址:https://www.cnblogs.com/wjaaron/p/11485685.html
Copyright © 2011-2022 走看看