zoukankan      html  css  js  c++  java
  • 【转载】C# 字符串截取指定长度的中文字符--精点

    通常,一个中文会占两个字节的空间。很多语言里,一个中文字符就算是2个字符长度。

    但在C#中,string里包含的中文字符只占一个字符长度。这就导致很多时候,使用string.SubString(int startIndex,int length)方法来截取字符会错位。

    最近由于工作原因,会截取指定长度的字符来使用。但是在文档里,1个中文是2个长度来计算。刚开始还只是以为文档错误,后来才知道是由于C#的差异造成的。

    刚开始,是直接到网上找算法,但是找到的算法,基本思路都是挨个字符判断(根据ASCII值)。不是算法复杂,就是容易出错,且不能涵盖所有的中文。

    稍微研究了下,还是利用.Net框架自带的方法最简单。


    基本思路如下,将string转化为byte[] ,将byte[]截取后,再转化为string ,这种方法,两步完成,且可谓万无一失。

    public static string SubString(string toSub,int startIndex,int length)
    
    {
    
        byte[] subbyte=System.Text.Encoding.Default.GetBytes(toSub);
    
        string Sub=System.Text.Encoding.Default.GetString(subbyte,startIndex,length);
    
        return Sub;
    
    }
    



    稍微解释下参数,toSub -需要截取的字符串,startIndex -开始截取的位置索引, length -截取的长度


    用法基本和string.SubString(int startIndex,int length)一样。

  • 相关阅读:
    codeforce 272B Dima and Sequence
    Codeforce 270D Greenhouse Effect
    codeforce 270C Magical Boxes
    codeforce 270B Multithreading
    图论--Dijkstra算法总结
    图论--(技巧)超级源点与超级汇点
    图论--Floyd总结
    ZOJ 3932 Handshakes
    ZOJ 3932 Deque and Balls
    ZOJ 3927 Programming Ability Test
  • 原文地址:https://www.cnblogs.com/zhanghai/p/5055211.html
Copyright © 2011-2022 走看看