在C#中截取指定长度的中文字符串（效率提高2500倍）

zoukankan html css js c++ java

在C#中截取指定长度的中文字符串（效率提高2500倍）
C#中字符串截断本没有那么麻烦，问题就出在string.Substring()这个方法将中文也按一个字符计算，导致我们在实际应用中截取字符串（中英文组合）后的“长度”不一致。

国际惯例，在网上搜索了一下，大致得到了两中截断算法：
1. 从起始位置取得字符 -> 逐一用正则表达式匹配 -> 拼接成最终字符串。（这是广为流传的方法，也是效率最低的方法。）
2. 从起始位置取得字符 -> 逐一用ASCII比较 -> 再拼接成最终字符串。

相比之下，算法2比算法1高明，毕竟ASCII比较比正则表达式的执行效率更高。但最终，我仍然没有使用算法2，而是进行了进一步的优化：
```
public static string CutStr(string str, int len)
{
    if (str == null || str.Length == 0 || len <= 0)
    {
        return string.Empty;
    }

    int l = str.Length;

    #region 计算长度
    int clen = 0;
    while (clen < len && clen < l)
    {
        //每遇到一个中文，则将目标长度减一。
        if ((int)str[clen] > 128) { len--; }
        clen++;
    }
    #endregion

    if (clen < l)
    {
        return str.Substring(0, clen) + "...";
    }
    else
    {
        return str;
    }
}
```
最后，通过比较，广为流传的算法1执行100次就需要700多毫秒，而我的算法700毫秒可执行250000次！
（注：实际运行时间和原始字符串长度、截取长度、电脑性能有关。但同条件下的效率比值是基本稳定的。）
查看全文

相关阅读:
朗志轻量级项目管理解决方案－RBAC角色权限模块介绍
 关于业务规则层、业务实体层、业务外观层、模型层的作用很不清楚，殷切期望解答
 已有类实例，现在想拥有另一个相同状态的实例，除了反序列化还有别的办法吗？
签名工具
 请教一个winform程序设计上的问题
 在使用WeifenLuo Suite时遇到的问题，自己记录一下，备忘
 解读C#正则表达式
 [导入]jbuilder 2006开发struts+sqlserver2K准备工作
 如何用设计模式变相实现类的多继承？
WriteXmlSchema(xsdFileName)和GetXmlSchema()输出的内容的差异

原文地址：https://www.cnblogs.com/uonun/p/1698964.html