C#中字符串截断本没有那么麻烦,问题就出在string.Substring()这个方法将中文也按一个字符计算,导致我们在实际应用中截取字符串(中英文组合)后的“长度”不一致。
国际惯例,在网上搜索了一下,大致得到了两中截断算法:
1. 从起始位置取得字符 -> 逐一用正则表达式匹配 -> 拼接成最终字符串。(这是广为流传的方法,也是效率最低的方法。)
2. 从起始位置取得字符 -> 逐一用ASCII比较 -> 再拼接成最终字符串。
相比之下,算法2比算法1高明,毕竟ASCII比较比正则表达式的执行效率更高。但最终,我仍然没有使用算法2,而是进行了进一步的优化:
/// <summary> /// 高效率的C#截取指定长度字符串,大于指定长度的,在末尾显示指定字符,默认为"..." /// 备注:C#中字符串截断本没有那么麻烦,问题就出在string.Substring()这个方法将中文也按一个字符计算,导致我们在实际应用中截取字符串(中英文组合)后的“长度”不一致。 /// </summary> /// <param name="str"></param> /// <param name="len"></param> /// <param name="endShow"></param> /// <returns></returns> public static string CutStr(string str, int len, string endShow = "...") { if (!string.IsNullOrWhiteSpace(str)) { int strLen = str.Length; #region 计算长度 int tempCutLen = 0; while (tempCutLen < len && tempCutLen < strLen) { //每遇到一个中文,则将目标长度减一。 if ((int)str[tempCutLen] > 128) { len--; } tempCutLen++; } #endregion if (tempCutLen < strLen && tempCutLen > 0) { str = string.Format("{0}{1}", str.Substring(0, tempCutLen), endShow); } } return str; }
版权声明:本文为博主原创文章,未经博主允许不得转载。