zoukankan      html  css  js  c++  java
  • 正则表达式+编码转换小工具


     


    下午花了点时间写了个正则表达式和编码转换的工具,正则表达式工具是模仿YART Yet Another Regex Tester写的,而里面

    涉及到编码转换的核心算法如下,工具在下面可以下载。

    1、unicode编码转汉字

    核心算法:

            public string StrToGB (string s)
            {
                if (s.Length > 0)
                {
                    MatchCollection mc = Regex.Matches(s, @"\\u([\w]{2})([\w]{2})", RegexOptions.Compiled | RegexOptions.IgnoreCase);
                    foreach (Match m in mc)
                    {
                        byte[] buffer = new byte[2];
                        string r = string.Empty;
                        string m0 = m.Groups[0].Value;
                        string m1 = m.Groups[1].Value;
                        string m2 = m.Groups[2].Value;
                        buffer[0] = (byte)int.Parse(m2, NumberStyles.HexNumber);
                        buffer[1] = (byte)int.Parse(m1, NumberStyles.HexNumber);
                        r += Encoding.Unicode.GetString(buffer);
                        //\\u8f6c\\u53d1
                        
    //\\u8bc4\\u8bba
                        s = s.Replace(m0, r);
                    }
                }
                return s;

             }

    2、汉字转unicode

            public string GBToUnicode(string text)
            {
                byte[] bytes = System.Text.Encoding.Unicode.GetBytes(text);
                string lowCode = "", temp = "";
                for (int i = 0; i < bytes.Length; i++)
                {
                    if (i % 2 == 0)
                    {
                        temp = System.Convert.ToString(bytes[i], 16);//取出元素4编码内容(两位16进制)
                        if (temp.Length < 2) temp = "0" + temp;
                    }
                    else
                    {
                        string mytemp = Convert.ToString(bytes[i], 16);
                        if (mytemp.Length < 2) mytemp = "0" + mytemp;
                        lowCode = lowCode + @"\u" + mytemp + temp;//取出元素4编码内容(两位16进制)
                    }
                }
                return lowCode;

               }

         

    3、字符转16进制

          public string StrToHex(string mStr) //返回处理后的十六进制字符串 

       {
                return BitConverter.ToString(ASCIIEncoding.Default.GetBytes(mStr)).Replace("-"" ");
       }

    4、16进制转字符

            public string HexToStr(string mHex) // 返回十六进制代表的字符串 
            {
                try
                {
                    mHex = mHex.Replace(" """);
                    mHex = mHex.Replace("-""");
                    if (mHex.Length <= 0)
                        return "";
                    byte[] vBytes = new byte[mHex.Length / 2];
                    for (int i = 0; i < mHex.Length; i += 2)
                        if (!byte.TryParse(mHex.Substring(i, 2), NumberStyles.HexNumber, nullout vBytes[i / 2]))
                            vBytes[i / 2] = 0;
                   
                    return ASCIIEncoding.Default.GetString(vBytes);
                }
                catch (Exception ex)
                {
                    MessageBox.Show(ex.Message);
                    return "";
                }
               } 


    喜欢的拿去,

    已经附上源码 。。。

    /Files/cyan/WindowsFormsApplicationUnicode_Source.rar

    /Files/cyan/WindowsFormsApplicationUnicode_Release.rar 

    每天进步一点点...

  • 相关阅读:
    OO第三单元总结
    OO第二单元总结
    OO第一单元总结
    OO第四单元总结
    OO第三单元总结
    OO第二单元总结
    OO第一单元总结
    BUAA_OO_2020_Total_Summary
    BUAA_OO_2020_Unit3_Summary
    BUAA_OO_2020_Unit2_Summary
  • 原文地址:https://www.cnblogs.com/cyan/p/2683715.html
Copyright © 2011-2022 走看看