经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 程序设计 » C# » 查看文章
C# Unicode编码解码的实现
来源:jb51  时间:2022/6/21 16:40:48  对本文有异议

Unicode是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

在这里插入图片描述

在表示一个Unicode的字符时,通常会用“U+”然后紧接着一组十六进制的数字来表示这一个字符。在 基本多文种平面里的所有字符,要用四位十六进制数;在零号平面以外的字符则需要使用五位或六位十六进制数了。

  1. string str = @"\u0005 \u0002\U00f3 \U +e9\u00e9";
  2. string newStr = UnicodeDecode(str);
  3. Console.WriteLine(newStr);
  4. Console.WriteLine();
  5.  
  6. newStr = ToUnicode("0 - * @ , 。 ? 真的 繁體字");
  7. Console.WriteLine(newStr);
  8. Console.WriteLine();

正常字符转换为unicode

  1. /// <summary>
  2. /// 对正常的字符串转换为 Unicode 的字符串
  3. /// </summary>
  4. /// <param name="normalStr">正常的字符串</param>
  5. /// <param name="isIgnoreSpace">是否忽略空格符;默认 true 空格符不转换;false 空格符要转换</param>
  6. /// <param name="isUpperCaseU">是否大写U字母 ‘\U';默认 false ‘\u'</param>
  7. /// <returns></returns>
  8. public string ToUnicode(this string normalStr, bool isIgnoreSpace = true, bool isUpperCaseU = false)
  9. {
  10. if (string.IsNullOrEmpty(normalStr))
  11. {
  12. return string.Empty;
  13. }
  14.  
  15. StringBuilder strResult = new StringBuilder();
  16.  
  17. void func(int index)
  18. {
  19. if (isUpperCaseU)
  20. {
  21. strResult.Append("\\U");
  22. }
  23. else
  24. {
  25. strResult.Append("\\u");
  26. }
  27. strResult.Append(((int)normalStr[index]).ToString("x").PadLeft(4, '0'));
  28. }
  29.  
  30. for (int i = 0; i < normalStr.Length; i++)
  31. {
  32. if (isIgnoreSpace)
  33. {
  34. if (normalStr[i] == ' ')
  35. {
  36. strResult.Append(" ");
  37. }
  38. else
  39. {
  40. func(i);
  41. }
  42. }
  43. else
  44. {
  45. func(i);
  46. }
  47. }
  48. return strResult.ToString();
  49. }
  50.  

解码

  1. /// <summary>
  2. /// 对 Unicode 的字符串解码
  3. /// </summary>
  4. /// <param name="unicodeStr">Unicode 字符串</param>
  5. /// <returns></returns>
  6. public string UnicodeDecode(string unicodeStr)
  7. {
  8. if (string.IsNullOrWhiteSpace(unicodeStr) || (!unicodeStr.Contains("\\u") && !unicodeStr.Contains("\\U")))
  9. {
  10. return unicodeStr;
  11. }
  12.  
  13. string newStr = Regex.Replace(unicodeStr, @"\\[uU](.{4})", (m) =>
  14. {
  15. string unicode = m.Groups[1].Value;
  16. if (int.TryParse(unicode, System.Globalization.NumberStyles.HexNumber, null, out int temp))
  17. {
  18. return ((char)temp).ToString();
  19. }
  20. else
  21. {
  22. return m.Groups[0].Value;
  23. }
  24. }, RegexOptions.Singleline);
  25.  
  26. return newStr;
  27. }
  28.  

到此这篇关于C# Unicode编码解码的实现的文章就介绍到这了,更多相关C# Unicode编码解码内容请搜索w3xue以前的文章或继续浏览下面的相关文章希望大家以后多多支持w3xue!

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号