经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 移动开发 » Swift » 查看文章
Swift踩坑实战之一个字符引发的Crash
来源:jb51  时间:2022/2/22 15:52:26  对本文有异议

最近因为一个字符引发了 Crash,因为实际的业务场景不便描述,这里便用一段测试代码作说明。

话不多说,直接上代码:

  1. let testCharacters: Set<Character> = ["!", "\"", "$", "%", "&", "'", "+", ",", "<", "=", ">", "@", "[", "]", "`", "{", "}"]
  2. let testString = "@`Hello World?!"
  3. var result: UInt8 = 0
  4. for character in testString {
  5. if testCharacters.contains(character) {
  6. result += character.asciiValue!
  7. }
  8. }

上面的代码做的事情是:取出 testString 里特定字符的 ASCII 码,然后相加。

我们来 Review 下这段代码,有经验的同学应该立马嗅到了代码里的坏味道:character.asciiValue! 这里用了强解。

那这里的强解用得合理吗?因为定义在 testCharacters 里的字符肯定都有对应的 ASCII 码,咋一看这里用强解也没关系。

但是,如果我们实际跑一下,就会出现因为 asciiValue 为 nil 的强解 Crash 了。这是为什么呢?

关键在于 testString 里面包含了 全角字符。testString 里的后一个 ? 是一个全角字符,它是没有 asciiValue 的。

我们可以在 Swift Playgrounds 里执行下面的代码得到答案:

  1. let halfWidth = "`"
  2. halfWidth.lengthOfBytes(using: .utf8) // 1
  3. halfWidth.first!.isASCII // true
  4. halfWidth.first!.asciiValue // 96
  5.  
  6. let fullWidth = "?"
  7. fullWidth.lengthOfBytes(using: .utf8) // 3
  8. fullWidth.first!.isASCII // false
  9. fullWidth.first!.asciiValue // nil
  10. // Character 实现 Equatable 协议,判断出两个值是相等的。
  11. halfWidth == fullWidth // true

从上面代码执行结果可以看到,halfWidth 这个半角字符占一个字节长度,对应的 ASCII 码为 96 而全角字符 fullWidth 占三个字节长度,其 asciiValue 为空的。

Swift 数组的 contains 方法利用的是 Equatable 协议 , 从上面代码里 halfWidth == fullWidth 的结果为 true 来看,Character 实现的 Equatable 协议并没有考虑字符全角/半角的情况。

用肉眼看,完全看不出字符有何不同,而 contains 方法结果为 true 也影响了我们的判断,以为这个强解是 OK 的,稍不注意就导致了 Crash。

最后,从维基百科上整理了关于全角/半角的历史知识:

在早期的计算机中,英语或拉丁字母语言使用的系统,每一个字母或符号,都是使用一字节的空间(一字节由 8 比特组成,共256个编码空间)来储存;而汉语、日语及韩语文字,由于数量大大超过256个,故惯常使用两字节来储存一个字符。所以这原本是编码层面的“单字节”“双字节”的问题。

当时的电脑使用等宽字体(如DOS、部分文字编辑器等)时,字体也就顺应这种编码形式,将中日韩文字的宽度绘制成拉丁字母和数字的两倍,这样字符的编码存储和显示宽度可以一一对应起来:

  • 单字节文字 显示成 半宽,
  • 双字节文字 显示成 全宽。

因此当时的用户就开始习惯称中、日、韩等文字为 全角字符,而称拉丁字母或数字为 半角字符。

但是,后来计算机的文字编码技术已经发生很大变化,存储一个字符可能用一个、两个、四个或者更多的字节。一个英文字符即使显示为半宽,依照不同的编码方式,并不一定是用一个字节存储。

因此,现在字符编码存储和字符显示宽度的已经没有一一对应关系。

但是由于字符编码和字形宽度曾经的对应关系,很多用户一直习惯性地使用"全角/半角"词汇。

因此现在的 全角字 可能是指:

  • 用两个字节存储的字符
  • ASCII(所谓半角英文和数字)以外所有的字符
  • 显示上字身宽度为一比一正方形的字形。

总结

到此这篇关于Swift踩坑实战之一个字符引发Crash的文章就介绍到这了,更多相关Swift字符引发的Crash内容请搜索w3xue以前的文章或继续浏览下面的相关文章希望大家以后多多支持w3xue!

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号