经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 软件/图像 » Git » 查看文章
2018-10-19 Chrome插件实现GitHub代码离线翻译v0.0.4
来源:cnblogs  作者:吴烜  时间:2019/3/11 8:43:42  对本文有异议

续前文Chrome插件实现GitHub代码翻译v0.0.3. 添加了对驼峰命名的支持. 由于调用浏览器插件-离线英汉词典进行词汇翻译, 因此也不依赖于任何在线翻译服务.

Chrome插件: 官网链接

支持所有编程语言

因为并不需要对源代码进行语法分析(之前Java源码英翻中进展-内测上线中使用了语法分析, 工作量大很多), 因此原则上已经支持所有编程语言的源代码. 但对一些编程语言效果更好, 见下面效果.

Java: 源码来源
2018-10-19-github源码翻译_Java_0.0.4

Python: 源码来源
2018-10-19-github源码翻译_Python_0.0.4

C: 源码来源 接下去添加C的关键词翻译后, include/char就不会那么坑了.

[2018-10-19-github源码翻译_c_0.0.4]({{ "/assets/2018-10-19-github源码翻译_c_0.0.4.png" | absolute_url }})

阶段小结

翻译方面做下去会遇到和自然语言机器翻译类似的问题. 当然会比自然语言好一些, 因为命名往往使用的是最正式(非口语化)的词汇, 连接词的使用也较少, 而且基本没有完整语句. 即便如此, 也会存在词汇的歧义, 比如词性问题, 比如顶图例子中BasicCalculator, Basic在內建词典中有名词/形容词几种词义:

  1. n. 基本原理, 要素, 基本规律
  2. a. 基本的, 碱性的
  3. (计算机)BASIC语言

现在的算法是直接用首个词义, 就是名词的"基本原理". 再比如"tell"在没有后接名词时应该是取vi释义:

  1. vt. 告诉, 说, 吩咐, 断定, 知道
  2. vi. 讲述, 泄密, 告发, 表明

改进就需要加入自然语言处理的方法.

源码

文本处理.js中驼峰命名拆分:

  1. function 拆分骆驼命名(命名) {
  2. // 参考: https://stackoverflow.com/a/7599674/1536803
  3. return 命名.split(/(?<=[a-z])(?=[A-Z])|(?<=[A-Z])(?=[A-Z][a-z])/);
  4. }

原文链接:http://www.cnblogs.com/program-in-chinese/p/10504062.html

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号