hadoop小学生
精灵王
精灵王
  • 注册日期2018-09-13
  • 发帖数160
  • QQ3234520070
  • 火币360枚
  • 粉丝0
  • 关注0
阅读:3920回复:0

汉语言处理工具pyhanlp的简繁转换

楼主#
更多 发布于:2019-03-29 10:34
繁简转换

hanlp几乎实现了所有我们需要的繁简转换方式,并且已经封装到了HanLP中,使得我们可以轻松的使用,而分词器中已经默认支持多种繁简格式或者混合。这里我们不再做过多描述。
说明
·HanLP能够识别简繁分歧词,比如打印机=印表機。许多简繁转换工具不能区分“以后”“皇后”中的两个“后”字,HanLP可以。
算法详解
·《汉字转拼音与简繁转换的java实现》——请查阅此文
1. from pyhanlp import *
2. # 繁简转化
3. print(HanLP.convertToTraditionalChinese("“以后等你当上皇后,就能买草莓庆祝了”。发现一根白头发"))
4. print(HanLP.convertToSimplifiedChinese("憑藉筆記簿型電腦寫程式HanLP"))
5. # 简体转台湾繁体
6. print(HanLP.s2tw("hankcs在台湾写代码"))
7. # 台湾繁体转简体
8. print(HanLP.tw2s("hankcs在臺灣寫程式碼"))
9. # 简体转香港繁体
10. print(HanLP.s2hk("hankcs在香港写代码"))
11. # 香港繁体转简体
12. print(HanLP.hk2s("hankcs在香港寫代碼"))
13. # 香港繁体转台湾繁体
14. print(HanLP.hk2tw("hankcs在臺灣寫代碼"))
15. # 台湾繁体转香港繁体
16. print(HanLP.tw2hk("hankcs在香港寫程式碼"))
17.
18.# 香港/台湾繁体和HanLP标准繁体的互转
19.print(HanLP.t2tw("hankcs在臺灣寫代碼"))
20.print(HanLP.t2hk("hankcs在臺灣寫代碼"))
21.
22.print(HanLP.tw2t("hankcs在臺灣寫程式碼"))
23.print(HanLP.hk2t("hankcs在台灣寫代碼"))


1.「以後等你當上皇后,就能買草莓慶祝了」。發現一根白頭髮
2.凭借笔记本电脑写程序HanLP
3.hankcs在臺灣寫程式碼
4.hankcs在台湾写代码
5.hankcs在香港寫代碼
6.hankcs在香港写代码
7.hankcs在臺灣寫程式碼
8.hankcs在香港寫代碼
9.hankcs在臺灣寫程式碼
10.hankcs在台灣寫代碼
11.hankcs在臺灣寫代碼
12.hankcs在臺灣寫代碼

喜欢0 评分0
DKHadoop用着还不错!
游客

返回顶部