zoukankan      html  css  js  c++  java
  • 汉字转拼音-pypinyin模块

    最近遇到一个问题,需要将一批中文用户名转换成拼音,网上查了一下,有两个模块可以使用,pypinyin和xpinyin模块,用起来也很方便。

    一、pypinyin模块

    1、安装

    pip3 install pypinyin

    2、转换

    from pypinyin import pinyin
    print(pinyin('张三'))
    [['zhāng'], ['sān']]

    可以看到结果是一个二维列表,每个元素都是一个列表,并且包含了每个字的读音。

    如果是多音字,比如 “朝阳”,默认只能识别其中一个读音
    from pypinyin import pinyin
    print(pinyin('朝阳'))
    [['zhāo'], ['yáng']]
    
    如果想要显示多个读音的话,只需添加 heteronym参数并设置为True:
    from pypinyin import pinyin
    print(pinyin('朝阳', heteronym=True))
    [['zhāo', 'cháo'], ['yáng']]

    3、其实多数情况下我们是不需要管多音字的,我们只是用它来转换一下名字而已,而处理上面的二维数组又比较麻烦,那么可以使用lazy_pinyin这个方法来生成

    from pypinyin import lazy_pinyin
    
    name_list = [
        '张三',
        '李四',
        '小六子'
    ]
    
    for name_zh in name_list:
        # 将每个中文汉字转换成拼音,组成列表
        name_pinyin_list = lazy_pinyin(name_zh)
        # print(name_pinyin_list)
        '''
        ['zhang', 'san']
        ['li', 'si']
        ['xiao', 'liu', 'zi']
        '''
        name_pinyin = ''
        # 将拼音拼接到一起
        for i in name_pinyin_list:
            name_pinyin += i
    
        print(name_pinyin)
        '''
        zhangsan
        lisi
        xiaoliuzi
        '''

     二、xpinyin模块

    from xpinyin import Pinyin
    
    p = Pinyin()  # 实例拼音转换对象
    re1 = p.get_pinyin('小姐姐真可爱',tone_marks=None,splitter=' ') #转换,不显示声调,使用空格作为分隔符。
    #其中tone_marks指定是否带声调,默认为None;splitter指定分隔符,默认为'-'。
    
    re2 = p.get_pinyin('小姐姐真可爱',tone_marks='marks',splitter=' ') #转换,显示声调。
    re3 = p.get_pinyin('小姐姐真可爱',tone_marks='numbers',splitter=' ') #转换,显示声调数字。
    
    p.get_initials("小姐姐真可爱",splitter=' ') #获取首字母
    print(re1,re2,re3)  #打印
  • 相关阅读:
    react中refs的使用
    在npm发布自己造的轮子
    如何阅读一本书——分析阅读模板
    如何阅读一本书——检视阅读模板
    Redis教程——检视阅读
    如何阅读一本书——分析阅读Pre
    SVN常用功能介绍(二)
    SVN常用功能介绍(一)
    分页sql大全
    .NetCore 登录(密码盐+随机数)
  • 原文地址:https://www.cnblogs.com/dxnui119/p/14660751.html
Copyright © 2011-2022 走看看