zoukankan      html  css  js  c++  java
  • python中将汉字转换成拼音

    python3.4环境,在3.0以下的版本有些地方不一样,可自行修改。

    可转换全部文章,唯一缺陷就是标点符号正常无法转换。以后想到再做修改。

     1 #coding=gbk
     2 '''
     3 Created on 2014-8-29
     4 
     5 @author: Administrator
     6 '''
     7 #import os
     8 
     9 def convert(ch):
    10     """该函数通过输入汉字返回其拼音,如果输入多个汉字,则返回第一个汉字拼音.
    11        如果输入数字字符串,或者输入英文字母,则返回其本身(英文字母如果为大写,转化为小写)
    12     """
    13     length = len('') #测试汉字占用字节数,utf-8,汉字占用3字节.bg2312,汉字占用2字节
    14     intord = ord(ch[0:1])
    15     if (intord >= 48 and intord <= 57):
    16         return ch[0:1]
    17     if (intord >= 65 and intord <=90 ) or (intord >= 97 and intord <=122):
    18         return ch[0:1].lower()
    19     ch = ch[0:len(ch)] #多个汉字只获取第一个
    20     with open(r'C:\convert-utf-8.txt') as f:
    21         for line in f:
    22             if ch in line:
    23                 return line[length:len(line)-2]
    24 
    25 path = 'C:\test\申.txt'
    26 f = open(path)
    27 p = f.read()
    28 for i in p:
    29     print(convert(i),end='')

    代码里面的convert-utf-8.txt是一个转换文件,可以在我网盘里面下载。

    至于申.txt里面是一段中文和数字组合,测试用的,可以自己diy,嘿嘿。

    网盘地址:http://pan.baidu.com/s/1eQGLDaq

  • 相关阅读:
    hadoop_05
    分布式集群时间同步
    crontab定时任务
    操作系统笔记五:输入输出系统
    操作系统笔记四:文件管理与磁盘存储器管理
    操作系统笔记三:存储器管理
    操作系统笔记二:进程与调度(2)
    操作系统笔记二:进程与调度(1)
    可能的加分项
    对老师的建议
  • 原文地址:https://www.cnblogs.com/lovecc/p/3961226.html
Copyright © 2011-2022 走看看