zoukankan      html  css  js  c++  java
  • 汉字转换拼音工具类

    package com.util;
    
    import java.util.ArrayList;
    import java.util.Hashtable;
    import java.util.List;
    import java.util.Map;
    
    import org.apache.jasper.tagplugins.jstl.core.ForEach;
    
    import net.sourceforge.pinyin4j.PinyinHelper;
    import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
    import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
    import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
    import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
    
    /**
     * 功能说明:汉字转换拼音工具类
     */
    public class PinyinUtil   {
    
        // 将汉字转换为拼音的全拼的大写,非汉字的原样输出
        public static StringBuilder getQuanPin(String str) {
    
            StringBuilder sb = new StringBuilder();
    
            for (int i = 0; i < str.length(); i++) {
                char s = str.charAt(i);
    
                /**
                 * PinyinHelper.toHanyuPinyinStringArray说明:
                 * 1、参数传中文,返回值是这个汉字的小写拼音+这个汉字是几声。比如:参数传 "汉 ",return的String[ ] 就是 [han4] 
                 * 2、当传字母时,返回值是null。 
                 * 注意:toHanyuPinyinStringArray接收的参数是char,意思就是说一次只能转换一个,
                 * 比如“美”是string,toHanyuPinyinStringArray不能直接接收,
                 * 每次只能传一个,返回的那个String数组里肯定只有一个元素。
                 */
                String[] s1 = PinyinHelper.toHanyuPinyinStringArray(s);
    
                if (null == s1) {
                    sb.append(s);
                } else {
                    String up = s1[0].substring(0, s1[0].length() - 1);
                    up = up.toUpperCase();
                    sb.append(up);
                }
            }
            return sb;
        }
        /**
         * 汉字转换位汉语拼音首字母,英文字符不变,特殊字符丢失 支持多音字,生成方式如(长沙市长:cssc,zssz,zssc,cssz)
         *
         * @param chines汉字
    
         *          
         * @return 拼音
         */
        public static String converterToFirstSpell(String chines) {
            StringBuffer pinyinName = new StringBuffer();
            char[] nameChar = chines.toCharArray();
            HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
            defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
            defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
            for (int i = 0; i < nameChar.length; i++) {
                if (nameChar[i] > 128) {
                    try {
                        // 取得当前汉字的所有全拼
                        String[] strs = PinyinHelper.toHanyuPinyinStringArray(
                                nameChar[i], defaultFormat);
                        if (strs != null) {
                            for (int j = 0; j < strs.length; j++) {
                                // 取首字母
                                pinyinName.append(strs[j].charAt(0));
                                if (j != strs.length - 1) {
                                    pinyinName.append(",");
                                }
                            }
                        }
                        // else {
                        // pinyinName.append(nameChar[i]);
                        // }
                    } catch (BadHanyuPinyinOutputFormatCombination e) {
                        e.printStackTrace();
                    }
                } else {
                    pinyinName.append(nameChar[i]);
                }
                pinyinName.append(" ");
            }
            // return pinyinName.toString();
            return parseTheChineseByObject(discountTheChinese(pinyinName.toString()));
        }
        /**
         * 解析并组合拼音,对象合并方案(推荐使用)
         *
         * @return
         */
        private static String parseTheChineseByObject(
                List<Map<String, Integer>> list) {
            Map<String, Integer> first = null; // 用于统计每一次,集合组合数据
            // 遍历每一组集合
            for (int i = 0; i < list.size(); i++) {
                // 每一组集合与上一次组合的Map
                Map<String, Integer> temp = new Hashtable<String, Integer>();
                // 第一次循环,first为空
                if (first != null) {
                    // 取出上次组合与此次集合的字符,并保存
                    for (String s : first.keySet()) {
                        for (String s1 : list.get(i).keySet()) {
                            String str = s + s1;
                            temp.put(str, 1);
                        }
                    }
                    // 清理上一次组合数据
                    if (temp != null && temp.size() > 0) {
                        first.clear();
                    }
                } else {
                    for (String s : list.get(i).keySet()) {
                        String str = s;
                        temp.put(str, 1);
                    }
                }
                // 保存组合数据以便下次循环使用
                if (temp != null && temp.size() > 0) {
                    first = temp;
                }
            }
            String returnStr = "";
            if (first != null) {
                // 遍历取出组合字符串
                for (String str : first.keySet()) {
                    returnStr += (str + ",");
                }
            }
            if (returnStr.length() > 0) {
                returnStr = returnStr.substring(0, returnStr.length() - 1);
            }
            return returnStr;
        }
    
        /**
         * 去除多音字重复数据
         *
         * @param theStr
         * @return
         */
        private static List<Map<String, Integer>> discountTheChinese(String theStr) {
            // 去除重复拼音后的拼音列表
            List<Map<String, Integer>> mapList = new ArrayList<Map<String, Integer>>();
            // 用于处理每个字的多音字,去掉重复
            Map<String, Integer> onlyOne = null;
            String[] firsts = theStr.split(" ");
            // 读出每个汉字的拼音
            for (String str : firsts) {
                onlyOne = new Hashtable<String, Integer>();
                String[] china = str.split(",");
                // 多音字处理
                for (String s : china) {
                    Integer count = onlyOne.get(s);
                    if (count == null) {
                        onlyOne.put(s, new Integer(1));
                    } else {
                        onlyOne.remove(s);
                        count++;
                        onlyOne.put(s, count);
                    }
                }
                mapList.add(onlyOne);
            }
            return mapList;
        }
    
    
    
        /**
         * 汉字转换位汉语全拼,英文字符不变,特殊字符丢失
         * 支持多音字,生成方式如(重当参:zhongdangcen,zhongdangcan,chongdangcen
         * ,chongdangshen,zhongdangshen,chongdangcan)
         *
         * @param chines
         *            汉字
         * @return 拼音
         */
        public static String converterToSpell(String chines) {
            StringBuffer pinyinName = new StringBuffer();
            char[] nameChar = chines.toCharArray();
            HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
            defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
            defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
            for (int i = 0; i < nameChar.length; i++) {
                if (nameChar[i] > 128) {
                    try {
                        // 取得当前汉字的所有全拼
                        String[] strs = PinyinHelper.toHanyuPinyinStringArray(
                                nameChar[i], defaultFormat);
                        if (strs != null) {
                            for (int j = 0; j < strs.length; j++) {
                                pinyinName.append(strs[j]);
                                if (j != strs.length - 1) {
                                    pinyinName.append(",");
                                }
                            }
                        }
                    } catch (BadHanyuPinyinOutputFormatCombination e) {
                        e.printStackTrace();
                    }
                } else {
                    pinyinName.append(nameChar[i]);
                }
                pinyinName.append(" ");
            }
            // return pinyinName.toString();
            return parseTheChineseByObject(discountTheChinese(pinyinName.toString()));
    
        }
    
        /**
         * 返回List集合
         * @param str 拼音字符串
         * @return 返回割分后的集合集合
         */
        public static List<Object> stringToList(String str){
            List<Object> list = new ArrayList<>();
            if(str.contains(",")) {
                String[] split = str.split(",");
                for (String string : split) {
                    list.add(string);
                }
            }
            return list;
        }
        //测试
        public static void main(String[] args) {
            //多音字转全拼
            String str01 = PinyinUtil.converterToSpell("重长");
            //多音字转首字母
            String str02 = PinyinUtil.converterToFirstSpell("重长");
            System.out.println(str02+"	"+str01);
            //转为List
            List<Object> strList = PinyinUtil.stringToList(str02);
            for (Object object : strList) {
                if ("Zc ".trim().equalsIgnoreCase(object.toString())) {
                    System.out.println("ok");
                }else{
                    System.out.println("error");
                }
            }   
        }
    }
    

    maven导入的包

            <dependency>
                <groupId>com.belerweb</groupId>
                <artifactId>pinyin4j</artifactId>
                <version>2.5.0</version>
            </dependency>
    勿忘初心 得过且过
  • 相关阅读:
    Brain network involved in autonomic functions 与自主功能相关的大脑网络
    Brief summary of classical components of ERP 事件相关成分(ERP)经典成分小结
    ICA & Percentage Variance Account For (PVAF)
    数据处理中白化Whitening的作用图解分析
    Loadings vs eigenvectors in PCA 主成分分析(PCA)中的负荷和特征向量
    主成分分析(PCA)和独立成分分析(ICA)相关资料
    Sketch of heart and QRS complex 心脏及QRS波群简图
    Brain Network visulation in EEG 脑电网络可视化
    Phase Locking Value (PLV) 神经信号的锁相值
    ubuntu16.04下的一些基本操作笔记
  • 原文地址:https://www.cnblogs.com/xpf1009/p/9227306.html
Copyright © 2011-2022 走看看