zoukankan      html  css  js  c++  java
  • 英文字符串排序算法

    编程工作偶尔会遇到一些不常见问题需要处理,学编程处理问题也难免需要熟悉一些算法

    以前学习的时候就遇到过一个看似简单的排序算法问题,当时的解决办法是我没有用过的,在此记录一下

    问题 - 英文字符串排序

    如下几个英文单词或者字母

    apple,car, a,family,sky,application,app,baby,back,background,bad,bbbbb,bee,cafe ,cake,care

    排序后的结果是

    /**
    a
    app
    apple
    application
    
    baby
    back
    background
    bad
    bbbbb
    bee
    cafe 
    cake
    car
    care
    family
    sky
    
    **/
    

    规则逻辑

    通过结果可知

    a 与 app a排前面 (开头字母相同,短的排在前面)

    back 与 backgroud back排在前面 (开头字母相同,短的排在前面)

    application 与 baby application 排在前面(开头字母不同,从a-z依次排序)

    设计实现

    a=1 b=2 c=3 d=4 e=5 f=6 g=7 h=8 i=9 j=10

    k=11 l=12 m=13 n=14 o=15 p=16 q=17 r=18 s=19 t=20

    u=21 v=22 w=23 x=24 y=25 z=26

    a代表的是 1

    b代表的是 2

    z 代表 26 就可以实现初步排序

    但是 bbbbb与 bee 两个单词要实现 apple 在前,逻辑该怎么写呢

    起初想法是,字母依次比较,bbbbbbee比较的第二个字母的时候, be 分别代表 2 和 5 所以bbbbb排前面,问题是一个一个字母比较看起来很麻烦,10个单词,10个都要比较

    有以下解决方案

    方法一 通过单词获取权重进行排序(当初使用方法)

    bbbbb => b =2 b=2 b=2 b=2 b=2

    bee => b = 2 e =5 e = 5

    权重数 Px

    Px(bbbbb) = 2 + 2 * 27^-1 + 2 * 27^-2 + 2 * 27^-3 + 2 * 27^-4 = 2.079

    Px(bee) = 2 + 5 * 27^-1 + 5 * 27^-2 = 2.192

    通过这个计算方式可以获得权重值

    Px(bbbbb) < Px(bee)

    所以 bbbbb 排在 bee 前面

    权重数27

    这里为什么是 27 不是26 是考虑到一种情况,会导致排序失败

    比如 az 与 b比较

    Px(az) = 1 + 26 * 26^-1 = 2

    Px(b) = 2

    Px(az) = Px(b) 显然是错的 将26 改为 27 就可避免这个错误

    优点

    不管是任何单词,一千个也好,得出每个字符串对应的权重值,就能做到排序

    缺点

    考虑到前一种算法的计算,如果单词长度超过20或者更长,会导致计算量很大的问题

    如果有一百个单词,比较计算很有必要,如果只有两个单词

    bbbbbbbbbbbbbbbb 与 bar 比较 用权重法不合适,因为只有两个单词没比较计算这么多,就能得出排序结论,下面就讲讲另一种排序算法

    方法二 逐个字母计算排序(用到递归)

    下面说一下新思路,逐个比较

    apple,car, a,family,sky,application,app,baby,back,background,bad,bbbbb,bee,cafe ,cake,care

    还是上面的单词

    1. 首先获取每个字符串的第一个字母,比较大小

    第一个字母为 a 的 全部取出

    apple a application app

    2.如果大小相同,还不能确定顺序,比较他们的第二个字母, a 没有第二个字母,自然排在最前面,

    3.apple->(pple) application->(pplication) app->(pp) 还没有得出排序,拿(pple,pplication,pp)继续比较,依此类推,使用递归即可完成排序

    大致步骤

    apple application app ->
    pple pplication pp ->
    ple plication p(p最短,排在最前面) ->
    le lication ->
    e i (e < i) 所以 apple 排在 application 前面

    因为临时想到的一种排序方法,用到了TreeMap 等工具类,感觉还可以后期优化。

    代码如下:

    package javabasis.algorithm;
    
    import java.util.ArrayList;
    import java.util.List;
    import java.util.Set;
    import java.util.TreeMap;
    
    /**
     * 字段排序算法
     * 
     * @author Narule
     *
     */
    
    public class StringAlgorithm {
    
    	/**
    	 * 逐个字母比较排序
    	 * 
    	 * @param disorder
    	 * @return orderly
    	 */
    	public static String[] nopTop(String[] disorder) {
    		int index = 0;
    		int end = disorder.length;
    		String[] orderly = new String[end]; // 新建排序后的数组
    		TreeMap<Character, List<String>> treeMap = new TreeMap<>(); // 排序工具类,key是按照大小排序的
    		List<String> list = null;
    
    		// 收集字符串首字母信息
    		for (String str : disorder) {
    			char cTag = str.charAt(0);
    
    			list = treeMap.get(cTag);
    			if (list == null) {
    				list = new ArrayList<>(1);
    			}
    			list.add(str);
    			treeMap.put(cTag, list);
    		}
    
    		// 通过收集的首字母信息给字符串排序
    		Set<Character> keySet = treeMap.keySet();
    		for (char cTag : keySet) {
    			list = treeMap.get(cTag);
    			if (list != null && list.size() > 0) {
    
    				if (list.size() < 2) { // 如果只有一个字符串,不需要递归
    					for (String string : list) {
    						orderly[index] = string;
    						index++;
    					}
    				} else { // 如果有两个以上字符串,开头字母相同,可能需要递归排序
    					ArrayList<String> arrayList = new ArrayList<>(0);
    					for (String string : list) {
    						if (string.length() > 1) { // 字符串长度大于2的,需要添加到list,准备下一次递归排序用到
    							arrayList.add(string.substring(1));
    						} else {
    							orderly[index] = string;
    							index++;
    						}
    					}
    					if (arrayList.size() > 1) {
    						String[] array = new String[arrayList.size()];
    						int i = 0;
    						for (String string : arrayList) {
    							array[i] = string;
    							i++;
    						}
    						array = nopTop(array); // 还需要递归排序 back background -> ack ackground
    						for (String string : array) {
    							orderly[index] = cTag + string;
    							index++;
    						}
    					} else if (arrayList.size() == 1) {
    						orderly[index] = cTag + arrayList.get(0);
    						index++;
    					}
    				}
    			}
    
    		}
    		treeMap.clear();
    		return orderly; // 排序后的字符串数组
    	}
    
    	public static void main(String[] args) {
    		String[] noP = { "apple", "car", "a", "family", "sky", "application", "app", "baby", "back", "background",
    				"bad", "bbbbb", "bee", "cafe", "cake", "care" };
    		String[] nopTop = nopTop(noP);
    		for (String string : nopTop) {
    			System.out.println(string);
    		}
    
    	}
    }
    
    

    此方法用到TreeMap,这是Java工具类,自带排序效果,对此有疑问可以查看java源代码,或介绍文档

    优点

    没有很大的计算量

    缺点

    使用TreeMap ArrayList 对象,递归过多也会出现内存损耗过大或者溢出的情况

    未完,后期待优化

  • 相关阅读:
    微服务划分的姿势
    微服务的时间和成本去哪儿了
    假如你是架构师,你要做些什么
    说透代码评审
    从哲学层面浅谈计算机学习方法论
    分布式事务:两阶段提交与三阶段提交
    敏捷史话(四):敏捷是人的天性 —— Arie van Bennekum
    敏捷史话(三):笃定前行的勇者——Ken Schwaber
    敏捷史话(二):Scrum社区的悲剧性损失——Mike Beedle
    敏捷史话(一):用一半的时间做两倍的事——Scrum之父Jeff Sutherland
  • 原文地址:https://www.cnblogs.com/Narule/p/12852317.html
Copyright © 2011-2022 走看看