zoukankan      html  css  js  c++  java
  • [Java解惑]字符串

     

    字符串... 13
    19.      char类型相加... 13
    20.      程序中的Unicode转义字符... 14
    21.      注释中的Unicode转义字符... 14
    22.      WindowsLinux上的行结束标示符... 14
    23.      输出0-255之间的ISO8859-1... 14
    24.      Stringreplace()replaceAll()15
    25.      一段程序的三个Bug. 16

    字符串

    19.char类型相加


    System.out.println('a' + 'A');//162
    上面的结果不是 aA ,而是 162
    当且仅当+操作符的操作数中至少有一个是String类型时,才会执行字符串连接操作;否则,执行加法。如果要连接的数值没有一个是字符串类型的,那么你可以有几种选择:预置一个空字符串("" + 'a' + 'A');将第一个数值用String.valueOf()显示地转换成一个字符串(String.valueOf('a') + 'A');使用一个字符串缓冲区(sb.append('a');sb.append('A'););或者如果使用的是JDK5.0,可以用printfSystem.out.printf("%c%c",'a','A'));

    20.程序中的Unicode转义字符


    //u0022是双引号的Unicode编码表示
    System.out.println("au0022.length() + u0022b".length());// 2
     
    Unicode编码表示的字符是在编译期间就转换成了普通字符,它与普通转义字符(如:")是不一样的,它们是在程序被解析为各种符号之后才处理转义字符序列。

    21.注释中的Unicode转义字符


    如果程序中含有以下的注释:// d:autil ,程序将不能编译通过,原因是u后面跟的不是四个十六进制数字,但编译器在编译时却要把u开头的字符的字符看作是Unicode编码表示的字符。
     
    所以要注意:注释中也是支持Unicode转义字符的。
     
    另外一个问题是不能在注释行的中间含有 u000A 表示换行的Unicode字符,因为这样在编译时读到 u000A 时,表示行结束,那么后面的字符就会当作程序代码而不在是注释了。

    22.WindowsLinux上的行结束标示符


    String line = (String)System.getProperties().get("line.separator");
    for(int i =0; i < line.length();i++){
           System.out.println((int)line.charAt(i));
    }
     
    Windows上运行结果:
    13
    10
    Linux上运行的结果:
    10
     
    Windows平台上,行分隔符是由回车( )和紧其后的换行( )组成,但在Unix平台上通常使用单独的换行( )表示。

    23.输出0-255之间的ISO8859-1


    byte bts[] = new byte[256];
    for (int i = 0; i < 256; i++) {
           bts[i] = (byte) i;
    }
    // String str = new String(bts,"ISO8859-1");//正确的做法
    String str = new String(bts);//使用操作系统默认编码方式编码(XP GBK
    for (int i = 0, n = str.length(); i < n; i++) {
           System.out.print((int) str.charAt(i) + " ");
    }
    上面不会输出0-255之间的数字串,正确的方式要使用new String(bts," ISO8859-1") 方式来解码。
     
    ISO8859-1是唯一能够让该程序按顺序打印从0255的整数的缺少字符集,这也是唯一在字符和字节之间一对一的映射字符集。
     
    通过java获取操作系统的默认编码方式:
    System.getProperty("file.encoding");//jdk1.4或之前版本
    java.nio.charset.Charset.defaultCharset();//jdk1.5或之后版本

    24.Stringreplace()replaceAll()


    System.out.println(".".replaceAll(".class", "\$"));
    上面程序将 . 替换成 $,但运行时报异常,主要原replaceAll的第二参数有两个字符( $)是特殊字符,具有特殊意思(用来转移 $$后面接数字表示反向引用)。另外,replaceAll的第一参数是正则表达式,所以要注意特殊字符,正确的作法有以下三种:
    System.out.println(".class".replaceAll("\.", "\\\$"));
    System.out.println(".class".replaceAll("\Q.\E", "\\\$"));
    System.out.println(".class".replaceAll(Pattern.quote("."), Matcher.quoteReplacement("\$")));
     
    APIQE的解释:
      引用(转义)下一个字符
    Q引用所有字符,直到 E
    E结束从 Q 开始的引用
     
    JDK5.0新增了一些解决此问题的新方法:
    java.util.regex.Pattern.quote(String s):使用QE将参数引起来,这些被引用的字符串就是一般的字符,哪怕含有正则式特殊字符。
    java.util.regex.Matcher.quoteReplacement(String s):将$转换成能应用于replaceAll第二个参数的字符串,即可作为替换内容。
     
    Stringreplace(char oldChar, char newChar)方法却不使用正则式,但它们只支持字符,而不是字符串,使用起来受限制:
    System.out.println(".".replace('.','\'));//能将 . 替换成
    System.out.println(".".replace('.','$')); //能将 . 替换成 $

    25.一段程序的三个Bug


    Random rnd = new Random();
    StringBuffer word = null;
    switch (rnd.nextInt(2)) {
    case 1:
           word = new StringBuffer('P');
    case 2:
           word = new StringBuffer('G');
    default:
           word = new StringBuffer('M');
    }
    word.append('a');
    word.append('i');
    word.append('n');
    System.out.println(word);
    上面的程序目的是等概率的打印 PainGainMain 三个单词,但多次运行程序却发现永远只会打印 ain,这是为什么?
     
    第一个问题在于:rnd.nextInt(2)只会返回01 两个数字,所以上面只会走case 1: 的分支语句,case 2: 按理是永远不会走的。
     
    第二个问题在于:如果case语句不以break结束时,则一直会往向运行,即直到执行到breakcase语句止,所以上面的的语句每次都会执行default分支语句。
     
    第三个问题在于:StringBuffer的构造函数有两种可接受参数的,一个是StringBuffer(int capacity)、另一个是StringBuffer(String str),上面用的是StringBuffer(char)构造函数,实质上运行时将字符型转换成了int型,这样将字符当作StringBuffer的初始容量了,而不是字符本身。
     
    以下是修改后的程序片段:
    Random rnd = new Random();
    StringBuffer word = null;
    switch (rnd.nextInt(3)) {
    case 1:
           word = new StringBuffer("P");
           break;
    case 2:
           word = new StringBuffer("G");
           break;
    default:
           word = new StringBuffer("M");
           break;// 可以不要
     
    }
    word.append('a');
    word.append('i');
    word.append('n');
    System.out.println(word);

  • 相关阅读:
    2019 牛客多校第五场 B generator 1
    POJ 1797 Heavy Transportation
    POJ 3352 Road Construction
    POJ 2553 The Bottom of a Graph
    POJ 1236 Network of Schools
    POJ 1144 Network
    POJ 3761 Bubble Sort
    2019 牛客多校第三场 B Crazy Binary String
    2019 牛客多校第三场 H Magic Line
    Codeforces Round #592 (Div. 2)
  • 原文地址:https://www.cnblogs.com/jiangzhengjun/p/4257572.html
Copyright © 2011-2022 走看看