//1.字符串和编码
字符串有一个重要特点就是字符串不可变,
这种不可变性是通过内部的private final char[]字段,
以及没有任何修改char[]的方法实现的
public class Main {
public static void main(String[] args) {
String s = "Hello";
System.out.println(s);
s = s.toUpperCase();
System.out.println(s);
}
}
这个例子到底怎么解释????
这个估计是在之前的基础上创建了一个新的字符串,然后把这个引用到这个上面来。
原来的字符串并没有改变。
字符串比较
Java编译器在编译期,会自动把所有相同的字符串当作一个对象放入常量池
所在使用==也可以
但是如果是后期转化的,但是如果不是一个对象,那么就会报错
最好使用equals()函数
要忽略大小写比较,使用equalsIgnoreCase()方法。
各种字符串操作函数:
// 是否包含子串:
"Hello".contains("ll"); // true
"Hello".indexOf("l"); // 2
"Hello".lastIndexOf("l"); // 3
"Hello".startsWith("He"); // true
"Hello".endsWith("lo"); // true
"Hello".substring(2); // "llo"
"Hello".substring(2, 4); "ll"
" Hello
".trim(); // "Hello"是去除首尾字符串空白字符,
是返回新字符串,原来的字符串内容没有改变
"".isEmpty(); // true,因为字符串长度为0
" ".isEmpty(); // false,因为字符串长度不为0
"
".isBlank(); // true,因为只包含空白字符
" Hello ".isBlank(); // false,因为包含非空白字符
String s = "hello";
s.replace('l', 'w'); // "hewwo",所有字符'l'被替换为'w'
s.replace("ll", "~~"); // "he~~o",所有子串"ll"被替换为"~~"
String s = "A,,B;C ,D";
s.replaceAll("[\,\;\s]+", ","); // "A,B,C,D"
String s = "A,B,C,D";
String[] ss = s.split("\,"); // {"A", "B", "C", "D"}
String[] arr = {"A", "B", "C"};
String s = String.join("***", arr); // "A***B***C"
String.valueOf(123); // "123"
String.valueOf(45.67); // "45.67"
String.valueOf(true); // "true"
String.valueOf(new Object()); // 类似java.lang.Object@636be97c
int n1 = Integer.parseInt("123"); // 123
int n2 = Integer.parseInt("ff", 16); // 按十六进制转换,255
boolean b1 = Boolean.parseBoolean("true"); // true
boolean b2 = Boolean.parseBoolean("FALSE"); // false
要特别注意,Integer有个getInteger(String)方法,它不是将字符串转换为int,
而是把该字符串对应的系统变量转换为Integer
Integer.getInteger("java.version"); // 版本号,11
String和char[]类型可以互相转换,方法是:
char[] cs = "Hello".toCharArray(); // String -> char[]
String s = new String(cs); // char[] -> String
如果修改char[]数组,String并不会改变
练习未解决
//2.字符编码
始终牢记:Java的String和char在内存中总是以Unicode编码表示。
在Java中,char类型实际上就是两个字节的Unicode编码。
如果我们要手动把字符串转换成其他编码,可以这样做:
byte[] b1 = "Hello".getBytes(); // 按ISO8859-1编码转换,不推荐
byte[] b2 = "Hello".getBytes("UTF-8"); // 按UTF-8编码转换
byte[] b2 = "Hello".getBytes("GBK"); // 按GBK编码转换
byte[] b3 = "Hello".getBytes(StandardCharsets.UTF_8); // 按UTF-8编码转换
注意:转换编码后,就不再是char类型,而是byte类型表示的数组。
如果要把已知编码的byte[]转换为String,可以这样做:
byte[] b = ...
String s1 = new String(b, "GBK"); // 按GBK转换
String s2 = new String(b, StandardCharsets.UTF_8); // 按UTF-8转换
var的使用
只能用于局部变量,根据等式右边来判断变量的类型
还有一个地方就是for循环的时候。
//3.StringBuilder
StringBuilder是可变对象,用来高效拼接字符串;
StringBuilder可以支持链式操作,实现链式操作的关键是返回实例本身;
StringBuffer是StringBuilder的线程安全版本,现在很少使用。