使用正则表达式进行替换:
代码片段:
String documentTxt = EntityUtils.toString(entity,"gbk");//获取数据
documentTxt=documentTxt.replaceAll("[\\t\\n\\r]", "");//将内容区域的回车换行去除
说明:String类的replaceAll就有正则替换功能。 \t为制表符 \n为换行 \r为回车
java正则使用:
示例方法:
public void parseTxt(String content){ Pattern p = Pattern.compile(Config.articlePtn); Matcher matcher = p.matcher(content); while(matcher.find()){ System.out.println(matcher.group(1)); } }
说明:只需记住Pattern类,它的静态方法complie解析一个正则表达式生成一个Pattern对象。
然后用模型去匹配字符串,得到一个Matcher,通过matcher的find方法遍历所有的匹配。
group为正则表达式中的组,及()表达式。group(0)为原字符串,gourp(1)为匹配到的第一个组...即匹配到的组的索引从1开始。