zoukankan      html  css  js  c++  java
  • [Linux] 正则表达式与文件格式化处理

    • 正则表达式就是处理字串的方法,他是以行为单位来进行字串的处理行为
    • 正则表达式通过一些特殊符号的辅助,可以让使用者轻易的达到“搜寻/删除/取代”某特定字串的处理程序
    • 只要工具程序支持正则表达式,那么该工具程序就可以用来作为正则表达式的字串处理之用
    • 正则表达式与万用字符是完全不一样的东西!万用字符 (wildcard) 代表的是 bash 操作接口的一个功能, 但正则表达式则是一种字串处理的表示方式
    • 使用 grep 或其他工具进行正则表达式的字串比对时,因为编码的问题会有不同的状态,因此, 你最好将 LANG 等变量设置为 C 或者是 en 等英文语系
    • grep 与 egrep 在正则表达式里面是很常见的两支程序,其中, egrep 支持更严谨的正则表达式的语法
    • 由于编码系统的不同,不同的语系 (LANG) 会造成正则表达式撷取数据的差异。因此可利用特殊符号如 [:upper:] 来替代编码范围较佳
    • 由于严谨度的不同,正则表达式之上还有更严谨的延伸正则表达式
    • 基础正则表达式的特殊字符有: *, ., [], [-], [^], ^, $ 等
    • 常见的支持正则表达式的工具软件有: grep , sed, vim 等等
    • printf 可以通过一些特殊符号来将数据进行格式化输出
    • awk 可以使用“字段”为依据,进行数据的重新整理与输出
    • 文件的比对中,可利用 diff 及 cmp 进行比对,其中 diff 主要用在纯文本方面的新旧版本比对
    • patch 指令可以将旧版数据更新到新版 (主要亦由 diff 创建 patch 的补丁来源文件)
  • 相关阅读:
    【JavaScript】--ajax
    【Django】--Models 和ORM以及admin配置
    【Django】--基础知识
    【jQuery】--图片轮播
    双系统 windows引导项添加
    LVM
    linux安全加固
    oracle 11G 配置侦听文件
    LVM
    《virtual san 最佳实践》节选 Virtual SAN的发展与现状
  • 原文地址:https://www.cnblogs.com/immjc/p/7610164.html
Copyright © 2011-2022 走看看