zoukankan      html  css  js  c++  java
  • linux命令(12)cut

    1. 作用

    cut是一个选取命令,就是将一段数据经过分析,取出我们想要的。一般来说,选取信息通常是针对“行”来进行分析的,并不是整篇信息分析的。

    2. 用法

    cut 【参数】【file or stdin】

    参数

    -d:后面接分隔字符,与-f一起使用,默认的字段分隔符为制表位TAB;

    -f:依据-d的分隔字符将一段信息切割开,用-f取出第几段;

    -b:以字节为单位进行分割;

    -c:以字符为单位进行分割;

    -n:与-b连用,不分割多字节字符;

    --complement:提取指定字段之外的列

    范围表示

    N-:从第N个字节、字符、字段到结尾;

    N-M:从第N个字节、字符、字段到第M个(包括M)字节、字符、字段;

    -N:从第1个字节、字符、字段到第N个(包括N)字节、字符、字段。

    3. 举例子

    3.1 cut -d ':' -f 1

    注:cut会先把-f后面所有的定位进行从小到大排序,然后再提取,所以结果不会颠倒顺序。

    注:结果是输出整行,不会出现第3个字段的重复出现。

    问题:在cut -d中用什么符号来设定制表符或空格呢?

    多个空格和制表位tab怎么看出来,用sed -n l file命令,l为字母L的小写:

    注:空格还是按原来显示,制表位tab显示为 ,换行符为$

    默认分隔符为制表位tab:

    以空格作为分隔符,-d后的引号里直接敲一个空格即可:

    -d后的引号里多敲一个空格会出错:

    注:如果文件里面的某些域是由若干个空格来间隔的,那么用cut就有点麻烦了,因为cut只擅长处理“以一个字符间隔”的文本内容。

    3.2 cut -b 2

    取出每行的第2个字节:

    3.3 cut -c 2

    取出每行的第2个字符:

    注:英文字母都是单字节字符,所以-b和-c的结果一样,若为中文则不同:

    3.4 cut -nb 1-3 file

    注:当遇到多字节字符时,可以使用-n选项,-n用于告诉cut不要将多字节字符拆开。

    但是不加-n也可以,尴尬。。。

     3.5 cut -d ' ' -f 2 --complement file

    提取指定字段之外的列:

  • 相关阅读:
    windows消息定义
    17种正则表达式
    DirectX程序例子
    C#调用WINDOWS API 要点
    提取网页中的超级链接
    基于消息驱动的C#Windows程序
    C#使用事件
    C#启动进程的方法
    C#注册表操作方法
    HighLight.net 2.0 版本源码
  • 原文地址:https://www.cnblogs.com/seaBiscuit0922/p/7746980.html
Copyright © 2011-2022 走看看