zoukankan      html  css  js  c++  java
  • Linux文本处理

    作为一名 Linux 研发人员,几乎每天都要面对文本处理场景。 因此 掌握文本处理套路熟练运用文本处理命令 ,对于 提升工作效率 意义重大。

    本文以一个实战例子抛砖引玉,介绍如何运用 grepawksedcut 等命令进行文本处理, 以 快速 完成原本很繁琐的操作。

    背景

    笔者开发机上有很多 Docker 镜像,现在需要删除名为 none 的那些:

    $ docker images
    REPOSITORY          TAG                 IMAGE ID            CREATED             SIZE
    api-adapter         v1                  e9bc8e28af2a        3 hours ago         7.67MB
    <none>              <none>              f0fa889be9e8        2 days ago          956MB
    <none>              <none>              257954316455        2 days ago          956MB
    <none>              <none>              99739acbfe7a        2 days ago          956MB
    <none>              <none>              52b10754a70c        2 days ago          956MB
    <none>              <none>              86878eefdd39        2 days ago          956MB
    golang              1.10                0a19f4d16598        12 days ago         729MB
    python              3                   1e80caffd59e        12 days ago         923MB
    

    如何操作呢?莫非手工一个个删除么?

    $ docker image rm f0fa889be9e8
    

    试想,如果有上百个这样的镜像待删,要搞到何年何月!但如何改进呢?

    文本过滤

    考虑先把名字为 none 的镜像从结果中过滤出来, grep 命令即可搞定:

    $ docker images | grep none
    <none>              <none>              f0fa889be9e8        2 days ago          956MB
    <none>              <none>              257954316455        2 days ago          956MB
    <none>              <none>              99739acbfe7a        2 days ago          956MB
    <none>              <none>              52b10754a70c        2 days ago          956MB
    <none>              <none>              86878eefdd39        2 days ago          956MB
    

    字段提取

    接着,将容器 ID 一列提取出来,这对 awk 来说简直是小儿科:

    $ docker images | grep none | awk '{print $3}'
    f0fa889be9e8
    257954316455
    99739acbfe7a
    52b10754a70c
    86878eefdd39
    

    当然了,通过 cut 命令进行 字段切分 也可以得到相同的结果。 由于 cut 只能按单个字符进行切分,而原文本中的空格为多个,因此需要先进行 文本替换

    文本替换

    文本替换是 sed 命令擅长的事,下面将一个或多个空格替换成一个:

    $ docker images | grep none | sed 's/  */ /g'
    <none> <none> f0fa889be9e8 2 days ago 956MB
    <none> <none> 257954316455 2 days ago 956MB
    <none> <none> 99739acbfe7a 2 days ago 956MB
    <none> <none> 52b10754a70c 2 days ago 956MB
    <none> <none> 86878eefdd39 2 days ago 956MB
    

    文本切分

    接下来,使用 cut 命令对结果进行进一步切分并取出第三个字段:

    $ docker images | grep none | sed 's/  */ /g' | cut -d ' ' -f 3
    f0fa889be9e8
    257954316455
    99739acbfe7a
    52b10754a70c
    86878eefdd39
    

    不错,我们得到与运用 awk 命令相同的结果。

    批量删除

    接下来,通过 xargs 批量删除镜像:

    $ docker images | grep none | awk '{print $3}' | xargs docker image rm
    Deleted: sha256:f0fa889be9e8f8369353a32e8cec17e9333cbeb581de5f78bf6875917d971bc9
    Deleted: sha256:d301d0546b29b7daa55d29f29d9253664870fd83465aefe8b92ff6a7048d5612
    ...
    

    在这个例子中, xargs 最终将执行以下命令:

    $ docker image rm f0fa889be9e8 257954316455 99739acbfe7a 52b10754a70c 86878eefdd39
    

    看到没有,所有不想要的镜像都删除干净了,而且只需要进行一次操作:

    $ docker images
    REPOSITORY          TAG                 IMAGE ID            CREATED             SIZE
    api-adapter         v1                  e9bc8e28af2a        3 hours ago         7.67MB
    golang              1.10                0a19f4d16598        12 days ago         729MB
    python              3                   1e80caffd59e        12 days ago         923MB
    

    下面这个操作也是等价的:

    $ docker images | grep none | sed 's/  */ /g' | cut -d ' ' -f 3 | xargs docker image rm
    

    小菜学编程

  • 相关阅读:
    线程(中)
    线程
    生产者消费者模型
    进程的常用方法
    HTML中head与body标签
    HTTP协议
    mysql:视图,触发器,事务,存储过程,函数。
    关于MySQL中pymysql安装的问题。
    MySQL多表查询,pymysql模块。
    MySQL之单表查询
  • 原文地址:https://www.cnblogs.com/fasionchan/p/10381831.html
Copyright © 2011-2022 走看看