zoukankan      html  css  js  c++  java
  • 文本统计分析工具指令

    cat命令

      查看文本内容或者特殊控制符

       cat  -A     

    tr命令

      转换和删除字符 | 压缩重复字符

      

       2.tr  -d   " "   < win.txt    > newfile.txt

       3.去掉某个字符串中的所有百分号或者其他的指定符号       tr -s "%" " "

       

    cut命令

       cut -d 指明切割符号 -f

       cut -c1-9  按每行中每个字符进行分割,包括空格字符.

       取某个列的数据

    paste命令

       2. 纵向合并    cat f1  f2 

        -d  指定分隔符

       

       -s 把每个文件合并成行而不是按行粘贴

        

        - 对每一个 ( - ),都从标准输入中读一次数据,使用空格作域分隔符号,以一个6列的格式显示就加- - - - - - 如果用三个- - -  就会以3列的格式显示

    wc命令

       wc默认统计文件或者输出有多少行,多少个单词(空格隔开就算一个单词) 多少个字节数.

    sort命令

       取得某个列并且对这个列进行排序

       -r 执行反方向(由上至下)

      -R  随机排序

      -n 执行按数字大小整理

      -f 选项忽略(fold)字符串中的字符大小写

      -u 选项(独特,unique)删除输出中的重复行

      -t  c 选项使用c做为字段界定符(指定分割符号) 相当于 cut -d

      -k  X 选项按照使用c字符分隔的X列来整理能够使用多次(指定排序的列)   相当于 cut -f

    uniq命令

        把相邻的重复行合并成一行

        -c: 显示每行重复出现的次数 

        -d: 仅显示重复过的行 

        -u: 仅显示不曾重复的行       

       注:连续且完全相同方为重复 

    文件内容:less和 cat

    文件截取:head和tail

    按列抽取:cut

    按关键字抽取:grep 

    vim 命令

      1       :%s/xyz/&er/g      把xyz字符串 替换成 xyzer

  • 相关阅读:
    Oracle GoldenGate部署系列
    SequoiaDB培训视频
    Macbook 修复Office Excel 异常问题
    linux vim 配置 go 开发环境
    hyperledger fabric 1.0.5 分布式部署 (九)
    IntelliJ IDEA 安装golang 插件
    hyperledger fabric 1.0.5 分布式部署 (八)
    docker 学习
    spring-boot 集成ehcache报错:org.springframework.expression.spel.SpelEvaluationException: EL1008E:
    CentOS7 Docker 安装
  • 原文地址:https://www.cnblogs.com/yxh168/p/8734040.html
Copyright © 2011-2022 走看看