基本文本处理工具

zoukankan html css js c++ java

基本文本处理工具

文本处理工具

用于处理文本的工具有很多，今天我们就来一个个说一说

文本查看工具 cat tac rev

命令：cat

格式：cat [OPTION]... [FILE]...

选项：   -v 显示非打印字符

　　-E 显示每一行末尾$符

　　-T 显示TAB（以^I形式显示）

　　-n 显示行号

　　-s 将连续的空行压缩成一行

　　-A 相当于-vET

　　-b 显示所有的非空行编号

　　cat是将文本按正常的格式显示出来，我们还有另外两个文本查看语句，是tac和rev，tac是将文本从最后一行开始，显示至第一行；而rev也是反向显示，不过是从每一行的最后一个字符开始显示，然后倒数第二个字符，一直到第一个字符；三者的区别，我们可以从下图看出：

小练习：1、把文件1.txt的内容加上行号后，输入到文件2.txt中。

分页查看文件内容 less more

命令：less

格式：less [OPTION]... [FILE]...

查看文件时常用指令：

　　space, ctrl+v, ctrl+f, ctrl+F：向文件尾翻屏

    ctrl+b：向文件首部翻屏

    ctrl+d：向文件尾部翻半屏

    ctrl+u：向文件首部翻半屏

    ctrl+N, e, ctrl+E, j, ctrl+J: 向文件尾部翻一行

    y, ctrl+Y, ctrl+P, k, ctrl+K：向文件首部翻一行

    q: 退出

    #：跳转至第#行

　　g: 回到文件首部

　　G：翻至文件尾部

　　/KEYWORD：以KEYWORD指定的字符串为关键字，从当前位置向文件尾部搜索（仅首次有效），不区分字符大小写

　　　　n：下一个

　　　　N：上一个

命令：more

格式：more [OPTION]... [FILE]...

选项：    -d 显示翻译及退出提示

显示文本前或后行内容： head tail

命令：head

格式：head [OPTION]... [FILE]...（默认显示前10行内容）

选项：    -n 行号显示前n行

　　　　　-行号显示前n行

　　　　　-c 字节数显示前n个字节

命令：tail

格式：tail [OPTION]... [FILE]...（默认显示后10行内容）

选项：   -n 行号显示后n行

　　-行号显示后n行

　　-c 字节数显示后n个字节

　　-f 动态显示（跟踪显示文件新追加的内容,常用日志监控）

小练习：1、显示/ect/passwd文件的第11行至第20行

2、利用 cat /dev/urandom 生成10位字符长度的随机密码（包含大小写字母及数字）

按列抽取文本 cut

命令：cut

格式：cut [OPTION]... [FILE]...

选项：　　-d 指定分隔符

　　　　　-f 选取第几列

　　　　　n 第n个字段

　　　　　n-r 连续的多个字段

　　　　　　　n,n-r 混合使用

　　　　　--output-delimiter 指定输出符

小练习：1、显示当前主机的第一个网卡地址

2、查出/app目录的空间使用量

合并文件paste

命令：paste

格式：paste [OPTION]... [FILE]...

选项：    -s f1 将文件内容变成一行显示

　　　　　　　也可以用 tr ' ' ' ' 实现

　　　　　-d "" f1 f2 [f3] 定义合并后的分隔符，默认为TAB

文本数据统计工具 wc （word count）

命令：wc

格式：wc [OPTION]... [FILE]...

选项：　　-m 显示字符数

　　　　　-c 显示字节

        　-l 显示行数

        　-w 显示单词数

wc 依次显示行数，单词数，字节数

小练习：1、统计当前目录下文件数量

文本排序 sort

命令：sort

格式：sort [OPTION]... [FILE]...

选项：　　-r 执行反方向（由上至下）整理

        　-n 执行按数字大小整理

        　-f 选项忽略（fold）字符串中的字符大小写

          -u 选项（独特，unique）删除输出中的重复行

          -t c 选项使用c做为字段界定符

          -k X 选项按照使用c字符分隔的X列来整理能够使用多次

小练习：1、找出分区利用率最大的值

去重管理 uniq

命令：uniq

格式：uniq [OPTION]... [FILE]...

选项：    -c 显示连续重复的次数

    　　　-d 仅显示重复的次数

    　　 -u 仅显示不曾重复的行

uniq仅能去除连续的重复行，如果想去除非连续的行，需要先用sort排序。

小练习：1、将此字符串：welcome to magedu linux 中的每个字符去重并排序，重复次数多的排到前面

比较文件diff

命令：diff

格式：diff 文件A 文件B

Eg：比较文件one.txt和文件two.txt的区别

作者：珂儿吖

出处：http://www.cnblogs.com/keerya/

本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。
大家写文都不容易，希望尊重劳动成果哟~

查看全文

相关阅读:
需求管理是CMM可重复级中的6个关键过程域之一，其主要目标是__________。A．客观地验证需求管理活动
 47、软件需求工程的活动可以划分为5个独立的阶段：需求获取、需求建模、形成需求规格、需求验证和需求管理，需求建模是（）
JavaScript alert()函数
 系统讲解一下，Dao，Entity，Servlet，Action各自有什么东西-Java/Web开发
 用Eclipse 开发Dynamic Web Project应用程序
 Connection conn = DriverManager.getConnection("jdbc:odbc:bbs");
linux 常用快捷命令
 Docker 命令大全
 小白入门之十七：yum源配置并使用其安装软件包
 Linux从一般用户切换到root用户

原文地址：https://www.cnblogs.com/keerya/p/7305148.html

基本文本处理工具

文本处理工具

文本查看工具 cat tac rev

分页查看文件内容 less more

显示文本前或后行内容： head tail

按列抽取文本 cut

合并文件paste

文本数据统计工具 wc （word count）

文本排序 sort

去重管理 uniq

比较文件diff