shell取出多列文件中某一列重复的数据 - 走看看

zoukankan html css js c++ java

shell取出多列文件中某一列重复的数据
文件内容的格式是：

1　　张三

2　　李四

3　　张三

第二列有重复数据，去重的脚本如下：
#!/bin/bash sort -t\t -k2 File.txt | awk -F'\t' '{ if($2 == VALUE) {} else if($2 != VALUE) { VALUE = $2; print $0; } }' > target.txt sort -t\t -k1 target.txt > result.txt rm target.txt
　　首先将第二列进行排序： sort -t\t -k2 File.txt

　　然后if($2 == VALUE) {}判断第一列是否与变量 VALUE相等 (不必要担心 VALUE变量的值在初始化时 awk 为 VALUE赋值为"")，如果相等什么多不做。　　

　　
else if($2 != VALUE) { VALUE = $2; print $0; }
```
如果 一列不等于VALUE变量的值将$2赋值为VALUE然后打印这行数据，然后进行下一行 比较 下一行数据与上一行数据的VALUE是否相等相等什么都不敢也就是说
```
不打印着一行如果不相等则打印着一行从而起到去除重复数据的作用
查看全文

相关阅读:
13.线性回归
 12.scikit-learn中的Scaler
11.数据归一化
 oracle之二表的几种类型
 oracle之二表和表空间的关系
 oracle之二数据字典表和动态性能视图
 oracle之二检查点
 oracle之二管理undo
oracle之二归档日志
 oracle之二日志挖掘log miner

原文地址：https://www.cnblogs.com/pigerhan/p/2702106.html

Copyright © 2011-2022 走看看