zoukankan      html  css  js  c++  java
  • 第六章

    这一章主要讲了程序驱动统计单词个数。 

    统计一个文件中某个字符串的个数,其实就能当成是在一块沙地里面找石头,有人看到石头以后,在上面做标记grep,然后记住做过多少个标记;有人看到石头以后,把它挖(tr),最后统计自己挖多少石头;有人看到石头以后,把它跳过去(awk),然后统计自己跳多少次。

    1. [root@bzhou test]# cat file
    2. hafsdha
    3. hahafsdfsdhaha
    4. haha

    假如我想匹配的是‘haha’这个字符串
           1.grep的-o选项

    最开始的时候是用-c这个选项,不过-c只能统计一行的,如果一行里面有多个匹配的字符串,那-c就无能为力了。
    这个是正确的

    1. [root@bzhou test]# grep -o 'haha' file | wc -l
    2. 3
    3. [root@bzhou test]# awk -v RS='haha' 'END {print --NR}' file

    -v 去设定一个变量的值,RS是记录的分隔符,默认的是新行( ),就是说awk按照一行一行读数据,但是现在RS为'haha'后,就按'haha'读数据了,NR为已读的记录数,n个记录是被n-1个分隔符分开的,所以就是NR了。
    严格意义说,tr匹配不了字符串,只能去匹配单个字符。这里就匹配这个文件中‘h’的个数。

    1. [root@bzhou test]# tr -cd 'h' <file | wc -c
    2. 8
    3. [root@bzhou test]# grep -o 'h' file | wc -l
    4. 8

    -d可以删除某个字符,如果只有-d就会输出删除特定字符后的字符串,但是-c可以反显,这就是显示被删除的字符。然后用wc -c去统计下字符的个数。

  • 相关阅读:
    线性判别分析(LDA)
    奇异值分解(SVD)
    傅里叶变换
    SVM 之非线性支持向量机
    三角函数常用公式
    协方差、样本协方差和协方差矩阵
    方差和样本方差
    SVM 之线性支持向量机
    参考资料汇总
    QObject: Cannot create children for a parent that is in a different thread
  • 原文地址:https://www.cnblogs.com/lianzhuoya/p/5561387.html
Copyright © 2011-2022 走看看