zoukankan      html  css  js  c++  java
  • 组合数据类型练习,英文词频统计实例

      1. 列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等。
        s=list('12323231312')
        s.append('3')
        s.pop(0)
        s[1]='2'
        s.index('2')
        s.count('1')
        s.count('3')

      2. 字典实例:建立学生学号成绩字典,做增删改查遍历操作。
        d={'01':85,'02':80,'03':90,'04':95,'05':75,'06':85,'07':86}
        d['01']
        d['08']=96
        d.pop('01')
        d.keys()
        d.values ()

      3. 列表,元组,字典,集合的遍历。
        l=list('12311312231')
        s=tuple('bsfdsbsk')
        t={'01':'98','02':'99','03':'92','04':'95'}
        d={'10','11','12','13','14'}
        for i in l:
            print(i,end='')
        for i in s:
            print(i,end='')
        for i in d:
            print(i,end='')
        for i in t:
            print(i,end='')
        for i in t:
            print(i,t.values())

        属性 列表list 元祖tuple                  字典dict      集合set
        有序 是 (正向递增/反向递减)
        数据可重复 key值唯一
        数据可修改
        特点

        查询速度随内容增加而变慢

        占用内存较小

        表达固定数据项、函数多返回值、

        多变量同步赋值、循环遍历等情况下适用

        改&查操作速度快,

        不会因key值增加而变慢。

        占用内存大,内存浪费多

        (利用空间成本换时间)

        数据独立性:

        能够过滤重复参数


        总结列表,元组,字典,集合的联系与区别。
      4. 英文词频统计实例
        1. 待分析字符串
        2. 分解提取单词
          1. 大小写 txt.lower()
          2. 分隔符'.,:;?!-_’
        3. 计数字典
          1. 排除语法型词汇,代词、冠词、连词

        4. 排序list.sort()
        5. 输出TOP(10)
          s=open('s.txt','r').read()
          exc={'the','a','to','of','and','in','on','that','i','it','at'}
          s=s.lower()
          for i in ''',.?!''':
              s=s.replace(i,' ')
          words=s.split(' ')
          dic={}
          keys=set(words)
          for w in exc:
              keys.remove(w)
          for i in keys:
              dic[i]=words.count(i)
          wc=list(dic.items ())
          wc.sort(key=lambda x:x[1],reverse=True)
          for i in range(20):
              print(wc[i])

  • 相关阅读:
    CCCC 2020 酱油记
    CCPC 2020 威海 滚粗记
    IEEExtreme 2020 酱油记
    CCSP 2020 酱油记
    ICPC 陕西省赛 2020 游记
    CCPC 网络赛 2020 自闭记
    CSP 第20次认证 酱油记
    CSP-S 2019 酱油记
    NOI2019 退役记
    树链剖分入门
  • 原文地址:https://www.cnblogs.com/lcm1995/p/7569585.html
Copyright © 2011-2022 走看看