zoukankan      html  css  js  c++  java
  • 复合数据类型,英文词频统计

    1.列表,元组,字典,集合分别如何增删改查及遍历。

    使用append()方法来添加列表项(仅支持增加一个元素),extend()增加一个列表,insert()根据索引添加元素

    del 根据索引删除元素,或者使用remove()删除指定值的元素,pop()根据索引删除元素

    对列表数组某元素进行赋值,以进行更新

    搜索可以通过搜索元素或者搜索元素索引值

    列表有三种遍历方法,一种是带Index索引的循环,一种是用range()方法进行的,还有一种是使用enumerate() 方法的。

    元组的增加和修改不能直接通过赋值,但可以对元组进行连接组合,

    例:

    tup3 = tup1 + tup2

    元组可以使用下标索引来访问元组中的值

    元组中的元素值是不允许删除的,但我们可以使用del语句来删除整个元组

    字典的访问需要在输出时把相应的键放入到方形弧内

    向字典添加新内容的方法是增加新的键,由于字典是另一种可变容器模型,且可存储任意类型对象,所以可以直接在方形弧内添加新的名称

    而字典内的修改是对已有键进行修改

    删除使用del()可以删除整个词典的条目,也可以用dict来删除某一条目。

    集合的增加是通过使用add()方法添加元素,使用remove()进行删除元素,

    2.总结列表,元组,字典,集合的联系与区别。参考以下几个方面:

    列表:

    括号:有括号:[]

    有序无序:有序

    可变不可变:可变

    重复不可重复:可重复

    存储与查找方式:顺序查找和根据下标查找,存储根据对应下标存储

    元组:

    括号:有括号:()

    有序无序:有序

    可变不可变:不可变

    重复不可重复:可重复

    存储与查找方式:顺序查找和根据下标查找,存储根据对应下标存储

    字典:

    括号:有括号:{}

    有序无序:无序

    可变不可变:可变,根据key改变键值

    重复不可重复:key不可重复,键值可重复

    存储与查找方式:根据key存储和查找所对应的键值

    集合:

    括号:有括号:()

    有序无序:无序

    可变不可变:可变

    重复不可重复:不可重复

    存储与查找方式:顺序查找和根据下标查找,存储根据对应下标存储

    3.词频统计

    1.下载一长篇小说,存成utf-8编码的文本文件 file

    2.通过文件读取字符串 

    import string
    import pandas as pd
    def getNumber(x):
    y=x[1]
    return y

    file = open('21.txt','r',encoding='UTF-8').read().lower()
    s = "'"
    for i in s:
    file = file.replace(s,' ')
    song = file.split()
    exclude = {'a','the','i','you','and','in','but','not','it','s','beat','do','m'}
    cun = set(song)-exclude
    dis = {}
    for i in cun:
    dis[i] = song.count(i)
    words = list(dis.items())
    words.sort(key=getNumber,reverse=True)
    #输出前20
    for j in range(20):
    print(words[j])
    #保存为csv文件
    pd.DataFrame(data=words).to_csv(r'21.csv',encoding='UTF-8')

    
    
    
  • 相关阅读:
    Maven 集成Tomcat插件
    dubbo 序列化 问题 属性值 丢失 ArrayList 解决
    docker 中安装 FastDFS 总结
    docker 从容器中拷文件到宿主机器中
    db2 相关命令
    Webphere WAS 启动
    CKEDITOR 4.6.X 版本 插件 弹出对话框 Dialog中 表格 Table 自定义样式Style 问题
    SpringMVC JSONP JSON支持
    CKEDITOR 3.4.2中 按钮事件中 动态改变图标和title 获取按钮
    git回退到远程某个版本
  • 原文地址:https://www.cnblogs.com/Winslow-liujie/p/10596879.html
Copyright © 2011-2022 走看看