zoukankan      html  css  js  c++  java
  • 实验八 文件

    安徽工程大学

      Python程序设计 实验报告

    班级   物流192   姓名  刘旭  学号3190505212 成绩          

    日期     2020.6.2    指导老师       修宇     

    【实验目的】  

    掌握读写文本文件或 CSV 文件,进而对数据进行处理的方法。

     

    【实验条件】  

    PC机或者远程编程环境

    【实验内容】

    完成二个编程题。

    1)水浒传词频统计

    水浒传-词频统计

    描述

    使用词频统计的方法,生成《水浒传》出场次数最多的10个人物的姓名。‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬

     水浒传文本下载:

     读取《水浒传》文本文件的代码如下:‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬

    txt = open("AllManAreBrothers.txt", "r", encoding="utf-8").read()

    代码模板:

    # ThreeKingdomsV2

    import jieba

    # 读取txt文件,获取需要统计词汇的文本

    txt = open("AllManAreBrothers.txt", "r", encoding="utf-8").read()

    # 设置需要输出最多的前n位人物的数量

    n = 10

    # 请在下列exludes集合中,自行补充其他需要排除的词汇

    excludes = {

        "两个", "一个", "只见", "如何", "那里", "哥哥",}

    words = jieba.lcut(txt)

    counts = {}

    # 请扩展下列分支结构,转换更多替代词

    for word in words:

        if len(word) == 1:

            continue

        elif word == "宋江道":

            rword = "宋江"

        else:

            rword = word

        counts[rword] = counts.get(rword, 0) + 1

        

    # 实现删除干扰词汇功能(此处约2行代码)    

    # 使用列表和lambda功能实现 词汇的排序 (此处约2行代码)    

    # 依次输出统计次数最多的前n位(此处约3行代码)  

     

    2)血压心率分析

    描述

    BP.txt”是以逗号分隔的日期、血压、心率记录数据文本文件( open('BP.txt',encoding="gbk"))

    统计收缩压、舒张压、心率的总平均值(保留3位小数)。

    【实验记录与分析】

    题目一:水浒传词频统计

    注:该题通过14次不断优化,排除干扰词,完成既定目标。

    题目二:血压心率分析

    该题最初未写出来,之后老师给了代码提示:

    理解每行代码的含义后,补充剩下的几行代码,最终得出答案:

    注:将代码复制到python123上后,还需注意输出时的中英文符号

  • 相关阅读:
    iOS
    iOS
    iOS
    Xcodeproject详解
    Swift
    iOS
    iOS
    错误 1 无法将文件“objDebugXXX.exe”复制到“binDebugXXX.exe”。文件“binDebugXXX.exe”正由另一进程使用,因此该进程无法访问该文件
    【转载】SQL注入原理讲解
    在“安装”阶段发生异常。 System.Security.SecurityException: 未找到源,但未能
  • 原文地址:https://www.cnblogs.com/LX1234/p/13029611.html
Copyright © 2011-2022 走看看