zoukankan      html  css  js  c++  java
  • 第二周词频统计

    作业的要求参见https://edu.cnblogs.com/campus/nenu/2018fall/homework/2126

    代码地址https://git.coding.net/xucs/cptj.git

     

     功能一

    实现小文件输入,先用open打开文件后,将字符替换成空格,大写字母转化为小写字母,然后将文本转化为列表。进行词频统计后排序输出

    name = raw_input('enter the novel:')
    file = open(name)
    novel = file.read()

    然后将字符替换成空格,大写字母转化为小写字母

     for ch in ['~','!','@','#', '$','^','&','*',':','(',')','_','+','=','[',']','"','{','}',',','.','?',';','|','/']:
            novel = article.replace(ch, ' ')
            exchange = novel.lower()

    然后将文本转化为列表。进行词频统计后排序

    list = exchange.split()
    xs = {}
    for i in list:
        count = list.count(i)
        xs[i] = count
    xs1 = sorted(xs.items(), key=lambda d: d[1], reverse=True)

    结果如下:

    功能二

    配置Python运行的环境变量后在cmd输入Python后空格再输入文件名即可

    功能三

     先调用三个模块

    import os
    import os.path
    import glob

    然后读取目录下的txt文件

    elif path1 != '':
        os.chdir(path1)
        files = glob.glob('*.txt')
        for file in files:
            # name = os.path.basename(file)
            # path2 = os.path.abspath(name)
            novel = open(file)
            novel = novel.read()

    运行之后没有结果,我没能实现这个功能。

    功能四

    从控制台输入英文单篇作品

    当从article输入是使用功能四。

    article = raw_input('enter the article:')
    if article != '':
        for ch in ['~','!','@','#', '$','^','&','*',':','(',')','_','+','=','[',']','"','{','}',',','.','?',';','|','/']:
            novel = article.replace(ch, ' ')
            exchange = novel.lower()

     

     psp表格

    Psp阶段

    估计时间

    实际时间

    时间差原因

    实现功能一

    120分钟

    207分钟

    符号替换失误

    实现功能二

    20分钟

    413分钟

    不会命令行

    实现功能三

    100分钟

    未能实现

     不会读取文件

    实现功能四

    20min

    259min

    编译错误

  • 相关阅读:
    NYOJ 625 笨蛋的难题(二)
    NYOJ 102 次方求模
    ZJU Least Common Multiple
    ZJUOJ 1073 Round and Round We Go
    NYOJ 709 异形卵
    HDU 1279 验证角谷猜想
    BNUOJ 1015 信息战(一)——加密程序
    HDU 1202 The calculation of GPA
    "蓝桥杯“基础练习:字母图形
    "蓝桥杯“基础练习:数列特征
  • 原文地址:https://www.cnblogs.com/xvcs/p/9696815.html
Copyright © 2011-2022 走看看