zoukankan      html  css  js  c++  java
  • 20200917-3 白名单

    此作业的要求参见[https://edu.cnblogs.com/campus/nenu/2020Fall/homework/11207]
    白名单 SPEC
    老杨因为留作业太多被学生投诉下岗了,去面试,刚好你是公司的面试官。出了道题,题目要求如下(别忙着答题,现在是背景,作业的要求还在后面)。
    1) 程序名brute,按照下面的要求读入两个文件。文件 whitelist,包含1列整数10个,随机生成(要求老杨自己想办法),通过命令行参数指出文件名。文件 q,包含1列整数1000个,随机生成(也要求老杨自己想办法),通过控制台读入。
    2) 在文件q中查找所有不在whitelist中的整数,定向输出到一个文件中。(读到此处,你见老杨面露困惑,出于多年,不,一年,不,半年的师生情谊,你补充道,“杨老师,您就当这是从交易记录q中查找不符合白名单whitelist的非法交易。”老杨感激地点点头。)
    3) 写一份如何部署运行代码的readme。

    作业0(5分)

    修改create.cpp文件,改成由命令行参数确定生成的数据的数据量。修改readme.md的对应部分。(要求贴出修改之后的代码和read.md。)
    修改后代码如下:

    #include <iostream>
    #include <stdlib.h>
    #include <time.h>
    
    using namespace std;
    
    int main(int argc, char* argv[])
    {
        srand((unsigned)time(NULL));
        int a;
        sscanf(argv[1],"%d",&a);
        for(int i=0; i<a;i++)
        {
             cout << rand() << "
    ";
        }
        cout << endl;
    
        return 0;
    }
    
    

    修改readme.md文件

    作业1(10分)

    对上面两段老杨写的代码任选其一进行profile,观察现象(要求有截图记录)。

    我选择的是第一个代码进行profile,使用的是vs2019,
    截图如下:


    由图可以看出,外部代码执行的最慢,因为运行时他站的百分比最大。

    你是一个好人,为了让老杨知道为什么要对代码进行profile,于是你在原来的题目的基础上做出了修改,修改之后的题要求如下:

    1) 读入两个文件,一个用控制台,一个用命令行参数指出文件名。

    文件 biggerwhitelist,包含1列整数1M个,随机生成(要求老杨自己想办法),通过命令行参数指出文件名。

    文件 biggerq,包含1列整数10M个,随机生成(也要求老杨自己想办法),通过控制台读入。

    2) 在文件biggerq中查找所有不在biggerwhitelist中的整数,重定向输出到一个文件中。

    3) 写一份如何部署运行代码的readme。

    作业2(10分)

    以biggerwhitelist和biggerq作为输入,对作业1中选择的代码再次进行profile,找到代码执行最“慢”的地方,截图为证并文字说明。

    由图可以看出,红色的代码块即为执行慢的地方,颜色越深,代表执行的越慢。所以说是is_match()函数效率比较低,所以要对is_match()函数进行优化。

    老杨再次profile之后发现了代码最慢的地方在哪儿。这时候你说:“既然找到了最慢的地方,那就开始对你的代码进行优化吧。”对于这次引导的结果,你很得意。

    作业3(10分)

    根据作业2找到的最慢的地方,优化作业1中你选择的代码,在保证输出结果正确的前提下,减少老杨程序运行的时间。(优化后的代码需要你提交到git上,作为教师的判断依据。优化后的程序的名字应该是better.cpp或者better.cs。)
    代码:

    #include <algorithm>
    #include <fstream>
    #include <iostream>
    #include <cstring>
    #include <cstdio>
    using namespace std;
    
    const int w_1m = 1000000;
    int w[w_1m];
    
    int binarySearch(int t, int low, int high)
    {
        //对排序后的有序数据进行二分查找
        while (low <= high)
        {
            int mid = low + (high - low) / 2;
            if (t < w[mid])high = mid - 1;
            else if (t > w[mid])low = mid + 1;
            else return mid;
        }
        return -1;
    }
    
    // brute -w whitelist < T
    int main(int argc, char* argv[])
    {
        if (argc != 3 || strcmp(argv[1], "-w"))
        {
            return 1;
        }
    
        // init w
        ////    for(int i=0;i<w_1m)
        ////    {
        ////        w[i]=-1; //填充非法数据
        ////    }
        ifstream infile;
        infile.open(argv[2]);
        int i = 0;
        cout << argv[2] << endl;
        while (infile >> w[i++])
        {
        }
        int w_length = i - 1;
        cout << w_length << endl;
        // check t
        int t = 0;
    
        sort(w, w + w_length);
        //对w中的数据进行排序
        while (cin >> t)
        {
            if (binarySearch(t, 0, w_length) != -1)
            {
                printf("%d", t);
            }
        }
    }
    

    git地址:https://github.com/hhwwxx11/better

    老杨在优化了代码之后,发现果然代码运行“快”了很多,很是得意。这时候你想“好人”做到底,顺水推舟一把。你说:“对优化后的代码再profile一下吧。”老杨与你意见一致。

    作业4(5分)

    对作业3优化后的代码进行profile,结果与作业2的结果做对比。画表格并文字说明。
    优化后的执行效果截图:

    很明显可以看出,优化之后颜色变浅了,运行时间也缩短了。

    最后,老杨发现了他原本代码的不足,并且对于你的引导表达了谢意。

    但是,你还是犹豫要不要录用老杨。因为你觉得老杨的文档(readme),注释和代码风格有很大的问题,并且给老杨指了出来。

    作业5(5分)

    你觉得老杨的文档(readme),注释和代码风格又哪些问题,该如何改进?
    (1)代码注释比较混乱,有的是//,有的是////。
    (2)每一个函数都应标明各自的作用,这样会让读者对程序有更好的理解。
    (3)应该把没用的代码删除
    (4)注释尽量用中文来说明

    面试结束了,你和老杨握手,对他说出了面试的结果。你说的内容,不是今天的作业题,也许是若干年以后你想对当年教你的教师说的,也许是你希望未来的面试官对你说的。你想说的是什么呢?
    以后还是要注意一下优化问题,会节省很多运行时间,继续加油!

  • 相关阅读:
    leetcode204-统计质数个数之一步步调试超时
    SpringBoot-注解一句话
    算法-总结规律
    kafka-版本变更相关
    异步线程池如何做同步业务
    es-快捷DSL检索手记
    并发学习第七篇——ThreadPoolExecutor
    kafka-consumer端的设计细节
    kafka-producer使用总结
    kafka-topic重要配置分析
  • 原文地址:https://www.cnblogs.com/houwx744/p/13715664.html
Copyright © 2011-2022 走看看