作业要求中已有的内容将不再回答,在博客或群中已解答的问题将不再回答。
-
Java 版本要求
- JDK 1.8
-
Java 对包管理器的支持情况,是否允许使用Maven / Gradle等
- 不支持包管理器,但在符合组织目录要求的情况下允许引用第三方库,必须可编译,如按包路径复制class文件等
-
C++ 编译参数,包括但不限于是否开启编译优化、使用字符集、target msvcrt等
- 使用VS的自带脚本vcvarsall.bat进行编译
-
C++ 对包管理器的支持情况,是否允许使用NuGet / vcpkg等
- 不支持包管理器,但在符合组织目录要求的情况下允许引用第三方库,必须可编译,如直接复制源代码等
-
输出格式换行符选用格式, 或
-
空白字符的定义
- ASCII中的33个控制字符和空格(0-32、127)
-
换行符字符数如何计算
- 换行符记为一个," "作为字符串记为四个
-
爬虫测试要求
- 爬虫部分不与wordcount一起测试,可自由发挥,具体请看作业要求
-
尾行输出要求
- 评测会自动去除尾行空白
-
输出格式修正
- 基本需求和进阶需求中的词频统计的输出中,格式应为"<word word>",单词或词组与尖括号间无空格
-
进阶需求测试数据
- 进阶需求的测试数据就是cvpr2018的论文列表爬取结果。
-
几个合法单词中夹杂着不合法单词,如何判定词组
- 比如:used in many computer(m=3时)由于in不是合法单词,故此时没有满足条件的词组
-
两个单词中穿插多个分隔符,还是一个词组吗
- 比如:answer the question("orange") (m=2时),这时只有1个合法词组 question("orange
-
几个合法单词组成词组输出时包含分隔符吗
- 比如上例,输出为<question("orange>:1
- 即输出的词组是单词+分隔符+单词+……+单词+分隔符
测试样例
换行符为 (CRLF)
压缩文件:测试样例