PTA 模拟，【放着一定要写哈哈哈哈哈】（据说用string哟） - 走看看

zoukankan html css js c++ java

PTA 模拟，【放着一定要写哈哈哈哈哈】（据说用string哟）

实现一种简单原始的文件相似度计算，即以两文件的公共词汇占总词汇的比例来定义相似度。为简化问题，这里不考虑中文（因为分词太难了），只考虑长度不小于3、且不超过10的英文单词，长度超过10的只考虑前10个字母。

输入格式:

输入首先给出正整数NNN（≤100le 100≤100），为文件总数。随后按以下格式给出每个文件的内容：首先给出文件正文，最后在一行中只给出一个字符#，表示文件结束。在NNN个文件内容结束之后，给出查询总数MMM（≤104le 10^4≤10
4
），随后MMM行，每行给出一对文件编号，其间以空格分隔。这里假设文件按给出的顺序从1到NNN编号。

输出格式:

针对每一条查询，在一行中输出两文件的相似度，即两文件的公共词汇量占两文件总词汇量的百分比，精确到小数点后1位。注意这里的一个“单词”只包括仅由英文字母组成的、长度不小于3、且不超过10的英文单词，长度超过10的只考虑前10个字母。单词间以任何非英文字母隔开。另外，大小写不同的同一单词被认为是相同的单词，例如“You”和“you”是同一个单词。

输入样例:
3
Aaa Bbb Ccc
#
Bbb Ccc Ddd
#
Aaa2 ccc Eee
is at Ddd@Fff
#
2
1 2
1 3

输出样例:
50.0%
33.3%

查看全文

相关阅读:
洛谷P5113 Sabbat of the witch
「学习笔记」洲阁筛
 【UNR #3】百鸽笼
 LOJ#6703. 小 Q 的序列
 python数组字符串还原为数组
 QGIS导入excel点数据
 QGIS统计面要素中包含的点要素数量
 gpd.read_file()，报错路径在系统文件中不存在
 QGIS平移要素
 QGIS多部件面转单部件面

原文地址：https://www.cnblogs.com/keyboarder-zsq/p/5934476.html

Copyright © 2011-2022 走看看