zoukankan      html  css  js  c++  java
  • PTA 模拟,【放着一定要写哈哈哈哈哈】(据说用string哟)

    实现一种简单原始的文件相似度计算,即以两文件的公共词汇占总词汇的比例来定义相似度。为简化问题,这里不考虑中文(因为分词太难了),只考虑长度不小于3、且不超过10的英文单词,长度超过10的只考虑前10个字母。

    输入格式:

    输入首先给出正整数NNN(≤100le 100≤100),为文件总数。随后按以下格式给出每个文件的内容:首先给出文件正文,最后在一行中只给出一个字符#,表示文件结束。在NNN个文件内容结束之后,给出查询总数MMM(≤104le 10^4≤10
    ​4
    ​​),随后MMM行,每行给出一对文件编号,其间以空格分隔。这里假设文件按给出的顺序从1到NNN编号。

    输出格式:

    针对每一条查询,在一行中输出两文件的相似度,即两文件的公共词汇量占两文件总词汇量的百分比,精确到小数点后1位。注意这里的一个“单词”只包括仅由英文字母组成的、长度不小于3、且不超过10的英文单词,长度超过10的只考虑前10个字母。单词间以任何非英文字母隔开。另外,大小写不同的同一单词被认为是相同的单词,例如“You”和“you”是同一个单词。

    输入样例:
    3
    Aaa Bbb Ccc
    #
    Bbb Ccc Ddd
    #
    Aaa2 ccc Eee
    is at Ddd@Fff
    #
    2
    1 2
    1 3

    输出样例:
    50.0%
    33.3%

  • 相关阅读:
    pthread_key_t和pthread_key_create()详解
    oracle的时间
    spring加载bean报错:expected at least 1 bean which qualifies as autowire candidate. Dependency annotations: {}
    MyBatis调用存储过程
    java的时间
    java的日期
    java中的多态
    笔记本设置wifi热点并抓包
    WiresShark使用说明
    HTTP协议概述
  • 原文地址:https://www.cnblogs.com/keyboarder-zsq/p/5934476.html
Copyright © 2011-2022 走看看