zoukankan      html  css  js  c++  java
  • 机器翻译

    题面

    小晨的电脑上安装了一个机器翻译软件,他经常用这个软件来翻译英语文章。

    这个翻译软件的原理很简单,它只是从头到尾,依次将每个英文单词用对应的中文含义来替换。

    对于每个英文单词,软件会先在内存中查找这个单词的中文含义,如果内存中有,软件就会用它进行翻译;如果内存中没有,软件就会在外存中的词典内查找,查出单词的中文含义然后翻译,并将这个单词和

    译义放入内存,以备后续的查找和翻译。

    假设内存中有M个单元,每单元能存放一个单词和译义。

    每当软件将一个新单词存入内存前,如果当前内存中已存入的单词数不超过M−1,软件会将新单词存入一个未使用的内存单元;若内存中已存入M个单词,软件会清空最早进入内存的那个单词,腾出单元来,存放新单词。

    假设一篇英语文章的长度为N个单词。

    给定这篇待译文章,翻译软件需要去外存查找多少次词典?

    假设在翻译开始前,内存中没有任何单词。

    输入格式
    输入文件共2行,每行中两个数之间用一个空格隔开。

    第一行为两个正整数M和N,代表内存容量和文章的长度。

    第二行为N个非负整数,按照文章的顺序,每个数(大小不超过1000)代表一个英文单词。

    文章中两个单词是同一个单词,当且仅当它们对应的非负整数相同。

    输出格式

    输出文件共1行,包含一个整数,为软件需要查词典的次数。

    数据范围

    (0<M≤100)
    (0<N≤1000)

    输入样例:
    3 7
    1 2 1 5 4 4 1
    
    输出样例:
    5
    

    算法

    (模拟,队列) (O(N))
    这道题是让我们实现一个先进先出的缓存机制。

    数据的存储:

    由于是先进先出,所以我们可以用循环队列来维护缓存中的所有单词,这里可以用C++STL中的queue。
    (bool)数组存储每个单词是否已经在队列中,这样就可以用 (O(1))的时间判断每个单词是否已在缓存中了。
    从前往后依次处理文章中的每个单词,然后分情况处理:

    • 如果 (x) 已在缓存中,不需要做其他处理;

    • 如果 (x) 不在缓存中:

      • 如果队列不满,将 (x) 插入队尾;

      • 如果队列已满,将队头弹出,然后将 (x) 插入队尾;

        时间复杂度分析
        依次对每个单词处理一遍,每次处理时只有常数次操作,所以总时间复杂度是 (O(N)),其中 (N) 是单词个数。

    代码

    #include <iostream>
    #include <queue>
    using namespace std;
    const int N = 1010;
    int m, n;
    bool st[N];
    int main()
    {
        cin >> m >> n;
        queue<int> q;
        int res = 0;
        for (int i = 0; i < n; i ++ )
        {
            int x;
            cin >> x;
            if (!st[x])
            {
                if (q.size() == m)
                {
                    int t = q.front();
                    st[t] = false;
                    q.pop();
                }
                q.push(x);
                st[x] = true;
                res ++ ;
            }
        }
        cout << res << endl;
        return 0;
    }
    
  • 相关阅读:
    POJ 3268——Silver Cow Party——————【最短路、Dijkstra、反向建图】
    POJ 1797 ——Heavy Transportation——————【最短路、Dijkstra、最短边最大化】
    POJ 2253 ——Frogger——————【最短路、Dijkstra、最长边最小化】
    HDU 5505——GT and numbers——————【素数】
    int,long,long long的数据范围
    HDU 5501——The Highest Mark——————【贪心+dp】
    UVALive 4262——Trip Planning——————【Tarjan 求强连通分量个数】
    随手记
    工作流引擎资料/产品收集
    Vim 学习指南
  • 原文地址:https://www.cnblogs.com/bangdexuanyuan/p/14400471.html
Copyright © 2011-2022 走看看