最短摘要 - 走看看

zoukankan html css js c++ java

最短摘要
转自：http://blog.csdn.net/huangxy10/article/details/8087035

2011年题目：

Alibaba笔试题：

给定一段产品的英文描述，包含M个英文字母，每个英文单词以空格分隔，无其他标点符号；再给定N个英文单词关键字，请说明思路并编程实现方法String extractSummary(String description,String[] key words)，目标是找出此产品描述中包含N个关键字（每个关键词至少出现一次）的长度最短的子串，作为产品简介输出。（不限编程语言）20分。

人搜面试题：

1、求包含所有query的最短距离

一篇文章，切完词之后放到一个vector<string>中，一个查询切完词也放到一个vector<string>中，写一个函数找出这篇文章中包含这个查询中所有词的最小区间的i和j。只要返回第一个即可。

解答：

这道笔试题和编程之美最短摘要生成的方法类似，先来看看这些序列：

w0,w1,w2,w3,q0,w4,w5,q1,w6,w7,w8,q0,w9,q1

问题在于，如何一次把所有的关键词都扫描到，并且不遗漏。扫描肯定是无法避免的，但是如何把两次扫描的结果联系起来呢？这是一个值得考虑的问题。

沿用前面的扫描方法，再来看看。第一次扫描的时候，假设需要包含所有的关键词，从第一个位置w0处将扫描到w6处：

w0,w1,w2,w3,q0,w4,w5,q1,w6,w7,w8,q0,w9,q1

那么，下次扫描应该怎么办呢？先把第一个被扫描的位置挪到q0处。

w0,w1,w2,w3,q0,w4,w5,q1,w6,w7,w8,q0,w9,q1

然后把第一个被扫描的位置继续往后面移动一格，这样包含的序列中将减少了关键词q0。那么，我们便可以把第二个扫描位置往后移，这样就可以找到下一个包含所有关键词的序列。即从w4扫描到w9处，便包含了q1，q0：

w0,w1,w2,w3,q0,w4,w5,q1,w6,w7,w8,q0,w9,q1

这样，问题就和第一次扫描时碰到的情况一样了。依次扫描下去，在w中找出所有包含q的序列，并且找出其中的最小值，就可得到最终的结果。
[cpp] view plain copy print ?

#include <iostream>

#include <vector>

#include <string>

#include <set>

using namespace std;



bool FindShortestAbstract( const vector<string> & doc, const set<string> & query, int &a, int &b){

    set<string> notFind(query.begin(), query.end());

    a=0;b=0;

    int i=0,j=0;

    int shortest=0;

    int len= doc.size();

    while( i<len&&j<len ){

        set<string>::iterator it = notFind.find( doc[j++] );

        if( it!=notFind.end()) {             //如果找到了，则删除

            notFind.erase( it  );

        }

        if( notFind.empty() ){                //如果全部找到

            while( query.find(doc[i++])==query.end() ); //寻找第一个出现的query

            if( i>0 ){

                notFind.insert( doc[i-1] );

                if( shortest>j-i||shortest==0 )

                    shortest = j-i;        //记录最小距离

                    a=i-1;b=j-1;

            }

        }

    }

    if( shortest==0 )

        return false;

    return true;

}



int main(){

    string doc[]={"I", "love", "you", "and", "me", "do", "you", "like" , "me"};

    string query[]={ "you", "like", "me"};

    vector<string> d(doc,doc+sizeof(doc)/sizeof(string));

    set<string> q(query, query+sizeof(query)/sizeof(string));

    int a=0,b=0;

    FindShortestAbstract( d,q,a,b);

    cout <<a<<endl<<b<<endl;

    return 0;

}
微信公众号：猿人谷
如果您认为阅读这篇博客让您有些收获，不妨点击一下右下角的【推荐】
如果您希望与我交流互动，欢迎关注微信公众号
本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接。
查看全文

相关阅读:
Vue cmd命令操作
 迭代器和生成器
 10-外键的变种三种关系
 09-完整性约束
 08-数据类型(2)
07-数据类型
 06-表的操作
 05-库的操作
 04-基本的mysql语句
 03-MySql安装和基本管理

原文地址：https://www.cnblogs.com/heyonggang/p/2817090.html