zoukankan      html  css  js  c++  java
  • 全文检索

    全文检索

    Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)
    Total Submission(s): 1048    Accepted Submission(s): 324


    Problem Description
    我们大家经常用google检索信息,但是检索信息的程序是很困难编写的;现在请你编写一个简单的全文检索程序。
    问 题的描述是这样的:给定一个信息流文件,信息完全有数字组成,数字个数不超过60000个,但也不少于60个;再给定一个关键字集合,其中关键字个数不超 过10000个,每个关键字的信息数字不超过60个,但也不少于5个;两个不同的关键字的前4个数字是不相同的;由于流文件太长,已经把它分成多行;请你 编写一个程序检索出有那些关键字在文件中出现过。
     
    Input
    第一行是两个整数M,N;M表示数字信息的行数,N表示关键字的个数;接着是M行信息数字,然后是一个空行;再接着是N行关键字;每个关键字的形式是:[Key No. 1] 84336606737854833158。
     
    Output
    输出只有一行,如果检索到有关键字出现,则依次输出,但不能重复,中间有空格,形式如:Found key: [Key No. 9] [Key No. 5];如果没找到,则输出形如:No key can be found !。
     
    Sample Input
    20 10
    646371829920732613433350295911348731863560763634906583816269
    637943246892596447991938395877747771811648872332524287543417
    420073458038799863383943942530626367011418831418830378814827
    679789991249141417051280978492595526784382732523080941390128
    848936060512743730770176538411912533308591624872304820548423
    057714962038959390276719431970894771269272915078424294911604
    285668850536322870175463184619212279227080486085232196545993
    274120348544992476883699966392847818898765000210113407285843
    826588950728649155284642040381621412034311030525211673826615
    398392584951483398200573382259746978916038978673319211750951
    759887080899375947416778162964542298155439321112519055818097
    642777682095251801728347934613082147096788006630252328830397
    651057159088107635467760822355648170303701893489665828841446
    069075452303785944262412169703756833446978261465128188378490
    310770144518810438159567647733036073099159346768788307780542
    503526691711872185060586699672220882332373316019934540754940
    773329948050821544112511169610221737386427076709247489217919
    035158663949436676762790541915664544880091332011868983231199
    331629190771638894322709719381139120258155869538381417179544
    000361739177065479939154438487026200359760114591903421347697
    [Key No. 1] 934134543994403697353070375063
    [Key No. 2] 261985859328131064098820791211
    [Key No. 3] 306654944587896551585198958148
    [Key No. 4]338705582224622197932744664740
    [Key No. 5] 619212279227080486085232196545
    [Key No. 6]333721611669515948347341113196
    [Key No. 7] 558413268297940936497001402385
    [Key No. 8] 212078302886403292548019629313
    [Key No. 9] 877747771811648872332524287543
    [Key No. 10] 488616113330539801137218227609
     
    Sample Output
    Found key: [Key No. 9] [Key No. 5]
    题目大意:给定一段长数字串和一组短的数字串,问哪些短串在长串中出现过。
     
    Trie  树
      1 #include <iostream>
      2 #include <cstdio>
      3 #include <cstring>
      4 #include <cmath>
      5 #include <algorithm>
      6 #include <string>
      7 #include <vector>
      8 #include <stack>
      9 #include <queue>
     10 #include <set>
     11 #include <map>
     12 #include <iomanip>
     13 #include <cstdlib>
     14 using namespace std;
     15 const int INF=0x5fffffff;
     16 const int MS=100005;
     17 const double EXP=1e-8;
     18 
     19 struct node
     20 {
     21      int id;
     22     //bool have;
     23     node * next[10];
     24 }nodes[MS*10];   //注意这个大小  尽量大一点
     25 
     26 node *root;
     27 bool flag;
     28 int cnt;
     29 
     30 char text[MS];
     31 char key[100];
     32 bool mark[MS/10];
     33 node * add_node(int c)
     34 {
     35     node *p=&nodes[c];
     36     for(int i=0;i<10;i++)
     37         p->next[i]=NULL;
     38    // p->have=false;
     39     p->id=-1;
     40     return p;
     41 }
     42 
     43 void insert(char *str,int no)
     44 {
     45     node *p=root,*q;
     46     int len=strlen(str);
     47     for(int i=0;i<len;i++)
     48     {
     49         int id=str[i]-'0';
     50         if(p->next[id]==NULL)
     51         {
     52             q=add_node(cnt++);
     53             p->next[id]=q;
     54         }
     55         p=p->next[id];
     56     }
     57     p->id=no;
     58 }
     59 void search(char *str)
     60 {
     61     node *p=root;
     62     int len=strlen(str);
     63     for(int i=0;i<len;i++)
     64     {
     65         int id=str[i]-'0';
     66         p=p->next[id];
     67         if(p==NULL)
     68             return ;
     69         if(p->id!=-1&&mark[p->id]==false)
     70         {
     71             if(!flag)
     72             {
     73                 printf("Found key: [Key No. %d]",p->id);
     74                 flag=true;
     75                 mark[p->id]=true;
     76             }
     77             else
     78             {
     79                 printf(" [Key No. %d]",p->id);
     80                 mark[p->id]=true;
     81             }
     82         }
     83     }
     84 }
     85 
     86 int main()
     87 {
     88     int n,m,i,j,k=0;
     89     scanf("%d %d",&n,&m);
     90     char tstr[MS/100];
     91     flag=false;
     92     memset(mark,false,sizeof(mark));
     93     cnt=0;
     94     root=add_node(cnt++);
     95     for(i=0;i<n;i++)
     96     {
     97         scanf("%s",tstr);
     98         int len=strlen(tstr);   //用strcat更好。
     99         for(j=0;j<len;j++)
    100             text[k++]=tstr[j];
    101     }
    102     text[k]='';
    103     //getchar();  //可以加也可以不加,因为scanf()可以跳过换行符
    104     for(i=0;i<m;i++)
    105     {
    106         scanf("%s%s%s%s",tstr,tstr,tstr,key);
    107         insert(key,i+1);
    108     }
    109     for(i=0;i<k-4;i++)
    110     {
    111         search(text+i);
    112     }
    113     if(!flag)
    114         printf("No key can be found !
    ");
    115     else
    116         printf("
    ");
    117     return 0;
    118 }
  • 相关阅读:
    LightOJ 1300 边双联通分量+交错路染色
    HDU 6143 快速幂,组合数
    windows 下fc工具
    HDU 6136 模拟
    HDU 6129 暴力,规律
    UVA Live 7770 模拟
    1096: [ZJOI2007]仓库建设
    1191: [HNOI2006]超级英雄Hero
    3224: Tyvj 1728 普通平衡树
    1208: [HNOI2004]宠物收养所
  • 原文地址:https://www.cnblogs.com/767355675hutaishi/p/4304651.html
Copyright © 2011-2022 走看看