zoukankan      html  css  js  c++  java
  • CCF 201803-3 URL映射

    CCF 201803-3  URL映射

    试题编号: 201803-3
    试题名称: URL映射
    时间限制: 1.0s
    内存限制: 256.0MB
    问题描述:
    问题描述
      URL 映射是诸如 Django、Ruby on Rails 等网页框架 (web frameworks) 的一个重要组件。对于从浏览器发来的 HTTP 请求,URL 映射模块会解析请求中的 URL 地址,并将其分派给相应的处理代码。现在,请你来实现一个简单的 URL 映射功能。
      本题中 URL 映射功能的配置由若干条 URL 映射规则组成。当一个请求到达时,URL 映射功能会将请求中的 URL 地址按照配置的先后顺序逐一与这些规则进行匹配。当遇到第一条完全匹配的规则时,匹配成功,得到匹配的规则以及匹配的参数。若不能匹配任何一条规则,则匹配失败。
      本题输入的 URL 地址是以斜杠 / 作为分隔符的路径,保证以斜杠开头。其他合法字符还包括大小写英文字母、阿拉伯数字、减号 -、下划线 _ 和小数点 .。例如,/person/123/ 是一个合法的 URL 地址,而 /person/123? 则不合法(存在不合法的字符问号 ?)。另外,英文字母区分大小写,因此 /case/ 和 /CAse/ 是不同的 URL 地址。
      对于 URL 映射规则,同样是以斜杠开始。除了可以是正常的 URL 地址外,还可以包含参数,有以下 3 种:
      字符串 <str>:用于匹配一段字符串,注意字符串里不能包含斜杠。例如,abcde0123。
      整数 <int>:用于匹配一个不带符号的整数,全部由阿拉伯数字组成。例如,01234。
      路径 <path>:用于匹配一段字符串,字符串可以包含斜杠。例如,abcd/0123/。
      以上 3 种参数都必须匹配非空的字符串。简便起见,题目规定规则中 <str> 和 <int> 前面一定是斜杠,后面要么是斜杠,要么是规则的结束(也就是该参数是规则的最后一部分)。而 <path> 的前面一定是斜杠,后面一定是规则的结束。无论是 URL 地址还是规则,都不会出现连续的斜杠。
    输入格式
      输入第一行是两个正整数 n 和 m,分别表示 URL 映射的规则条数和待处理的 URL 地址个数,中间用一个空格字符分隔。
      第 2 行至第 n+1 行按匹配的先后顺序描述 URL 映射规则的配置信息。第 i+1 行包含两个字符串 pi 和 ri,其中 pi 表示 URL 匹配的规则,ri 表示这条 URL 匹配的名字。两个字符串都非空,且不包含空格字符,两者中间用一个空格字符分隔。
      第 n+2 行至第 n+m+1 行描述待处理的 URL 地址。第 n+1+i 行包含一个字符串 qi,表示待处理的 URL 地址,字符串中不包含空格字符。
    输出格式
      输入共 m 行,第 i 行表示 qi 的匹配结果。如果匹配成功,设匹配了规则 pj ,则输出对应的 rj。同时,如果规则中有参数,则在同一行内依次输出匹配后的参数。注意整数参数输出时要把前导零去掉。相邻两项之间用一个空格字符分隔。如果匹配失败,则输出 404。
    样例输入
    5 4
    /articles/2003/ special_case_2003
    /articles/<int>/ year_archive
    /articles/<int>/<int>/ month_archive
    /articles/<int>/<int>/<str>/ article_detail
    /static/<path> static_serve
    /articles/2004/
    /articles/1985/09/aloha/
    /articles/hello/
    /static/js/jquery.js
    样例输出
    year_archive 2004
    article_detail 1985 9 aloha
    404
    static_serve js/jquery.js
    样例说明
      对于第 1 个地址 /articles/2004/,无法匹配第 1 条规则,可以匹配第 2 条规则,参数为 2004。
      对于第 2 个地址 /articles/1985/09/aloha/,只能匹配第 4 条规则,参数依次为 1985、9(已经去掉前导零)和 aloha。
      对于第 3 个地址 /articles/hello/,无法匹配任何一条规则。
      对于第 4 个地址 /static/js/jquery.js,可以匹配最后一条规则,参数为 js/jquery.js。
    数据规模和约定
      1 ≤ n ≤ 100,1 ≤ m ≤ 100。
      所有输入行的长度不超过 100 个字符(不包含换行符)。
      保证输入的规则都是合法的。
    /*
    70分(数据水?)
    分享一下完全错误的思路
    1、将每条规则以‘/’为分割符拆分成单词,每个单词hash成值v,然后构建trie树
    2、匹配可是直接构建fail树,AC自动机优先匹配,因为构建的trie节点有先后顺序。
    匹配到第一个直接break,输出。
    由于年久忘记,代码难度颇高,匹配直接使用dfs暴力匹配。
    
    以上做法是错的!!!
    非常容易给出反例,见代码最后 
    */
    #include<bits/stdc++.h>
    #define debug(x) cerr<<#x<<" "<<x<<endl;
    using namespace std;
    const int N=2e4+5;
    struct URL{
    //    string nam;
        unordered_map<string,int>next;
    }d[N];int n,m,rt,tot,cnt,f1[N],f2[N],Slip[N]; 
    string s[N],chr[N],rec[N];int ret;bool tag[N];
    char str[N],str2[N],tmp[N];
    void SplitStr(int &cnt,string *s,int &slip){
        cnt=0;
        int xn(0),len=strlen(str);
        if(str[len-1]!='/') slip=0,str[len]='/',str[++len]=0;else slip=1;
        for(int i=1;i<len;i++){
            if(str[i]=='/') xn++;
        }
        char *p1=str+1,*p2;
        for(int i=0;i<xn;i++){
            p2=strchr(p1,'/');
            strncpy(tmp,p1,p2-p1);
            tmp[p2-p1]=0;
            s[++cnt]=tmp;
            p1=p2+1;
        }
    }
    void dealStr(int &cnt,string *s,int &slip){
        scanf("%s%s",str,str2);
        SplitStr(cnt,s,slip);
        s[++cnt]=str2;
    } 
    void build(int len,string *s,int &slip){
        int now=0;
        for(int i=1;i<len;i++){
            string &x=s[i];
            if(!d[now].next[x]) d[now].next[x]=++tot;
            now=d[now].next[x];
        }
        if(!tag[now]){
            tag[now]=1;
            chr[now]=s[len];
            Slip[now]=slip;
        }
            
    }
    bool judgeNum(const string &s){
        int l=s.length();
        for(int i=0;i<l;i++) if(s[i]>'9'||s[i]<'0') return 0;
        return 1;
    }
    int flag;
    #define mp make_pair
    #define fi first
    #define se second
    void dfs(int now,int cur,int len,string *s,int spe){
        if(cur>len){
            if(chr[now]!=""){
                flag=1;
                cout<<chr[now]<<(ret?" ":"
    ");
                for(int j=1;j<=ret;j++) cout<<rec[j]<<(j!=ret?" ":"
    ");
            } 
            return ;
        }
        if(flag) return ;
        int cct=0;pair<int,string> GoNext[10];string &x=s[cur];
        if(d[now].next[x]) GoNext[++cct]=mp(d[now].next[x],x);
        if(judgeNum(x)&&d[now].next["<int>"]) GoNext[++cct]=mp(d[now].next["<int>"],"<int>");
        if(d[now].next["<str>"]) GoNext[++cct]=mp(d[now].next["<str>"],"<str>");
        if(d[now].next["<path>"]) GoNext[++cct]=mp(d[now].next["<path>"],"<path>");
        sort(GoNext+1,GoNext+cct+1);
        for(int i=1;i<=cct;i++){
            if(flag) return ;
            if(GoNext[i].se=="<path>"){
                flag=2;
                cout<<chr[GoNext[i].fi]<<" ";
                for(int j=1;j<=ret;j++) cout<<rec[j]<<" ";
                for(int j=cur;j<=len;j++)
                    cout<<s[j]<<(j!=len?"/":spe?"/
    ":"
    ");
                return ;
            }
            bool pp=0;
            if(GoNext[i].se!=x){
                if(judgeNum(x)&&GoNext[i].se=="<int>"){
                    char ch[20];
                    itoa(atoi(x.c_str()),ch,10);
                    rec[++ret]=ch;
                } 
                else rec[++ret]=x;
                pp=1;
            }
            if(cur==len){
                if(spe^Slip[GoNext[i].fi]){
                    if(pp) ret--;continue;
                }
            }
            dfs(GoNext[i].fi,cur+1,len,s,spe);
            if(pp) ret--;
        } 
    } 
    int main(){
        scanf("%d%d",&n,&m);
        for(int i=1;i<=n;i++){
            dealStr(cnt,s,f1[i]);
            build(cnt,s,f1[i]);
        }
        for(int i=1;i<=m;i++){
            scanf("%s",str);
            SplitStr(cnt,s,f2[i]);
            flag=0;ret=0;dfs(0,1,cnt,s,f2[i]);
            if(!flag) cout<<"404
    ";
        } 
        return 0; 
    }
    /*
    6 3
    /-/<int> JHDNTOKO
    /h_H/<int>/<str>/- ICE
    /<str>/shen.txt/<str> I
    /<path> OE
    /<str>/H_h/<path> TZ
    /<str>/ XBFOTLZGVO
    /h_H/
    /h_H/01231ok
    /3.1415926
    */
    70分错误代码

    解法:使用正则匹配

    //100分 0ms    580.0KB
    #include<iostream>
    #include<regex>
    using namespace std;
    int n,m;string p,r;
    inline bool isStringDigit(const string &s){
        for(char c:s) if(c<'0'||c>'9') return 0;
        return 1;
    }
    int main(){
        cin>>n>>m;
        vector<pair<string,regex>>rules;//存储URL规则,映射为规则名->规则的正则表达式
        vector<pair<regex,string>>trans={
    //        {regex("<int>"),"([0-9]+)"},{regex("<str>"),"([^/]+)"},{regex("<path>"),"(.+)"}
            {regex("<int>"),"(\d+)"},{regex("<str>"),"(\w+)"},{regex("<path>"),"(.+)"}
        };
        while(n--){
            cin>>p>>r;
            for(auto&i:trans)
                p=regex_replace(p,i.first,i.second);//将规则转换为对应的正则表达式
            rules.push_back({r,regex(p)});//按输入顺序压入rules中
        }
        smatch result;
        while(m--){
            cin>>p;
            for(auto &i:rules)//对每条规则逐一进行匹配
                if(regex_match(p,result,i.second)){//匹配成功
                    printf("%s",i.first.c_str());//输出规则名
                    for(auto i=1;i<=result.size();++i){//遍历每一个匹配到的元组
                        p=result.str(i).c_str();
                        if(p!=""&&isStringDigit(p))//是整数
                            printf(" %d",stoi(p));//输出转换后的整数,这里自动去除了前导0
                        else
                            printf(" %s",p.c_str());//输出
                    }
                    puts("");//换行
                    goto loop;//匹配成功,直接匹配下一个URL地址
                }
            puts("404");//没有匹配到任何一个规则,输出404
            loop:;
        }
        return 0;
    }
  • 相关阅读:
    [原创]iFPGACable FT2232H JTAG & UART调试器
    [原创]创芯电子实验室iFPGACable JTAG工具实物图
    [原创]FPGA JTAG工具设计(一)
    [方案]基于Zynq WiFi方案构建
    [原创]基于Zynq Linux环境搭建(四)
    [原创]基于Zynq Linux环境搭建(二)
    [原创]基于Zynq Linux环境搭建(三)
    [原创]Zynq AXICDMA测试结果
    [原创]基于Zynq Linux环境搭建(一)
    git使用教程及github远程仓库管理
  • 原文地址:https://www.cnblogs.com/shenben/p/11845930.html
Copyright © 2011-2022 走看看