zoukankan      html  css  js  c++  java
  • 什么是伪静态,以及ubuntu + apache 如何实现伪静态

    原文链接:http://www.cnblogs.com/ainiaa/archive/2010/07/25/1784564.html

    php伪静态

    一直在做php的开发工作.在开发的过程中老早就听说了“伪静态”这一说。但是一直没有对其进行了解。

    今天终于下定决定 要好好的了解下这方面的内容。

    首先,什么是伪静态:

    伪静态又名URL重写,是动态的网址看起来像静态的网址。换句话说就是,动态网页通过重写 URL 方法实现去掉动态网页的参数,但在实际的网页目录中并没有必要实现存在重写的页面。

    另外在补充两个名词解析

    静态网址:纯静态HTML文档,能使用filetype:htm 查询到的网页

    动态网址:内容存于数据库中,根据要求显示内容,URL中以 ? # & 显示不同的参数,如:news.php?lang=cn&class=1&id=2

    动态、静态、伪静态之间的利与弊(新)

    动态网址

    首先,动态网址目前对于Google来说,“不能被抓取”的说法是错误的,Google能够很好的处理动态网址并顺利抓取;其次“参数不能超过3个”的说法也不正确,Google能够抓取参数超过3个的动态网址,不过,为了避免URL太长应尽量减少参数。

    其次,动态网址有其一定的优势,以上面所说的 news.php?lang=cn&class=1&id=2 为例,网址中的参数准确的告诉Google,此URL内容语言为cn、隶属于分类1、内容ID为2,更便于Google对内容的识别处理。

    最后,动态网址应尽量精简,特别是会话标识(sid)和查询(query)参数,容易造成大量相同页面。

    静态网址

    首先,静态网址具有的绝对优势是其明晰,/product/nokia/n95.html和/about.html可以很容易被理解,从而在搜索结果中可能点击量相对较高。

    其次,静态网址未必就是最好的网址形式,上述动态网址中说到,动态网址能够告诉Google一些可以识别的参数,而静态网址如果文档布置不够恰当(如:过于扁平化,将HTML文档全放在根目录下)及其他因素,反而不如静态网址为Google提供的参考信息丰富。

    最后,樂思蜀觉得Google此文中是否有其隐藏含义?“更新此种类型网址的页面会比较耗费时间,尤其是当信息量增长很快时,因为每一个单独的页面都必须更改编译代码。”虽然所说的是网站,但在Google系统中是否同样存在这样的问题呢?

    伪静态网址

    首先,伪静态网址不能让动态网址“静态化”,伪静态仅仅是对动态网址的一个重写,Google不会认为伪静态就是HTML文档。

    其次,伪静态可取,但应把重心放在去除冗余参数、规范URL、尽可能的避免重复页上。

    最后,伪静态有很大潜大危险,最好在对网站系统、网站结构、内容分布、参数意义熟悉的情况下使用。

    在写伪静态规则时,应保留有价值的参数,不要将有价值的参数全部精简掉,如前面例子中的 news.php?lang=cn&class=1&id=2 最好重写为 news-cn-class1-id2.html,而不是过份精简重写为 news-2.html。

    再就是伪静态中一定不能包含会话标识(sid)和查询(query)参数,/product.asp?sid=98971298178906& amp;id=1234 这样的动态网址,其中的sid本来Google能够识别并屏蔽,但如果重写为 /product/98971298178906/1234,Google不但无法识别,还在整站中造成无限重复页面(每个会话都会产生一个新的会话 ID)。

    我们应该选择伪静态还是真静态

          1、使用真静态和假静态对SEO来说没有什么区别

      2、使用真静态可能将导致硬盘损坏并将影响论坛性能

      3、使用伪静态将占用一定量的CPU占有率,大量使用将导致CPU超负荷

      4、最重要的一点,我们要静态是为了SEO

      所以:

      1、使用真静态的方法可以直接排除了,因为无论怎么生成,对硬盘来说都是很伤的。

      2、既然真伪静态的效果一样,我们就可以选择伪静态了。

      3、但是伪静态大量使用会造成CPU超负荷。

      4、所以我们只要不大量使用就可以了。

      5、既然静态只是给SEO看的,我们只需要伪静态给SEO就行了,不需要给用户使用。

      6、所以我们只要在专门提供给SEO爬的Archiver中使用伪静态就可以了。

      7、谢谢大家耐心看我写的文章。

      8、有何不解的地方或是有不同的看法欢迎提出

    关于伪静态和真静态的评论  

          真正的静态化和伪静态还是有本质的区别的。为浏览用户处理一个纯粹html和一个调用多个数据的php在CPU的使用率方面明显前者少。记得原来有个人说 html下载硬盘读写频繁,他这么说好像读取数据库不用读写磁盘似的,何况还有一大堆缓存的零散php也是放在硬盘的,这些读取不用磁盘操作么?可笑。

      读取单个html+图片Flash等附件就可以实现的目的,何苦要读数据库又要读php缓存文件又要重新整合数据输出再+图片Flash等附件 这么大费周章呢?CMS首页不需要很多的互动的,论坛那一套不应该拿到这里来用,相反应该更多考虑的是:美观!兼容!信息的直观!性能!还有稳定!

    在转一个 php伪静态的实现四法(flymood: 没有试过):

    复制代码
    1 <?php
    2  //伪静态方法一
    3
    4 // localhost/php100/test.php?id|1@action|2
    5  $Php2Html_FileUrl = $_SERVER["REQUEST_URI"];
    6  echo $Php2Html_FileUrl."<br>";// /php100/test.php?id|1@action|2
    7  $Php2Html_UrlString = str_replace("?","",str_replace("/", "", strrchr(strrchr($Php2Html_FileUrl, "/"),"?")));
    8  echo $Php2Html_UrlString."<br>";// id|1@action|2
    9  $Php2Html_UrlQueryStrList = explode("@", $Php2Html_UrlString);
    10  print_r($Php2Html_UrlQueryStrList);// Array ( [0] => id|1 [1] => action|2 )
    11  echo "<br>";
    12  foreach($Php2Html_UrlQueryStrList as $Php2Html_UrlQueryStr)
    13 {
    14  $Php2Html_TmpArray = explode("|", $Php2Html_UrlQueryStr);
    15  print_r($Php2Html_TmpArray);// Array ( [0] => id [1] => 1 ) ; Array ( [0] => action [1] => 2 )
    16  echo "<br>";
    17  $_GET[$Php2Html_TmpArray[0]] = $Php2Html_TmpArray[1];
    18 }
    19  //echo '假静态:$_GET变量<br />';
    20  print_r($_GET); // Array ( [id|1@action|2] => [id] => 1 [action] => 2 )
    21  echo "<br>";22  echo "<hr>";23  echo $_GET[id]."<br>";// 124  echo $_GET[action];// 225  ?>26  
    复制代码
    复制代码
    1 <?php
    2  //伪静态方法二
    3
    4 // localhost/php100/test.php/1/2
    5  $filename = basename($_SERVER['SCRIPT_NAME']);
    6  echo $_SERVER['SCRIPT_NAME']."<br>";// /php100/test.php
    7  echo $filename."<br>";// test.php
    8  
    9  if(strtolower($filename)=='test.php'){
    10 if(!empty($_GET[id])){
    11 $id=intval($_GET[id]);
    12 echo $id."<br>";
    13 $action=intval($_GET[action]);
    14 echo $action."<br>";
    15 }else{
    16 $nav=$_SERVER['REQUEST_URI'];
    17 echo "1:".$nav."<br>";// /php100/test.php/1/2
    18   $script=$_SERVER['SCRIPT_NAME'];
    19 echo "2:".$script."<br>";// /php100/test.php
    20   $nav=ereg_replace("^$script","",urldecode($nav));
    21 echo $nav."<br>"; // /1/222   $vars=explode("/",$nav);23 print_r($vars);// Array ( [0] => [1] => 1 [2] => 2 )24   echo "<br>";25 $id=intval($vars[1]);26 $action=intval($vars[2]);27 }28 echo $id.'&'.$action;29 }30  ?>31  
    复制代码
    复制代码
    1 <?php
    2 //伪静态方法三
    3
    4
    5 function mod_rewrite(){
    6 global $_GET;
    7 $nav=$_SERVER["REQUEST_URI"];
    8 echo $nav."<br>";
    9 $script_name=$_SERVER["SCRIPT_NAME"];
    10 echo $script_name."<br>";
    11 $nav=substr(ereg_replace("^$script_name","",urldecode($nav)),1);
    12 echo $nav."<br>";
    13 $nav=preg_replace("/^.ht(m){1}(l){0,1}$/","",$nav);//这句是去掉尾部的.html或.htm
    14 echo $nav."<br>";
    15 $vars = explode("/",$nav);
    16 print_r($vars);
    17 echo "<br>";
    18 for($i=0;$i<Count($vars);$i+=2){
    19 $_GET["$vars[$i]"]=$vars[$i+1];
    20 }
    21 return $_GET;
    22 }
    23 mod_rewrite();24 $year=$_GET["year"];//结果为'2006'25 echo $year."<br>";26 $action=$_GET["action"];//结果为'_add'27 echo $action;28 ?>29
    复制代码
    复制代码
    1 <?php
    2 //伪静态方法四
    3
    4 //利用server变量 取得PATH_INFO信息 该例中为 /1,100,8630.html 也就是执行脚本名后面的部分
    5 if(@$path_info =$_SERVER["PATH_INFO"]){
    6 //正则匹配一下参数
    7 if(preg_match("//(d+),(d+),(d+).html/si",$path_info,$arr_path)){
    8 $gid =intval($arr_path[1]); //取得值 1
    9 $sid =intval($arr_path[2]); //取得值100
    10 $softid =intval($arr_path[3]); //取得值8630
    11 }else die("Path:Error!");
    12 //相当于soft.php?gid=1&sid=100&softid=8630
    13 }else die('Path:Nothing!');
    14 ?>
    15
    复制代码

    如果不想使用php来实现伪静态,可是使用 apache,nginx,iis 等服务器自带的url rewrite 功能进行设置。

    这些文件写在哪里?文章并没有写清楚。不过这篇文章告诉我们:伪静态可以通过自己写php 来实现,也可以用apache 自带的url rewrite 功能设置。

     

    wordpress  检测伪静态的方法:

    http://www.wpdaxue.com/wordpress-rewriterule.html

    检测主机是否支持伪静态的方法:在WP后台 > 设置 > 固定链接,设置为 默认带?的那种结构,然后访问任何一篇文章,如果出现 404 错误,说明你的主机当前不支持 WordPress 伪静态。

    Apache 为wordpress设置伪静态规则

    1. 开启apache 支持伪静态的功能

    通过php提供的phpinfo()函数查看环境配置,通过Ctrl+F查找到“Loaded Modules”,其中列出了所有apache2handler已经开启的模块,如果里面包括“mod_rewrite”,则已经支持,不再需要继续设置。
    如 果没有开启“mod_rewrite

    方法:

    检查 /etc/httpd/conf/httpd.conf 中是否存在以下两段代码 (具体路径可能会有所不同,但形式基本是一样的):

    flymood: 注意,
    (一)LoadModule rewrite_module libexec/mod_rewrite.so
    (二)AddModule mod_rewrite.c
    检查Apache是否开启.htaccess支持
    vi  /etc/httpd/conf/httpd.conf  

      修改httpd.conf文件 
      Options FollowSymLinks
      AllowOverride None
      改为
      Options FollowSymLinks
      AllowOverride All

    AllowOverride All   #如果后面参数为None需要修改为All(大概在338行)

    以上设置都是windows 下的apache的用户配置都是放在http.conf文件中,要开启Rewrite功能,只需要把该文件中LoadModule rewrite_module modules/mod_rewrite.so前面的注视去掉,然后重启APACHE即可。
    但在Ubuntu上则有所不同,默认Apache包配置是按照目录和文件存放的,/etc/apache2目录包含conf.d、mods- available、mods-enabled、sites-available、sites-enabled文件夹,apache2.conf、 envvars、httpd.conf(用户配置文件)、magic、ports.conf(APACHE端口配置)配置文件。

    在ubuntu 下的设置方法为:

    用命令开启伪静态sudo a2enmod rewrite

    service apache2 restart

    然后在/etc/apache2/apache2.config中设置访问的站点


    1
    2
    3
    4
    5
    6
    7
    8
    9
    <Directory /home/iat/workspace/PHPsite>
     
    Options Indexes FollowSymLinks
     
    AllowOverride ALL
     
    Require all granted
     
    </Directory>

    service apache2 restart

    2. 配置htaccess 文件

    Apache是 Linux 主机下常见的环境,现在一般的 Linux 虚拟主机都采用这种环境。新建一个 htaccess.txt 文件,添加下面的代码:

    1. <IfModule mod_rewrite.c>
    2. RewriteEngine On
    3. RewriteBase /
    4. RewriteRule ^index.php$ - [L]
    5. RewriteCond %{REQUEST_FILENAME} !-f
    6. RewriteCond %{REQUEST_FILENAME} !-d
    7. RewriteRule . /index.php [L]
    8. </IfModule>

    然后上传到 WordPress 站点的根目录,重命名为 .htaccess 即可

    (flymood: 我好像是直接自动生成的,没有要手动添加)

    3、重启Apache
    /etc/init.d/httpd restart
        
    4、设置WordPress
    系统运维  www.osyunwei.com  温馨提醒:qihang01原创内容©版权所有,转载请注明出处及原文链接
    在WordPress后台-设置-固定链接-自定义结构,输入下面的代码,最后保存更改即可。        
    /archives/%post_id%.html

    附加说明:

    登录你的WordPress,点击左侧菜单设置选项下固定链接,如下图所示:

    WordPress已经给出了几种URL伪静态形式,但都不很理想,我们希望的URL形式为:

    域名/分类别名/文章ID.html

    那么,如上图所示,选择自定义结构选项,填写:

    /%category%/%post_id%.html

    如果你对这种形式不满意,可以自定义任意形式,只要合理搭配参数即可,可以使用的参数如下:

    %year%:文章发表的年份,四位数字,如2012

    %monthnum%:文章发表的月份,如08

    %day%:文章发表的日期,如28

    %hour%:文章发表的时间(小时),如15

    %minute%:文章发表的时间(分钟),如18

    %second%:文章发表的时间(秒),如28

    %postname%:文章别名,在发表文章时可以设置。

    %post_id%:文章的ID,如68

    %category%:分类别名,在添加分类时可以设置。

    %tag%:标签的别名,在添加标签时可以设置。

    设置好后,有的Linux主机允许程序自动创建.htaccess文件,但有的Linux主机不支持,此时,就需要我们手工上传.htaccess文件。将以下代码复制到记事本,保存为.htaccess。

    # BEGIN WordPress

    <IfModule mod_rewrite.c>

    RewriteEngine On

    RewriteBase /

    RewriteRule ^index.php$ - [L]

    RewriteCond %{REQUEST_FILENAME} !-f

    RewriteCond %{REQUEST_FILENAME} !-d

    RewriteRule . /index.php [L]

    </IfModule>

    # END WordPress

    可能你会发现,电脑不允许保存文件时文件名为空,那么随便起一个名称,用FTP工具上传到你的网站根目录后重命名,将名称去掉即可。

    此时,细心的你可能会发现分类页的URL里有一个category,你可以使用WP No Category Base插件来解决。

    wp永久链接设置技巧:

    一、不要让日期出现在wordpress固定链接里面
    这基于两个方面的考虑。一是如果数字出现在固定链接里面,等于提醒搜索引擎,这是很旧的内容了,没必要再爬一遍了。另外一个原因是,假如你要修改文章的日期重新发布的话,链接地址就变了,也就是意味着你的反向链接,PR 等等都没有了。

    二、不要让分类的链接出现在固定链接里面

    这一点是很多人都会忽略的地方。让分类出现在固定链接里面有两个缺陷:一是一篇文章如果选择了多个分类的话,则会出现多个链接地址,这很容易造成因为重复内容而被搜索引擎惩罚;二是有可能会造成关键词堆砌而被搜索引擎惩罚。

    三、链接不要过深

    这一点经常看到。很多wordpress 用户的固定链接是年/月/日/分类名/文章名。这种过于深的固定链接对搜索引擎是非常不友好的。

    四、不要让中文字符出现在固定链接里面

    虽然现在的搜索引擎已经能识别URL地址里面的中文字符,但无论是从美观上,还是从wordpress 优化的角度来看,都是非常差的。
    Win服务器下设置WordPress固定链接伪静态
    只要主机支持自定义404页面,无需安装插件,就能让Win主机像Linux 那样,方便使用WordPress的固定链接为静态化地址格式。

    参考:

    1。apache 伪静态规则教程

    http://jingyan.baidu.com/article/ae97a646a7419bbbfd461df7.html

    2。利用.htacess进行301重定向

    http://jingyan.baidu.com/article/359911f5104c3757fe0306ba.html

    3。如何让apache 支持伪静态

    http://zhidao.baidu.com/link?url=F_aIzlhptalw0hNquDUgHNf7do3k_2E7Vzsr8dycv8opdejcoQQHeB2jjPJEp3RbMQN08zpGIPCgvZJuV4FPg_

    url 重写规则举例

    RewriteBase   /
    RewriteRule ^(.*)show-([0-9]+)-([0-9]+).html$ $1/show.php?itemid=$2&page=$3

    其中RewriteRule是例子,意思为在浏览器中输入的是show-1-2.html,而实际访问的却是show.php?itemid=1&page=2

  • 相关阅读:
    c语言知识
    数字地与模拟地
    C语言实现顺序表(增删)
    传统数据库、Nosql数据库与云数据库区别?
    大数据处理架构如何
    warning: implicit declaration of function 'func1' [-Wimplicit-function-declaration]
    window10创建virtualenv虚拟环境
    二叉树的实现以及三种遍历方法--代码
    损失函数--KL散度与交叉熵
    市场回测与对冲套利
  • 原文地址:https://www.cnblogs.com/flymood/p/4868401.html
Copyright © 2011-2022 走看看