zoukankan      html  css  js  c++  java
  • 米扑科技的开源项目:sitemap-php 自动生成网站地图

    米扑科技旗下的产品,近期正在做SEO网站优化,其中子需求之一是调研实现了网站地图(sitemap.xml)

    封装简化了许多功能模块,现在分享出来,源代码可在Github上下载,有简单的示例。


    Github 开源网址sitemap-php


    What is sitemap-php ?

    sitemap-php 是一个轻量级、简单快速生成网站地图的开源项目,由北京米扑科技有限公司(mimvp.com)开发分享。

    通过简单的配置定义,一个函数createSitemap(),可自动生成sitemap.xml、sitemap.html等网站地图文件,

    自动生成的xml、html文件,支持Google、Bing、Baidu等主流搜索引擎收录。

    Fast and lightweight class for generating Google sitemap XML files and index of sitemap files.

    Written on PHP and uses XMLWriter extension (wrapper for libxml xmlWriter API) for creating XML files. XMLWriter extension is enabled by default in PHP 5 >= 5.1.2.

    If you having more than 50000 url, it splits items to seperated files. (In benchmarks, 1.000.000 url was generating in 8 seconds)

    示例:

    sitemap.xml : http://mimvp.com/sitemap.xml

    sitemap.html : http://mimvp.com/sitemap.html

     

    How to use

    Sitemap 封装了生成sitemap.xml的属性和方法的类,使用非常简单,示例代码:

    function testSitemap() {
    	$sitemap = new Sitemap("http://mimvp.com");
    
    	 $sitemap->addItem('/', '1.0', 'daily', 'Today');
    	 $sitemap->addItem('/hr.php', '0.8', 'monthly', time());
    	 $sitemap->addItem('/index.php', '1.0', 'daily', 'Jun 25');
    	 $sitemap->addItem('/about.php', '0.8', 'monthly', '2017-06-26');
    
    	 $sitemap->addItem('/hr2.php', '1.0', 'daily', time())->addItem('/index2.php', '1.0', 'daily', 'Today')->addItem('/about2.php', '0.8', 'monthly', 'Jun 25');
    
    	 $sitemap->endSitemap();
    }
    1. 初始化类对象
    $sitemap = new Sitemap("http://mimvp.com");
    1. 添加Item
    $sitemap->addItem('/', '1.0', 'daily', 'Today');
    $sitemap->addItem('/hr.php', '0.8', 'monthly', time());
    $sitemap->addItem('/index.php', '1.0', 'daily', 'Jun 25');
    $sitemap->addItem('/about.php', '0.8', 'monthly', '2017-06-26');

    或者

    $sitemap->addItem('/hr2.php', '1.0', 'daily', time())->addItem('/index2.php', '1.0', 'daily', 'Today')->addItem('/about2.php', '0.8', 'monthly', 'Jun 25');
    1. 结束文档
    $sitemap->endSitemap();
    1. 生成结果 sitemap.xml
    <?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    	<url>
    		<loc>http://mimvp.com/</loc>
    		<priority>1.0</priority>
    		<changefreq>daily</changefreq>
    		<lastmod>2017-06-26T00:00:00+08:00</lastmod>
    	</url>
    	<url>
    		<loc>http://mimvp.com/hr.php</loc>
    		<priority>0.8</priority>
    		<changefreq>monthly</changefreq>
    		<lastmod>2017-06-26T20:16:23+08:00</lastmod>
    	</url>
    	<url>
    		<loc>http://mimvp.com/index.php</loc>
    		<priority>1.0</priority>
    		<changefreq>daily</changefreq>
    		<lastmod>2017-06-25T00:00:00+08:00</lastmod>
    	</url>
    	<url>
    		<loc>http://mimvp.com/about.php</loc>
    		<priority>0.8</priority>
    		<changefreq>monthly</changefreq>
    		<lastmod>2017-06-26T00:00:00+08:00</lastmod>
    	</url>
    </urlset>

    More Functions

    1. 设置根域名
    $sitemap = new Sitemap("http://mimvp.com");

    也可以修改初始化的域名为

    $sitemap->setDomain('http://blog.mimvp.com');
    1. 设置保存路径 sitemap.xml默认保存在当前目录下,也可设置文件夹目录,例如: xmls/sitemap,表示sitemap.xml保存在当前目录下的xmls/目录下,其中xmls目录会自动创建。注:支持多级目录
    $sitemap->setXmlFile("xmls/sitemap");
    $sitemap->setXmlFile("xmls/mimvp/sitemap");
    1. 设置是否更多头部
    $sitemap->setIsChemaMore(true);

    如果设置为true,则sitemap.xml文件头部会增加一些头部信息:

    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 	
    xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" 
    1. 获取当前写入的sitemap文件
    $sitemap->getCurrXmlFileFullPath();

    Advanced Functions

    1. 指定包含文件,以/开头
    $GIncludeArray = array("", "/index.php", "about.php", "hr.php");
    1. 排除特定文件或目录
    $GExcludeArray = array("usercenter/", "sadmin/", "admin/", "sitemap.php");
    1. 递归扫描指定目录,默认扫描三层(可自己设定)
    function scanRootPath($rootPath=".", $dirLevel=1, $MaxDirLevel=3, &$resArray=array())
    1. 转化 xml + xsl 为 html
    function createXSL2Html($xmlFile, $xslFile, $htmlFile, $isopen_htmlfile=false) 

    Sitemap Demo

    1. 全局变量,G开头
    $GCONFIG = array(	"domain"=>"http://mimvp.com",
    			"xmlfile"=>"sitemap",
    			"htmlfile"=>"sitemap.html",
    			"xslfile"=>"sitemap-xml.xsl",
    			"isopen_xmlfile"=>true,
    			"isopen_htmlfile"=>true,
    			"isscanrootpath"=>true,
    			"isxsl2html"=>true,
    			"isschemamore"=>true);
    1. 生成sitemap.xml
    createSitemap();

    生成示例:

    sitemap.xml 示例

    1. 生成 sitemap.html
    createXSL2Html($xmlFile, $xslFile, $htmlFile, $isopen_htmlfile=false);

    生成示例:

    sitemap.html 示例

    You need to submit sitemap.xml and sitemap.html to Google、 Bing、 Baidu,etc.

    sitemap-php项目,目前支持指定网页、排除网页、扫描根目录等网站地图;
    后期完善时,会增加导出数据库、爬取整个网站等功能,
    也希望您的加入,继续完善此项目

    sitemap-php All Rights by mimvp.com


  • 相关阅读:
    Caused by: java.util.MissingResourceException: Can't find bundle for base name javax.servlet.LocalStrings, locale zh_CN
    java调优
    idea的spring配置
    【从0到1学Web前端】javascript中的ajax对象(一) 分类: JavaScript 2015-06-24 10:18 754人阅读 评论(1) 收藏
    javascript中对条件判断语句的优化 分类: JavaScript 2015-06-07 09:54 832人阅读 评论(2) 收藏
    【从0到1学Web前端】CSS伪类和伪元素 分类: HTML+CSS 2015-06-02 22:29 1065人阅读 评论(0) 收藏
    django中url,静态文件,POST请求的配置 分类: Python 2015-06-01 17:00 789人阅读 评论(0) 收藏
    【从0到1学Web前端】CSS定位问题三(相对定位,绝对定位) 分类: HTML+CSS 2015-05-29 23:01 842人阅读 评论(0) 收藏
    Javascript图片预加载详解 分类: JavaScript HTML+CSS 2015-05-29 11:01 768人阅读 评论(0) 收藏
    【从0到1学Web前端】CSS定位问题二(float和display的使用) 分类: HTML+CSS 2015-05-28 22:03 812人阅读 评论(1) 收藏
  • 原文地址:https://www.cnblogs.com/mimvp/p/7190438.html
Copyright © 2011-2022 走看看