zoukankan      html  css  js  c++  java
  • Validator.nu 本地实例搭建过程

     

    Validator.nu是一个验证HTML5文件是否符合标准和规范的一个在线服务,基本上和 W3C Validator 提供的服务类似。W3C的验证期在Ubuntu的软件库中已经有现成可用的(w3c-markup-validator),但是这个现成的验证器如果要验证HTML5的话,还是需要使用Validator.nu。

    由于我们只需要验证HTML5的代码,所以计划直接在本地搭建一个Validator.NU的实例。如果要验证的文件比较少,那么可以直接去使用在线服务。如果要验证大量的HTML5页面,在本地搭建一个实例是最合适的了,主要是为了能够快速的得到验证的结果。

    在Validator.nu的官方站点上,有一个简单的关于搭建Validator.nu本地实例的说明

    mkdir checker
    cd checker
    hg clone https://bitbucket.org/validator/build build
    python build/build.py all
    python build/build.py all
    

    但是由于Validator.nu的源代码托管服务bitbucket在国内无法直接访问,所以需要手动的做一些工作才能够完成这个本地实例的搭建。

    首先你的机器上应该安装了Java SDK、Tortoise、Python。如果是Windows的机器,还有设置相关的环境变量,保证能够在命令行工具运行javacjavapythonhg命令。

    要想从bitbucket上检出Validator.nu的代码,需要使用VPN或者代理的手段翻出去。由于我使用的是Ubuntu Server,在Ubuntu Server上配置VPN比较啰嗦,所以干脆在自己的Mac机器上拨VPN,检出代码后再去Ubuntu Server上build。但是在文档中我是直接截取的在Mac机器上build的代码。

    如果你的机器上没有hg命令,请去下载TortoiseHG (这个站竟然是可以访问的!)

    yuanyq@yuanyq-mac:~ $ cd apps
    yuanyq@yuanyq-mac:~ $ mkdir checker
    yuanyq@yuanyq-mac:apps $ cd checker
    yuanyq@yuanyq-mac:checker $ hg clone https://bitbucket.org/validator/build build
    yuanyq@yuanyq-mac:checker $ python build/build.py checkout
    

    检出源代码之后,就会在checker目录下生成build文件夹,该文件夹下有一个主要的文件就是build.py

    源代码检出之后,就可以下载依赖包了,此时无需拨VPN了,以加快下载速度。但是在实际操作中发现,下载jetty-6.1.26.zip依赖包时,速度太慢,甚至最后报出了MD5校验无法通过的错误(难道是因为jetty的新版本被Eclipse项目组收编了之后老版本的服务器不维护了?)。所以,这里我们先使用其他下载工具下载jetty-6.1.26(http://dist.codehaus.org/jetty/jetty-6.1.26/jetty-6.1.26.zip),然后在本地搭建一个HTTP的服务器,把jetty-6.1.26.zip放置到本地HTTP服务器的根目录,然后修改一下build/build.py脚本,指向本地下载。

    修改build.py脚本,找到第92行,将

    http://dist.codehaus.org/jetty/jetty-6.1.26/jetty-6.1.26.zip

    替换为

    http://localhost/jetty-6.1.26.zip

    保存修改后的build.py,然后执行依赖包的下载。下载依赖包的时候可以不用VPN,因为依赖包所在的网址都是可以直接访问到的:

    yuanyq@yuanyq-mac:~$ cd apps/checker
    yuanyq@yuanyq-mac:~/apps/checker$ python build/build.py --no-self-update dldeps
    

    其中--no-self-update参数是告诉脚本不要尝试去bitbucket上下载源文件。 等到依赖包下载完毕之后,就可以build了。build之前要确认JAVA_HOME环境变量设置正确。在我的机器上的.bash_profile中环境变量设置如下:

    export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64
    export PATH=${JAVA_HOME}/bin:${PATH}
    

    执行build命令:

    yuanyq@yuanyq-mac:~/apps/checker$ python build/build.py --no-self-update build
    

    build命令执行成功之后,再重复执行build命令一次,否则在启动服务的时候会发生如下错误:

    nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/html5.rnc
    Error:
    Syntax error.
    File: http://s.validator.nu/html5/html5full.rnc
    Line: 1 Col: 0
    
    Error:
    Reference to undefined pattern “common.elem.flow”.
    File: http://s.validator.nu/html5-svg-mathml.rnc
    Line: 22 Col: 17
    

    两次build命令完成之后,进入nu-validator-site文件夹,修改startit.sh脚本,注释掉JAVA_HOMEPATH的设置,因为在bash环境上已经设置了相关的环境变量了。然后修改脚本中的cd /usr/local/validator.nu一行,设置为在检出代码之前创建的checker目录。最终startit.sh脚本看起来是这样的:

    #!/bin/sh
    
    #JAVA_HOME=/usr/local/java
    #export JAVA_HOME
    
    #PATH=$JAVA_HOME/bin/:$PATH
    #export PATH
    
    cd /some/path/to/apps/checker
    
    if [ "$1" != "" ]
    then
        args=$@
    else
        args="--no-self-update run"
    fi
    python build/build.py \
      --w3cbranding \
      --heap=512 \
      --connection-timeout=3 \
      --socket-timeout=3 \
      --html5link=http://www.w3.org/html/wg/drafts/html/master/single-page.html \
      --user-agent=Validator.nu/LV\ http://validator.w3.org/services \
      --name="Ready to validate" \
      $args
    

    最后,就可以通过执行startit.sh来启动服务了。默认的监听端口是8888。

    yuanyq@yuanyq-mac:~/apps/checker/nu-validator-site$ nohup ./startit.sh &
    [1] 21556
    yuanyq@yuanyq-mac:~/apps/checker/nu-validator-site$ nohup: ignoring input and appending output to ‘nohup.out’
    
    yuanyq@yuanyq-mac:~/apps/checker/nu-validator-site$
    

    查看一下nohup.out中的输出:

    yuanyq@yuanyq-mac:~/apps/checker/nu-validator-site$ cat nohup.out
    2013-05-24 11:07:13.437:INFO::Logging to STDERR via org.mortbay.log.StdErrLog
    nu.validator.servlet.VerifierServletTransaction - Starting static initializer.
    nu.validator.servlet.VerifierServletTransaction - Starting to loop over config file lines.
    nu.validator.servlet.VerifierServletTransaction - Finished reading config.
    nu.validator.servlet.VerifierServletTransaction - Converted config to arrays.
    nu.validator.servlet.VerifierServletTransaction - Prepared namespace array.
    nu.validator.servlet.VerifierServletTransaction - Parsed doctype numbers into ints.
    nu.validator.servlet.VerifierServletTransaction - The cache path prefix is: null
    nu.validator.servlet.VerifierServletTransaction - Parsing set up. Starting to read schemas.
    nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/html5.rnc
    nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/html5-its.rnc
    nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/html5-rdfalite.rnc
    nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml10/xhtml-strict.rnc
    nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml10/xhtml-transitional.rnc
    nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml10/xhtml-frameset.rnc
    nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml5.rnc
    nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml5-rdfalite.rnc
    nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml1-ruby-rdf-svg-mathml.rnc
    nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/svg-xhtml5-rdf-mathml.rnc
    nu.validator.servlet.VerifierServletTransaction - Schemas read.
    nu.validator.servlet.VerifierServletTransaction - Reading spec.
    nu.validator.servlet.VerifierServletTransaction - Spec read.
    nu.validator.servlet.VerifierServletTransaction - Initialization complete.
    2013-05-24 11:07:16.593:INFO::jetty-6.1.26
    2013-05-24 11:07:16.614:INFO::Started SocketConnector@0.0.0.0:8888
    Exception in thread "main" java.io.IOException: Bad file descriptor
        at java.io.FileInputStream.readBytes(Native Method)
        at java.io.FileInputStream.read(FileInputStream.java:242)
        at java.io.BufferedInputStream.fill(BufferedInputStream.java:235)
        at java.io.BufferedInputStream.read(BufferedInputStream.java:254)
        at nu.validator.servlet.Main.main(Main.java:120)
    

    最后的一个异常信息不影响应用工作,可以不用管他。

    打开浏览器访问http://localhost:8888

    至此,Validator.nu本地实例搭建完毕。

  • 相关阅读:
    转【程序员七问】
    【转】又一次线上 OOM 排查经过
    【转】java:多网卡环境下获取MAC地址
    eclipse 国际化 $NON-NLS-1$ 含义
    eclipse 重构代码自动抽取函数
    转:GEF 英文全称Graphical Editor Framework
    转:Eclipse使用Git图解教程
    转:Java通过百度地图API获取地址经纬度
    转:Lucene学习——IKAnalyzer中文分词(一)
    转:Maven项目中获取classpath和资源文件的路径
  • 原文地址:https://www.cnblogs.com/yuanyq/p/3103013.html
Copyright © 2011-2022 走看看