zoukankan      html  css  js  c++  java
  • heritrix 下载、安装、配置、以及简单开发

    一、下载:

    到www.sourceforge.net 网站搜索heritrix, 然后分别下载下来hheritrix-1.14.4-src.zip,heritrix-1.14.4.zip

    下载地址:http://sourceforge.net/projects/archive-crawler/files/archive-crawler%20%28heritrix%201.x%29/

     

     

          二、配置

    1. 解压 heritrix-1.14.4.zip ,假设解压到了c 盘根目录下并把解压后的文件夹命名为heritrix(http://www.my400800.cn

    2. 进入c:/heritrix/conf 复制文件jmxremote.password.template 到c:/heritrix 下并把文件重新命名为jmxremote.password ,

     

              然后修改其内容为下:

               monitorRole  @123456789@ ->monitorRole admin (@ 于@ 之间设置的是密码, 后面是-> 用户角色用户名)

               controlRole  @123456789@ ->controlRole shi 

               并设置文件jmxremote.password 的属性为只读

     

    3. 进入c:/heritrix/conf 打开文件heritrix.properties ,修改其中的几项key-value 值

              heritrix.cmdline.admin = admin:770629 ( 用户名:密码)

              heritrix.cmdline.port = 8080 (heritrix 服务器默认端口号8080, 保证该端口不被占用就不用改了)

     

    4. 打开cmd ,切换目录到c:/heritrix/bin

              然后敲入命令:heritrix.cmd --admin=admin:123456789

    会出现如下错误:

    1. WARNING: It's currently not possible to run Heritrix in background  
    2.          on Windows. It was just started minimized in a new  Window  
    3.          and will be shut down as soon as you log off.  
    4.   
    5. 2011 / 02 / 25  周五  23 : 49 : 27.00  Starting heritrix  
    6.   
    7. Heritrix failed to start properly. Possible causes:  
    8.   
    9. - Login and password have not been specified (see --admin switch )  
    10. - another program uses the port for  the web UI ( 8080  by  default )  
    11.   (e.g. another Heritrix instance)  
    12. - JMX password file is missing or permissions not set correctly  
    13.   
    14.   
    15. JMX permissions file missing. A template can be found in  
    16.   E:\framework\heritrix-1.14 . 4 \conf\jmxremote.password.template.  
    17. Copy it to  
    18.   E:\framework\heritrix-1.14 . 4 \jmxremote.password  
    19. and edit the passwords at the end of the file. Then, make sure  
    20. the file is read-restricted to only the user that the Heritrix  
    21. Java VM will run as. For example: 

    5. 再设置文件的为只读,并且要设置文件的拥有者只能为当前登录系统的用户,删除文件的其他用户或角色权限。修改方法:

       文件->属性->"安全"标签页->高级->"权限"标签页->更改权限按钮

        ->取消"包括从该对象的父项继承的权限"的勾选-,同时再删除其他多余的用户或角色权限(只留下当前登录系统的用户)

    如果删除不了要全部设定他们的权限限定




     里面的用户要全部设定权限,不然会报错的要

  • 相关阅读:
    SharePoint 2010学习笔记之一:创建”最新动态”WebPart
    IE6 Png 图片透明
    C# Url 过滤特殊字符
    委托的几个实例用法
    MVC中Code First编程一些小技巧
    Javascript 学习
    NET下XML的读写操作
    C#位运算讲解与示例[转]
    DB2导入导出命令(工作中使用)
    上海长期招聘c#/c++软件工程师
  • 原文地址:https://www.cnblogs.com/jishu/p/2235888.html
Copyright © 2011-2022 走看看