zoukankan      html  css  js  c++  java
  • Ubuntu14.04部署pyspider的过程

    1、安装,安装官方文档,应该先执行

    1. sudo apt-get install python python-dev python-distribute python-pip libcurl4-openssl-dev libxml2-dev libxslt1-dev python-lxml  

    再执行:

    1. sudo pip install --allow-all-external pyspider[all]  

    第一个错误:

    1. No distributions at all found for mysql-connector-python>=1.2.2  

    解决方法:换pip源,给~/.pip/pip.conf里面加上:

    1. [global]  
    2. index-url = http://pypi.douban.com/simple/  

    第二个错误:

    1. Error: pg_config executable not found.  

    解决方法:

    1. sudo aptitude install libpq-dev  

    第三个错误:

        In file included from src/docstrings.c:4:0:
        src/pycurl.h:170:31: fatal error: openssl/crypto.h: No such file or directory
        compilation terminated.
        error: command 'x86_64-linux-gnu-gcc' failed with exit status 1

    解决方法:

    sudo apt-get install libssl-dev

    如果要用phantomjs,还得独立安装:

    1. sudo aptitude install phantomjs  

    建议使用MongoDB做数据存储:

    1. sudo aptitue install mongodb  

    建议使用redis做消息队列存储:

    1. sudo aptitude install redis-server  

    给个与官放文档略有不同的配置文件范本(config.json):

    1. {  
    2.  "taskdb":"mongodb+taskdb://mongodbuser:password@127.0.0.1:27017/taskdb",  
    3.  "projectdb":"mongodb+projectdb://mongodbuser:password@127.0.0.1:27017/projectdb",  
    4.  "resultdb":"mongodb+resultdb://mongodbuser:password@127.0.0.1:27017/resultdb",  
    5.  "message_queue":"redis://:redis_password@127.0.0.1:6379/1",  
    6.  "webui": {  
    7.     "username": "webUIusername",  
    8.     "password": "webUIpassword",  
    9.     "need-auth": true  
    10.   }  
    11. }  


    启动shell脚本:

    1. #!/bin/bash  
    2. sudo nohup pyspider -c config.json all &  



  • 相关阅读:
    hadoop面试
    常用脚本
    1.kafka
    2.flink
    java面试
    Hbase 项目
    linux 2>&1 和 &的意思
    Jetbrains系列产品重置试用方法
    解决GitHub网页githubusercontent地址无法访问问题
    stylus 成熟的写法
  • 原文地址:https://www.cnblogs.com/dhcn/p/7121400.html
Copyright © 2011-2022 走看看