zoukankan      html  css  js  c++  java
  • Python的虚拟机安装已经如何配置Scrapy for Mac

    时间:2018年2月21日

    因为时间问题,以下笔记就粗略记录。仅作为个人笔记为用

    安装virtualenv和virtualenvwrapper

    如何安装的细节下面这篇也有介绍,包括如何使用切换虚拟机也有介绍

    http://blog.csdn.net/xshalk/article/details/47301339

    其中如何找 .bash_profile文件

      在Finder用快捷键command+shift+G输入打开目录~/
      再快捷键:shift+comman+. 显示隐藏文件即可找到这个文件
      修改保存之后,再在终端命令行运行 source ~/.bash_profile,就会执行这个文件

    后来在安装过程遇到一些问题,再经过百度,下面这篇可以解决python路径的问题

    https://www.jianshu.com/p/2999e258cbf9

    另外,创建不需要任何包的虚拟环境 mkvirtualenv --no-site-packages venv

    接着步骤就是:workon虚拟环境,pip3 install 一系列包,

    然后cd进入到需要创建项目的目录下创建项目,

    再cd进入项目根目录创建一个爬虫的py文件,

    注意,这里下面截图有个小错误:scrapy genspider name url,这里的url不需要“http://”:

    然后就是用pycharm来open这个项目,并且要记得重新选择虚拟环境配置,直接就选前面workon选中的虚拟环境。

     

    然后是调试技巧,在scrapy.cfg同级目录下新建main.py文件

    然后代码如下:

     1 # 通过这个文件来调试,可以提高开发效率
     2 
     3 from scrapy.cmdline import execute
     4 
     5 import sys
     6 import os
     7 
     8 '''
     9 设置工程的目录
    10 os.path.abspath(__file__) 获取当前文件的目录
    11 
    12 os.path.dirname(file的全路径) 获取当前file的父目录 
    13 
    14 打印测试
    15 print(os.path.abspath(__file__))
    16 print(os.path.dirname(os.path.abspath(__file__)))
    17 
    18 '''
    19 
    20 # print(os.path.abspath(__file__))
    21 # print(os.path.dirname(os.path.abspath(__file__)))
    22 sys.path.append(os.path.dirname(os.path.abspath(__file__)))
    23 
    24 
    25 # path = os.path.dirname(os.path.abspath(__file__))+"/ArticleSpider"
    26 # sys.path.append(path)
    27 # print(sys.path)
    28 
    29 '''执行命令的方法 —— 查询股票名字代码列表'''
    30 # execute("scrapy crawl quote_eastmoney_com".split())
    31 
    32 '''执行命令的方法 —— 查询股票名字代码列表'''
    33 execute("scrapy crawl data_eastmoney_com_hsgtcg".split())
  • 相关阅读:
    【Python第九篇】异步IO数据库队列缓存
    【Python第八篇】线程、进程及协程
    【Python第七篇】Socket网络编程
    实验五全部代码,ajax请求
    添加员工
    联级选择
    查询,利用jquery选择器
    列表、表格单选框
    注册
    聊天框
  • 原文地址:https://www.cnblogs.com/goodboy-heyang/p/8456924.html
Copyright © 2011-2022 走看看