zoukankan      html  css  js  c++  java
  • Python_scrapyRedis零散

    1.

    # Redis
    
    1.解压,配环境变量
    
    2.win上设置自启动
    
        redis-server --service-install D:
    edis
    edis.windows.conf --loglevel verbose
    
    3.启动redis
    
        redis-server E:
    edis
    edis-latest
    edis.windows.conf
    
    4.进入数据库,另起一个cmd框
    
        redis-cli -h 127.0.0.1 -p 6379
    
    5.在 redis.windows.conf 中解注 “requirepass foobared”   将foobared改为密码;注:不能有空格
    
    6.重开始登陆 
    
        redis-cli -h 127.0.0.1 -p 6379 -a 123456
    ---
    
    ## 1.非关系型数据库 Nosql(not noly sql)不是典型数据库 / Key-Values存储系统
    
    - momgoDB 的优势:支持多种查询和支持创建索引
    - Redis 速度极快,价格高;持久化和热备时候消耗大量带宽和运力  → 5种数据类型的几种常用方法,默认不支持查询,可以在键上设置
    
    注:memcached 是sql中继器,不算Nosql
    
    redis的字符类型
    
    1.string
    
    2.hash
    
    3.lsit
    
    4.set
    
    ---
    十大算法 快速排序、
    多进程多线程
    
    ---
    购物车 以前是session,现在是redis
    功能:
    
        商品展示
        购物车操作
        添加删除商品
        结算
        ...
    
    ---
    ## scrapy
    
    ### 1.解释scrapy的工作流程
    
    ### 2.scrapy的优势
    
        scrapy自带多进程,能执行整站采集,自动调度器
    
    ### 3.多主机爬虫架构
    
        待整理:...
        一个起始spider(共享主队列)
        一个主机多个从机
        分布式进程
    
    ### 在scrapy中使用redis,,去重
    
        “指纹”:当前对象的唯一标示
        redis每次执行前检查指纹是否存在,再进行添加任务
    
    ### 分布式防止终端
    
    ### 如何实现架构?
    
        scrapy自带框架
    
    ## scrapy-redis 的分布式实现
    
        master  主机
        slave    副机
        可移植性好
        
    ## 
  • 相关阅读:
    1234D.Distinct Characters Queries(树状数组)
    1217C.The Number of Good Substrings(思维)
    1217B.Zmei Gorynich(思维)
    1213D2.Equalizing by Division(hard version)(图论)
    CentOS7.5搭建Hadoop2.7.6完全分布式集群
    CentOS7.5搭建spark2.3.1集群
    CentOS7.5搭建Hive2.3.3
    【Java入门】JDK安装和环境变量配置(Win7版)
    python第三方库大全
    Python常用模块大全
  • 原文地址:https://www.cnblogs.com/hellangels333/p/9046563.html
Copyright © 2011-2022 走看看