zoukankan      html  css  js  c++  java
  • 多线程爬虫

    一、 程序,进程,线程

    1. 程序:由源代码生成的可执行应用。(例如:QQ,淘宝等)
    2. 进程:一个正在运行的程序可以看做一个进程,进程拥有独立运行所需要的全部资源。(例如:打开QQ相当于开启一个进程)
    3. 线程:程序中独立运行的代码段。(例如:在QQ这个进程中,传输文字是一个线程,传输语音是一个线程,弹出对话框是一个线程。)

    一个程序至少拥有一个进程,一个进程至少拥有一个线程。进程负责资源的调度和分配,线程才是程序真正的执行单元,负责代码的执行。

    二、单线程

    原理:

      每个正在运行的程序(即进程),至少包含一个线程,这个线程叫做主线程,

    主线程在程序启动时被创建,用于执行main函数,只有一个主线程的程序叫做单线

    程程序,主线程负责执行程序的所有代码。这些代码只能顺序执行,无法并发执行。

     

     

    三、多线程

    多线程定义:

      多线程是指程序中包含多个执行流,即在一个程序中可以同时运

    行多个不同的线程来执行不同的任务,也就是说允许单个程序创建多个并行执

    行的线程来完成各自的任务

     

    多线程优点

      可以提高CPU的利用率。在多线程程序中,一个线程必须等待的

    时候,CPU可以运行其它的线程而不是等待,这样就大大提高了程序的效率。

     

    1.创建多线程的第一种写法(代码)

    import time
    import random
    import threading
    
    def download(i):
        """
        一个文件一个文件的下载,按顺序下载
        """
        print(f"----------------下载{i}文件开始-----------------")
        time.sleep(random.random()*10)
        print(f"---------------下载{i}文件开始------------------")
    
    
    # 单线程(主线程)
    if __name__ == '__main__':
    
        for i in range(5):
            # 创建线程 target参数传递的是这个线程需要执行的函数
            #         args参数传递的元组格式  实现文件同时下载
            t = threading.Thread(target=download, args=(i,))
            # 启动线程
            t.start()
    

     

     

     

     

     

     

     

  • 相关阅读:
    Jest | expect常用匹配方法
    typescript | typeScript 笔记
    好用的思维脑图
    VSCode launch.json 配置详解
    各种语法技术栈文档汇总|api文档集合
    浏览器的运行机制
    js字符串转数字长度限制|超过长度有误差
    css对话框| 气泡框| css箭头
    nginx和php-fpm的用户权限
    mac安装redis拓展
  • 原文地址:https://www.cnblogs.com/renshaoqi/p/10456231.html
Copyright © 2011-2022 走看看