zoukankan      html  css  js  c++  java
  • 并发编程一

    并发编程

    操作系统的作用

    • 接口: 提供良好的接口,供用户自己使用,而调用硬件部分则直接交给操作系统
    • 硬件:管理硬件资源

    多道技术

    • 针对单核,实现多道技术,现在计算机一般为多核,但是每个核内还是在应用多道技术
    • 时间上的复用:复用一个cpu的时间片,即占用cpu时间过长或者遇到i/o
    • 空间上的复用:如内存中同时有多个程序,多个进程之间要实现物理隔离

    进程

    概念:正在进行的一个任务;程序只是代码,而进程是指程序的运行状态,一个程序执行两次,也是两个进程

    # 进程是计算机中最小的资源分配单位(进程是负责圈资源)
    # 线程是计算机中能被CPU调度的最小单位 (线程是负责执行具体代码的)
    # 线程 后面的爬虫阶段经常用;进程:数据分析或者是高计算的程序;协程:异步的框架 异步的爬虫模块
    
    • 并发:即看起来时同时运行,cpu同时在多个程序之间切换,单个cpu+多道技术实行并发(并行属于并发)
    • 并行:同时运行,多个程序同时占用多个cpu执行任务,只有多个cpu才能实现
    image-20200824145148965
    • 阻塞和非阻塞:程序的运行状态;阻塞,是指调用结果返回之前,指当前线程会被挂起;非阻塞,指不能立即得到结果也会立即返回,同时该函数不会阻塞当前线程

    • 阻塞
      # cpu不工作
      非阻塞
      # cpu工作
      
    • 同步 异步:程序的调用方式;同步就是在发出一个功能调用时,在没有得到结果之前,该调用不会返回;异步:调用对象时,调用者不能立即得到结果,只有异步完成后才能得到结果

    • 同步
      # 正在烧水
      # 停下烧水这个动作   吹头发
      # 吹完头发之后继续烧水
      异步
      #  正在烧水
      #  吹头发 烧水也在继续
      
    • 进程三状态image-20200824151121278

    multiprocessing

    # p.start():启动进程,并调用该子进程中的p.run() 
    # p.run():进程启动时运行的方法,正是它去调用target指定的函数,我们自定义类的类中一定要实现该方法  
    p.terminate():强制终止进程p,不会进行任何清理操作,如果p创建了子进程,该子进程就成了僵尸进程,使用该方法需要特别小心这种情况。如果p还保存了一个锁那么也将不会被释放,进而导致死锁
    p.is_alive():如果p仍然运行,返回True
    # p.join([timeout]):主线程等待p终止(强调:是主线程处于等的状态,而p是处于运行的状态)。timeout是可选的超时时间,需要强调的是,p.join只能join住start开启的进程,而不能join住run开启的进程  
        
    p.daemon:默认值为False,如果设为True,代表p为后台运行的守护进程,当p的父进程终止时,p也随之终止,并且设定为True后,p不能创建自己的新进程,必须在p.start()之前设置
    p.name:进程的名称
    # p.pid:进程的pid
    p.exitcode:进程在运行时为None、如果为–N,表示被信号N结束(了解即可)
    p.authkey:进程的身份验证键,默认是由os.urandom()随机生成的32字符的字符串。这个键的用途是为涉及网络连接的底层进程间通信提供安全性,这类连接只有在具有相同的身份验证键时才能成功(了解即可)
    
    • multiprocessing里Process的应用  开启子进程两种方式
      from multiprocessing import Process
      # import time
      # def task(n):
      #     print('我是子进程')
      #     time.sleep(n)
      #     print('子进程结束')
      # if __name__ == '__main__':
      #     # args=(), kwargs={}
      #     # t=Process(task,args=(1,))
      #     t = Process(target=task, kwargs={'n': 1})
      #     t.start()  # 通知操作系统,开启进程,执行task函数
      #     print('主')
      
      # 第二种:
      # from multiprocessing import Process
      # import time
      # class Task(Process):
      #     def __init__(self, n):
      #         super().__init__()            # 一定要继承以前父类的__init__方法
      #         self.n = n
      #     def run(self):
      #         print('我是子进程')
      #         time.sleep(self.n)
      #         print('子进程结束')
      # if __name__ == '__main__':
      #     t = Task(1)
      #     # t.run(1)           # 不是调用t.run(),而是调用t.start()
      #     t.start()
      #     print('主')
      
      
      在进程中的典型同步和异步的例子
      p.start() 开启进程      异步非阻塞
      p.terminate() 结束进程  异步非阻塞
      p.join()     同步阻塞
      
      
      
    • # join的使用
      # from multiprocessing import Process
      # import time
      # def task(n):
      #     print('我是子进程')
      #     time.sleep(n)
      #     print('子进程结束')
      # if __name__ == '__main__':
      #     ctime = time.time()
      #     t = Process(target=task, kwargs={'n': 1})
      #     t2 = Process(target=task, kwargs={'n': 2})
      #     t.start()
      #     t2.start()
      #     t.join()        # 等待t子进程执行完成
      #     t2.join()       # 等待t2子进程执行完成
      #     print('主')
      #     ctime2 = time.time()
      #     print(ctime2 - ctime)
      
      # 进程之间数据隔离       主程序 和进程之间数据隔离,可以用global全局变量来验证
      # from multiprocessing import Process
      # import time
      # age = 18
      # def task(n):
      #     global age  # 局部修改全局
      #     age = 99
      #     print('我是子进程')
      #     time.sleep(n)
      #     print('子进程结束')
      #     print(age)
      # if __name__ == '__main__':
      #     t = Process(target=task, kwargs={'n': 1})
      #     t.start()
      #     t.join()        #  主进程等待t子进程执行完成   明确一点,join是相对于主进程来说的
      #     print('主')
      #     print(age)       # 数据没有变,主进程中打印age和子进程的age没有半毛钱关系,数据是隔离的
      

    僵尸进程和孤儿进程

    • 僵尸进程:有害,一个进程使用fork ( linux 中) 创建子进程,如果子进程退出,而父进程并没有调用wait或waitpid获取子进程的状态信息,那么子进程的进程描述符仍然保存在系统中。这种进程称之为僵死进程,如果父进程是一个死循环,永远不会结束,那么该僵尸进程就会一直存在,僵尸进程过多,就是有害的

    • 孤儿进程:无害, 一个父进程退出,而它的一个或多个子进程还在运行,那么那些子进程将成为孤儿进程。孤儿进程将被init进程(进程号为1)所收养,并由init进程对它们完成状态收集工作。孤儿进程是没有父进程的进程,孤儿进程这个重任就落到了init进程身上,由init进程进行回收

    守护进程

    • 创建守护进程:1. 守护进程会在主进程代码执行结束后就终止 2.守护进程内无法再开启子进程,否则抛出异常:注意:进程之间是互相独立的,主进程代码运行结束,守护进程随即终止

      from multiprocessing import Process
      import time
      import random
      class Piao(Process):
          def __init__(self,name):
              self.name=name
              super().__init__()
          def run(self):
              print('%s is piaoing' %self.name)
              time.sleep(random.randrange(1,3))
              print('%s is piao end' %self.name)
      p=Piao('egon')
      p.daemon=True #一定要在p.start()前设置,设置p为守护进程,禁止p创建子进程,并且父进程代码执行结束,p即终止运行
      p.start()
      print('主')
      

    进程同步(锁)

    • 进程之间数据不共享,但是共享同一套文件系统,所以访问同一个文件,或同一个打印终端,是没有问题的,

      而共享带来的是竞争,竞争带来的结果就是错乱,如何控制,就是加锁处理

      #由并发变成了串行,牺牲了运行效率,但避免了竞争
      from multiprocessing import Process,Lock   # Lock
      import os,time
      def work(lock):
          lock.acquire()      # 上锁
          print('%s is running' %os.getpid())
          time.sleep(2)
          print('%s is done' %os.getpid())
          lock.release()      # 解锁
      if __name__ == '__main__':
          lock=Lock()
          for i in range(3):
              p=Process(target=work,args=(lock,))
              p.start()
      
      模拟抢票   #文件db的内容为:{"count":1}   注意一定要用双引号,不然json无法识别
      from multiprocessing import Process,Lock
      import time,json,random
      def search():
          dic=json.load(open('db.txt'))
          print('33[43m剩余票数%s33[0m' %dic['count'])
          
      def get():
          dic=json.load(open('db.txt'))
          time.sleep(0.1) #模拟读数据的网络延迟
          if dic['count'] >0:
              dic['count']-=1
              time.sleep(0.2) #模拟写数据的网络延迟
              json.dump(dic,open('db.txt','w'))
              print('33[43m购票成功33[0m')
      
      def task(lock):
          search()
          lock.acquire()
          get()
          lock.release()
      if __name__ == '__main__':
          lock=Lock()
          for i in range(100): #模拟并发100个客户端抢票
              p=Process(target=task,args=(lock,))
              p.start()
      
    • 加锁可以保证多个进程修改同一块数据时,同一时间只能有一个任务可以进行修改,即串行的修改,没错,速度是慢了,但牺牲了速度却保证了数据安全。
      虽然可以用文件共享数据实现进程间通信,但问题是:
      1.效率低(共享数据基于文件,而文件是硬盘上的数据)
      2.需要自己加锁处理
      
      #因此我们最好找寻一种解决方案能够兼顾:1、效率高(多个进程共享一块内存的数据)2、帮我们处理好锁问题。这就是mutiprocessing模块为我们提供的基于消息的IPC通信机制:队列和管道。
      1 队列和管道都是将数据存放于内存中
      2 队列又是基于(管道+锁)实现的,可以让我们从复杂的锁问题中解脱出来,
      我们应该尽量避免使用共享数据,尽可能使用消息传递和队列,避免处理复杂的同步和锁问
      

    管道

    程彼此之间互相隔离,要实现进程间通信(IPC),multiprocessing模块支持两种形式:队列和管道,这两种方式都是使用消息传递的

    • 第三方工具(软件)提供给我们的IPC机制redis,memcache,kafka,rabbitmq
      

     创建队列的类(底层就是以管道和锁定的方式实现):以后的分布式架构和消息队列都是基于此演变而来

    # Queue([maxsize]):创建共享的进程队列,Queue是多进程安全的队列,可以使用Queue实现多进程之间的数据传递。 maxsize是队列中允许最大项数,若有值,则只能放固定多个值,省略则无大小限制
    
    # q.put方法用以插入数据到队列中,put方法还有两个可选参数:blocked和timeout。如果blocked为True(默认值),并且timeout为正值,该方法会阻塞timeout指定的时间,直到该队列有剩余的空间。如果超时,会抛出Queue.Full异常。如果blocked为False,但该Queue已满,会立即抛出Queue.Full异常。
    # q.get方法可以从队列读取并且删除一个元素。同样,get方法有两个可选参数:blocked和timeout。如果blocked为True(默认值),并且timeout为正值,那么在等待时间内没有取到任何元素,会抛出Queue.Empty异常。如果blocked为False,有两种情况存在,如果Queue有一个值可用,则立即返回该值,否则,如果队列为空,则立即抛出Queue.Empty异常. 
    q.get_nowait():同q.get(False)  # 取值不等待
    q.put_nowait():同q.put(False)  # 放值不等待
    7 q.empty():调用此方法时q为空则返回True,该结果不可靠,比如在返回True的过程中,如果队列中又加入了项目。
    8 q.full():调用此方法时q已满则返回True,该结果不可靠,比如在返回True的过程中,如果队列中的项目被取走。
    9 q.qsize():返回队列中目前项目的正确数量,结果也不可靠,理由同q.empty()和q.full()一样
    
    from multiprocessing import Queue   队列  先进先出
    # 实例化得到要给对象
    q=Queue(5)  # 默认很大,可以放很多,写了个5,只能放5个
    # 往管道中放值
    q.put(1)
    q.put('lqz')
    q.put(18)
    q.put(19)
    # q.put(20)
    # q.put(21)
    # q.put_nowait(100)
    
    # 从管道中取值
    # print(q.get())
    # print(q.get())
    # print(q.get())
    # print(q.get(timeout=100))  # 等0.1s还没有值,就结束
    # print(q.get_nowait())        # 不等了,有就是有,没有就没有
    print(q.empty())  # 看一下队列是不是空的
    print(q.full())   # 看一下队列是不是满的
    
    '''
    q=Queue(队列大小)
    # 放值
    q.put(asdf)
    q.put_nowait(asdf)  # 队列满了,放不进去就不放了,报错
    # 取值
    q.get()  # 从队列头部取出一个值
    q.get_nowait()   # 从队列头部取值,没有就抛错
    # 队列是否为空,是否满
    print(q.empty())  # 看一下队列是不是空的
    print(q.full())   # 看一下队列是不是满的
    

    其他方法(了解):

    1 q.cancel_join_thread():不会在进程退出时自动连接后台线程。可以防止join_thread()方法阻塞
    2 q.close():关闭队列,防止队列中加入更多数据。调用此方法,后台线程将继续写入那些已经入队列但尚未写入的数据,但将在此方法完成时马上关闭。如果q被垃圾收集,将调用此方法。关闭队列不会在队列使用者中产生任何类型的数据结束信号或异常。例如,如果某个使用者正在被阻塞在get()操作上,关闭生产者中的队列不会导致get()方法返回错误。
    3 q.join_thread():连接队列的后台线程。此方法用于在调用q.close()方法之后,等待所有队列项被消耗。默认情况下,此方法由不是q的原始创
    

    tasklist 查看进程id号 tasklist | findstr 进程id号 os.getpid()

    mac ps aux|grep 进程号

  • 相关阅读:
    IDEA导入项目后,导入artifacts 方法 以及 Spring的配置文件找不到的解决方法
    Tomcat8中如何内存溢出,如何增大内存?
    SpringSecurity-权限关联与控制
    学习黑马教学视频SSM整合中Security遇到的问题org.springframework.security.access.AccessDeniedException: Access is denied
    SSM项目中,关于Test类中不能使用Autowired注入bean的问题
    spring mvc绑定参数之 类型转换 有三种方式:
    maven缺失ojdbc6解决方案 :Missing artifact com.oracle:ojdbc6:jar:11.2.0.1.0问题解决 ojdbc包pom.xml出错
    学习SpringMVC 文件上传 遇到的问题,403:returned a response status of 403 Forbidden ,409文件夹未找到
    【转】Linux环境搭建FTP服务器与Python实现FTP客户端的交互介绍
    Protocol buffers--python 实践 简介以及安装与使用
  • 原文地址:https://www.cnblogs.com/feiguoguobokeyuan/p/13560572.html
Copyright © 2011-2022 走看看