zoukankan      html  css  js  c++  java
  • celery的使用

    介绍

    Celery 是一个基于python开发的分布式异步消息任务队列,通过它可以轻松的实现任务的异步处理, 如果你的业务场景中需要用到异步任务,就可以考虑使用celery。
    异步任务介绍
    在写项目过程中经常会遇到一些耗时的任务, 比如:发送邮件、发送短信等等~。这些操作如果都同步执行耗时长对用户体验不友好,在这种情况下就可以把任务放在后台异步执行
    celery就是用于处理异步任务的框架,celery能完成的功能远不止异步任务,还有一个很常用的功能定时任务.

    架构
     
    image.png
    Celery包含如下组件:

    Celery Beat:任务调度器,Beat进程会读取配置文件的内容,周期性地将配置中到期需要执行的任务发送给任务队列。
    Celery Worker:执行任务的消费者,通常会在多台服务器运行多个消费者来提高执行效率。
    Broker:消息代理,或者叫作消息中间件,接受任务生产者发送过来的任务消息,存进队列再按序分发给任务消费方(通常是消息队列或者数据库)。
    Producer:调用了Celery提供的API、函数或者装饰器而产生任务并交给任务队列处理的都是任务生产者。
    Result Backend:任务处理完后保存状态信息和结果,以供查询。Celery默认已支持Redis、RabbitMQ、MongoDB、Django ORM、SQLAlchemy等方式。

    特点
    • 简单:一单熟悉了celery的工作流程后,配置和使用还是比较简单的
    • 高可用:当任务执行失败或执行过程中发生连接中断,celery 会自动尝试重新执行任务
    • 快速:一个单进程的celery每分钟可处理上百万个任务
    • 灵活: 几乎celery的各个组件都可以被扩展及自定制
    多任务执行方式

    后台多任务方式:
    启动:celery multi start w1 -A proj -l info
    重启:celery multi restart w1 -A proj -l info
    停止:celery multi stop w1 -A proj -l info
    任务执行完毕后才退出:celery multi stopwait w1 -A proj -l info

    定时任务

    celery支持定时任务,设定好任务的执行时间,celery就会定时自动帮你执行, 这个定时任务模块叫celery beat

    方式一:函数方式
    from celery import Celery
    from celery.schedules import crontab
     
    app = Celery()
     
    @app.on_after_configure.connect
    def setup_periodic_tasks(sender, **kwargs):
        # Calls test('hello') every 10 seconds.
        sender.add_periodic_task(10.0, test.s('hello'), name='add every 10')
     
        # Calls test('world') every 30 seconds
        sender.add_periodic_task(30.0, test.s('world'), expires=10)
     
        # Executes every Monday morning at 7:30 a.m.
        sender.add_periodic_task(
            crontab(hour=7, minute=30, day_of_week=1),
            test.s('Happy Mondays!'),
        )
     
    @app.task
    def test(arg):
        print(arg)
    
    方式二:配置文件形式
    app.conf.beat_schedule = {
        'add-every-30-seconds': {
            'task': 'tasks.add',
            'schedule': 30.0,
            'args': (16, 16)
        },
    }
    app.conf.timezone = 'UTC'
    

    任务添加好了,需要让celery单独启动一个进程来定时发起这些任务, 注意, 这里是发起任务,不是执行,这个进程只会不断的去检查你的任务计划, 每发现有任务需要执行了,就发起一个任务调用消息,交给celery worker去执行
    启动任务调度器celery beat:celery -A periodic_task beat
    此时还差一步,就是还需要启动一个worker,负责执行celery beat发起的任务
    启动celery worker来执行任务:celery -A periodic_task worker

    常用的定时任务配置
    ExampleMeaning
    crontab() 默认是每分钟
    crontab(minute=0, hour=0) 每天0点执行
    crontab(minute=0, hour='*/3') 每隔3个小时执行
    crontab(minute=0,hour='0,3,6') 0点、3点、6点执行
    crontab(minute='*/15') 每隔15分钟
    crontab(day_of_week='sunday') 每逢周日的每一分钟执行
    crontab(minute='',hour='',day_of_week='sun') 与上一个意义一致
    crontab(minute='*/10',hour='3,17,22',day_of_week='fri') 在周五3-4点、17-18点、22-23点之间每隔10分钟执行
    crontab(minute=0,hour='/2,/3') 能被2,3整除的小时执行
    crontab(minute=0, hour='*/5') 能被5整除的小时执行
    crontab(minute=0, hour='*/3,8-17') 能被3整除或者8-17之间的小时执行
    crontab(0, 0,day_of_month='2') 每个月的第二天
    crontab(0, 0,day_of_month='2-30/3') 偶数天执行
    crontab(0, 0,day_of_month='1-7,15-21') 每个月的第一周和第三周
    crontab(0, 0,day_of_month='11',month_of_year='5') 每年的5月11日执行
    crontab(0, 0,month_of_year='*/3') 在每个季度的第一个月执行

    上面能满足你绝大多数定时任务需求了,甚至还能根据潮起潮落来配置定时任务

    最佳实践之与django结合

    django 可以轻松跟celery结合实现异步任务,只需简单配置即可
    项目目录

    - proj /
       - proj / __init__ . py
       - proj / settings . py
       - proj / urls . py
    - manage . py
    

    proj/proj/celery.py

    from __future__ import absolute_import, unicode_literals
    import os
    from celery import Celery
     
    # 为celery程序设置默认的Django设置模块
    os.environ.setdefault('DJANGO_SETTINGS_MODULE', 'proj.settings')
     
    app = Celery('proj')
     
    # 从配置文件中引入celery相关参数,每个参数使用CELERY_开头
    app.config_from_object('django.conf:settings', namespace='CELERY')
     
    # 从每个app中的tasks.py文件加载异步任务
    app.autodiscover_tasks()
     
     
    @app.task(bind=True)
    def debug_task(self):
        print('Request: {0!r}'.format(self.request))
    

    proj/proj/__init__.py

    from __future__ import absolute_import, unicode_literals
     
    # 确保celery文件一定被引用
    from .celery import app as celery_app
     
    __all__ = ['celery_app']
    

    proj/xxx/tasks.py

    from __future__ import absolute_import, unicode_literals
    from celery import shared_task
    
    @shared_task
    def add(x, y):
        return x + y
    
    @shared_task
    def mul(x, y):
        return x * y
    
    @shared_task
    def xsum(numbers):
        return sum(numbers)
    

    proj/xxx/views.py

    from django.shortcuts import render,HttpResponse
    from  bernard import tasks
     
    def task_test(request):
        res = tasks.add.delay(228,24)
        print("start running task")
        print("async task res",res.get() )
        return HttpResponse('res %s'%res.get())
    
    在django中使用计划任务功能

    安装:pip install django-celery-beat
    加载:在settings.py中INSTALLED_APPS加入django_celery_beat
    生成相关数据库:python manage.py migrate
    开启定时任务:celery -A proj beat -l info -S django
    结果:

     
    admin中的3张表

     
    image.png

    此时启动你的celery beat 和worker,会发现每隔2分钟,beat会发起一个任务消息让worker执行scp_task任务
    注意,经测试,每添加或修改一个任务,celery beat都需要重启一次,要不然新的配置不会被celery beat进程读到
    celery flower

    (1).查看任务历史,任务具体参数,开始时间等信息。
    (2).提供图表和统计数据。
    (3).实现全面的远程控制功能, 包括但不限于 撤销/终止任务, 关闭重启 worker, 查看正在运行任务。
    (4).提供一个 HTTP API , 方便集成。
    终端执行:celery flower --broker=redis://localhost:6379/6



  • 相关阅读:
    go爬虫
    node简单爬虫request简单运用
    Centos7.4安装Mysql5.6
    HTML本地资源读取!
    node-request模块
    react中使用AntDesign库 --- babel-plugin-import 配置
    Django 模型(数据库)
    TypeScript--安装依赖,vscode配置ts自动转换成js文件
    python爬虫
    nodejs爬虫简单实现
  • 原文地址:https://www.cnblogs.com/ouyang99-/p/11412842.html
Copyright © 2011-2022 走看看