zoukankan      html  css  js  c++  java
  • Celery

    Celery

    什么是 Celery ?

    Celery是一个简单、灵活且可靠的,处理大量消息的分布式系统

    专注于实时处理的异步任务队列

    同时也支持任务调度

    Celery 官网:http://www.celeryproject.org/

    Celery 官方文档英文版:http://docs.celeryproject.org/en/latest/index.html

    Celery 官方文档中文版:http://docs.jinkan.org/docs/celery/


    Celery 架构

    1)可以不依赖任何服务器,通过自身命令,启动服务(内部支持socket)
    2)celery 服务为其他项目服务提供异步解决任务需求的
    注:会有两个服务同时运行,一个是项目服务,一个是celery服务,项目服务将需要异步处理的任务交给celery服务,celery就会在需要时异步完成项目的需求

    Celery的架构由三部分组成,

    消息中间件(message broker),

    任务执行单元(worker)和

    任务执行结果存储(task result store)组成。

    消息中间件

    Celery本身不提供消息服务,但是可以方便的和第三方提供的消息中间件集成。包括,RabbitMQ, Redis等等

    任务执行单元

    Worker是Celery提供的任务执行的单元,worker并发的运行在分布式的系统节点中。

    任务结果存储

    Task result store用来存储Worker执行的任务的结果,Celery支持以不同方式存储任务的结果,包括AMQP, redis等



    使用场景

    异步执行:解决耗时任务

    延迟执行:解决延迟任务

    定时执行:解决周期(周期)任务



    Celery 的安装配置

    pip install celery

    消息中间件:RabbitMQ/Redis

    app=Celery('任务名', broker='xxx', backend='xxx')

    from celery import Celery
    
    broker = "redis://:redis123@127.0.0.1:6379/1"
    backend = "redis://:redis123@127.0.0.1:6379/2"
    
    # worker
    app = Celery(broker=broker, backend=backend, include=['celery_task.tasks'])
    


    两种 Celery 任务结构

    如果 Celery对象:Celery(...) 是放在一个模块下的
    1)终端切换到该模块所在文件夹位置:scripts
    2)执行启动worker的命令:celery worker -A 模块名 -l info -P eventlet
    注:windows系统需要eventlet支持,Linux与MacOS直接执行:celery worker -A 模块名 -l info
    注:模块名随意

    如果 Celery对象:Celery(...) 是放在一个包下的
    1)必须在这个包下建一个celery.py的文件,将Celery(...)产生对象的语句放在该文件中
    2)执行启动worker的命令:celery worker -A 包名 -l info -P eventlet
    注:windows系统需要eventlet支持,Linux与MacOS直接执行:celery worker -A 模块名 -l info
    注:包名随意



    Celery 执行异步任务

    包架构封装

    project
     ├── celery_task  	# celery包 Broker
     │   ├── __init__.py # 包文件
     │   ├── celery.py   # celery连接和配置相关文件,且名字必须交celery.py
     │   └── tasks.py    # 所有任务函数
     ├── add_task.py  	# 添加任务 Worker
     └── get_result.py   # 获取结果 Backend
    

    基本使用

    1)创建app + 任务

    2)启动celery(app)服务:

    非 windows
    命令:celery worker -A celery_task -l info
    
    windows:
    pip3 install eventlet
    celery worker -A celery_task -l info -P eventlet
    

    3)添加任务:手动添加,要自定义添加任务的脚本,右键执行脚本

    4)获取结果:手动获取,要自定义获取任务的脚本,右键执行脚本

    celery.py

    from celery import Celery
    broker = 'redis://127.0.0.1:6379/1'
    backend = 'redis://127.0.0.1:6379/2'
    app = Celery(broker=broker, backend=backend, include=['celery_task.tasks'])
    

    tasks.py

    from .celery import app
    import time
    @app.task
    def add(n, m):
     print(n)
     print(m)
     time.sleep(10)
     print('n+m的结果:%s' % (n + m))
     return n + m
    
    @app.task
    def low(n, m):
     print(n)
     print(m)
     print('n-m的结果:%s' % (n - m))
     return n - m
    
    

    add_task.py

    from celery_task import tasks
    
    # 添加立即执行任务
    t1 = tasks.add.delay(10, 20)
    t2 = tasks.low.delay(100, 50)
    print(t1.id)
    
    
    # 添加延迟任务
    from datetime import datetime, timedelta
    eta=datetime.utcnow() + timedelta(seconds=10)
    tasks.low.apply_async(args=(200, 50), eta=eta)
    

    get_result.py

    from celery_task_1.celery import app
    
    from celery.result import AsyncResult
    
    id = 'cfbea343-3ecd-4924-9e20-56b6d55924aa'
    if __name__ == '__main__':
     task_result = AsyncResult(id=id, app=app)
     if task_result.successful():
         result = task_result.get()
         print(result)
     elif task_result.failed():
         print('任务失败')
     elif task_result.status == 'PENDING':
         print('任务等待中被执行')
     elif task_result.status == 'RETRY':
         print('任务异常后正在重试')
     elif task_result.status == 'STARTED':
         print('任务已经开始被执行')
    


    高级使用

    celery.py

    # 1)创建app + 任务
    
    # 2)启动celery(app)服务:
    # 非windows
    # 命令:celery worker -A celery_task -l info
    # windows:
    # pip3 install eventlet
    # celery worker -A celery_task -l info -P eventlet
    
    # 3)添加任务:自动添加任务,所以要启动一个添加任务的服务
    # 命令:celery beat -A celery_task -l info
    
    # 4)获取结果
    
    
    # 任务的定时配置
    from datetime import timedelta
    from celery.schedules import crontab
    
    from celery import Celery
    
    broker = 'redis://:redis9@10.0.223.82:8979/10'
    backend = 'redis://:redis9@10.0.223.82:8979/11'
    
    app = Celery(broker=broker, backend=backend, include=['celery_task.tasks'])
    
    # 时区
    app.conf.timezone = 'Asia/Shanghai'
    # 是否使用UTC
    app.conf.enable_utc = False
    
    
    app.conf.beat_schedule = {
        'get_effect_list_task': {
            'task': 'celery_task.tasks.get_effect_list',
            'schedule': timedelta(minutes=60),
            # 'schedule': crontab(hour=8, minute=30, day_of_week=1),  # 每周一早八点
            'args': (),
        },
        'effect_top20_task': {
            'task': 'celery_task.tasks.effect_top20',
            'schedule': timedelta(minutes=1440),
            'args': ()
        },
        'effect_rise_task': {
            'task': 'celery_task.tasks.effect_rise',
            'schedule': timedelta(minutes=1440),
            'args': ()
        },
        'validity_of_week_task': {
            'task': 'celery_task.tasks.validity_of_week',
            'schedule': timedelta(minutes=1441)
        }
    }
    

    windows:

    发布任务
    celery -A celery_task beat
    执行任务
    celery -A celery_task worker -l info -P eventlet
    

    tasks.py

    from .celery import app
    import time
    
    from DouYinApp_Effects import effect_spider, effect_top20_spider, effect_rise_spider, del_validity_file
    
    from DouYinApp_Effects import Effect_spider
    
    effect_spider = Effect_spider()
    # get_effect_list = effect_spider.get_effect_list()
    # effect_top20 = effect_spider.effect_top20()
    # effect_rise = effect_spider.effect_rise()
    # validity_of_week = effect_spider.validity_of_week()
    
    
    @app.task
    def get_effect_list():
        effect_spider.get_effect_list()
    
    @app.task
    def effect_top20():
        effect_spider.effect_top20()
    
    @app.task
    def effect_rise():
        effect_spider.effect_rise()
    
    @app.task
    def validity_of_week(self):
        effect_spider.validity_of_week()
    
    

    get_result.py

    from celery_task.celery import app
    
    from celery.result import AsyncResult
    
    id = '21325a40-9d32-44b5-a701-9a31cc3c74b5'
    if __name__ == '__main__':
     async = AsyncResult(id=id, app=app)
     if async.successful():
         result = async.get()
         print(result)
     elif async.failed():
         print('任务失败')
     elif async.status == 'PENDING':
         print('任务等待中被执行')
     elif async.status == 'RETRY':
         print('任务异常后正在重试')
     elif async.status == 'STARTED':
         print('任务已经开始被执行')
    

    django 中使用

    celery.py

    """
    celery框架django项目工作流程
    1)加载django配置环境
    2)创建Celery框架对象app,配置broker和backend,得到的app就是worker
    3)给worker对应的app添加可处理的任务函数,用include配置给worker的app
    4)完成提供的任务的定时配置app.conf.beat_schedule
    5)启动celery服务,运行worker,执行任务
    6)启动beat服务,运行beat,添加任务
    
    重点:由于采用了django的反射机制,使用celery.py所在的celery_task包必须放置项目的根目录下
    """
    
    # 一、加载django配置环境
    import os
    os.environ.setdefault("DJANGO_SETTINGS_MODULE", "luffyapi.settings.dev")
    
    # 二、加载celery配置环境
    from celery import Celery
    # broker
    broker = "redis://:redis123@127.0.0.1:6379/1"
    # backend
    backend = "redis://:redis123@127.0.0.1:6379/2"
    # worker
    app = Celery(broker=broker, backend=backend, include=['celery_task.tasks'])
    
    
    # 时区
    app.conf.timezone = 'Asia/Shanghai'
    # 是否使用UTC
    app.conf.enable_utc = False
    
    # 任务的定时配置
    from datetime import timedelta
    from celery.schedules import crontab
    app.conf.beat_schedule = {
     'update-banner-list': {
         'task': 'celery_task.tasks.update_banner_list',
         'schedule': timedelta(seconds=10),
         'args': (),
     }
    }
    

    tasks.py


    from .celery import app
    
    from django.core.cache import cache
    from home import models, serializers
    from django.conf import settings
    
    @app.task
    def update_banner_list():
     cache.delete('banner_list')
     return True
    
    
    '''
    @app.task
    def update_banner_list():
     queryset = models.Banner.objects.filter(is_delete=False,
                                             is_show=True).order_by('-orders')[:settings.BANNER_COUNT]
     banner_list = serializers.BannerSerializer(queryset, many=True).data
    
     # 拿不到 request 对象,所以对象的链接 base_url 要自己拼接
     for banner in banner_list:
         banner['image'] = 'http://127.0.0.1:8000%s' %banner['image']
     cache.set('banner_list', banner_list, 86400)
     return True
     
    '''
    

    celery在服务器上启动:
    1)打开终端连接服务器
    2)cd到项目所在目录,也就是大luffyapi
    3)启动celery,不需要-P eventlet,但是要在最后加上&,代表后台启动
    4)按ctrl + c退出,再去启动beat命令就行,同样带&,再ctrl + c退出

  • 相关阅读:
    实习第一周小记------生活不易
    第一次实习面试感受----苦逼程序员生活初体验
    第一次实习面试感受----苦逼程序员生活初体验 分类: 程序人生 2013-07-28 14:13 2395人阅读 评论(0) 收藏
    Java-基于JDK的动态代理
    JS字符串去替换元素再转换成数组
    byte溢出栗子
    Java链式写法
    Scala笔记
    Java反射使用方法
    Java数组3种创建方式
  • 原文地址:https://www.cnblogs.com/kai-/p/12411863.html
Copyright © 2011-2022 走看看