欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 文旅 > 手游 > 【实战:Django-Celery-Flower实现异步和定时爬虫及其监控邮件告警】

【实战:Django-Celery-Flower实现异步和定时爬虫及其监控邮件告警】

2024/10/24 10:18:05 来源:https://blog.csdn.net/weixin_50556117/article/details/140428237  浏览:    关键词:【实战:Django-Celery-Flower实现异步和定时爬虫及其监控邮件告警】

1 Django中集成方式一(通用方案)

1.1 把上面的包-复制到djagno项目中

在这里插入图片描述

1.2 在views中编写视图函数

1.3 配置路由

1.4 浏览器访问,提交任务

1.5 启动worker执行任务

1.6 查看任务结果


2 Django中集成方式二(官方方案)

2.0 安装模块

pip installDjango==3.2.22
pip install celery
pip install redis
pip install eventlet  #在windows环境下需要安装eventlet包
-----------
pip install django-celery-beat
pip install django-celery-results
pip install django-simpleui

2.1 在项目目录下新建celery.py

import os
import django
from celery import Celery
from django.conf import settingsos.environ.setdefault('DJANGO_SETTINGS_MODULE', 'celery_demo.settings')
django.setup()
# broker = 'redis://127.0.0.1:6379/1'
# backend = 'redis://127.0.0.1:6379/2'
# app = Celery('celery_demo',broker=broker, backend=backend)app = Celery('celery_demo')
# app.conf.update(
#     BROKER_URL='redis://127.0.0.1:6379/1',
#     # BACKEND配置,使用redis
#     CELERY_RESULT_BACKEND='redis://127.0.0.1:6379/2',
#     CELERY_ACCEPT_CONTENT=['json'],
#     CELERY_TASK_SERIALIZER='json',
#     # 结果序列化方案
#     CELERY_RESULT_SERIALIZER='json',
#     # 任务结果过期时间,秒
#     CELERY_TASK_RESULT_EXPIRES=60 * 60 * 24,
#     # 时区配置
#     CELERY_TIMEZONE='Asia/Shanghai',
# )app.config_from_object('django.conf:settings')app.autodiscover_tasks()
# app.autodiscover_tasks(lambda: settings.INSTALLED_APPS)

在这里插入图片描述

2.2 在django配置文件中加入

# celery 配置
###----Celery redis 配置-----###
# Broker配置,使用Redis作为消息中间件
BROKER_URL = 'redis://127.0.0.1:6379/1'
# BACKEND配置,使用redis
CELERY_RESULT_BACKEND = 'redis://127.0.0.1:6379/2'
CELERY_ACCEPT_CONTENT = ['json']
CELERY_TASK_SERIALIZER = 'json'
# 结果序列化方案
CELERY_RESULT_SERIALIZER = 'json'
# 任务结果过期时间,秒
CELERY_TASK_RESULT_EXPIRES = 60 * 60 * 24
# 时区配置
CELERY_TIMEZONE = 'Asia/Shanghai'

在这里插入图片描述

2.3 在主目录的__init__.py中添加如下代码

from .celery import app as celery_app__all__ = ('celery_app',)

在这里插入图片描述

2.4 在app下新建tasks.py(必须叫tasks.py)

from celery import shared_task
import time@shared_task()
def add():time.sleep(1)print('结果是')return 10@shared_task()
def send_email(mail):time.sleep(1)print(f'给{mail}发送邮件了')return '成功'

在这里插入图片描述

2.5 实现异步views.py

from django.shortcuts import render,HttpResponse# Create your views here.from .tasks import add
def celery_add(request):res=add.delay()return HttpResponse(res)

在这里插入图片描述

2.6 配置路由

总路由urls.py

from django.contrib import admin
from django.urls import path,includeurlpatterns = [path('admin/', admin.site.urls),path('app01/', include('app01.urls')),
]

app自己的路由urls.py

from django.contrib import admin
from django.urls import path
from .views import celery_addurlpatterns = [path('celery_demo/', celery_add),
]

2.7 启动celery

celery -A celery_demo worker -l debug -P eventlet

在这里插入图片描述

2.8 浏览器访问-添加任务

http://127.0.0.1:8000/app01/celery_demo/

3 实现定时任务

3.1 settings.py加入

# celery_beat
CELERYBEAT_SCHEDULE = {'every_5_seconds': {# 任务路径'task': 'app01.tasks.add',# 每5秒执行一次'schedule': 200,'args': ()},# 'every_10_seconds': {#     # 任务路径#     'task': 'app01.tasks.send_email',#     # 每10秒执行一次,task1的参数是5#     'schedule': 10,#     'args': (['306334678@qq.com'])# }
}

3.2 启动worker和beat

celery -A celery_demo worker -l debug -P eventlet
celery -A celery_demo beat -l debug

4 通过Admin配置定时任务

通过settings.py的配置可以实现定时任务的配置,做为实际项目中可能还是不够实用,更加工程化的做法是将定时任务的配置放到数据库里通过界面来配置。
Celery对此也提供了很好的支持,这需要安装django-celery-beat插件

4.1 安装djiango-celery-beat

pip install django-celery-beat

4.2 在APP中注册djiango-celery-beat

INSTALLED_APPS = [
....
'django_celery_beat',
]

4.3 在settings.py中设置调度器及时区

在settings.py中屏蔽到原来的调度器,加入

CELERYBEAT_SCHEDULER = 'django_celery_beat.schedulers.DatabaseScheduler' 

4.4 设置时区

LANGUAGE_CODE = 'zh-hans'
TIME_ZONE = 'Asia/Shanghai'
USE_I18N = True
USE_TZ = False

4.5 数据库迁移

python manage.py migrate django_celery_beat

4.6 启动woker和beat

#在两个控制台分别启动woker和betacelery -A celery_demo worker -l debug -P eventlet
celery -A celery_demo beat -l debug

4.7 创建超级用户-访问admin的web管理端

# 1 创建超级用户
python manage.py createsuperuser# 2 访问admin
http://127.0.0.1:8000/admin/login/

4.8 美化admin

# 1 开源地址
https://gitee.com/tompeppa/simpleui
# 2 文档地址
https://newpanjing.github.io/simpleui_docs/config.html# 3 安装
pip3 install django-simpleui# 4 配置appINSTALLED_APPS = ['simpleui','django.contrib.admin','django.contrib.auth','django.contrib.contenttypes','django.contrib.sessions','django.contrib.messages','django.contrib.staticfiles',...]# 5 重新打开admin

在这里插入图片描述

5 admin监控任务执行情况

在控制台监控任务执行情况,还不是很方便,最好是能够通过web界面看到任务的执行情况,如有多少任务在执行,有多少任务执行失败了等。
这个Celery也是可以做到了,就是将任务执行结果写到数据库中,通过web界面显示出来。
这里要用到django-celery-results插件。
通过插件可以使用Django的orm作为结果存储,这样的好处在于我们可以直接通过django的数据查看到任务状态,同时为可以制定更多的操作

5.1 安装django-celery-results

pip install django-celery-results

5.2 配置settings.py,注册app

INSTALLED_APPS = (
...,
'django_celery_results',
)

5.3 修改backend配置,将Redis改为django-db

# BACKEND配置,使用redis
#CELERY_RESULT_BACKEND = 'redis://127.0.0.1:6379/1'# 使用使用django orm 作为结果存储
CELERY_RESULT_BACKEND = 'django-db'  #使用django orm 作为结果存储

5.4 迁移数据库

python manage.py migrate django_celery_results
# 可以看到创建了django_celery_results相关的表

5.5 admin 查看

在这里插入图片描述

6 Flower监控任务执行情况

如果不想通django的管理界面监控任务的执行,还可以通过Flower插件来进行任务的监控。Flower的界面更加丰富,可以监控的信息更全

Flower 是一个用于监控和管理 Celery 集群的开源 Web 应用程序。它提供有关 Celery workers 和tasks状态的实时信息

# Flower可以:
1 实时监控celery的Events-查看任务进度和历史记录-查看任务详细信息(参数、开始时间、运行时间等)2 远程操作-查看workers 状态和统计数据-关闭并重新启动workers 实例-控制工作池大小和自动缩放设置-查看和修改工作实例消耗的队列-查看当前正在运行的任务-查看计划任务(预计到达时间/倒计时)-查看保留和撤销的任务-应用时间和速率限制-撤销或终止任务3 Broker 监控-查看所有 Celery 队列的统计信息

6.1 安装和启动

# 安装
pip install flower# 启动
# 方式一:
celery -A celery_demo flower --port-5555
#方式二
celery --broker=redis://127.0.0.1:6379/1 flower# 浏览器访问:
http://127.0.0.1:5555/

在这里插入图片描述
在这里插入图片描述

7 任务异常自动告警

虽然可以通过界面来监控了,但是我们想要得更多,人不可能天天盯着界面看吧,如果能实现任务执行失败就自动发邮件告警就好了。这个Celery当然也是没有问题的。
通过钩子程序在异常的时候触发邮件通知

7.1 tasks.py中加入

from celery import shared_task
import time
from celery import Task
from django.core.mail import send_mail
from django.conf import settings
# 成功失败邮件告警
class SendEmailTask(Task):def on_success(self, retval, task_id, args, kwargs):info = f'任务成功-- 任务id是:{task_id} , 参数是:{args} , 执行成功 !'send_mail('celery任务监控成功告警', info, settings.EMAIL_HOST_USER, ["616564099@qq.com",])print('------------成功')def on_failure(self, exc, task_id, args, kwargs, einfo):info = f'任务失败-- 任务id为:{task_id} , 参数为:{args} , 失败 ! 失败信息为: {exc}'send_mail('celery任务监控失败告警', info, settings.EMAIL_HOST_USER, ["616564099@qq.com",])print('------------失败')def on_retry(self, exc, task_id, args, kwargs, einfo):print(f'任务id位::{task_id} , 参数为:{args} , 重试了 !  错误信息为: {exc}')@shared_task(base=SendEmailTask, bind=True)
def add(a,b):time.sleep(1)return a+b@shared_task()
def send_email(mail):print(f'给{mail}发送邮件了')return '成功'# celery -A celery_demo worker -l debug -P eventlet
# celery -A celery_demo beat -l debug
# celery -A celery_demo flower --port-5566

7.2 重启服务

# celery -A celery_demo worker -l debug -P eventlet# celery -A celery_demo beat -l debug

7.3 验证效果

在任务成功或失败的时候发邮件通知

在这里插入图片描述

在这里插入图片描述

8 爬取技术文章并告警

8.1 task.py

import requests
from bs4 import BeautifulSoup
from redis import Redis
from app01.models import Article
@shared_task(base=SendEmailTask, bind=True)
def crawl_cnblogs(self):# redis 链接conn = Redis(host='127.0.0.1', port='6379')res = requests.get('https://www.cnblogs.com/')soup = BeautifulSoup(res.text, 'html.parser')article_list = soup.find_all(name='article', class_='post-item')for article in article_list:title = article.find(name='a', class_='post-item-title').textauthor = article.find(name='a', class_='post-item-author').span.texturl = article.find(name='a', class_='post-item-title').attrs.get('href')desc = article.find(name='p', class_='post-item-summary').text.strip()print(f'''文章标题:{title}文章作者:{author}文章地址:{url}文章摘要:{desc}''')res = conn.sadd('urls', url)if res:Article.objects.create(title=title, author=author, url=url, desc=desc)

8.2 models.py

class Article(models.Model):title = models.CharField(max_length=64)author = models.CharField(max_length=64)url = models.CharField(max_length=64)desc = models.TextField()

8.3 在admin中添加任务并查看结果

#### 邮箱配置####
EMAIL_HOST = 'smtp.qq.com'  # 如果是 163 改成 smtp.163.com
EMAIL_PORT = 465
EMAIL_HOST_USER = '306334678@qq.com'  # 帐号
EMAIL_HOST_PASSWORD = 'nbjpdbazeeflbjej'  # 密码
DEFAULT_FROM_EMAIL = EMAIL_HOST_USER
#这样收到的邮件,收件人处就会这样显示
#DEFAULT_FROM_EMAIL = 'lqz<'306334678@qq.com>'
EMAIL_USE_SSL = True   #使用ssl
#EMAIL_USE_TLS = False # 使用tls#EMAIL_USE_SSL 和 EMAIL_USE_TLS 是互斥的,即只能有一个为 True

8.4 爬美女图片

import os
# 爬取美女图片
@shared_task(base=SendEmailTask, bind=True)
def crawl_photo(self,url):res = requests.get(url)res.encoding = 'gbk'# print(res.text)soup = BeautifulSoup(res.text, 'html.parser')ul = soup.find('ul', class_='clearfix')img_list = ul.find_all(name='img', src=True)for img in img_list:try:url = img.attrs.get('src')if not url.startswith('http'):url = 'https://pic.netbian.com' + urlprint(url)res1 = requests.get(url)name = url.split('-')[-1]with open(os.path.join(settings.BASE_DIR,'img',name), 'wb') as f:for line in res1.iter_content():f.write(line)except Exception as e:continue

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com