当前位置: 首页 > 图灵资讯 > 行业资讯> Python之自动获取目标网站最新通知

Python之自动获取目标网站最新通知

来源:图灵python
时间: 2025-02-10 13:42:01

Python自动获取目标网站最新通知:

1、建立通知数据库

本步骤的目的是爬取目标网站发布的通知数据并存储,以建立与目标网站内容相对应的本地数据库。

考虑到数据库中的数据将是识别和获取新通知的唯一方法,建立的数据库将存储每个通知的标题、发布日期和访问链接。

第一步使用的模块包括urllib、Beautifulsoup和sqlite3模块。其中,目标网页html数据通过urlib模块爬行;通过beautifulsoup模块分析网页数据,爬行网页内容;通过sqlite3模块建立目标网站的通知数据库。

该步骤的主要代码显示如下。

d55afae3a58c439e98ea73d4448e0c49.jpg

2、建立邮件发送系统

本步骤的目的是利用Python标准库模块smtplib访问网络,创建发送电子邮件的功能。

由于我们大多数人的计算机没有建立自己的电子邮件服务器,我们需要使用第三方服务器来模拟电子邮件发送。

常用的有谷歌邮件系统、网易邮件系统和QQ邮件系统,如SMTP服务器和QQ邮件系统的端口号.qq.com和465。

该步骤的主要代码显示如下。

4f20d07bdd824be9a0cb9bd1797ed6de.jpg

在这个例子中,Python标准库中的email模块被用来格式化电子邮件信息,主要包括电子邮件的主题和发件人、收件人的电子邮件昵称和电子邮件内容。

3、分析检测目标网站通知

在前两步中,目标网站已经建立了通知数据库和邮件发送系统,第三步主要由两部分组成。

首先,使用第一步使用的urllib、BeautifulSoup模块分析目标网站的内容数据,并与之前建立的数据库进行比较检测。

第二,如果发现目标网站有新的通知,将新的通知数据插入数据库,然后发送提示电子邮件。

该步骤的主要代码显示如下。

在这个例子中,只选择最新的通知发送电子邮件提示,具体的电子邮件信息可以自己设置。

c1680efe0ac142ae970387b007a71a99.jpg

4、制定计划任务

前三步完成了使用Python获取目标网站最新通知并发送提示电子邮件的脚本程序。

在此步骤中,Python脚本将使用Windows自带的DOS命令框架和任务计划程序每小时自动运行一次,以实现自动更新通知的目的。

首先,在DOS框架下执行Python脚本需要编写cmd命令文件。

主要代码显示如下:

@echooff#关闭回显
cdC:\demo#找到Python脚本文件的路径
pythonPython.py#Python脚本文件执行

最后,使用任务计划程序制定任务,可以设置为每小时自动运行一次cmd命令文件。

2d473db35dfb44ef8064ce4b03f5b731.jpg

更多python高级知识,请观看python高级视频教程!!