Qt Designer设计微博采集界面实战

微博采集界面是将热门微博的爬虫与软件开发相结合,这是爬虫软件的核心开发思想,使用者在软件设置中的信息会以函数参数的形式传递给爬虫函数,爬虫根据用户设置的信息去执行相应的爬取操作。

微博采集界面使用了多个不同类型的控件,使用QT Designer打开weibo_collect.ui,进一步分析软件界面设计原理。

微博采集界面共有9个功能控件以及多个优化控件,优化控件是为了美化界面,实质上并没有太多的功能,比如Line和QLabel控件等。界面的功能控件说明如下:
● 主菜单。返回软件主界面,并关闭微博采集界面。
● 账号密码。设置微博采集的账号,因为爬取热门微博需要登录微博用户,所以采集微博之前,需要根据文本框的内容进行微博登录。
● 采集内容。采集热门微博需根据关键词筛选相关微博再进行爬取,而该文本框是为爬虫提供动态的关键词。
● 采集选项。默认情况下只爬取微博的文字内容,如需爬取微博的图片和视频,可勾选相应的选项。
● 采集页数。微博搜索只提供50页的相关微博,通过设置页数来控制爬取范围。
● 采集按钮。用于启动或暂停爬虫的运行,爬取结果存储在CSV文件中。
● 进度条。将采集页数进行分段爬取,每完成一次爬取就会显示相应的进度。
● 状态。显示爬虫的信息提示,如用户登录是否成功、微博采集是否完成等信息。
● 微博内容。读取CVS文件,将爬取结果以数据表格形式呈现。

界面的设计流程与软件主界面相同,将界面设计文件weibo_collect.ui转换成weibo_collect.py文件,然后在collect.py中定义子类weibo_collect_logic,通过继承并重写weibo_collect.py的Ui_Dialog类。子类重写了初始化函数并自定义了5个类方法,具体的代码如下:

发表评论