手动刷图费时费力,至少我是这么想的。于是就有了这个项目及后续更新。
本项目基于Win7, Python3.5.2
与Win10, Python3.6.7
开发,在Ubuntu16.04, Python3.5.2
运行成功,其他环境未考虑。
- 支持从指定的开始页码爬取到结束页码
- 也支持从第一页爬取到上一次开始爬取的位置
- 支持设置爬取的图片类型(全部、横图、竖图、正方形)
- 支持最大或最小图片尺寸、宽高比限制
- 支持限制爬取的图片体积
- 按照当天的日期创建目录并存放爬取的图片
- 爬取结束后会在图片目录下生成日志文件
- 支持tag搜索与排除
- (可选)GUI
可选
编辑config.json
中folder_path
参数,设为自己想要的目录,如文件夹不存在将会自动创建。路径必须以斜杠结尾。
可接受的分隔符只有/
或\\
,\
将被认为是转义字符而报错。
剩下的参数可以运行后根据提示修改。
Windows下命令行执行python index.py
或python GUI.py
均可,Linux下可直接执行。
每次运行后config.json
中last_stop_id
参数会被自动修改为爬取到的第一张图片的ID,便于下一次爬取时只爬取新post,无论停止条件为ID或是页码。
新增:tag搜索,图形界面与并行下载
终于完成了啦