Skip to content

Python多线程下载 草榴(t66y.com) 网站【新時代的我們】和【達蓋爾的旗幟】两个板块帖子内的图片

Notifications You must be signed in to change notification settings

iyzgit/t66y_spider

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

69 Commits
 
 
 
 
 
 
 
 

Repository files navigation

t66y_spider

利用爬虫下载草榴【新時代的我們】和【達蓋爾的旗幟】两个板块帖子内的图片

环境要求

解释器版本

Python 3.x

模块列表

pip install -r requirements.txt

代理配置

根目录下有代理配置文件,可以配置http/https代理,(参数[-p 0]可以禁用代理)
默认配置:

{
  "http": "socks5://localhost:1080",
  "https": "socks5://localhost:1080"
}

本地代理

  1. 本地开启ss/ssr/v2ray等服务
  2. 设置“允许来自局域网的链接”
  3. 修改配置文件proxy中的代理端口为ss/ssr/v2ray的本地代理端口(一般默认1080)
    请确保PAC文件设置了代理草榴网站的规则

远程代理

填入代理提供商的IP地址以及对应端口号即可(如socks5://xxx.xxx.xxx.xxx:1234/)

使用方法

命令行:

python Spider_of_t66y.py [-h] [-c CLASS_ID] [-s START] [-e END] [-m MAX_THREAD]
[-h] 显示帮助信息
[-c] 下载类别,1下载【新時代的我們】板块 , 2下载【達蓋爾的旗幟】板块 , 0同时下载两个板块
[-s] 下载的起始页(默认1)
[-e] 下载的尾页
[-m] 设置最大下载线程(默认200)
[-p] '0':禁用代理配置 默认'1':启用代理
下载完成的图片会保存在./t66y目录

example:

python Spider_of_t66y.py -c 1 -s 1 -e 2 -m 300
python Spider_of_t66y.py -c 2 -p 0
python Spider_of_t66y.py -h

友情提醒

实际测试中线程数量过多会触发图床的流量保护,导致无法下载图片
同时如果代理服务器带宽较小,造成长时间拥塞,程序会自动结束某些下载线程

仅供学习,注意身体
by.赤道企鹅™

About

Python多线程下载 草榴(t66y.com) 网站【新時代的我們】和【達蓋爾的旗幟】两个板块帖子内的图片

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Python 100.0%