t66y_spider

利用爬虫下载草榴【新時代的我們】和【達蓋爾的旗幟】两个板块帖子内的图片

环境要求

解释器版本

Python 3.x

模块列表

pip install -r requirements.txt

代理配置

根目录下有代理配置文件，可以配置http/https代理，（参数[-p 0]可以禁用代理）
默认配置：

{
  "http": "socks5://localhost:1080",
  "https": "socks5://localhost:1080"
}

本地代理

本地开启ss/ssr/v2ray等服务
设置“允许来自局域网的链接”
修改配置文件proxy中的代理端口为ss/ssr/v2ray的本地代理端口（一般默认1080）
请确保PAC文件设置了代理草榴网站的规则

远程代理

填入代理提供商的IP地址以及对应端口号即可（如socks5://xxx.xxx.xxx.xxx:1234/）

使用方法

命令行:

python Spider_of_t66y.py [-h] [-c CLASS_ID] [-s START] [-e END] [-m MAX_THREAD]
[-h] 显示帮助信息
[-c] 下载类别，1下载【新時代的我們】板块 , 2下载【達蓋爾的旗幟】板块 , 0同时下载两个板块
[-s] 下载的起始页（默认1）
[-e] 下载的尾页
[-m] 设置最大下载线程（默认200）
[-p] '0':禁用代理配置默认'1'：启用代理
下载完成的图片会保存在./t66y目录

example:

python Spider_of_t66y.py -c 1 -s 1 -e 2 -m 300
python Spider_of_t66y.py -c 2 -p 0
python Spider_of_t66y.py -h

友情提醒

实际测试中线程数量过多会触发图床的流量保护，导致无法下载图片
同时如果代理服务器带宽较小，造成长时间拥塞，程序会自动结束某些下载线程

仅供学习，注意身体
by.赤道企鹅™

Name		Name	Last commit message	Last commit date
Latest commit History 69 Commits
README.md		README.md
Spider_of_t66y.py		Spider_of_t66y.py
proxy		proxy
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

t66y_spider

环境要求

解释器版本

模块列表

代理配置

本地代理

远程代理

使用方法

命令行:

example:

友情提醒

About

Uh oh!

Releases

Packages

Languages

iyzgit/t66y_spider

Folders and files

Latest commit

History

Repository files navigation

t66y_spider

环境要求

解释器版本

模块列表

代理配置

本地代理

远程代理

使用方法

命令行:

example:

友情提醒

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages