Skip to content

yuan-boss/crawling_pythonSpider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 

Repository files navigation

crawling_pythonSpider

简介

本脚本使用面向对象的编程思想,借助爬虫技术,实现对pythonSpider网站的源码,图片爬取与下载。

主要用于提高对python的爬虫熟练度

使用帮助

环境准备

将pythonSpider部署到web服务中,可以将文件夹放入phpStudy或者其他web服务的根目录下

安装库

pip install -r requirements.txt

演示

启动程序

python crawling_pythonSpider.py

输入网站路径

我的路径为:

http://127.0.0.1/python-spider/

image-20230920100043389

image-20230919222031896

可以看到,目录中已经存在网页源码,js源码与图片

image-20230919220720627

About

面向对象之爬取 pythonSpider 网页数据实战

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors