GitHub - JohnLyonX/supspider: Join a more convenient web crawler project: Suspider

Supspider 超级蜘蛛

1. 为何使用?

结合了优秀网络库以及原生Python的操作,让实现效果的代码更加简短

2. 有何特点?

2.1. 降低学习成本,更快上手,更加简单
2.2. 让爬虫程序更加简单再简单
2.3. 语法简短,更优雅的编码风格

阶段: 完善中,欢迎参与开发

目前提供的方法:

1.1. get
1.2. post

API:

请求方法:
Obtain(url,method,dp(data or params),headers(默认拥有简单的请求头))

doc() 获取整个html文档
edoc(path,index,encoding) 获取指定标签, path: 标签路径用法和Xpath一致, index: 标签索引(默认为None), encoding: 编码( 默认为utf-8)
json() 获取json数据

写入:
W(content, filename, mode(默认为'w'写入模式), encoding(默认为utf-8))

开始使用:

import supspider as sp

# 获取博客的body,并写入body.html
rep = sp.Obtain("http://www.lyonjohn.xyz", "GET").edoc("/html/body")
print(rep)
sp.W(rep, "body.html")

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
__pycache__		__pycache__
README-EN.md		README-EN.md
README.md		README.md
supspider.py		supspider.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

pycache

pycache

README-EN.md

README-EN.md

README.md

README.md

supspider.py

supspider.py

Repository files navigation

Supspider 超级蜘蛛

1. 为何使用?

2. 有何特点?

About

Releases

Packages

Languages

JohnLyonX/supspider

Folders and files

Latest commit

History

Repository files navigation

Supspider 超级蜘蛛

1. 为何使用?

2. 有何特点?

About

Topics

Resources

Stars

Watchers

Forks

Languages