Python爬虫历程

Python爬虫历程

社蕙 139 2023-01-20

教程

GitHub-公众号式的爬虫教程
知乎-Python3网络爬虫快速入门实战解析

Python爬虫入门教程:超级简单的Python爬虫教程
Python爬虫教程(从入门到精通):上面那个教程的全面版

request库

官方api文档
在requests如何添加Cookie参数

资源

爬虫工具库

正则表达式

正则表达式在线测试
表达式速查表

用于练手的项目位于家里电脑的D:/Code/exhentai_fav_release1.0

  1. 等研究了OCR之后打算将之扩写,因为更多人在手机上使用EHviewer或者yealico看E站而非直接在网页上收藏
  2. 实现逐本的全tag收集,目前只是访问收藏页显示的有限的tag
  3. 需要模拟点击,将本子的排列方式正确修改