# 关于作者 大家好,我是程序员阿江-Relakkes,近期我会给大家出一些爬虫方面的教程,爬虫入门、进阶、高级都有,有需要的朋友,star仓库并持续关注本仓库的更新。 - [Github万星开源自媒体爬虫仓库MediaCrawler作者](https://github.com/NanmiCoder/MediaCrawler) - 全栈程序员,熟悉Python、Golang、JavaScript,工作中主要用Golang。 - 曾经主导并参与过百万级爬虫采集系统架构设计与编码 - 爬虫是一种技术兴趣爱好,参与爬虫有一种对抗的感觉,越难越兴奋。 ## 爬虫入门 ### 爬虫入门教程目录大纲 - [✔] [01_为什么要写这个爬虫教程](爬虫入门/01_为什么要写这个爬虫教程.md) - [✔] [02_个人学会爬虫能赚钱吗](爬虫入门/02_个人学会爬虫能赚钱吗.md) - [✔] [03_网络爬虫到底是什么](爬虫入门/03_网络爬虫到底是什么.md) - [✔] [04_爬虫的基本工作原理](爬虫入门/04_爬虫的基本工作原理.md) - [✔] [05_常用的抓包工具有那些](爬虫入门/05_常用的抓包工具有那些.md) - [✔] [06_Python写爬虫的优势](爬虫入门/06_为什么说用Python写爬虫有天生优势.md) - [✔] [07_Python常见的网络请求库](爬虫入门/07_Python常见的网络请求库.md) - [✔] [08_入门实战1_静态网页数据提取](爬虫入门/08_爬虫入门实战1_静态网页数据提取.md) - [✔] [09_入门实战2_动态数据提取](爬虫入门/09_爬虫入门实战2_动态数据提取.md) - [✔] [10_入门实战3_数据存储实现](爬虫入门/10_爬虫入门实战3_数据存储实现.md) - [✔] [11_入门实战4_高效率的爬虫实现](爬虫入门/11_爬虫入门实战4_高效率的爬虫实现.md) - [✖] [12_入门实战5_编写易于维护的爬虫代码](爬虫入门/12_爬虫入门实战5_编写易于维护的爬虫代码.md) ## 爬虫进阶 ### 爬虫进阶教程目录大纲 - [✔] [01_工程化爬虫开发规范](爬虫进价/01_工程化爬虫开发规范.md) - [✔] [02_反爬虫对抗基础_请求伪装](爬虫进价/02_反爬虫对抗基础_请求伪装.md) - [✔] [03_代理IP的使用与管理](爬虫进价/03_代理IP的使用与管理.md) - [✔] [04_Playwright浏览器自动化入门](爬虫进价/04_Playwright浏览器自动化入门.md) - [✔] [05_Playwright进阶_反检测与性能优化](爬虫进价/05_Playwright进阶_反检测与性能优化.md) - [✔] [06_登录认证_Cookie与Session管理](爬虫进价/06_登录认证_Cookie与Session管理.md) - [✔] [07_登录认证_扫码与短信登录实现](爬虫进价/07_登录认证_扫码与短信登录实现.md) - [✔] [08_验证码识别与处理](爬虫进价/08_验证码识别与处理.md) - [✔] [09_数据清洗与预处理](爬虫进价/09_数据清洗与预处理.md) - [✔] [10_数据分析与可视化](爬虫进价/10_数据分析与可视化.md) - [✔] [11_进阶综合实战项目](爬虫进价/11_进阶综合实战项目.md) ## 高级爬虫 ### 高级爬虫教程目录大纲 - [✖] 待更新... ## 爬虫交流群 扫码加作者企微拉进群,备注来自github爬虫教程 企微二维码 ## 免责声明 >本仓库的所有内容仅供学习和参考之用,禁止用于商业用途。任何人或组织不得将本仓库的内容用于非法用途或侵犯他人合法权益。本仓库所涉及的爬虫技术仅用于学习和研究,不得用于对其他平台进行大规模爬虫或其他非法行为。对于因使用本仓库内容而引起的任何法律责任,本仓库不承担任何责任。使用本仓库的内容即表示您同意本免责声明的所有条款和条件。 ## Star History [![Star History Chart](https://api.star-history.com/svg?repos=NanmiCoder/CrawlerTutorial&type=Date)](https://star-history.com/#NanmiCoder/CrawlerTutorial&Date)