静态网页:正则、requests、BeautifulSoup 动态网页:Selenium、PantonJS、验证码(接码兔等API、机器学习简单验证码识别) 爬虫框架(Scrapy、Pyspider) 数据存储(CSV、Excel、TXT、MongoDB、Redis、mysql等等)