爬虫之异步加载(实战花瓣网)
本文章属于爬虫入门到精通系统教程第八讲
本次我们会讲解两个知识点
1. 异步加载
2. headers中的Accept
本次我们要抓取的是花瓣网美女照片美女花瓣,陪你做生活的设计师(发现、采集你喜欢的美女图片)花瓣网(http://huaban.com/favorite/beauty/)
本次我们会用到的辅助包
scrapy/parsel (https://github.com/scrapy/parsel)(假如你用过scrapy,那么一定不陌生,这就是其中提取器)
Parsel is a library to extract data from HTML and XML usin