如何让爬虫更快
本文章属于爬虫入门到精通系统教程第十一讲
在前面的教程中,我们已经学会了如何抓取一个网页,可是,当我需要抓取的数据足够多的时候,应该如何让我抓取的速度更快呢?
最简单的方法就是使用多进程.
什么是多线程
多线程(英语:multithreading),是指从软件或者硬件上实现多个线程并发执行的技术。具有多线程能力的计算机因有硬件支持而能够在同一时间执行多于一个线程,进而提升整体处理性能。
使用多线程的好处
* 使用线程可以把占据时间长的程序中的任务放到后台去处理
* 用户界面可以更加吸引人,这样比如用户点击了一个按钮去触发某些事件的处理,可以弹出一个进度条来显示处理的进度
* 程