背景
前几天写了一篇文章,爬虫入门到精通-网页的解析(xpath) - 知乎专栏
然后有人问我,xpath速度比bs4快么?说实话,我也不太清楚。。。
还有人说,“XPATH是最快的”,那么xpath,bs4,pyquery到底谁比较快呢?
作为一个严谨的程序员,我们必须拿数据说话
测试环境
硬件环境:
操作系统:Windows7 64
处理器:Inter(R)Xeon(R) CPU E5-2650 v3
内存:8G
软件环境:
pyquery:1.2.17
lxml:3.7.3
bs4:4.5.1
parsel:1.1.0
测试代码
1 | from pyquery import PyQuery as pq |
然后每段都跑10000次
最后的结果是
总结
显而易见 xpath以绝对的优势领先
所有代码都放在了 kimg1234/pachong
本文作者:高金
本文地址: https://igaojin.me/2018/02/03/拒绝撕逼,用数据来告诉你选择器到底哪家强/
版权声明:转载请注明出处!