爬虫简介

爬风景,爬美女,爬链接,专业爬…

爬,不是偷窃!尊重版权,分享技术

* 爬,不是偷窃!“尊重版权,分享技术”:仅此而已!

* 生活是艰难的:甚至需要爬……

* 但在这里,爬网页,爬知识,是有乐趣的:缓存网页结果,类似jQuery选择器取资料,多进程执行(折腾中)……

* 我怎么感觉,这个`理论`与“人生苦短,我用Python”非常接近???

简单采集小试牛刀

* 爬风景(图片)爬美女(图片)动物世界花鸟壁纸baidu图片nipic图……

* 爬链接:自动搜索关键字,自动打开这些链接;为SEO???

* DIY爬:自定义采集页面元素,我怎么感觉在用JQ?对,这里用PyQuery!

某网站专业采集

* 专业采集某网站:类别(地区等),信息列表,信息详情,关联图片……

ReadMe申明

* 所有爬取的图片文字等资源,版权等属于目标网站或原版权所有者; 这里,仅为演示功能,分享技术!

* 您若在意(爬您图片):请联系 xpigeon#163.com,3工作日内屏蔽;

* 您若使用(本系统)采集东西:欢迎切磋;但请同时尊重(被采集方的)版权,合法使用!

* 多进程:放在Flask中,总出问题(折腾中)……感谢指点!

(Node.js)微框架 # 贴心猫 # QQ群:607070548 # E-mail

微爬(Wepy) Copyright © MIT

run:0.188(s), tpl:front/pa/index.htm, upd:2024-04-20 19:14:42