scrapy框架学习

框架图

downloader

用来下载输入url的

Spiders

用来将下载的reponse信息进行解析的

item

在item类中定义好需要从response中提取的属性

pipeline

管道,将爬取完成后item进行自定义的处理,比如持久化到DB中

settings

对整个爬虫进行设置,例如深度设置

Newer Post

RabbitMQ 总结

最近在工作中因为要用到消息队列,所以简单学习了一下,把rabbitmq的官方文档学习了一遍,代码运行了一遍,收获颇丰,遂总结一下学到的这些知识点。 关于角色 P:发布者(producer)是发布消息的应用程序。 X:交换机(exchange)发布者只需要把消息发送给一个交换机。交换机非常简单,它一 …

mq 继续阅读
Older Post

博客里程碑

刚看完2018世界杯,边看边把博客倒腾了一下。 每次看到别人的优秀的博客,总是暗暗称奇!可是自己多年来却总也没能养成写博客的习惯。闲来无事,思考一下写博客的意义,所谓名不正则言不顺,言不顺则事不成。 最早开始写博客是为了记录项目的分析过程,当时做了一个开源的二次开发项目,主要记录了一些代码的阅读分析 …

daodao 继续阅读