基于scrapy的redis安装和配置方法

时间：2020-10-11 10:45:20|栏目：Python代码|点击：次

在定向爬虫的制作过程中，使用分布式爬取技术可以显著提高爬取效率。而 Redis 配合 Scrapy 是实现分布式爬取的基础。

Redis 是一个高性能的 Key-Value 数据库，它把数据保存在内存里。因此可以有非常快的数据读写速度。

scrapy-redis 的安装

pip install scrapy-redis
easy_install scrapy-redis

下载

http://redis.io/download

版本推荐

stable 3.0.2

运行redis

redis-server redis.conf

清空缓存

redis-cli flushdb

scrapy配置redis

settings.py配置redis

SCHEDULER = "scrapy_redis.scheduler.Scheduler"
SCHEDULER_PERSIST = True
SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.SpiderPriorityQueue'
REDIS_URL = None # 一般情况可以省去
REDIS_HOST = '127.0.0.1' # 也可以根据情况改成 localhost
REDIS_PORT = 6379

在scrapy中使用scrapy-redis

spider 继承RedisSpider

class tempSpider(RedisSpider) 
name = "temp"
redis_key = ''temp:start_url"

上一篇：Python使用dis模块把Python反编译为字节码的用法详解

栏目：Python代码

下一篇：Python实现设置windows桌面壁纸代码分享

本文标题：基于scrapy的redis安装和配置方法

本文地址：http://www.codeinn.net/misctech/9734.html

更多Python代码

Python代码

基于scrapy的redis安装和配置方法

阅读排行

推荐教程