2019-04-03 12:25:25 [scrapy.extensions.logstats] INFO: Crawled 18852 pages (at 0 pages/min), scraped 1762 items (at 0 items/min) #145

python-D · 2019-04-03T08:52:43Z

爬虫运行过程中会出现2019-04-03 12:25:25 [scrapy.extensions.logstats] INFO: Crawled 18852 pages (at 0 pages/min), scraped 1762 items (at 0 items/min)这种状况，大概过了一到两分钟才重新拉取到redis的队列里面的url

Cehae · 2019-06-25T10:12:27Z

兄弟，我也遇到这个问题了，你解决了吗？ @python-D

ghost · 2019-07-03T00:45:49Z

因为scrapyredis爬虫依赖空闲信号idle signal来开始爬取

@Cehae 我建议你们用scapy frontera,不会有那个问题，因为它使用kafka和hbase作为后端处理。

LuckyPigeon added bug improvement question labels Jan 4, 2022

LuckyPigeon closed this as completed May 30, 2023

LuckyPigeon reopened this May 30, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

2019-04-03 12:25:25 [scrapy.extensions.logstats] INFO: Crawled 18852 pages (at 0 pages/min), scraped 1762 items (at 0 items/min) #145

2019-04-03 12:25:25 [scrapy.extensions.logstats] INFO: Crawled 18852 pages (at 0 pages/min), scraped 1762 items (at 0 items/min) #145

python-D commented Apr 3, 2019

Cehae commented Jun 25, 2019

ghost commented Jul 3, 2019 •

edited by ghost

2019-04-03 12:25:25 [scrapy.extensions.logstats] INFO: Crawled 18852 pages (at 0 pages/min), scraped 1762 items (at 0 items/min) #145

2019-04-03 12:25:25 [scrapy.extensions.logstats] INFO: Crawled 18852 pages (at 0 pages/min), scraped 1762 items (at 0 items/min) #145

Comments

python-D commented Apr 3, 2019

Cehae commented Jun 25, 2019

ghost commented Jul 3, 2019 • edited by ghost

ghost commented Jul 3, 2019 •

edited by ghost