由 Zyte 并在500多名其他贡献者的共同努力下维护

全球使用最广泛的开源数据提取框架

一个用于提取公共网络数据的协作式开源框架。

$pipinstallscrapy

阅读文档

当前版本 2.13.2下载发布版本

快速且强大

编写规则来提取所需数据，其余的交给 Scrapy。

可定制

使用 Python 构建爬虫，并根据任何网站或数据模型进行定制。

开源

由一个活跃的社区维护，全球数百万开发者正在使用。

几分钟内即可上手

更快地构建爬虫

选择一个功能以查看相应的代码片段。

创建 Scrapy 项目: 使用单个命令初始化一个新的 Scrapy 项目。
运行爬虫: 运行 Scrapy 爬虫来抓取数据。
导出数据: 将提取的数据保存为您选择的格式文件。
使用 Scrapy Shell: 交互式地测试和调试您的抓取逻辑。

$ scrapy startproject myproject

为什么要创建 Scrapy 项目？

创建 Scrapy 项目会设置必要的文件夹结构和文件，以便高效地开始构建您的网络爬虫。

了解更多

加入社区

“ 如果没有 Scrapy，我的自由职业生涯以及后来的爬虫业务将永远无法起步。Scrapy 框架，尤其是它的文档，简化了对任何具备基本 Python 技能的人的爬取工作。我不知道，现在我已经对 Scrapy 产生了一种情感上的纽带，这种纽带是多年来发展起来的。”

Nishant Choudhary

DataFlirt.com 创始人

“ Scrapy：这份礼物彻底改变了网络爬取，并激励我用 Scrapoxy 回馈社区！"
"Scrapy 自首次发布以来，一直是我所有项目的核心引擎。”

Fabien Vauchelles

Scrapoxy 创建者

“ Scrapy 作为一款卓越的工具脱颖而出，能够无缝管理开放请求，使大规模数据收集高效可靠。"
"凭借其卓越的抓取速度，Scrapy 将复杂的网络数据提取任务转化为快速、简化的操作，从而节省时间并最大化产出。”

Hyder Khan

Flipdish

“ Scrapy 是用 Python 进行网络爬取的基石。没有它，爬取会困难得多。"
"在我的职业生涯中，我构建了数千个爬虫，大部分都使用 Scrapy。它让我的生活轻松了许多。”

Pierluigi Vinciguerra

Databoutique.com 联合创始人兼 CTO

“ 凭借超过6年的网络爬取经验，Scrapy 一直是我构建快速、可靠、可扩展数据管道的首选框架。"
"在我6年多的爬取经验中，没有任何工具能在功能、灵活性和社区支持方面与 Scrapy 相媲美。”

Ganesh Satheendran

Turbolab Technologies

“ 当 Google 搜索强制执行 JavaScript 时，我们的爬虫就坏了。在短时间内努力用 Puppeteer 构建一个可行的替代方案时，我们启动了 Scrapy 和 Splash，并迅速编写了一个脚本。瞧——它成功了！我们的 Google 基准测试又开始运行了。”

Adam

Proxyway

加入数百万使用 Scrapy 的开发者。

55.1k 星标，10.8k 分支。

快速、免费的网络爬取，由活跃的社区提供支持。

开始使用探索文档

全球使用最广泛的 开源 数据提取框架