Tools 导读

Firecrawl 接入:三种用法、API Key 与配置陷阱

Firecrawl 在 OpenClaw 里能当 web_search 提供商、独立插件工具(firecrawl_search / firecrawl_scrape)以及 web_fetch 的回退提取器。先拿 API Key 并配好 plugins.entries.firecrawl.config,注意 baseUrl 只能填 https://api.firecrawl.dev,别改错。

先讲这一页到底在解决什么

Firecrawl 接入:三种用法、API Key 与配置陷阱

Firecrawl 在 OpenClaw 里能当 web_search 提供商、独立插件工具(firecrawl_search / firecrawl_scrape)以及 web_fetch 的回退提取器。先拿 API Key 并配好 plugins.entries.firecrawl.config,注意 baseUrl 只能填 https://api.firecrawl.dev,别改错。

原文共 10 节,先看 Start Here 路径:/tools/firecrawl 查看官方原文

第一站

🚚 Firecrawl 不只是一种工具,它像三条进门路线

官方一上来就说得很清楚:Firecrawl 可以当搜索提供商、可以当显式工具,还可以当 web_fetch 的后备抽取器。

🔎

web_search 提供商

像让 Firecrawl 负责平时的网页搜索入口。

🧰

firecrawl_search

像点名让它用更细的搜索方式去找。

🧲

firecrawl_scrape

像指定某个网页,让它直接搬重点回来。

🛟

web_fetch 后备

像普通搬运失败后,Firecrawl 出来兜底。

第二站

🔑 API key 像给搬运员发进场证

和其他提供商一样,先办 key,再把它放进 config 或环境变量。这个动作看起来普通,但很关键。

1. 注册 Firecrawl

像先雇到这位搬运员。

2. 生成 API key

FIRECRAWL_API_KEY 像工牌。没有它,系统不认。

3. 放进环境或配置

你可以写进 Gateway 环境,也可以放在插件 config 里。

📌 一句话

先发工牌,再叫搬运员上场。

第三站

🛠 配置那两段 JSON,翻成人话就是“把网页搜索和网页抓取都接到 Firecrawl”

官方把 search 和 fetch 分开写,是为了让你知道:同一个服务,能干两种不同的活。

tools.web.search.provider: \"firecrawl\"

像给总搜索台换上 Firecrawl 这位新值班员。

tools.web.fetch.firecrawl

像在普通 fetch 后面再放一个后备抽取员。

onlyMainContent: true

像让它别把网页边边角角都抱回来,只抱主菜。

maxAgeMs: 172800000

像给缓存结果设一个“新鲜期”。默认两天。

第四站

🎛 Firecrawl 的工具,像“搜索员”和“抄网页的人”两份工作

这页里最重要的就是这两个工具。名字不同,动作也不同。

🔎

firecrawl_search

像更会搜网页的版本。你可以再告诉它 sources、categories、scrapeResults 等等。

📄

firecrawl_scrape

像拿着明确网址去抄重点,特别适合 JS-heavy 页面。

🧯

web_fetch 兜底

普通 fetch 先试,失败了 Firecrawl 来接手。

先记一句

搜索和抽取是两条工作线。

第五站

🪄 proxy = auto,像让搬运员先试普通门,卡住了再换隐身门

官方这段写得很重要。Firecrawl 支持 proxy 模式,OpenClaw 默认会用 auto,再配上缓存。

proxy: \"auto\"

像先试普通路线,如果遇到门禁,再换更会绕路的路线。

storeInCache: true

像把背回来的网页内容先存进仓库,别下次又白跑一趟。

stealth

像穿上隐身雨衣。不是所有站都需要,但有些站会很爱拦人。

📌 为什么要这样做

因为有些网页就是会对普通抓取很凶。Firecrawl 的价值,就是尽量把内容搬回来,而不是在门口站着发呆。

第六站

🧠 web_fetch 用 Firecrawl 兜底,这个顺序很像“先自己拿,再请强力帮手”

官方把 extraction order 写得很明白:先看本地 readability,再用 Firecrawl,最后才做基本清理。

1. Readability

先自己把网页整理一下。能看就先自己看。

2. Firecrawl

不够用时,叫专门会绕门的搬运员来。

3. Basic HTML cleanup

最后再做最朴素的清理。

🎈 一句话

Firecrawl 是 web_fetch 的后备大力士,不是第一步就上场的唯一选项。

最后总结

🎈 把 Firecrawl 压成一句最好记的话

Firecrawl 就是那个在网页不好搬、页面很爱挡人时,愿意上来帮你把内容背回来的搬运员;它既能搜,也能抄,还能给 web_fetch 做后备。

如果你下一页只想继续看一页,我建议看 Web SearchWeb Fetch。这样更容易把 Firecrawl 放进整个网页工具家族里看。