web_search 提供商
像让 Firecrawl 负责平时的网页搜索入口。
Tools 导读
Firecrawl 在 OpenClaw 里能当 web_search 提供商、独立插件工具(firecrawl_search / firecrawl_scrape)以及 web_fetch 的回退提取器。先拿 API Key 并配好 plugins.entries.firecrawl.config,注意 baseUrl 只能填 https://api.firecrawl.dev,别改错。
先讲这一页到底在解决什么
Firecrawl 在 OpenClaw 里能当 web_search 提供商、独立插件工具(firecrawl_search / firecrawl_scrape)以及 web_fetch 的回退提取器。先拿 API Key 并配好 plugins.entries.firecrawl.config,注意 baseUrl 只能填 https://api.firecrawl.dev,别改错。
第一站
官方一上来就说得很清楚:Firecrawl 可以当搜索提供商、可以当显式工具,还可以当 web_fetch 的后备抽取器。
web_search 提供商像让 Firecrawl 负责平时的网页搜索入口。
firecrawl_search像点名让它用更细的搜索方式去找。
firecrawl_scrape像指定某个网页,让它直接搬重点回来。
web_fetch 后备像普通搬运失败后,Firecrawl 出来兜底。
第二站
和其他提供商一样,先办 key,再把它放进 config 或环境变量。这个动作看起来普通,但很关键。
像先雇到这位搬运员。
FIRECRAWL_API_KEY 像工牌。没有它,系统不认。
你可以写进 Gateway 环境,也可以放在插件 config 里。
先发工牌,再叫搬运员上场。
第三站
官方把 search 和 fetch 分开写,是为了让你知道:同一个服务,能干两种不同的活。
tools.web.search.provider: \"firecrawl\"像给总搜索台换上 Firecrawl 这位新值班员。
tools.web.fetch.firecrawl像在普通 fetch 后面再放一个后备抽取员。
onlyMainContent: true像让它别把网页边边角角都抱回来,只抱主菜。
maxAgeMs: 172800000像给缓存结果设一个“新鲜期”。默认两天。
第四站
这页里最重要的就是这两个工具。名字不同,动作也不同。
firecrawl_search像更会搜网页的版本。你可以再告诉它 sources、categories、scrapeResults 等等。
firecrawl_scrape像拿着明确网址去抄重点,特别适合 JS-heavy 页面。
普通 fetch 先试,失败了 Firecrawl 来接手。
搜索和抽取是两条工作线。
第五站
官方这段写得很重要。Firecrawl 支持 proxy 模式,OpenClaw 默认会用 auto,再配上缓存。
proxy: \"auto\"像先试普通路线,如果遇到门禁,再换更会绕路的路线。
storeInCache: true像把背回来的网页内容先存进仓库,别下次又白跑一趟。
stealth像穿上隐身雨衣。不是所有站都需要,但有些站会很爱拦人。
因为有些网页就是会对普通抓取很凶。Firecrawl 的价值,就是尽量把内容搬回来,而不是在门口站着发呆。
第六站
官方把 extraction order 写得很明白:先看本地 readability,再用 Firecrawl,最后才做基本清理。
先自己把网页整理一下。能看就先自己看。
不够用时,叫专门会绕门的搬运员来。
最后再做最朴素的清理。
Firecrawl 是 web_fetch 的后备大力士,不是第一步就上场的唯一选项。
最后总结
Firecrawl 就是那个在网页不好搬、页面很爱挡人时,愿意上来帮你把内容背回来的搬运员;它既能搜,也能抄,还能给 web_fetch 做后备。
如果你下一页只想继续看一页,我建议看 Web Search 或 Web Fetch。这样更容易把 Firecrawl 放进整个网页工具家族里看。