Cli 导读

用 openclaw browser 控制浏览器:启动、开标签、截图、调试

先跑 `openclaw browser profiles` 看可用配置,再用 `--browser-profile` 指定一个来执行 start、open、snapshot 等动作。最容易踩的坑是:start 失败通常是 CDP 未就绪,而 open 失败多半是导航被 SSRF 策略拦截,不是控制面坏了。

先讲这一页到底在解决什么

用 openclaw browser 控制浏览器:启动、开标签、截图、调试

先跑 `openclaw browser profiles` 看可用配置,再用 `--browser-profile` 指定一个来执行 start、open、snapshot 等动作。最容易踩的坑是:start 失败通常是 CDP 未就绪,而 open 失败多半是导航被 SSRF 策略拦截,不是控制面坏了。

原文共 14 节,先看 Start Here 路径:/cli/browser 查看官方原文

第一站

🎪 先把舞台搭好:浏览器不是一个按钮,而是一整套小剧场

官方开头就说它能管 tabs、snapshots、screenshots、navigation、clicks、typing。翻成人话,就是浏览器里的动作都能被它接住。

🪟

tabs

像一叠小卡片。每一张都可以是一个网页。

📷

snapshot / screenshot

像先看一眼、再拍一张照。一个偏结构,一个偏画面。

🖱

navigation / click / typing

像在网页里走路、按按钮、写字,把手伸进网页里干活。

一句话先记住

它不是“打开一个浏览器窗口”,而是“让 OpenClaw 能指挥浏览器做事”。

第二站

🧰 Common flags 像出门前先拿对门牌和门票

这一页的参数不多,但都很关键。你可以把它们想成“我要连哪儿、用谁的身份、等多久、要哪种输出”。

--url

像告诉这只眼睛:你要先飞到哪个 Gateway 门口去排队。

--token

像门票。门口如果要验票,你就得带着它。

--timeout

像说“我只等这么久,别让我在门口站太久”。

--browser-profile

像告诉小助手要用哪套衣服、哪副眼镜、哪间小房间。

第三站

🚀 Quick start 其实就是“先叫醒浏览器,再把它领到网页前”

官方把最常见的开法压成了几条命令。顺序很重要:先看 profile,再启动,再打开网页,再拍一张。

1

openclaw browser profiles

像先去看家里有几只小眼睛、它们叫什么名字。

2

openclaw browser --browser-profile openclaw start

像把指定那只眼睛叫醒,让它准备看网页。

3

openclaw browser ... open https://example.com

像牵着它走到指定网页门口。

4

openclaw browser ... snapshot

像让它睁眼看一眼,然后把眼前的样子记下来。

第四站

🎭 Profiles 不是花哨名字,而是“不同性格的浏览器小帮手”

官方把 profile 讲得很实用:有的跟随你自己的 Chrome,有的用 OpenClaw 管的独立 Chrome,有的连远端 CDP。

🧩 openclaw

像 OpenClaw 自己养的一只独立小帮手,住在自己的小窝里,互不打扰。

👤 user

像直接借你平时正在登录的那只浏览器,用它已经有的登录状态继续干活。

🌐 自定义 CDP

像把这只眼睛接到一台远处的浏览器机器上,不一定是本机。

📌 一句话

profile 决定你叫来的到底是哪只浏览器。

第五站

📑 Tabs 这段在提醒你:先找到桌上的牌子,再决定翻哪一张

标签页操作是最像“手伸进去翻卡片”的部分。它们不是抽象概念,而是浏览器里一张张能被点开的门。

tabs

像把所有小卡片摊开看看,现在桌上有几张。

open

像再放一张新卡片进桌面,让小助手打开一个新页面。

focus

像把手指点到那一张上,让它成为眼前正在看的那张。

close

像把看完的卡片收起来,不要占着桌面。

第六站

🪄 snapshot、screenshot、navigate、click、type,是“五个动作手势”

这些词看起来很技术,其实都可以当成动作来记。它们是小助手最常见的五个手势。

👀

snapshot

先看清楚现在页面长什么样,像扫一眼桌面布局。

📸

screenshot

像按下相机快门,把画面拍下来。

🧭

navigate

像从这张网页走到另一张网页。

⌨️

click / type

像伸手按按钮,再在输入框里写字。

第七站

🔗 远程浏览器这段,其实是在说“浏览器可以住在别的机器上”

如果浏览器不在本机,OpenClaw 也不是束手无策。它可以通过 node host 代理到那台机器上,让动作照样做出去。

🖥 node host

像在那台真正有 Chrome 的机器旁边,放一个小耳朵,帮 OpenClaw 递话。

🧷 不用再单独起浏览器控制服务器

因为 Gateway 会把动作转发过去,像派快递员把纸条送到远处的桌子上。

gateway.nodes.browser.mode

像告诉系统:要不要自动找一台合适的浏览器小帮手。

gateway.nodes.browser.node

像在多台机器里指定“就让这台来干活”。

最后总结

🎈 把 openclaw browser 这页压成一句话

openclaw browser 就是给 OpenClaw 配一只会看网页、会点网页、会写网页的眼睛;你选 profile,就是选这只眼睛住哪儿,选 tab,就是选它正看哪一张卡片。

如果你下一页只想继续看一页,我建议看 /tools/browser。那一页会继续讲“这个浏览器工具本身到底能干什么”。