Tools 导读

让智能体直接生成图片，只需配好一个 API Key

配置好任意一个图片生成 provider 的 API Key（如 OpenAI 或 Google），智能体就能在对话中自动调用 `image_generate` 工具生成并附上图片。默认启用，无需额外开启工具白名单。最易踩坑的是：不同 provider 支持的参数（尺寸、编辑张数）不同，当主 provider 不支持时系统会自动降级到 fallback，但返回的 `size` 等值会反映实际发送的配置，务必检查 `details.normalization` 确认是否发生了映射。

先讲这一页到底在解决什么

让智能体直接生成图片，只需配好一个 API Key

原文共 12 节，先看 Start Here 路径：/tools/image-generation 查看官方原文

第一步

🎯 先让工具出现，再让它干活

这不是手动 allowlist 的工具，它是“有 provider 就亮”的那种。

自动出现

只要配置了图像 provider，工具就会在 agent 工具里冒出来。

默认模型

可选但常用，像先给它选一支默认画笔。

生成结果

会直接回到回复里作为媒体附件。

第二步

🛠 各家画师各有分工

OpenClaw 支持的 provider 很多，但思路是一样的：选对工位。

OpenAI

默认 gpt-image-1。

Google

带多模态图片生成能力。

fal

快、轻、常用。

Vydra

图像线也有，但不做编辑。

第三步

📦 ``/tool image_generate`` 像现场下单

你给一句话，代理就会自己决定要不要画图。

Prompt

像把画面描述交给画师。

List

可以先看哪些 provider 和模型在线。

Edit

有些 provider 还能拿参考图改图。

最后总结

🎈 把 Image Generation 这页压成一句最好记的话

`image_generate` 就是代理的画画手：先有 provider，再选默认模型，然后就能把图直接送回回复里。