Tools 导读

让智能体直接生成图片,只需配好一个 API Key

配置好任意一个图片生成 provider 的 API Key(如 OpenAI 或 Google),智能体就能在对话中自动调用 `image_generate` 工具生成并附上图片。默认启用,无需额外开启工具白名单。最易踩坑的是:不同 provider 支持的参数(尺寸、编辑张数)不同,当主 provider 不支持时系统会自动降级到 fallback,但返回的 `size` 等值会反映实际发送的配置,务必检查 `details.normalization` 确认是否发生了映射。

先讲这一页到底在解决什么

让智能体直接生成图片,只需配好一个 API Key

配置好任意一个图片生成 provider 的 API Key(如 OpenAI 或 Google),智能体就能在对话中自动调用 `image_generate` 工具生成并附上图片。默认启用,无需额外开启工具白名单。最易踩坑的是:不同 provider 支持的参数(尺寸、编辑张数)不同,当主 provider 不支持时系统会自动降级到 fallback,但返回的 `size` 等值会反映实际发送的配置,务必检查 `details.normalization` 确认是否发生了映射。

原文共 12 节,先看 Start Here 路径:/tools/image-generation 查看官方原文

第一步

🎯 先让工具出现,再让它干活

这不是手动 allowlist 的工具,它是“有 provider 就亮”的那种。

自动出现

只要配置了图像 provider,工具就会在 agent 工具里冒出来。

默认模型

可选但常用,像先给它选一支默认画笔。

生成结果

会直接回到回复里作为媒体附件。

第二步

🛠 各家画师各有分工

OpenClaw 支持的 provider 很多,但思路是一样的:选对工位。

A

OpenAI

默认 gpt-image-1

G

Google

带多模态图片生成能力。

F

fal

快、轻、常用。

V

Vydra

图像线也有,但不做编辑。

第三步

📦 `/tool image_generate` 像现场下单

你给一句话,代理就会自己决定要不要画图。

Prompt

像把画面描述交给画师。

List

可以先看哪些 provider 和模型在线。

Edit

有些 provider 还能拿参考图改图。

最后总结

🎈 把 Image Generation 这页压成一句最好记的话

`image_generate` 就是代理的画画手:先有 provider,再选默认模型,然后就能把图直接送回回复里。