image_generate
画图和改图。
Tools 导读
OpenClaw 能生成图片、视频、音乐,也能理解收到的图片、音频、视频,还能用 TTS 把回复读出来。所有媒体工具默认不出现,只有当你配置了至少一个对应的 Provider 后,Agent 才会在对话中自动启用它们。视频和音乐生成是异步的,提交后 Agent 会继续处理其他消息,等 Provider 完成后再把结果发回频道。
先讲这一页到底在解决什么
OpenClaw 能生成图片、视频、音乐,也能理解收到的图片、音频、视频,还能用 TTS 把回复读出来。所有媒体工具默认不出现,只有当你配置了至少一个对应的 Provider 后,Agent 才会在对话中自动启用它们。视频和音乐生成是异步的,提交后 Agent 会继续处理其他消息,等 Provider 完成后再把结果发回频道。
第一站
媒体能力不是一坨,它分得很清楚。
画图和改图。
做视频。
做音乐。
把回复念出来。
第二站
图片、音频、视频进来后,代理也能做理解和总结。
像看图说话。
像把音频翻成字再理解。
像看完视频再给你讲一遍重点。
工具不足时还会用 CLI 路线兜底。
第三站
Provider 是底层柜台,tool 是你在前台真正按的按钮。
负责真正干活的后端能力。
负责把能力暴露给 agent 用。
只要背后有 provider,前台工具就会亮起来。
最后总结
这页是媒体总菜单:先分清图、视频、音乐、TTS 和理解能力,再去看具体工具页。