Providers 导读

ElevenLabs:模型入口要怎么敲门

ElevenLabs 这一页像在认一家新店的门头。先别急着掏 key,先看它认哪种证件、默认会叫谁出场、哪几个地址一写歪整条路就黑掉。原文最响的一记鼓点,其实是:OpenClaw uses ElevenLabs for text-to-speech, batch speech-to-text with Scribe v2, and 一…。

先听这页的人话版

ElevenLabs

这一页不是在堆术语,它像把“ElevenLabs”这台小机器搬到桌上,当着你的面拆开给你看。你先不用全记住,先抓住它到底在忙什么:OpenClaw uses ElevenLabs for text-to-speech, batch speech-to-text with Scribe v2, and 一边说一边送ing…。

如果把这页当成“给普通人看的版本”,你最应该带走的是:它到底在教你一件什么事、什么时候要这样做、以及哪里最容易踩坑。

原始路径:/providers/elevenlabs 章节数量:6 查看原文

第 1 站

Start Here

这一节主要在解释“Start Here”到底是干什么的,以及你什么时候会遇到它。

这段在解决什么

这一节主要在解释“Start Here”到底是干什么的,以及你什么时候会遇到它。

为什么值得看

如果你是第一次接触 OpenClaw,这一节最值得看的不是术语本身,而是它背后的使用场景和限制。

真要动手时

真正动手时,先看它有没有默认值、有没有必须打开的选项、以及会不会影响安全边界。

先别急着背术语

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:OpenClaw uses ElevenLabs for text-to-speech, batch speech-to-text with Scribe v2, and 一边说一边送ing STT with Scribe v2 Real…。

像讲绘本

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:OpenClaw uses ElevenLabs for text-to-speech, batch speech-to-text with Scribe v2, and 一边说一边送ing STT with Scribe v2 Real…。

原文小纸条

OpenClaw uses ElevenLabs for text-to-speech, batch speech-to-text with Scribe v2, and streaming STT with Scribe v2 Realtime.

像整理表格

这段是在把几种选项排成表格,左边像标签,右边像说明。手机上可以横向滑动原文表格。

原文表格
CapabilityOpenClaw surfaceDefault
Text-to-speechmessages.tts / talkeleven_multilingual_v2
Batch speech-to-texttools.media.audioscribe_v2
Streaming speech-to-textVoice Call streaming or Google Meet realtime.transcriptionProviderscribe_v2_realtime

第 2 站

Authentication

这一节在讲一类能力是怎么工作的:它能做什么、不能做什么、适合在什么场景下调用。

这段在解决什么

这一节在讲一类能力是怎么工作的:它能做什么、不能做什么、适合在什么场景下调用。

为什么值得看

你理解的是能力边界,不只是功能名字。

真要动手时

如果这节里同时出现命令、配置和例子,优先先看例子,再回头看配置。

先别急着背术语

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:Set ELEVENLABS_对话接口_KEY in the environment. XI_对话接口_KEY is also accepted for compatibility with existing ElevenLabs 工具小…。

像讲绘本

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:Set ELEVENLABS_对话接口_KEY in the environment. XI_对话接口_KEY is also accepted for compatibility with existing ElevenLabs 工具小…。

原文小纸条

Set ELEVENLABS_API_KEY in the environment. XI_API_KEY is also accepted for compatibility with existing ElevenLabs tooling.

像魔法口令拆解

这是一串终端口令,像你站在控制台前,一下下按按钮让机器醒过来。

  • 这一行“export ELEVENLABS_API_KEY="..."”是在给电脑递一张小纸条,告诉它眼下该做哪一步。
原文代码块
export ELEVENLABS_API_KEY="..."

第 3 站

Text-to-speech

这一节在讲规则和边界:什么默认允许、什么必须显式打开、什么被禁止。

这段在解决什么

这一节在讲规则和边界:什么默认允许、什么必须显式打开、什么被禁止。

为什么值得看

这种内容决定了 OpenClaw 是“能做”还是“现在还不能做”,读懂它比记术语更重要。

真要动手时

你可以把这一节当成权限说明书,真正配置时优先盯住 default、required、allow、deny 这几个词。

先别急着背术语

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:Set 聪明脑袋模型Id to eleven_v3 to use ElevenLabs v3 TTS. OpenClaw keeps eleven_multilingual_v2 as the default for existing i…。

像魔法口令拆解

这段不是对白,而是一叠设置卡片,像在给系统贴门牌、路线和规矩。

  • 大括号像两只手把同一组设置拢住,意思是“这些东西算一伙”。
  • 这里在给“messages”挂牌子,告诉系统它该指向“{”。
  • 这里在给“tts”挂牌子,告诉系统它该指向“{”。
原文代码块
{
  messages: {
    tts: {
      providers: {
        elevenlabs: {
          apiKey: "${ELEVENLABS_API_KEY}",
          voiceId: "pMsXgVXv3BLzUgSXRplE",
          modelId: "eleven_multilingual_v2",
        },
      },
    },
  },
}
像讲绘本

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:Set 聪明脑袋模型Id to eleven_v3 to use ElevenLabs v3 TTS. OpenClaw keeps eleven_multilingual_v2 as the default for existing i…。

原文小纸条

Set modelId to eleven_v3 to use ElevenLabs v3 TTS. OpenClaw keeps eleven_multilingual_v2 as the default for existing installs.

像讲绘本

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:Discord voice 消息通道s use ElevenLabs' 一边说一边送ing TTS endpoint when ElevenLabs is the selected voice.tts/小纸条消息s.tts provide…。

原文小纸条

Discord voice channels use ElevenLabs' streaming TTS endpoint when ElevenLabs is the selected voice.tts/messages.tts provider. Playback starts from the returned audio stream instead of waiting for OpenClaw to download and write the whole audio file first. latencyTier maps to ElevenLabs' optimize_streaming_latency query parameter for models that accept it; OpenClaw omits that parameter for eleven_v3, which rejects it.

第 4 站

Speech-to-text

这一节主要在解释“Speech-to-text”到底是干什么的,以及你什么时候会遇到它。

这段在解决什么

这一节主要在解释“Speech-to-text”到底是干什么的,以及你什么时候会遇到它。

为什么值得看

如果你是第一次接触 OpenClaw,这一节最值得看的不是术语本身,而是它背后的使用场景和限制。

真要动手时

真正动手时,先看它有没有默认值、有没有必须打开的选项、以及会不会影响安全边界。

先别急着背术语

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:Use Scribe v2 for inbound audio attachments and short recorded voice segments: OpenClaw sends multipart audio to Eleven…。

像讲绘本

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:Use Scribe v2 for inbound audio attachments and short recorded voice segments:。

原文小纸条

Use Scribe v2 for inbound audio attachments and short recorded voice segments:

像魔法口令拆解

这段不是对白,而是一叠设置卡片,像在给系统贴门牌、路线和规矩。

  • 大括号像两只手把同一组设置拢住,意思是“这些东西算一伙”。
  • 这里在给“tools”挂牌子,告诉系统它该指向“{”。
  • 这里在给“media”挂牌子,告诉系统它该指向“{”。
原文代码块
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "elevenlabs", model: "scribe_v2" }],
      },
    },
  },
}
像讲绘本

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:OpenClaw sends multipart audio to ElevenLabs /v1/speech-to-text with 聪明脑袋模型_id: "scribe_v2". Language hints map to lang…。

原文小纸条

OpenClaw sends multipart audio to ElevenLabs /v1/speech-to-text with model_id: "scribe_v2". Language hints map to language_code when present.

第 5 站

一边说一边送ing STT

这一节在讲规则和边界:什么默认允许、什么必须显式打开、什么被禁止。

这段在解决什么

这一节在讲规则和边界:什么默认允许、什么必须显式打开、什么被禁止。

为什么值得看

这种内容决定了 OpenClaw 是“能做”还是“现在还不能做”,读懂它比记术语更重要。

真要动手时

你可以把这一节当成权限说明书,真正配置时优先盯住 default、required、allow、deny 这几个词。

先别急着背术语

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:The bundled elevenlabs 新本领插件 registers Scribe v2 Realtime for Voice Call and Google Meet 机器人朋友-mode 一边说一边送ing transcrip…。

像讲绘本

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:The bundled elevenlabs 新本领插件 registers Scribe v2 Realtime for Voice Call and Google Meet 机器人朋友-mode 一边说一边送ing transcrip…。

原文小纸条

The bundled elevenlabs plugin registers Scribe v2 Realtime for Voice Call and Google Meet agent-mode streaming transcription.

像整理表格

这段是在把几种选项排成表格,左边像标签,右边像说明。手机上可以横向滑动原文表格。

原文表格
SettingConfig pathDefault
API keyplugins.entries.voice-call.config.streaming.providers.elevenlabs.apiKeyFalls back to ELEVENLABS_API_KEY / XI_API_KEY
Model...elevenlabs.modelIdscribe_v2_realtime
Audio format...elevenlabs.audioFormatulaw_8000
Sample rate...elevenlabs.sampleRate8000
Commit strategy...elevenlabs.commitStrategyvad
Language...elevenlabs.languageCode(unset)
像魔法口令拆解

这段不是对白,而是一叠设置卡片,像在给系统贴门牌、路线和规矩。

  • 大括号像两只手把同一组设置拢住,意思是“这些东西算一伙”。
  • 这里在给“plugins”挂牌子,告诉系统它该指向“{”。
  • 这里在给“entries”挂牌子,告诉系统它该指向“{”。
原文代码块
{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          streaming: {
            enabled: true,
            provider: "elevenlabs",
            providers: {
              elevenlabs: {
                apiKey: "${ELEVENLABS_API_KEY}",
                audioFormat: "ulaw_8000",
                commitStrategy: "vad",
                languageCode: "en",
              },
            },
          },
        },
      },
    },
  },
}
像讲绘本

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:Note。

原文小纸条

Note

像讲绘本

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:Voice Call receives Twilio media as 8 kHz G.711 u-law. The ElevenLabs realtime provider defaults to ulaw_8000, so telep…。

原文小纸条

Voice Call receives Twilio media as 8 kHz G.711 u-law. The ElevenLabs realtime provider defaults to ulaw_8000, so telephony frames can be forwarded without transcoding.

像讲绘本

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:For Google Meet 机器人朋友 mode, set 新本领插件s.entries.google-meet.设置说明书.realtime.transcriptionProvider to "elevenlabs" and 设置说…。

原文小纸条

For Google Meet agent mode, set plugins.entries.google-meet.config.realtime.transcriptionProvider to "elevenlabs" and configure the same provider block under plugins.entries.google-meet.config.realtime.providers.elevenlabs.

第 6 站

Related

这一节主要在解释“Related”到底是干什么的,以及你什么时候会遇到它。

这段在解决什么

这一节主要在解释“Related”到底是干什么的,以及你什么时候会遇到它。

为什么值得看

如果你是第一次接触 OpenClaw,这一节最值得看的不是术语本身,而是它背后的使用场景和限制。

真要动手时

真正动手时,先看它有没有默认值、有没有必须打开的选项、以及会不会影响安全边界。

先别急着背术语

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:---。

像准备清单

这一串条目别硬背,把它当成“Related”门口贴出来的几张便签就行。它们在提醒你先备好什么、别漏掉什么、哪里最容易走错:Text-to-speech、Google Meet、聪明脑袋模型 selection。

像讲绘本

如果把这一段摆成一个小场景,你会看到几样东西正在互相打招呼、拦路或者传东西。别急着记名词,先抓住它此刻到底在发生什么:---。

原文小纸条

---

AdSense 连接验证已经放在页面头部;广告单元等站点审批通过后再启用。

google-adsense-account: ca-pub-3833673520933536