语音与多媒体处理

集成 ElevenLabs 与 Whisper,实现高保真语音对话、克隆与视频帧分析。

1

配置与安装

API Key: 获取 ElevenLabs 与 OpenAI Key

配置: 设置环境变量,启用 `voice.talk.enabled=true`

安装技能: `sag` (ElevenLabs) 和 `openai-whisper-api`

电话插件: 配置 Twilio AccountSid (可选)

2

指令示例

Transcribe this audio (语音转文字)

用 Clawd 的声音朗读 Hello World

openclaw voicecall call --to ...

分析视频: /frame.sh video.mp4

注意事项

  • API 按量计费,需监控余额
  • 拨打电话属高风险权限,建议沙箱运行
  • 本地 Whisper 需 GPU 支持

想了解更多?

加入 OpenClaw 社区,获取更多高级脚本与自动化工作流分享。