音声とメディア

ElevenLabsとWhisperを統合。高精度な音声対話、声のクローン、ビデオフレーム分析が可能。

1

セットアップとインストール

APIキー: ElevenLabsとOpenAIのキーを取得

設定: 環境変数を設定し `voice.talk.enabled=true` に

スキルのインストール: `sag` (ElevenLabs) と `openai-whisper-api` を追加

電話プラグイン: 必要に応じて Twilio の AccountSid を設定

2

コマンド例

この音声を文字起こしして

Clawdの声で「Hello World」と読んで

openclaw voicecall call --to ... で電話をかけて

動画を分析：/frame.sh video.mp4

重要な注意事項

APIは従量課金制。残高に注意すること
電話機能はリスクが高いため、サンドボックス内で使用すること
ローカルWhisperの実行にはGPUを推奨

さらに詳しく知りたいですか？

OpenClawコミュニティに参加して、高度なスクリプトや自動化ワークフローを共有しましょう。

GitHubを訪問