專業指南:高效提升 Claude Code 工作流程,掌握語音指令輸入的最新技術與實踐。
如何將語音輸入添加到 Claude Code
想要在 Claude Code 中使用語音輸入嗎?這個問題很多開發者都有,因為說話通常比打字快 3 倍左右。雖然 Claude Code 本身沒有內建語音輸入功能,但有幾個不錯的方法可以實現這個功能。
手機版 Claude 的語音功能
如果你使用的是手機版 Claude,那你運氣不錯!Anthropic 在 2025 年推出了 Voice Mode,這是一個功能強大的語音對話模式。
如何使用手機版語音模式:
- 在你的 iOS 或 Android 設備上打開 Claude 應用
- 點擊輸入框旁邊的語音模式圖標(聲波符號)
- 選擇五種不同的語音選項之一:Buttery、Airy、Mellow、Glassy 和 Rounded
- 開始說話,Claude 會即時回應
這個功能支援完整的語音對話,你可以跟 Claude 進行自然的對話,就像跟真人說話一樣。Claude 甚至會在螢幕上顯示對話的重點摘要。
電腦版 Claude Code 的語音解決方案
對於電腦版的 Claude Code,情況就複雜一些了,因為它本身沒有內建語音功能。但開發者社群已經創造了一些聰明的解決方案。
方法一:使用系統內建的語音辨識
最簡單的方法就是使用作業系統內建的語音辨識功能:
- Windows 用戶:按 Win + H 鍵可以啟動 Windows 語音辨識
- Mac 用戶:按 Fn + F5 鍵可以啟動 macOS 語音辨識
一位開發者在 GitHub 上分享說:「Claude Code 可以跟系統內建的語音辨識完美配合。只要在輔助功能設定中啟用它,然後開始說話。這是我做 Claude Code 工作的主要方式!」
方法二:使用第三方語音工具
有些開發者推薦使用 WisprFlow 這類專門的語音轉文字工具。WisprFlow 可以在任何應用程式中提供語音輸入功能,包括 Claude Code。
方法三:使用 MCP(Model Context Protocol)擴展
這是最技術性的解決方案,但也是最強大的。有開發者創建了一個名為 voice-mcp 的擴展,可以為 Claude Code 添加語音功能。
設置步驟:
- 安裝 voice-mcp:
claude mcp add voice-mcp uvx voice-mcp - 設置 OpenAI API 金鑰:
export OPENAI_API_KEY=your-openai-key - 啟動 Claude:
claude - 嘗試說:「Let's have a voice conversation」
方法四:使用瀏覽器擴展
如果你在網頁版使用 Claude,可以安裝一些 Chrome 擴展來添加語音功能:
- Claude Voice:使用 OpenAI 的 Whisper 模型進行語音輸入
- Speech to Text for Claude.ai:支援 37 種語言的語音輸入
- Claudet:使用 Transformers.js 和 Groq API 提供語音功能
自建語音助手
對於更高階的用戶,還有一些開源專案可以讓你建立自己的語音助手:
Claude Code Voice Agent 是一個開源專案,可以讓你:
- 使用語音與 Claude Code 互動
- 支援對話記憶功能
- 整合 OpenAI TTS 進行語音回應
RealtimeSTT + Claude Code 是另一個選項,可以創建一個 700 行代碼的個人 AI 助手,結合了:
- 即時語音轉文字(RealtimeSTT)
- Claude Code 作為「大腦」
- OpenAI TTS 作為「聲音」
未來發展
雖然 Claude Code 目前沒有內建語音功能,但 Anthropic 正在積極開發相關功能。有開發者在 GitHub 上提出了語音輸入的建議,而且考慮到手機版 Claude 已經有了強大的語音功能,相信桌面版的語音支援也不會太遠。
實用小貼士:
- 選擇適合的方法:如果你只是偶爾需要語音輸入,系統內建的語音辨識就夠用了
- 考慮工作流程:如果你經常需要語音輸入,投資一個好的第三方工具可能值得
- 測試和調整:不同的語音工具在不同環境下表現會有差異,找到最適合你的方案
記住,語音輸入不只是為了方便,它還能讓你在程式開發時保持更自然的思維流程。當你能夠直接說出你想要的功能,而不是停下來打字,你的創造力和效率都會得到提升。
