Audio Transcription Action 讓您將音訊檔案(語音備忘錄、會議錄音、播客、訪談等)一鍵轉為精準文字,支援 多國語言 與 說話者分段。系統採用進階語音辨識模型,自動偵測語者、標註時間戳記,產出可搜尋、可編輯的文字內容。
常見應用:
– 會議記錄整理
– 內容字幕生成
– 語音資料結構化
– 客戶訪談分析
使用範例
1. 會議錄音自動產出逐字稿:上傳 Zoom 錄音檔案 → 選擇 JSON 格式 → 輸出含說話者與時間戳的結構化資料 → 匯入 Notion 會議筆記。
2. Podcast 生成 SRT 字幕:輸入 Podcast 音訊檔案 → 選擇 SRT 格式 → 自動產出字幕檔 → 上傳 YouTube 提升 SEO 與可及性。
3. 客戶訪談重點提取:轉錄為 Text Only → 搭配 Extract Data Action 提取「痛點」「需求」「預算」等關鍵欄位。
輸入格式
– 來源音訊 URL(Audio Source URL):公開可存取的音訊連結,支援格式如 .mp3、.wav、.m4a。
輸出格式
選擇轉錄結果呈現方式,包含
– JSON:完整結構化資料,包含 start_time / end_time、text。
– Text Only:純文字逐字稿,段落分隔,無時間戳。
– SRT:標準字幕格式,含時間軸 1\n00:00:10,500 –> 00:00:15,200\n你好,今天我們來談…。
使用常見問題
1. 轉錄失敗或空白:確認音訊 URL 公開可存取(無需登入),或音訊檔案正常可播放,且有人聲說話。
2. 語者分段錯誤:音質過差或多人同時說話,建議使用高品質麥克風錄音。
3. 中文辨識不準:請確認音訊為清晰國語。
常見搭配 Actions
1. Generate Text Action:將轉錄文字生成「會議摘要」、「行動項目」、「重點整理」。
2. Extract Data Action:從 JSON 轉錄中提取「決議事項」、「負責人」、「截止日期」。
3. Format Result Action:將 SRT + 摘要整合為 Email 或 PDF 報告。
4. Send Email Notification Action:會議結束後自動寄送逐字稿給與會者。