Extract Data from text Action 讓您從長篇文字中精準擷取特定資料欄位或欄位清單,適用於會議記錄、LinkedIn 個人檔案、財報、會議逐字稿等內容。
您可選擇擷取單一值或多筆相同類型的清單,並依任務難度調整模型品質(平衡成本、速度與準確度)。
輸出為結構化 JSON 物件,方便後續 Workflow 直接引用,無需處理完整原始文字。
使用範例
- 從長篇內容提取關鍵資料點:像是會議記錄、財報或個人檔案中擷取客觀資訊(員工數、年度營收、主題標籤、會議日期、與會者名單、行動項目等)。
- 提取網址清單(URLs):從網頁內容或搜尋結果中一次抓取所有超連結,後續可用於批量處理或存檔。
- 將 HTML 表格轉為 JSON 資料集:搭配 Scrape Webpage Action 取得表格 HTML,接著使用「清單模式」逐列解析後,輸出為結構化資料,供後續分析或匯出。
輸入格式
Source text:欲解析的完整文字內容,如網頁文字、會議記錄等。
Data to extract:為每個欄位命名並提供清晰描述,例如:
- 員工數:公司總員工
- 子公司清單:所有子公司名稱,並以清單式呈現
輸出格式
Output Format:輸出為 JSON 物件 或 JSON 物件陣列,每個欄位對應您定義的名稱。
使用常見問題
- 想擷取清單但只得到單一值:確認已開啟「擷取清單模式」,並在欄位描述中強調「所有」「清單」「多筆」等詞。
- 擷取結果不準確或遺漏優化欄位描述:需加入明確格式、上下文或舉例,例如「錯誤:員工數; 正確:公司總員工數」,「數字格式,例如 22668」。
- 無法擷取動態內容:確保來源文字已包含完整資訊。若來自網頁,建議先用 Scrape Webpage(Best + HTML) 取得原始碼。
常見搭配 Actions
- Generate Text Action:將擷取資料(如營收、員工數)作為提示詞,生成財報摘要、比較分析
- Scrape Webpage Action:先抓取網頁 → 再用本動作解析結構化資訊
- Loop Through Data Action:處理擷取出的清單,每筆獨立執行後續邏輯