如何寫出更精確的 Prompt:讓 AI 精準鎖定您需要的資料?

歡迎使用我們 Growise 的 No-code Scraper!雖然我們的 AI 盡力理解您的意圖,但網頁內容千變萬化。透過一些簡單的技巧,您可以讓 AI 爬蟲的精確度提升 200%!
這份指南將教您如何撰寫「更精準的 Prompt」設定爬蟲,確保 Scraper AI 總是能擷取到您想要的欄位名稱與對應的值。

 

進階 Prompt 寫法:結構化您的要求

最有效的 Prompt 不是單純的列表,而是「清楚有結構的指令」。請將您的要求拆解成三個關鍵元素:「想要擷取的項目」、「您期待的欄位名稱」、「資料的性質或位置」。

 

技巧一:明確指定欄位名稱

AI 預設會根據您的敘述產生欄位名稱,但這可能與您的資料庫或表格格式不符。在您的敘述中直接定義您想要的輸出欄位名稱,能簡單的解決這個問題。

 

技巧二:加入「輸出格式」或「資料類型」的指令

網頁上的數字可能夾帶貨幣符號、日期格式不一。透過指定輸出格式,可以讓 AI 在擷取時自動進行清理。

一般寫法:擷取價格。
擷取出的可能是「$1,200.00 USD」,但這結果並未清理過,還需後續處理。

進階寫法:擷取價格,且移除所有符號並輸出為純數字,例如1200。
如此一來,AI 就會進行自動清理,減少您的負擔。

類似的進階寫法舉例參考:
– 擷取發布日期,輸出為 YYYY-MM-DD 格式。
– 擷取評論總數,確保輸出為數字格式。

 

技巧三:提供「上下文線索 (Context)」來排除干擾

網頁上可能有多個同類型的項目,例如有多個日期或多個地址。透過描述項目**「在哪裡」**,可以幫助 AI 做出正確的判斷。
假設網頁上有多個地址,例如網頁 footer 區的地址、文章內容描述的公司地址,也有多個聯絡電話,產品價格上還區分為產品定價、實際折扣價、實際折扣後的價格

你想抓 footer 區地址的進階寫法:擷取公司地址,它位於網頁側邊欄或 footer 區塊。提供 AI 判斷目標資料的「格式」與「相對位置」。
你想抓文章內聯絡電話的進階寫法:擷取電話號碼,它在「業務聯繫」這幾個字之後。這能告訴 AI 要強調目標資訊與特定文本之間的緊密關係。
你想抓文章內產品定價的進階寫法:擷取產品定價,它是產品名稱旁邊以 $ 開頭的產品定價數字,不是折扣的相關金額。提供 AI 判斷目標資料的「格式」與「相對位置」。

 

技巧四:排除法

如果網頁上其他區塊(如 Header 或 Footer)的地址容易干擾,可以明確要求 AI 排除這些區域。

想擷取文章內作者的進階寫法:擷取作者名稱,位於文章主要內容區塊,且不是網頁最上方的用戶登入名稱。雖然不是直接描述地址,但這個技巧可用於排除干擾。
想擷取文章內地址的進階寫法:擷取公司地址,這個地址位於網頁主要文章的文本區,而不是位於最底部的版權宣告區 (Footer)。一樣直接點出不要抓取的區域,引導 AI 專注於內容區。

我們可以說,當資料位於文章/內容區時,最有效的方式是:

  1. 利用周圍的文字標籤或標題:…位於「XXX」標題下方。
  2. 描述資料的屬性或用途:…這是標註為「總公司」的地址。
  3. 描述資料所屬的邏輯群組:…與日期、時間並列的地址。
  4. 描述資料不存在於哪些情況:…不是在 Footer 區。

 

這樣一來,無論網頁結構如何變化,AI 都能根據您給予的文字線索,更準確地在主要內容中定位到目標資訊。

 

想了解有關 Growise AI 如何幫助業務團隊、營銷團隊,請參考我們的部落格或是與我們聯繫

 

 

 

 

更多文章

立即試用 Growise AI 無需程式碼的網頁抓取工具,
快速高效完成資料蒐集!

Copyright © 2025 Growise 愛肯客科技有限公司 | All Rights Reserved