
摘要
如果你已經用 Dify 做出第一個內部 AI 應用,下一關通常不是「再加一個模型」,而是「讓它真的懂你公司」。而讓 AI 懂你的最快路徑,就是把知識庫做對。
本文把知識庫 / RAG 的實作拆成三個關鍵問題:
- 資料要整理成什麼樣子,才不會亂答?
- 哪些內容可以給誰看,權限要怎麼設才安全?
- 上線後怎麼驗收與監控,才能可持續擴張?
你不需要先變工程師;你需要的是一套能落地、能管理、能交接的整理方法。
Dify 系列閱讀順序
這篇是 Dify 系列第 4 篇,負責把已上線的第一個應用接上公司資料。若你還沒有完成第一個可控用例,建議先回到第 2、3 篇。
| 順序 | 文章 | 你會解決的問題 |
|---|---|---|
| 1 | 為什麼台灣中小企業先從 Dify 做可控內部 AI 應用 | 先判斷 Dify 是否適合你的公司 |
| 2 | 用 Dify 選第一個較容易驗證用例 | 在客服、業務、內勤中挑第一案 |
| 3 | 7 天做出可上線 FAQ 客服助理 | 把提示詞變成可交付流程 |
| 4 | 本文 | 讓 Dify 依據 SOP、型錄與報價規則回答 |
| 5 | Dify 上線前治理清單 | 把權限、日誌、個資與供應商條款講清楚 |
| 6 | Dify 上線後怎麼證明有用 | 用 KPI 證明成效並規劃擴張 |
完整路線整理在:Dify AI 工作流導入路線圖。
目錄
- 先講結論:你要做的不是「堆資料」,而是「建立可回答的知識」
- 為什麼 RAG 最容易翻車?三種最常見的「亂答」根源
- 資料整理三件套:SOP、產品型錄、報價規則,各自怎麼切才對
- 最小可行知識庫(MKB):用 2 小時把第一版做出來
- 檢索與回答的安全欄位:權限、引用、拒答、handoff
- 上線驗收與監控:你要看的不是「覺得很像」,而是可量化指標
- FAQ:你有機會遇到的 8 個問題
- 延伸閱讀
- CTA:如果你要把它導入團隊
先講結論:你要做的不是「堆資料」,而是「建立可回答的知識」
很多團隊把 RAG 想成:「把 PDF 丟進去,AI 就會變聰明。」
但在企業場景,RAG 真正要解決的是:
- 把答案的邊界定義清楚(哪些能答、哪些不能答)
- 把答案的依據給出來(引用來源、版本、日期)
- 把風險降到可控(權限、個資、敏感資訊)
所以「好的知識庫」不是資料量大,而是:
| 指標 | 你要追求的狀態 |
|---|---|
| 可檢索 | 同義詞、舊稱、縮寫都找得到 |
| 可授權 | 不同角色看到的內容不同 |
| 可驗收 | 有測試題庫、有準確率門檻 |
| 可維護 | 有版本、更新流程、責任人 |
為什麼 RAG 最容易翻車?三種最常見的「亂答」根源
根源一:你的資料「沒有結構」,只有堆疊
最常見的狀況是:
- SOP 寫在 Google 文件,版本不明
- 產品型錄散落在 PDF、Excel、LINE 對話
- 報價規則存在業務腦袋或舊 email
這會導致 AI 即使檢索到內容,也很難把答案組合成「可交付」的敘述。
根源二:你的問題「沒有邊界」,只有期待
企業內部最危險的問題通常長這樣:
-「幫我算一下這個客戶大概要報多少?」 -「你覺得這個案子要不要接?」
如果沒有先定義「可答範圍」與「必要輸入」,模型就會在不完整資訊下補全,然後自信地亂答。
根源三:你的知識「沒有版本」,只有歷史
只要公司曾經改過:
- 產品規格
- 服務內容
- 定價與折扣
- 退換貨條款
沒有版本控管的知識庫,就會把「舊答案」不小心當成「新規則」。
資料整理三件套:SOP、產品型錄、報價規則,各自怎麼切才對
下面這三種資料,幾乎是所有台灣中小企業最常見、也最能快速產生 ROI 的知識庫來源。
A. SOP(流程型知識)
目標: 讓 AI 回答「我下一步要做什麼」,而不是只講道理。
建議的 SOP 格式(你可以直接照抄):
- 流程名稱
- 適用情境(什麼時候用)
- 前置條件(需要哪些輸入)
- 步驟(1、2、3…)
- 例外情境(失敗怎麼辦)
- 交接點(什麼時候一定要轉人工)
- 版本 / 生效日 / 負責人
B. 產品型錄(資訊型知識)
目標: 讓 AI 能「正確比對」而不是「憑印象描述」。
最佳做法是把型錄拆成「可比對的欄位」:
| 欄位 | 範例 |
|---|---|
| 產品名稱 / 代號 | A-100 |
| 適用族群 | 小型辦公室 |
| 主要賣點 | 低噪音、低耗電 |
| 規格 | 功率、尺寸、重量 |
| 限制與不適用 | 不適用戶外 |
| 交付內容 | 含安裝 / 不含安裝 |
| 常見問題 | 退換貨、保固 |
如果你把型錄全部塞成一份長文,檢索很容易撈到「近似但不正確」的片段,最後組合成錯答案。
C. 報價規則(規則型知識)
目標: 讓 AI 在「可解釋」與「可拒答」之間取得平衡。
報價最怕「看起來很合理但其實不符合公司規則」。你需要把規則拆成:
- 定價表(固定價格)
- 條件式規則(數量、區域、急件、客製)
- 禁止規則(哪些條件不能報 / 必須轉主管)
- 需要確認的欄位(缺一不可)
建議的規則表模板:
| 規則類型 | 內容 | 必要輸入 | 不足時怎麼辦 |
|---|---|---|---|
| 條件式 | 數量 > 50 給 8 折 | 數量 | 要求補齊,不補就拒答 |
| 禁止 | 公家機關案一律轉主管 | 客戶類型 | 直接 handoff |
| 需確認 | 工期 < 7 天視為急件 | 工期 | 先問清楚再計算 |
最小可行知識庫(MKB):用 2 小時把第一版做出來
不要一開始就想「把全公司資料都整理完」。最容易成功的做法是先做一個 MKB(Minimum Knowledge Base)。
第一步:選 20 題「最常被問、最常出事」的問題
來源可以是:
- 客服常見問題
- 業務常被追問的規格與價格
- 內勤新人最常卡住的流程
把它整理成一份「測試題庫」,這份題庫就是你後續驗收的基準。
第二步:用「一題一頁」建立資料最小單位
每個文件只回答一個核心問題,例如:
-「保固多久?哪些情況不保?」 -「退換貨流程怎麼走?需要什麼附件?」 -「報價前必問的 6 個欄位是什麼?」
這樣做的好處是:
- 內容短,檢索精準
- 版本更新不會牽一髮動全身
第三步:補上 4 個最低限度的 meta 欄位
每一頁至少要有:
- 生效日期
- 最後更新日期
- 適用產品 / 適用部門
- 負責人(誰要維護)
「沒有責任人」的知識庫,最後有機會變成資料垃圾場。
檢索與回答的安全欄位:權限、引用、拒答、handoff
把知識庫放進系統只是起點。真正決定你能不能上線的,是安全機制。
1) 權限:先分三層就夠
你可以先用最粗的三層,先避免大事故:
- 公開層:可以對外分享也不怕(品牌介紹、一般 FAQ)
- 內部層:員工可看(SOP、規格、一般報價原則)
- 敏感層:只有少數人可看(成本、毛利、特價表、客訴個資)
如果你無法在資料來源處先分層,至少要在知識庫命名與資料夾結構上做分離,避免誤匯入。
2) 引用:要求它「先引用、再回答」
對企業應用而言,最穩定的指令之一是:
- 先列出引用來源(文件名稱、段落重點、版本/日期)
- 再依據引用內容回答
- 如果引用不足,就明確說「資料不足」並提出補問
3) 拒答:把「不能答」寫進規則
以下問題類型建議預設拒答或 handoff:
- 涉及個資(身分證、電話、住址、健康資料)
- 涉及成本、毛利、特價策略
- 涉及法律、合約解釋、客訴責任歸屬
- 缺少必要輸入欄位的報價
4) handoff:把人工交接點設成流程,而不是情緒
最好的 handoff 不是「我不確定」。而是:
-「這題需要主管確認:因為符合『公家機關案』條件。請把以下 3 個欄位補齊後轉交:A、B、C。」
如果你已經做過 Dify 的第一個可上線用例,可以把 handoff 當成固定模組重複利用。參考:7 天做出第一個可上線的 Dify 應用
上線驗收與監控:你要看的不是「覺得很像」,而是可量化指標
1) 驗收:用題庫做準確率門檻
用你前面整理的 20 題題庫,做三個分數:
- 可用率:回答是否能直接交付(不是繞圈子)
- 準確率:是否引用到正確文件,且內容正確
- 安全率:是否踩到敏感資訊或亂推論
你可以先設定保守門檻,例如:
- 可用率 ≥ 70%
- 準確率 ≥ 85%
- 安全率:不得出現重大誤答(尤其是價格、法務、個資)
2) 監控:記錄「錯在哪」比「答得多」更重要
建議你至少分類三種錯誤,方便回補:
| 錯誤類型 | 常見原因 | 修法方向 |
|---|---|---|
| 找不到 | 同義詞、命名不一致 | 加別名、改標題、補關鍵字 |
| 找到但不會用 | 段落太長、混雜多題 | 拆分文件、一題一頁 |
| 用錯了 | 版本混亂、規則衝突 | 加版本欄位、撤下舊規則 |
3) 擴張:每次只增加一種資料類型
你下一個月最好的擴張策略不是「再加 200 份文件」,而是:
- 先把 SOP 做到穩定
- 再加入產品型錄
- 最後才是報價規則(風險最高)
這樣你才會越做越穩,而不是越做越亂。
FAQ:你有機會遇到的 8 個問題
Q1:我公司資料很亂,真的做得起來嗎?
做得起來。重點是先做 MKB,不要一開始就追求全公司覆蓋率。你只要先讓「最常被問、最常出事」的 20 題變準,就已經能產生明顯效益。
Q2:一定要把資料變成表格嗎?
不一定。SOP 很適合條列;產品型錄很適合表格;報價規則建議用規則表。原則是:能讓人類快速掃懂的格式,通常也能讓檢索更穩定。
Q3:知識庫放進去後,還需要提示詞嗎?
需要。知識庫只是材料,提示詞是「使用規則」。你至少要規定:引用優先、資料不足要補問、敏感問題要拒答或 handoff。
Q4:為什麼 AI 明明引用到了文件,還是答錯?
常見原因是「引用段落太長」或「同一段包含兩個答案」。把文件拆短、拆成一題一頁,通常能立刻改善。
Q5:報價這種高風險問題,能交給 AI 嗎?
可以,但要分層:AI 先做「必要欄位檢查」與「規則比對」,最後輸出「可解釋的草稿」,並在高風險條件下自動 handoff。
Q6:版本要怎麼管?我沒有 IT 團隊。
先從最簡單的做起:每份文件都加上「生效日 / 最後更新日 / 負責人」。你甚至可以用一個 Google Sheet 做版本清單,先把責任釐清。
Q7:怎麼避免把敏感資料不小心丟進去?
從流程上做:敏感資料一定要分資料夾、分命名、分責任人;匯入前做一次抽查。若要更嚴謹,建議建立一份「禁止匯入清單」並固定稽核。
Q8:做到這裡,我下一篇該看什麼?
如果你還在第一個用例階段,先把「可控」做穩:用 Dify 選第一個「較容易驗證」用例。 如果你正在評估導入策略與治理,先補框架:台灣中小企業為什麼先從 Dify 做可控的內部 AI 應用。
參考來源與審核說明
資料時間:2026-05-28。本文涉及工具、商業、學習、法規、財務或健康相關內容時,僅供一般資訊與流程設計參考,不構成法律、投資、醫療、心理治療或財務建議;正式採購、投資、導入或決策前,請以官方文件、合格專業人士與你自己的實際數據為準。
導購揭露:本文未置入新的商業推薦連結;文中提及工具、平台或案例僅作情境說明與操作示例。
延伸閱讀
- 別急著買一堆 AI 工具:台灣中小企業為什麼先從 Dify 做「可控的內部 AI 應用」
- 用 Dify 選第一個「較容易驗證」用例:客服、業務、內勤三條線,怎麼挑才不會一上來就失敗?
- 7 天做出第一個可上線的 Dify 應用:從提示詞到流程編排(以 FAQ 客服助理為例)
- AI 隱私與資安檢查清單(台灣版)
CTA:如果你要把它導入團隊
如果你希望把知識庫 / RAG 從「看起來很厲害」變成「能穩定交付」,建議你先做三件事:
- 選一個部門(客服或內勤優先),先做 MKB 的 20 題題庫
- 用 SOP → 型錄 → 報價規則的順序擴張
- 把 handoff 與拒答做成規則,先保住風險底線
你不需要一次到位;你需要的是每週都能更穩一點的迭代節奏。