未來領航員 / Dify 與部門工作流 / 讓 Dify 真的懂你公司：知識庫 / RAG 實戰（SOP、產品型錄、報價規則怎麼整理才不會亂答）

讓 Dify 真的懂你公司：知識庫 / RAG 實戰（SOP、產品型錄、報價規則怎麼整理才不會亂答）

作者：FlyPig AI 團隊發布：2026-05-06 閱讀：14 分鐘

摘要

如果你已經用 Dify 做出第一個內部 AI 應用，下一關通常不是「再加一個模型」，而是「讓它真的懂你公司」。而讓 AI 懂你的最快路徑，就是把知識庫做對。

本文把知識庫 / RAG 的實作拆成三個關鍵問題：

資料要整理成什麼樣子，才不會亂答？
哪些內容可以給誰看，權限要怎麼設才安全？
上線後怎麼驗收與監控，才能可持續擴張？

你不需要先變工程師；你需要的是一套能落地、能管理、能交接的整理方法。

Dify 系列閱讀順序

這篇是 Dify 系列第 4 篇，負責把已上線的第一個應用接上公司資料。若你還沒有完成第一個可控用例，建議先回到第 2、3 篇。

順序	文章	你會解決的問題
1	為什麼台灣中小企業先從 Dify 做可控內部 AI 應用	先判斷 Dify 是否適合你的公司
2	用 Dify 選第一個較容易驗證用例	在客服、業務、內勤中挑第一案
3	7 天做出可上線 FAQ 客服助理	把提示詞變成可交付流程
4	本文	讓 Dify 依據 SOP、型錄與報價規則回答
5	Dify 上線前治理清單	把權限、日誌、個資與供應商條款講清楚
6	Dify 上線後怎麼證明有用	用 KPI 證明成效並規劃擴張

完整路線整理在：Dify AI 工作流導入路線圖。

先講結論：你要做的不是「堆資料」，而是「建立可回答的知識」
為什麼 RAG 最容易翻車？三種最常見的「亂答」根源
資料整理三件套：SOP、產品型錄、報價規則，各自怎麼切才對
最小可行知識庫（MKB）：用 2 小時把第一版做出來
檢索與回答的安全欄位：權限、引用、拒答、handoff
上線驗收與監控：你要看的不是「覺得很像」，而是可量化指標
FAQ：你有機會遇到的 8 個問題
延伸閱讀
CTA：如果你要把它導入團隊

先講結論：你要做的不是「堆資料」，而是「建立可回答的知識」

很多團隊把 RAG 想成：「把 PDF 丟進去，AI 就會變聰明。」

但在企業場景，RAG 真正要解決的是：

把答案的邊界定義清楚（哪些能答、哪些不能答）
把答案的依據給出來（引用來源、版本、日期）
把風險降到可控（權限、個資、敏感資訊）

所以「好的知識庫」不是資料量大，而是：

指標	你要追求的狀態
可檢索	同義詞、舊稱、縮寫都找得到
可授權	不同角色看到的內容不同
可驗收	有測試題庫、有準確率門檻
可維護	有版本、更新流程、責任人

為什麼 RAG 最容易翻車？三種最常見的「亂答」根源

根源一：你的資料「沒有結構」，只有堆疊

最常見的狀況是：

SOP 寫在 Google 文件，版本不明
產品型錄散落在 PDF、Excel、LINE 對話
報價規則存在業務腦袋或舊 email

這會導致 AI 即使檢索到內容，也很難把答案組合成「可交付」的敘述。

根源二：你的問題「沒有邊界」，只有期待

企業內部最危險的問題通常長這樣：

-「幫我算一下這個客戶大概要報多少？」 -「你覺得這個案子要不要接？」

如果沒有先定義「可答範圍」與「必要輸入」，模型就會在不完整資訊下補全，然後自信地亂答。

根源三：你的知識「沒有版本」，只有歷史

只要公司曾經改過：

產品規格
服務內容
定價與折扣
退換貨條款

沒有版本控管的知識庫，就會把「舊答案」不小心當成「新規則」。

資料整理三件套：SOP、產品型錄、報價規則，各自怎麼切才對

下面這三種資料，幾乎是所有台灣中小企業最常見、也最能快速產生 ROI 的知識庫來源。

A. SOP（流程型知識）

目標： 讓 AI 回答「我下一步要做什麼」，而不是只講道理。

建議的 SOP 格式（你可以直接照抄）：

流程名稱
適用情境（什麼時候用）
前置條件（需要哪些輸入）
步驟（1、2、3…）
例外情境（失敗怎麼辦）
交接點（什麼時候一定要轉人工）
版本 / 生效日 / 負責人

B. 產品型錄（資訊型知識）

目標： 讓 AI 能「正確比對」而不是「憑印象描述」。

最佳做法是把型錄拆成「可比對的欄位」：

欄位	範例
產品名稱 / 代號	A-100
適用族群	小型辦公室
主要賣點	低噪音、低耗電
規格	功率、尺寸、重量
限制與不適用	不適用戶外
交付內容	含安裝 / 不含安裝
常見問題	退換貨、保固

如果你把型錄全部塞成一份長文，檢索很容易撈到「近似但不正確」的片段，最後組合成錯答案。

C. 報價規則（規則型知識）

目標： 讓 AI 在「可解釋」與「可拒答」之間取得平衡。

報價最怕「看起來很合理但其實不符合公司規則」。你需要把規則拆成：

定價表（固定價格）
條件式規則（數量、區域、急件、客製）
禁止規則（哪些條件不能報 / 必須轉主管）
需要確認的欄位（缺一不可）

建議的規則表模板：

規則類型	內容	必要輸入	不足時怎麼辦
條件式	數量 > 50 給 8 折	數量	要求補齊，不補就拒答
禁止	公家機關案一律轉主管	客戶類型	直接 handoff
需確認	工期 < 7 天視為急件	工期	先問清楚再計算

最小可行知識庫（MKB）：用 2 小時把第一版做出來

不要一開始就想「把全公司資料都整理完」。最容易成功的做法是先做一個 MKB（Minimum Knowledge Base）。

第一步：選 20 題「最常被問、最常出事」的問題

來源可以是：

客服常見問題
業務常被追問的規格與價格
內勤新人最常卡住的流程

把它整理成一份「測試題庫」，這份題庫就是你後續驗收的基準。

第二步：用「一題一頁」建立資料最小單位

每個文件只回答一個核心問題，例如：

-「保固多久？哪些情況不保？」 -「退換貨流程怎麼走？需要什麼附件？」 -「報價前必問的 6 個欄位是什麼？」

這樣做的好處是：

內容短，檢索精準
版本更新不會牽一髮動全身

第三步：補上 4 個最低限度的 meta 欄位

每一頁至少要有：

生效日期
最後更新日期
適用產品 / 適用部門
負責人（誰要維護）

「沒有責任人」的知識庫，最後有機會變成資料垃圾場。

檢索與回答的安全欄位：權限、引用、拒答、handoff

把知識庫放進系統只是起點。真正決定你能不能上線的，是安全機制。

1) 權限：先分三層就夠

你可以先用最粗的三層，先避免大事故：

公開層：可以對外分享也不怕（品牌介紹、一般 FAQ）
內部層：員工可看（SOP、規格、一般報價原則）
敏感層：只有少數人可看（成本、毛利、特價表、客訴個資）

如果你無法在資料來源處先分層，至少要在知識庫命名與資料夾結構上做分離，避免誤匯入。

2) 引用：要求它「先引用、再回答」

對企業應用而言，最穩定的指令之一是：

先列出引用來源（文件名稱、段落重點、版本/日期）
再依據引用內容回答
如果引用不足，就明確說「資料不足」並提出補問

3) 拒答：把「不能答」寫進規則

以下問題類型建議預設拒答或 handoff：

涉及個資（身分證、電話、住址、健康資料）
涉及成本、毛利、特價策略
涉及法律、合約解釋、客訴責任歸屬
缺少必要輸入欄位的報價

4) handoff：把人工交接點設成流程，而不是情緒

最好的 handoff 不是「我不確定」。而是：

-「這題需要主管確認：因為符合『公家機關案』條件。請把以下 3 個欄位補齊後轉交：A、B、C。」

如果你已經做過 Dify 的第一個可上線用例，可以把 handoff 當成固定模組重複利用。參考：7 天做出第一個可上線的 Dify 應用

上線驗收與監控：你要看的不是「覺得很像」，而是可量化指標

1) 驗收：用題庫做準確率門檻

用你前面整理的 20 題題庫，做三個分數：

可用率：回答是否能直接交付（不是繞圈子）
準確率：是否引用到正確文件，且內容正確
安全率：是否踩到敏感資訊或亂推論

你可以先設定保守門檻，例如：

可用率 ≥ 70%
準確率 ≥ 85%
安全率：不得出現重大誤答（尤其是價格、法務、個資）

2) 監控：記錄「錯在哪」比「答得多」更重要

建議你至少分類三種錯誤，方便回補：

錯誤類型	常見原因	修法方向
找不到	同義詞、命名不一致	加別名、改標題、補關鍵字
找到但不會用	段落太長、混雜多題	拆分文件、一題一頁
用錯了	版本混亂、規則衝突	加版本欄位、撤下舊規則

3) 擴張：每次只增加一種資料類型

你下一個月最好的擴張策略不是「再加 200 份文件」，而是：

先把 SOP 做到穩定
再加入產品型錄
最後才是報價規則（風險最高）

這樣你才會越做越穩，而不是越做越亂。

FAQ：你有機會遇到的 8 個問題

Q1：我公司資料很亂，真的做得起來嗎？

做得起來。重點是先做 MKB，不要一開始就追求全公司覆蓋率。你只要先讓「最常被問、最常出事」的 20 題變準，就已經能產生明顯效益。

Q2：一定要把資料變成表格嗎？

不一定。SOP 很適合條列；產品型錄很適合表格；報價規則建議用規則表。原則是：能讓人類快速掃懂的格式，通常也能讓檢索更穩定。

Q3：知識庫放進去後，還需要提示詞嗎？

需要。知識庫只是材料，提示詞是「使用規則」。你至少要規定：引用優先、資料不足要補問、敏感問題要拒答或 handoff。

Q4：為什麼 AI 明明引用到了文件，還是答錯？

常見原因是「引用段落太長」或「同一段包含兩個答案」。把文件拆短、拆成一題一頁，通常能立刻改善。

Q5：報價這種高風險問題，能交給 AI 嗎？

可以，但要分層：AI 先做「必要欄位檢查」與「規則比對」，最後輸出「可解釋的草稿」，並在高風險條件下自動 handoff。

Q6：版本要怎麼管？我沒有 IT 團隊。

先從最簡單的做起：每份文件都加上「生效日 / 最後更新日 / 負責人」。你甚至可以用一個 Google Sheet 做版本清單，先把責任釐清。

Q7：怎麼避免把敏感資料不小心丟進去？

從流程上做：敏感資料一定要分資料夾、分命名、分責任人；匯入前做一次抽查。若要更嚴謹，建議建立一份「禁止匯入清單」並固定稽核。

Q8：做到這裡，我下一篇該看什麼？

如果你還在第一個用例階段，先把「可控」做穩：用 Dify 選第一個「較容易驗證」用例。如果你正在評估導入策略與治理，先補框架：台灣中小企業為什麼先從 Dify 做可控的內部 AI 應用。

參考來源與審核說明

資料時間：2026-05-28。本文涉及工具、商業、學習、法規、財務或健康相關內容時，僅供一般資訊與流程設計參考，不構成法律、投資、醫療、心理治療或財務建議；正式採購、投資、導入或決策前，請以官方文件、合格專業人士與你自己的實際數據為準。

導購揭露：本文未置入新的商業推薦連結；文中提及工具、平台或案例僅作情境說明與操作示例。

CTA：如果你要把它導入團隊

如果你希望把知識庫 / RAG 從「看起來很厲害」變成「能穩定交付」，建議你先做三件事：

選一個部門（客服或內勤優先），先做 MKB 的 20 題題庫
用 SOP → 型錄 → 報價規則的順序擴張
把 handoff 與拒答做成規則，先保住風險底線

你不需要一次到位；你需要的是每週都能更穩一點的迭代節奏。

讓 Dify 真的懂你公司：知識庫 / RAG 實戰（SOP、產品型錄、報價規則怎麼整理才不會亂答）

摘要

Dify 系列閱讀順序

目錄

先講結論：你要做的不是「堆資料」，而是「建立可回答的知識」

為什麼 RAG 最容易翻車？三種最常見的「亂答」根源

根源一：你的資料「沒有結構」，只有堆疊

根源二：你的問題「沒有邊界」，只有期待

根源三：你的知識「沒有版本」，只有歷史

資料整理三件套：SOP、產品型錄、報價規則，各自怎麼切才對

A. SOP（流程型知識）

B. 產品型錄（資訊型知識）

C. 報價規則（規則型知識）

最小可行知識庫（MKB）：用 2 小時把第一版做出來

第一步：選 20 題「最常被問、最常出事」的問題

第二步：用「一題一頁」建立資料最小單位

第三步：補上 4 個最低限度的 meta 欄位

檢索與回答的安全欄位：權限、引用、拒答、handoff

1) 權限：先分三層就夠

2) 引用：要求它「先引用、再回答」

3) 拒答：把「不能答」寫進規則

4) handoff：把人工交接點設成流程，而不是情緒

上線驗收與監控：你要看的不是「覺得很像」，而是可量化指標

1) 驗收：用題庫做準確率門檻

2) 監控：記錄「錯在哪」比「答得多」更重要

3) 擴張：每次只增加一種資料類型

FAQ：你有機會遇到的 8 個問題

Q1：我公司資料很亂，真的做得起來嗎？

Q2：一定要把資料變成表格嗎？

Q3：知識庫放進去後，還需要提示詞嗎？

Q4：為什麼 AI 明明引用到了文件，還是答錯？

Q5：報價這種高風險問題，能交給 AI 嗎？

Q6：版本要怎麼管？我沒有 IT 團隊。

Q7：怎麼避免把敏感資料不小心丟進去？

Q8：做到這裡，我下一篇該看什麼？

參考來源與審核說明

延伸閱讀

CTA：如果你要把它導入團隊

延伸閱讀