返回索引 | 讓 Dify 真的懂你公司:知識庫 / RAG 實戰(SOP、產品型錄、報價規則怎麼整理才不會亂答)
未來領航員 / Dify 與部門工作流 / 讓 Dify 真的懂你公司:知識庫 / RAG 實戰(SOP、產品型錄、報價規則怎麼整理才不會亂答)

讓 Dify 真的懂你公司:知識庫 / RAG 實戰(SOP、產品型錄、報價規則怎麼整理才不會亂答)

作者:FlyPig AI 團隊 發布:2026-05-06 閱讀:14 分鐘

讓 Dify 真的懂你公司:知識庫 / RAG 實戰(SOP、產品型錄、報價規則怎麼整理才不會亂答)


摘要

如果你已經用 Dify 做出第一個內部 AI 應用,下一關通常不是「再加一個模型」,而是「讓它真的懂你公司」。而讓 AI 懂你的最快路徑,就是把知識庫做對。

本文把知識庫 / RAG 的實作拆成三個關鍵問題:

  1. 資料要整理成什麼樣子,才不會亂答?
  2. 哪些內容可以給誰看,權限要怎麼設才安全?
  3. 上線後怎麼驗收與監控,才能可持續擴張?

你不需要先變工程師;你需要的是一套能落地、能管理、能交接的整理方法。


Dify 系列閱讀順序

這篇是 Dify 系列第 4 篇,負責把已上線的第一個應用接上公司資料。若你還沒有完成第一個可控用例,建議先回到第 2、3 篇。

順序文章你會解決的問題
1為什麼台灣中小企業先從 Dify 做可控內部 AI 應用先判斷 Dify 是否適合你的公司
2用 Dify 選第一個較容易驗證用例在客服、業務、內勤中挑第一案
37 天做出可上線 FAQ 客服助理把提示詞變成可交付流程
4本文讓 Dify 依據 SOP、型錄與報價規則回答
5Dify 上線前治理清單把權限、日誌、個資與供應商條款講清楚
6Dify 上線後怎麼證明有用用 KPI 證明成效並規劃擴張

完整路線整理在:Dify AI 工作流導入路線圖


目錄

  1. 先講結論:你要做的不是「堆資料」,而是「建立可回答的知識」
  2. 為什麼 RAG 最容易翻車?三種最常見的「亂答」根源
  3. 資料整理三件套:SOP、產品型錄、報價規則,各自怎麼切才對
  4. 最小可行知識庫(MKB):用 2 小時把第一版做出來
  5. 檢索與回答的安全欄位:權限、引用、拒答、handoff
  6. 上線驗收與監控:你要看的不是「覺得很像」,而是可量化指標
  7. FAQ:你有機會遇到的 8 個問題
  8. 延伸閱讀
  9. CTA:如果你要把它導入團隊

先講結論:你要做的不是「堆資料」,而是「建立可回答的知識」

很多團隊把 RAG 想成:「把 PDF 丟進去,AI 就會變聰明。」

但在企業場景,RAG 真正要解決的是:

  • 把答案的邊界定義清楚(哪些能答、哪些不能答)
  • 把答案的依據給出來(引用來源、版本、日期)
  • 把風險降到可控(權限、個資、敏感資訊)

所以「好的知識庫」不是資料量大,而是:

指標你要追求的狀態
可檢索同義詞、舊稱、縮寫都找得到
可授權不同角色看到的內容不同
可驗收有測試題庫、有準確率門檻
可維護有版本、更新流程、責任人

為什麼 RAG 最容易翻車?三種最常見的「亂答」根源

根源一:你的資料「沒有結構」,只有堆疊

最常見的狀況是:

  • SOP 寫在 Google 文件,版本不明
  • 產品型錄散落在 PDF、Excel、LINE 對話
  • 報價規則存在業務腦袋或舊 email

這會導致 AI 即使檢索到內容,也很難把答案組合成「可交付」的敘述。

根源二:你的問題「沒有邊界」,只有期待

企業內部最危險的問題通常長這樣:

-「幫我算一下這個客戶大概要報多少?」 -「你覺得這個案子要不要接?」

如果沒有先定義「可答範圍」與「必要輸入」,模型就會在不完整資訊下補全,然後自信地亂答。

根源三:你的知識「沒有版本」,只有歷史

只要公司曾經改過:

  • 產品規格
  • 服務內容
  • 定價與折扣
  • 退換貨條款

沒有版本控管的知識庫,就會把「舊答案」不小心當成「新規則」。


資料整理三件套:SOP、產品型錄、報價規則,各自怎麼切才對

下面這三種資料,幾乎是所有台灣中小企業最常見、也最能快速產生 ROI 的知識庫來源。

A. SOP(流程型知識)

目標: 讓 AI 回答「我下一步要做什麼」,而不是只講道理。

建議的 SOP 格式(你可以直接照抄):

  • 流程名稱
  • 適用情境(什麼時候用)
  • 前置條件(需要哪些輸入)
  • 步驟(1、2、3…)
  • 例外情境(失敗怎麼辦)
  • 交接點(什麼時候一定要轉人工)
  • 版本 / 生效日 / 負責人

B. 產品型錄(資訊型知識)

目標: 讓 AI 能「正確比對」而不是「憑印象描述」。

最佳做法是把型錄拆成「可比對的欄位」:

欄位範例
產品名稱 / 代號A-100
適用族群小型辦公室
主要賣點低噪音、低耗電
規格功率、尺寸、重量
限制與不適用不適用戶外
交付內容含安裝 / 不含安裝
常見問題退換貨、保固

如果你把型錄全部塞成一份長文,檢索很容易撈到「近似但不正確」的片段,最後組合成錯答案。

C. 報價規則(規則型知識)

目標: 讓 AI 在「可解釋」與「可拒答」之間取得平衡。

報價最怕「看起來很合理但其實不符合公司規則」。你需要把規則拆成:

  • 定價表(固定價格)
  • 條件式規則(數量、區域、急件、客製)
  • 禁止規則(哪些條件不能報 / 必須轉主管)
  • 需要確認的欄位(缺一不可)

建議的規則表模板:

規則類型內容必要輸入不足時怎麼辦
條件式數量 > 50 給 8 折數量要求補齊,不補就拒答
禁止公家機關案一律轉主管客戶類型直接 handoff
需確認工期 < 7 天視為急件工期先問清楚再計算

最小可行知識庫(MKB):用 2 小時把第一版做出來

不要一開始就想「把全公司資料都整理完」。最容易成功的做法是先做一個 MKB(Minimum Knowledge Base)。

第一步:選 20 題「最常被問、最常出事」的問題

來源可以是:

  • 客服常見問題
  • 業務常被追問的規格與價格
  • 內勤新人最常卡住的流程

把它整理成一份「測試題庫」,這份題庫就是你後續驗收的基準。

第二步:用「一題一頁」建立資料最小單位

每個文件只回答一個核心問題,例如:

-「保固多久?哪些情況不保?」 -「退換貨流程怎麼走?需要什麼附件?」 -「報價前必問的 6 個欄位是什麼?」

這樣做的好處是:

  • 內容短,檢索精準
  • 版本更新不會牽一髮動全身

第三步:補上 4 個最低限度的 meta 欄位

每一頁至少要有:

  • 生效日期
  • 最後更新日期
  • 適用產品 / 適用部門
  • 負責人(誰要維護)

「沒有責任人」的知識庫,最後有機會變成資料垃圾場。


檢索與回答的安全欄位:權限、引用、拒答、handoff

把知識庫放進系統只是起點。真正決定你能不能上線的,是安全機制。

1) 權限:先分三層就夠

你可以先用最粗的三層,先避免大事故:

  • 公開層:可以對外分享也不怕(品牌介紹、一般 FAQ)
  • 內部層:員工可看(SOP、規格、一般報價原則)
  • 敏感層:只有少數人可看(成本、毛利、特價表、客訴個資)

如果你無法在資料來源處先分層,至少要在知識庫命名與資料夾結構上做分離,避免誤匯入。

2) 引用:要求它「先引用、再回答」

對企業應用而言,最穩定的指令之一是:

  • 先列出引用來源(文件名稱、段落重點、版本/日期)
  • 再依據引用內容回答
  • 如果引用不足,就明確說「資料不足」並提出補問

3) 拒答:把「不能答」寫進規則

以下問題類型建議預設拒答或 handoff:

  • 涉及個資(身分證、電話、住址、健康資料)
  • 涉及成本、毛利、特價策略
  • 涉及法律、合約解釋、客訴責任歸屬
  • 缺少必要輸入欄位的報價

4) handoff:把人工交接點設成流程,而不是情緒

最好的 handoff 不是「我不確定」。而是:

-「這題需要主管確認:因為符合『公家機關案』條件。請把以下 3 個欄位補齊後轉交:A、B、C。」

如果你已經做過 Dify 的第一個可上線用例,可以把 handoff 當成固定模組重複利用。參考:7 天做出第一個可上線的 Dify 應用


上線驗收與監控:你要看的不是「覺得很像」,而是可量化指標

1) 驗收:用題庫做準確率門檻

用你前面整理的 20 題題庫,做三個分數:

  • 可用率:回答是否能直接交付(不是繞圈子)
  • 準確率:是否引用到正確文件,且內容正確
  • 安全率:是否踩到敏感資訊或亂推論

你可以先設定保守門檻,例如:

  • 可用率 ≥ 70%
  • 準確率 ≥ 85%
  • 安全率:不得出現重大誤答(尤其是價格、法務、個資)

2) 監控:記錄「錯在哪」比「答得多」更重要

建議你至少分類三種錯誤,方便回補:

錯誤類型常見原因修法方向
找不到同義詞、命名不一致加別名、改標題、補關鍵字
找到但不會用段落太長、混雜多題拆分文件、一題一頁
用錯了版本混亂、規則衝突加版本欄位、撤下舊規則

3) 擴張:每次只增加一種資料類型

你下一個月最好的擴張策略不是「再加 200 份文件」,而是:

  1. 先把 SOP 做到穩定
  2. 再加入產品型錄
  3. 最後才是報價規則(風險最高)

這樣你才會越做越穩,而不是越做越亂。


FAQ:你有機會遇到的 8 個問題

Q1:我公司資料很亂,真的做得起來嗎?

做得起來。重點是先做 MKB,不要一開始就追求全公司覆蓋率。你只要先讓「最常被問、最常出事」的 20 題變準,就已經能產生明顯效益。

Q2:一定要把資料變成表格嗎?

不一定。SOP 很適合條列;產品型錄很適合表格;報價規則建議用規則表。原則是:能讓人類快速掃懂的格式,通常也能讓檢索更穩定。

Q3:知識庫放進去後,還需要提示詞嗎?

需要。知識庫只是材料,提示詞是「使用規則」。你至少要規定:引用優先、資料不足要補問、敏感問題要拒答或 handoff。

Q4:為什麼 AI 明明引用到了文件,還是答錯?

常見原因是「引用段落太長」或「同一段包含兩個答案」。把文件拆短、拆成一題一頁,通常能立刻改善。

Q5:報價這種高風險問題,能交給 AI 嗎?

可以,但要分層:AI 先做「必要欄位檢查」與「規則比對」,最後輸出「可解釋的草稿」,並在高風險條件下自動 handoff。

Q6:版本要怎麼管?我沒有 IT 團隊。

先從最簡單的做起:每份文件都加上「生效日 / 最後更新日 / 負責人」。你甚至可以用一個 Google Sheet 做版本清單,先把責任釐清。

Q7:怎麼避免把敏感資料不小心丟進去?

從流程上做:敏感資料一定要分資料夾、分命名、分責任人;匯入前做一次抽查。若要更嚴謹,建議建立一份「禁止匯入清單」並固定稽核。

Q8:做到這裡,我下一篇該看什麼?

如果你還在第一個用例階段,先把「可控」做穩:用 Dify 選第一個「較容易驗證」用例。 如果你正在評估導入策略與治理,先補框架:台灣中小企業為什麼先從 Dify 做可控的內部 AI 應用



參考來源與審核說明

資料時間:2026-05-28。本文涉及工具、商業、學習、法規、財務或健康相關內容時,僅供一般資訊與流程設計參考,不構成法律、投資、醫療、心理治療或財務建議;正式採購、投資、導入或決策前,請以官方文件、合格專業人士與你自己的實際數據為準。

導購揭露:本文未置入新的商業推薦連結;文中提及工具、平台或案例僅作情境說明與操作示例。

延伸閱讀


CTA:如果你要把它導入團隊

如果你希望把知識庫 / RAG 從「看起來很厲害」變成「能穩定交付」,建議你先做三件事:

  1. 選一個部門(客服或內勤優先),先做 MKB 的 20 題題庫
  2. 用 SOP → 型錄 → 報價規則的順序擴張
  3. 把 handoff 與拒答做成規則,先保住風險底線

你不需要一次到位;你需要的是每週都能更穩一點的迭代節奏。

延伸閱讀