Knowledge Consolidation Pass¶
概念概覽
問題診斷¶
核心知識¶
問題診斷¶
知識庫長期累積「同主題多頁碎片」問題,例如 ComfyUI 相關文章在多個 session 中被拆成多個重複頁面,彼此內容高度重疊但無法自動合併。
Consolidation 策略¶
採用**高信心 group 優先**策略(選項 A): 1. 先對相似度高(cosine similarity > 閾值)的文件群組進行自動合併 2. 合併時以最完整的文件為主幹,其餘文件的獨特段落追加進去 3. 原始碎片文件標記為 deprecated 或直接刪除 4. 第一輪只處理「高信心 4 個 group」,降低誤合併風險
執行結果¶
- commit
71d2267:Consolidation Pass v1 — 合併 18 頁同 session 碎片為 4 頁 canonical - 覆蓋範圍:全庫所有概念文章,不限於特定主題
經驗教訓¶
-
Consolidation 要分批執行(高信心先行),避免一次全量合併產生不可逆錯誤
-
ComfyUI 等熱門主題是碎片化重災區,應優先處理
-
合併後使用者視覺上「看不出差異」是正常的 — 差異在於結構,不在於外觀
常見陷阱¶
-
使用者反映「看不出和原本有什麼差異」— 需要配合知識圖譜視覺化才能讓改善可感知
-
全庫 consolidation 需要語義相似度索引支撐,純關鍵字比對會漏掉同義詞碎片
相關概念¶
相關視角¶
以下頁面與本概念共享主題,但從不同角度切入。保留獨立視角同時提供交叉參考:
- Knowledge Consolidation — 共享:
consolidation,deduplication,knowledge-management/ 獨特:content-quality - Semi-Brain Session Deduplication — 共享:
deduplication,knowledge-management,semi-brain/ 獨特:document-fusion,ledger - Semi-Brain Knowledge Management System — 共享:
knowledge-management,semi-brain/ 獨特:automation,ci
來源 Sessions¶
| 日期 | Session | 貢獻摘要 |
|---|---|---|
| 2026-04-11 | a0379709-073f-4231-a61f-87b8486559f7 | 本 session 對全庫所有概念文章執行 Consolidation Pass,將同 session 產出的碎片文件合併為 canonical 頁面(18頁→4頁) |