Semantic Knowledge Graph CI Integration¶

概念概覽

目標¶

核心知識¶

目標¶

超越關鍵字連結，讓知識庫具備語義層級的概念關聯能力——即使兩個文件沒有直接 [[Wikilink]]，也能發現它們討論相同概念。

方案設計¶

Phase 2 核心元件： 1. obra/knowledge-graph：作為 CI 步驟，掃描所有文件後產出語義索引 knowledge-graph.json 2. wiki_manager.py 語義重複檢查：在概念提取階段，用向量相似度比對新概念是否已存在，避免碎片化

CI Pipeline:
  1. wiki_manager.py → 提取概念（含語義去重）
  2. backlink_pass.py → 注入反向連結  
  3. obra/knowledge-graph → 產出語義索引
  4. mkdocs build → 部署

語義重複檢查邏輯¶

新概念提取時計算 embedding
與現有概念庫做 cosine similarity
超過閾值（如 0.85）視為重複，合併而非新建

經驗教訓¶

關鍵字 backlink 解決「已知關聯」，語義圖譜解決「隱性關聯」，兩者互補
語義去重閾值需根據知識庫領域調整，技術文章建議用較高閾值（0.85+）

常見陷阱¶

obra/knowledge-graph 是重量級依賴，CI 時間可能顯著增加，需評估是否值得
語義重複檢查需要持久化 embedding 向量，冷啟動成本高

來源 Sessions¶

日期	Session	貢獻摘要

| 2026-04-11 | a0379709-073f-4231-a61f-87b8486559f7 | 此 session 規劃了將語義知識圖譜產生整合進 CI pipeline 的方案，包含語義重複概念檢查與 obra/knowledge-graph 索引產出。 |

本概念頁面由 Semi-Brain Wiki 系統自動維護

最後更新: 2026-04-11