跳轉到

Semantic Knowledge Graph CI Integration

概念概覽

目標

核心知識

目標

超越關鍵字連結,讓知識庫具備語義層級的概念關聯能力——即使兩個文件沒有直接 [[Wikilink]],也能發現它們討論相同概念。

方案設計

Phase 2 核心元件: 1. obra/knowledge-graph:作為 CI 步驟,掃描所有文件後產出語義索引 knowledge-graph.json 2. wiki_manager.py 語義重複檢查:在概念提取階段,用向量相似度比對新概念是否已存在,避免碎片化

CI Pipeline:
  1. wiki_manager.py → 提取概念(含語義去重)
  2. backlink_pass.py → 注入反向連結  
  3. obra/knowledge-graph → 產出語義索引
  4. mkdocs build → 部署

語義重複檢查邏輯

  • 新概念提取時計算 embedding
  • 與現有概念庫做 cosine similarity
  • 超過閾值(如 0.85)視為重複,合併而非新建

經驗教訓

  • 關鍵字 backlink 解決「已知關聯」,語義圖譜解決「隱性關聯」,兩者互補

  • 語義去重閾值需根據知識庫領域調整,技術文章建議用較高閾值(0.85+)

常見陷阱

  • obra/knowledge-graph 是重量級依賴,CI 時間可能顯著增加,需評估是否值得

  • 語義重複檢查需要持久化 embedding 向量,冷啟動成本高

相關概念

相關視角

以下頁面與本概念共享主題,但從不同角度切入。保留獨立視角同時提供交叉參考:

來源 Sessions

日期 Session 貢獻摘要

| 2026-04-11 | a0379709-073f-4231-a61f-87b8486559f7 | 此 session 規劃了將語義知識圖譜產生整合進 CI pipeline 的方案,包含語義重複概念檢查與 obra/knowledge-graph 索引產出。 |


本概念頁面由 Semi-Brain Wiki 系統自動維護

最後更新: 2026-04-11