dffefdcdc2
KBDB 堆疊的餵食器(最薄一層):拉 GitHub repo → 採取/萃取三元組 → 餵 graph 寫入端 → 織跨 vault 的圖。 - CLAUDE.md:上游指針 + ingest 鐵律(純餵食器/不碰儲存/不算向量/ 不帶查詢 MCP/部署繞 Actions/三守則) - README:定位 + 護城河命題(跨 vault 的圖) - contracts/ingest-candidate.json:凍結 envelope 契約(與 graph repo 同份) - docs/3-specs/ingest-pipeline/:SDD 三件式骨架(藍圖指向 InkStoneCo mira-dissolve) Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
3.3 KiB
3.3 KiB
CLAUDE.md — KBDB-ingest 插件開發規範
上游約束(InkStoneCo 總管):此 repo 是 InkStoneCo 子專案,受頂層知識庫約束。 動工前讀
github.com/uncle6me-web/InkStoneCo的 CLAUDE.md +docs/3-specs/mira-dissolve/(本插件的跨專案藍圖)。 定位(leo 2026-06-26):此 repo = KBDB-ingest 插件(餵食器),堆疊裡最薄一層。掛在 kbdb-graph-plugin 上,graph 又掛在基本盤arcrun/kbdb上。 關鍵鐵律:禁跨 repo 自動同步 Actions / 部署繞開 GitHub / API-as-Wall(不碰儲存)。
本檔由 Claude Code 自動讀取。所有此目錄下的開發必須遵守以下規則。
🔒 ingest 鐵律(leo 2026-06-26 拍板)
- 純餵食器,不碰儲存 — ingest 只 POST 候選 envelope 給 graph 的寫入 API,不直連 base、不碰 D1/Vectorize、不碰任何表。牆是「儲存」不是「運算」:准做萃取(LLM 呼叫),不准碰儲存。
- 不算向量 normalize — 詞+gloss 的語義 normalize 歸 base optional embed 模組,不在 ingest(單檔視角算不準跨庫同義)。
- 不帶查詢 MCP — ingest 是 ambient 餵食器,沒人互動「問」它。只帶薄 ops CLI(人手動觸發重萃)。觸發由 KBDB MCP 的
refresh代理。 - 三守則(北極星 §5.2) — 無環(graph 永不回呼 ingest)、純 API(走 graph HTTP 寫入端,不碰 graph 內部)、凍結契約(
contracts/ingest-candidate.json是唯一耦合面)。 - 部署繞開 GitHub Actions(被 flag 教訓)— 走 wrangler;runtime 用 GitHub API/webhook 拉 repo 是 runtime 行為,不衝突。
職責(採取為主,extract 為 fallback,跨庫織網是主職)
路徑 A(用了 system-dev-template,優先):
GitHub 拉 → 本地 CC 已建好的三元組 + gloss → ingest 採取(拉)→ POST envelope
路徑 B(裸原文,fallback):
GitHub 拉 → 本地無三元組 → ingest extract(模型用戶可選)→ 候選 (s,p,o)+gloss → POST envelope
共同:跨 repo 匯總 → 織跨庫三元組關聯(ingest 主職,本地做不到)
- 採取 > 萃取:本地萃成效更好(知識連結長在生產當下,LLM Wiki 指引);ingest 優先採取本地已建的。
- extract 模型用戶可選(像
/model,選意圖非型號)+ 品質門檻(萃得出深層暗示 + 中文過關才入白名單);預設 Haiku;深萃 Claude via CC(走月費,不走 API)。 - 跨 repo 織網:匯總多 repo 三元組(單 repo 本地看不到的橋/異見)=ingest 不可取代的價值。
掛載架構
基本盤 arcrun/kbdb(不動)
↑ API
kbdb-graph-plugin(三元組領域 + 查詢 + POST /triplets/ingest 寫入端)
↑ API(ingest 餵候選 envelope)
kbdb-ingest-plugin(本 repo,純餵食器)
· SourceAdapter:GitHub 拉 + content-hash(source.uri = github:owner/repo@path)
· 採取本地三元組 / extract(text, model) fallback
· POST envelope → graph 寫入 API
凍結契約:contracts/ingest-candidate.json(與 graph repo 同一份)。SDD:docs/3-specs/ingest-pipeline/(待立)。
命名
只養一個品牌 Arcrun;本元件功能名當水管:ingest。