dffefdcdc2
KBDB 堆疊的餵食器(最薄一層):拉 GitHub repo → 採取/萃取三元組 → 餵 graph 寫入端 → 織跨 vault 的圖。 - CLAUDE.md:上游指針 + ingest 鐵律(純餵食器/不碰儲存/不算向量/ 不帶查詢 MCP/部署繞 Actions/三守則) - README:定位 + 護城河命題(跨 vault 的圖) - contracts/ingest-candidate.json:凍結 envelope 契約(與 graph repo 同份) - docs/3-specs/ingest-pipeline/:SDD 三件式骨架(藍圖指向 InkStoneCo mira-dissolve) Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
28 lines
1.7 KiB
Markdown
28 lines
1.7 KiB
Markdown
# ingest pipeline — Requirements
|
||
|
||
> 建立:2026-06-26
|
||
> **跨專案藍圖在 InkStoneCo `docs/3-specs/mira-dissolve/`(R7 攝入分工、§6.6 模型策略、§6.7 MCP 邊界)。本 SDD 只放 ingest 內部實作細節。**
|
||
> 凍結契約:`contracts/ingest-candidate.json`(與 graph repo 同一份,唯一耦合面)。
|
||
|
||
## 範圍
|
||
|
||
ingest 插件內部:SourceAdapter(拉)+ 採取/extract + 跨庫織網匯總 + POST envelope 給 graph。**不涉**graph 內部圖演算法、不涉 base 儲存。
|
||
|
||
## 需求
|
||
|
||
- **R1 SourceAdapter**:GitHub 拉 repo + content-hash(`source.uri = github:owner/repo@path`)。webhook/排程觸發,或被 KBDB MCP `refresh` 代轉觸發。
|
||
- **R2 採取(路徑 A,優先)**:用了 system-dev-template 的 repo → 本地 CC 已建三元組 + gloss → ingest 拉取,不重萃。
|
||
- **R3 extract(路徑 B,fallback)**:裸原文 → 萃 (s,p,o)+gloss。模型用戶可選(意圖非型號)+ 品質門檻白名單(深層暗示 + 中文);預設 Haiku;深萃 Claude via CC;JSON-fail 升級閘。
|
||
- **R4 跨 repo 織網**:匯總多 repo 三元組(單 repo 看不到的橋/異見)=主職。
|
||
- **R5 輸出**:POST envelope(嚴格符合 contract)給 graph `POST /triplets/ingest`,不直連 base。
|
||
- **R6 ops CLI**:手動觸發重萃。不帶查詢 MCP。
|
||
|
||
## 約束(沿用 ingest 鐵律,見 CLAUDE.md)
|
||
|
||
- 純餵食器、不碰儲存、不算向量、不帶查詢 MCP、部署繞 Actions、三守則(無環/純 API/凍結契約)。
|
||
|
||
## 待對端
|
||
|
||
- graph 的 `POST /triplets/ingest` 寫入端(InkStoneCo T3.3,graph repo 實作)。
|
||
- 模型品質門檻測試集(含中文 + 人類暗示樣本,InkStoneCo §6.6)。
|