검색 가능한 소스 자격을 단일 게이트로 명시

문제 (Context)

0.0.2.5 RAG-01 항목은 수용된 위키 페이지와 원시 런타임 텍스트를 구분하는 수용 페이지 스키마, 즉 품질 게이트를 필요로 한다.

시도한 해결 (Decision)

소스 자격 표는 수용된 마크다운 페이지만 검색 대상으로 인정하고, 승격 후보는 후보로만 두며, 원시 대화 기록은 자격에서 제외한다. 증류 품질 게이트는 소스 인용과 원시 id 제거를 더한다. 이 판정들은 엔진 곳곳에 흩어져 부분적으로만 강제되고 있었다. 이번에 하나의 명시적 게이트로 모았다: eligibility_status(), retrieval_eligible(), eligible_corpus(). 노드는 살아 있는 PM 수용 상태(RAG-06)이고 경계가 깨끗하며(RAG-02) source_ref를 인용하고 본문이 비어 있지 않을 때만 자격을 얻는다. 심층 방어로 iter-1의 대체된 오염 노드는 not_live_pm_accepted와 boundary_violation 양쪽 모두에서 정확히 자격을 잃는다. 라이브 코퍼스는 수용된 깨끗한 페이지 3장이다. CLI의 eligible 명령이 이를 그대로 나열한다.

근거·결과 (Consequences)

테스트 5건을 새로 더했고 49건이 통과한다.

노드 계약 (contract)

필드
type결정(decision)
Statusaccepted
source_count1
confidence미설정 — 구 엔진 격차
confidence_reason_codes미설정 — 구 엔진 격차
stalefresh
이슈(feature)RAG·지식엔진

상호참조


이슈 RAG 검색·소스 경계 · Status accepted · 2026-06-25