검색 후보는 어휘 일치만 받고 그래프는 재랭킹에만 쓰도록 경계를 그음

문제 (Context)

코드 리뷰에서 HIGH 등급 결함 하나를 잡았다. 후보 집합이 PPR>0인 노드를 모두 받아들였는데, personalized PageRank는 도달 가능한 모든 노드로 점수를 퍼뜨린다. 그 결과 질의어와 한 단어도 겹치지 않는 그래프 이웃까지 검색 결과로 끌려 나왔다.

시도한 해결 (Decision)

graph_boost는 재랭커이지 리트리버가 아니다. 후보는 이제 bm25>0인 노드만 받는다. PPR은 RRF 기여를 통해 여전히 재랭킹은 하지만, 어휘가 겹치지 않는 노드를 주입하지는 못한다. 겹침이 없는 이웃이 제외되는지 회귀 테스트로 고정했다.

근거·결과 (Consequences)

검색 결함 두 건 중 하나다. 폐기 노드를 읽기 시점에 거르는 필터는 접수 레인에 남는다.

노드 계약 (contract)

필드
type결정(decision)
Statussuperseded
source_count1
confidence미설정(구 엔진 격차)
confidence_reason_codes미설정(구 엔진 격차)
stalefresh
이슈(feature)RAG·지식엔진

시행착오 타임라인 (supersede)


이슈 wiki_chain 코드 리뷰 · Status superseded · 2026-06-25