벡터 임베딩 없이도 검색 품질이 충분함을 벤치마크로 증명해 클라우드 의존을 떼어냄
문제 (Context)
0.0.2.5의 미결 수용 항목 하나가 BM25·그래프·wiki 검색 경로를 벤치마크해 클라우드 벡터 임베딩이 필수 의존이 아님을 보이라고 요구했다. 주장만으로는 항목을 닫을 수 없었다.
시도한 해결 (Decision)
이곳 검색 경로는 어휘 토큰 겹침 순위(신선도 가중)로 찾고, 1-hop 타입 엣지 그래프로 확장한다. 모두 순수 표준 라이브러리다.
벤치마크 두 가지를 더했다. retrieval_benchmark()는 라벨된 질의 집합에서 평균 recall@k와 평균 역순위(MRR)를 측정한다. retrieval_embedding_dependency()는 모듈 소스를 정적으로 훑어 임베딩·벡터 라이브러리 임포트를 찾는다. 결과가 비면 벡터 없는 상태이고, 소스 기반 검사라 다른 곳의 무관한 임포트가 거짓 양성을 낼 수 없다.
라벨 픽스처와 실현성 기준(평균 recall@3과 MRR이 0.8 이상), 그리고 검색 소스가 임베딩 라이브러리를 임포트하지 않는다는 강한 테스트를 함께 커밋했다. 이로써 임베딩이 필요 없다는 말이 주장이 아니라 증거가 됐고, 마지막 RAG 수용 항목이 닫혔다.
근거·결과 (Consequences)
테스트 4개를 새로 더했고 전체 57개가 통과한다.
노드 계약 (contract)
| 필드 | 값 |
|---|---|
| type | 결정(decision) |
| Status | accepted |
| source_count | 1 |
| confidence | 미설정 — 구 엔진 격차 |
| confidence_reason_codes | 미설정 — 구 엔진 격차 |
| stale | fresh |
| 이슈(feature) | 검증·증거·회귀 |
상호참조
- 이어받음 — 회상이 폐기된 결정을 되살리지 않음
- 이어받음 — 이어받기 묶음 경계(명시 승인 참조만)
- 관련 — 검색 가능 소스 자격 게이트
이슈 회귀 스위트·검증 원장 · Status accepted · 2026-06-25