이론

[검색] 키워드 서치, 시맨틱 서치, 하이브리드 서치 개념 정리

weweGH 2025. 11. 17. 22:00
반응형

키워드, 시맨틱, 하이브리드 서치
키워드, 시맨틱, 하이브리드 서치


키워드 서치, 시맨틱 서치, 하이브리드 서치 개념 정리


들어가며


정보의 양이 방대해지면서 '검색'의 역할이 매우 중요해졌습니다. 과거에 수 천 개 문서를 검색하는 수준에서 벗어나 지금은 수백만 개의 문서 속에서 원하는 정보를 정확하게 찾아내야 합니다. 검색이 진화되면서 전통적인 키워드 검색부터 의미 기반 검색, 그리고 두 방식을 결합한 하이브리드 검색까지 발전했습니다. 이러한 발전을 통해 RAG, LLM 등 검색 시스템을 기반한 서비스들이 등장하며, 단순한 문서 조회를 넘어 ‘문맥을 이해하고 답변을 생성하는’ 새로운 형태의 정보 활용 방식이 가능해졌습니다.

이 글에서는 키워드 서치, 시맨틱 서치, 하이브리드 서치에 대한 개념을 정리하고, 차이점을 비교하여 "검색"을 더 명확하게 알아보겠습니다.



키워드 서치 Keyword Search


키워드 서치 Keyword Search는 사용자가 검색하고자하는 텍스트가 문서에 포함되어 있는지를 기반으로 검색합니다. 예를 들어, "데이터 분석"을 검색하면 "데이터 분석 방법", "데이터 분석가 채용" 등이 검색 결과로 제공됩니다.

하지만, 의미에 대한 이해는 하지 않으므로 "데이터 분석"을 검색하면, "data anlaysis"가 포함된 문서는 검색되지 않습니다.


주요 특징

▪ 빠르고 단순합니다.
검색하고자 하는 단어가 정확히 포함되어 있어야 매칭됩니다.


시맨틱 서치 Semantic Search


시맨틱 서치 Semantic Search는 단어의 의미(Semantic)를 벡터화하여 유사도를 비교하는 검색 방식입니다. 문장이나 단어를 임베딩으로 변환하여 텍스트 유사도로 비교합니다. 예를 들어, "자동차"를 검색하면, "차량", "Car", "승용차"도 함께 검색 결과로 제공됩니다.


주요 특징

▪ 문맥과 의미를 이해할 수 있으므로 동의어나 유사 표현 검색이 가능합니다.
▪ 단어의 모양이 아닌, 의미의 거리로 검색 결과를 제공합니다.


하이브리드 서치 Hybrid Search


하이브리드 서치 Hybrid Search는 "키워드 서치"와 "시맨틱 서치"를 결합한 방식입니다. 키워드 서치의 정확한 키워드를 매칭하는 장점과 시맨틱 서치의 의미 기반 검색 장점을 확장한 검색입니다.


주요 특징

▪ 검색 속도와 의미 이해력을 모두 갖추고 있습니다.
▪ 챗봇, RAG 등 실제 서비스에서 가장 널리 사용되고 있습니다.

반응형

검색 비교 정리


키워드 서치, 시맨틱 서치, 하이브리드 서치를 비교하면 다음과 같습니다.

구분 키워드 서치 시맨틱 서치 하이브리드 서치
검색 기준 단어 일치 의미 유사도 단어 일치 + 의미 유사도
예시 쿼리 "데이터 분석" 포함 문서 "데이터 분석" 유사 문서 "데이터 분석" 포함 + 유사 문서
장점 빠름, 명확 의미 이해, 유연함 정확도 + 다양성
단점 의미 이해 불가 느림, 구축 복잡 구현 난이도 높음

반응형