본문 바로가기

Dev/ElasticSearch3

[ElasticSearch] 엘라스틱서치(3) - inverted index, analyzer '기초부터 다지는 ElasticSearch 운영 노하우' 책을 읽고 정리한 내용입니다. inverted index 엘라스틱서치의 검색엔진을 활용하면 검색이 빠른 이유는 무엇일까? 바로 엘라스틱 서치는 인덱스를 구성할 때 역 색인 구조로 문서를 저장하기 때문이다. 그렇다면 역색인이란 무엇인가? RDB에서는 인덱스를 구성할 때 특정 컬럼을 기준으로 B-tree 구조로 별도의 인덱스 테이블을 만들고 몇 번째 로우에 어떤 데이터가 있다는 방식으로 저장을 하게 된다. 역 색인은 말 그대로 반전된 인덱스로써 어떤 데이터가 몇 번째 로우에 저장되어있는 지의 구조로 저장되는 것이다. 특히나 엘라스틱서치는 여러 단어들로 쪼개서 인덱스에 저장되기 때문에 키워드 검색 시에 뛰어난 속도를 나타낼 수 있는 것이다. 그렇다면 어.. 2022. 11. 15.
[ElasticSearch] 엘라스틱 서치 (2) - 클러스터, 노드, 샤드 기본 개념 '기초부터 다지는 ElasticSearch 운영 노하우' 책을 읽고 정리한 내용입니다. 클러스터 클러스터란? 여러 개의 노드를 하나의 ElasticSearch처럼 동작하게 하는 것 클러스터 내의 노드들은 하나의 ElasticSearch처럼 동작하기 때문에 클러스터를 구성하는 어느 노드에 API요청을 해도 동일한 응답과 동작을 보장한다. 대부분 하나 이상의 노드로 클러스터를 구성하고 사용자 요청을 클러스터 단위로 처리 여러 개의 노드로 클러스터를 구성했을 때 장애 발생 시 대처가 가능하다. 즉 안정적으로 클러스터 유지가 가능 고유의 이름과 UUID를 갖는다. 두 가지의 고유 속성으로 인해 클러스터 내에 속한 노드가 서로 동일한 클러스터 안에 있음을 인지하고 클러스터링 한다. > 클러스터 정보 확인하기 cu.. 2022. 10. 5.
[ElasticSearch] 엘라스틱 서치 (1) - 기본 개념 훑어보기 '기초부터 다지는 ElasticSearch 운영 노하우' 책을 읽고 정리한 내용입니다. ElasticSearch란? Lucene 기반의 오픈소스 검색 엔진. Documents 형식의 문서를 저장하고 검색할 수 있으며 데이터를 통해 분석 작업도 가능하다. > 특징 준 실시간 검색 엔진 실시간에 준하는 수준의 검색 제공 json문서를 입력하면 refresh_interval 파라미터 값(default 1s)에 따라 엘라스틱 서치의 데이터 공간인 샤드에 저장되고 쿼리를 통해 검색이 가능해진다. 클러스터 구성 여러대의 컴퓨터 혹은 구성요소들을 논리적으로 결합하여 전체를 하나의 구성요소처럼 사용할 수 있게 하는 기술 클러스터로 구성하면 높은 수준의 안정성과 부하분산을 시킬 후 있음 node1에 문제가 생기면 문제의.. 2022. 9. 29.
반응형