관리 메뉴

피터의 개발이야기

[Elasticsearch] index vs indices 본문

DevOps/Elasticsearch

[Elasticsearch] index vs indices

기록하는 백앤드개발자 2022. 5. 17. 09:17
반응형

 

ㅁ 개요

ㅇ Elasticsearch를 이야기 하면서 개념적으로 헷갈리는 부분이 있어서 정리를 하였다.

ㅇ index와 indices, node, Documents에 관한 설명이다.

 

ㅁ 용어 개념 정리

 ㅇ 도큐먼트는 가장 기본 단위로 로그 한줄을 말한다.

 ㅇ index는 도큐먼트의 논리적인 한 묶음이다.

 ㅇ indices는 언어적으로는 index의 복수형을 뜻하고, index의 물리적인 의미로 저장소 단위 개념이다.
 ㅇ shard는 indices의 분산저장 단위이다.

 

 

ㅇ 위의 이미지를 참조하여 설명하면,
     elasticsearch의 인프라는 3개의 master node와 2개의 data node로 구성되어 총 5개 노드가 있다.

 ㅇ shard는 5개의 노드 중에서 data 노드에 24개의 indices가 이중으로 저장이 된다.

 

 ㅇ 트레픽 발생에 따라 로그량이 증가하면서 indices가 여러 샤드로 분리되고 샤드를 복제하는 과정에서

     유휴시간이 급격히 줄어드는 경우가 있었다.

 ㅇ 간혹 트레픽이 폭발적으로 증가한 상태에서 샤드의 복제까지 일어나는 경우

     disk IO의 부족으로 병목현상이 발생할 수 있기 때문에 트래픽이 증가하는 경우 집중적으로 모니터링이 필요하다.

 

 

ㅁ 함께 보면 좋은 사이트

 

 

3.2 인덱스와 샤드 - Index & Shards - Elastic 가이드북

인덱스를 생성할 때 별도의 설정을 하지 않으면 7.0 버전부터는 디폴트로 1개의 샤드로 인덱스가 구성되며 6.x 이하 버전에서는 5개로 구성됩니다. 클러스터에 노드를 추가하게 되면 샤드들이 각

esbook.kimjmin.net

 

 

ElasticSearch 개념을 익혀보자..

토이 프로젝트를 준비하면서 엘라스틱서치를 사용해야하는 상황이 발생했습니다. CQRS를 참고하면서 개발하면서 Query 즉, Select하는 부분에 ElasticSearch를 선택하여 역색인 지원을 통한 매우 빠른

velog.io

 

반응형
Comments