B-Tree 인덱스 사용에 영향을 미치는 요소

Study/MySQL

kanado 2026. 3. 2. 12:49

인덱스 키가 커지면 발생하는 일로는 인덱스는 디스크에 저장되고,
검색 시 디스크 또는 메모리(Buffer Pool)에서 한 페이지 단위로 읽힌다.
그런데 인덱스 키 값이 길어질수록 한 페이지에 저장할 수 있는 레코드 수가 줄어든다.

👉 같은 데이터를 찾기 위해 더 많은 페이지를 읽어야 할 수 있음으로, 디스크 I/O 증가하고 검색 속도 저하

인덱스에 저장되는 값의 바이트 수가 적어야한다는 의미

SELECT *
FROM bt_test
WHERE country = 'KOREA'
  AND city = 'SEOUL';

country 유니크 값이 10개일 때
- 한 국가당 평균 레코드 수 : 10,000 ÷ 10 = 1,000건
- 즉, 약 1,000건 조회하지만 그 중에서 AND city = 'SEOUL’ 를 만족하는 레코드 1건
- 결과적으로 1,000건 읽을 때, 999건은 불필요하게 읽음
- 유니크 값 적음 → 많은 레코드 묶여 있음 → 많이 읽어야 함 👉 인덱스 효율 낮음
country 유니크 값이 1,000개일 때
- 한 국가당 평균 레코드 수 : 10,000 ÷ 1,000 = 10건
- 즉, 약 10건 조회하고, 그 중에서 AND city = 'SEOUL’ 를 만족하는 레코드 1건
- 결과적으로 10건 읽고, 9건만 불필요하게 읽음
- 유니크 값 많음 → 좁은 범위 → 적게 읽음 👉 인덱스 효율 매우 좋음

일반적으로 인덱스를 통해 1건 읽는 비용 ≈ 테이블에서 직접 1건 읽는 비용의 4~5배

DB 옵티마이저는 보통 이렇게 판단한다.

이걸 인덱스 손익분기점이라고 한다.

조인 방식 비교 (네스티드 루프 조인 VS 블록 네스티드 루프 조인 VS 해시 조인) (0)	2026.03.16
MySQL 풀 테이블 스캔과 리드 어헤드 (1)	2026.03.08
B-Tree 인덱스를 통한 데이터 읽기 (0)	2026.03.02
디스크 읽기 방식 HDD VS SSD (0)	2026.03.01
MySQL 격리 수준 (0)	2026.02.17

코딩 메모장

코딩 메모장