Search

반정규화의 성능

반정규화의 정의

① 정규화된 엔터티, 속성, 관계에 대해 시스템의 성능향상과 개발(Development)과 운영(Maintenance)의 단순화를 위해 중복, 통합, 분리 등을 수행하는 데이터 모델링의 기법을 의미
② 협의의 반정규화는 데이터를 중복하여 성능을 향상시키기 위한 기법이라고 정의할 수 있고 좀 더 넓은 의미의 반정규화는 성능을 향상시키기 위해 정규화된 데이터 모델에서 중복, 통합, 분리 등을 수행하는 모든 과정을 의미
③ 데이터 무결성이 깨질 수 있는 위험을 무릅쓰고 데이터를 중복하여 반정규화를 적용하는 이유는 데이터를 조회할 때 디스크 I/O량이 많아서 성능이 저하되거나 경로가 너무 멀어 조인으로 인한 성능저하가 예상되거나 칼럼을 계산하여 읽을 때 성능이 저하될 것이 예상되는 경우 반정규화를 수행하게 된다.
중복성의 원리를 활용하여 데이터 조회 시 성능을 향상시키는 역할을 할 수 있음
디스크 IO : 데이터를 작성 하고 변경 할적에 디스크 즉 HDD 에 그것이 저장되는 것

반정규화 절차

① 반정규화도 하나의 난이도 높은 데이터 모델링의 실무기술이다. ② 반정규화에 대한 필요성이 결정이 되면 칼럼의 반정규화 뿐만 아니라 테이블의 반정규화와 관계의 반정규화를 종합적으로 고려하여 적용 ③ 반정규화를 막연하게 중복을 유도하는 것만을 수행하기 보다는 성능을 향상시킬 수 있는 다른 방법들을 고려하고 그 이후에 반정규화를 적용하도록 해야 한다.
반정규화의 대상을 조사하고 다른 방법을 적용할 수 있는지 검토하고 그 이후에 반정규화를 적용하도록 한다.

반정규화의 기법 → 테이블 반정규화

테이블 병합

1:1관계 테이블 병합 - 1:1 관계를 통합하여 성능향상 1:M 관계 테이블 병합 - 1:M 관계 통합하여 성능향상 슈퍼/서브타입 테이블 병합 - 슈퍼/서브관계를 통합하여 성능향상

테이블 분할

수직분할
칼럼단위의 테이블을 디스크I/O 분산처리를 하기 위해 테이블을 1:1로 분리하여 성능 향상
(트랜잭션의 처리되는 유형 파악이 선행되어야 함)
수평분할
로우 단위로 집중 발생되는 트랜잭션을 분석하여 디스크 I/O 및 데이터 접근 효율을 높여 성능을 향상하기 위해 로우단위로 테이블을 쪼갬(관계가 없음)

테이블 추가

중복 테이블 추가
다른 업무이거나 서버가 다른 경우 동일한 테이블 구조를 중복하여 원격 조인을 제거하여 성능을 향상
통계 테이블 추가
SUM, AVG 등을 미리 수행하여 계산해둠으로써 조회 시 성능을 향상
이력 테이블 추가
이력 테이블 중에서 마스터 테이블에 존재하는 레코드를 중복하여 이력 테이블에 존재하는 방법은 반정규화 유형 → 이력
부분 테이블 추가
하나의 테이블의 전체 칼럼 중 자주 이용하는데 자주 이용하는 집중화된 칼럼들이 있을 때 디스크I/O를 줄이기 위해 해당 칼럼들을 모아놓은 별도의 반정규화된 테이블을 생성

반정규화의 기법 – 칼럼의 반정규화

중복 칼럼 추가
조인에 의해 처리할 때 성능 저하를 예방하기 위해 즉, 조인을 감소시키기 위해 중복된 칼럼을 위치 시킴
파생 칼럼 추가
트랜잭션이 처리되는 시점에 계산에 의해 발생되는 값을 성능저하를 예방하기 위해 미리 값을 계산하여 칼럼에 보관함
이력 테이블 칼럼 추가
대량의 이력 데이터를 처리할 때 불특정날 조회나 최근값을 조회할 때 나타날수 있는 성능저하를 예방하기 위해 이력테이블에 칼럼 추가(최근값 여부, 시작과 종료일자 등)
PK에 의한 칼럼 추가
복합 의미를 갖는 PK를 단일 속성으로 구성하였을 경우 발생됨,
단일 PK안에서 특정값을 별도로 조회하는 경우 성능 저하가 발생함, 이때 이미 PK안에 데이터가 존재하지만 성능향상을 위해 일반속성으로 생성하는 방법이 PK에 의한 칼럼 추가 반정규화임
응용시스템의 오작동을 위한 칼럼 추가
업무적으로 의미가 없지만 사용자가 데이터 처리를 하다가 잘못 처리하여 원래의 값으로 복구를 원하는 경우 이전 데이터를 임시적으로 중복하여 보관하는 기법임 칼럼으로 이것을 보관하는 방법은 오작동 처리를 위한 임시적인 기법이지만 이것을 이력데이터 모델로 풀어내면 정상적인 데이터 모델의 기법이 될 수 있음

반정규화의 기법 – 관계 반정규화

중복 관계 추가
데이터를 처리하기 위한 여러 경로를 거쳐 조인이 가능하지만 이 때 발생할 수 있는 성능저하를 예방하기 위해 추가적인 관계를 맺는 방법이 관계의 반정규화임
테이블과 칼럼의 반정규화는 데이터 무결성에 영향을 미치게 되나
관계의 반정규화는 데이터 무결성을 깨뜨릴 위험을 갖지 않고서도 데이터처리의 성능을 향상시킬 수 있는 반정규화의 기법이 된다.

정규화가 잘 정의된 데이터 모델에서 성능이 저하될 수 있는 경우

정규화가 된 모델
공급자와 전화번호, 메일주소, 위치는 1:M 관계이므로 한명의 공급자당 여러 개의 전화번호, 메일주소, 위치가 존재한다.
따라서 가장 최근에 변경된 값을 가져오기 위해서는 조금 복잡한 조인이 발생될 수 밖에 없다.
반정규화가 된 모델
SELECT 공급자명 , 전화번호 , 메일주소 , 위치 FROM 공급자 WHERE 공급자번호 BETWEEN '1001' AND '1005' ;
SQL
복사
반정규화를 적용하면 즉, 가장 최근에 변경된 값을 공급자 엔터티에 위치시키면 아주 간단한 SQL구문이 작성 된다

정규화가 잘 정의된 데이터 모델에서 성능이 저하된 경우 2

정규화가 된 모델
서버A에 부서와 접수 테이블이 있고 서버B에 연계라는 테이블이 있는데 서버B에서 데이터를 조회할 때 빈번하게 조회되는 부서명이 서버A에 존재하기 때문에 연계, 접수, 부서 테이블이 모두 조인이 걸리게 된다.
게다가 산데이터베이스 환경이기 때문에 다른 서버간에도 조인이 걸리게 되어 성능이 저하되는 것이다.
서버 A : 서울 / B : 제주
반정규화가 된 모델
연계 테이블에서 바로 부서명을 조회하면 된다.
SQL구문도 간단해지고 분산되어 있는 서버 간에 도 DB LINK 조인이 발생하지 않아 성능이 개선되 었다.
반정규화를 적용할 때 기억해야 할 내용은 데이터를 입력, 수정, 삭제할 때는 성능이 떨어지는 점 을 기억해야 하고 데이터의 무결성 유지에 주의를 해야 한다.