데이터 마트에서는 뭘 파나요?
•
데이터 마트에서는 데이터에 대한 접근성을 판매한다.
◦
아무리 잘 만든 데이터라도 사용자들의 접근성이 낮다면 활용되지 못하고
◦
결국 구석 한켠에서 저장 비용만 차지하고 있게 된다.
◦
그렇지만, 접근성을 높이려고 계속 마트를 생성하는 것이 능사는 아니다.
•
왜냐하면, 접근성에 대한 담보로 중복 데이터가 생성될 수 밖에 없기 때문이다(data redundancy).
◦
위에서 예시로 든 데이터 마트도 결국에는 각각의 테이블에 나누어져서 저장되어 있었다.
◦
이를 하나로 합치면 결국 동일한 데이터가 중복돼서 생길 수 밖에 없다.
•
그럼, 어떻게 마트를 구성하는게 좋은 걸까?
◦
스키마를 어떻게 구성할 것인지(Star, Snowflake) / 데이터 소스를 어디서 가져올 것인지 (Dependent Data Mart, Independent Data Mart, Hybrid Data Mart)에 대해 많은 설명들을 봤지만.. 개인적으로 제일 와닿았던 것은
I say data marts should be by subject area, not by department.
위 문구였다. 위에서 예시로든 발주량을 선정하는 일은 모두가 관심을 가질만한 중요한 주제이다. 어떤 스키마를 짤지, 데이터를 어디에서 가져올지(데이터 소스)도 중요하지만 마트를 흥행(=데이터 접근성 향상)시키기 위해서는
결국에는 잘 팔릴만한 주제(subject area)인지가 가장 중요할 것이다.