행궁동 데이터 엔지니어

반응형

본 포스팅은 학습 용도로 작성하였습니다.
이미지와 주요 내용은 책 ‘빅데이터를 지탱하는 기술(니시다 케이스케 지음, 정인식 옮김, 2018, 제이펍)’ 의 내용을 정리하였습니다. 이외 참고자료는 포스팅 하단에 링크를 남겼습니다.

  • 주요 키워드: 트랜잭션 테이블(Transaction table), 마스터 테이블(Master table), 히스토리 테이블(History table)

개요

기업의 데이터를 활용하기 위해 기업에서 운영 중인 데이터베이스 현황 분석을 하다 보면 수많은 테이블 때문에 난관에 봉착하는 경우가 많습니다.
수많은 테이블 현황을 분석할 때 테이블을 트랜잭션(Transaction), 마스터(Master) 테이블로 분류해 정리하면 분석하고 정리하기 수월합니다.

트랜잭션 테이블

트랜잭션 테이블(Transaction table)은 시간과 함께 생성되는 데이터를 기록한 테이블로 한 번 기록하면 변하지 않습니다.
판매일시와, 판매상품, 금액 등의 정보를 담은 판매 테이블을 예로 들 수 있습니다.

마스터 테이블

마스터 테이블(Master table)은 트랜잭션에서 참고하는 각종 정보(매핑 용도) 상황에 따라 일부 데이터(컬럼)가 업데이트됩니다. 고객 ID, 고객명, 주소 정보를 담고 있는 고객 테이블을 예로 들 수 있습니다.
마스터 테이블에서 고객 테이블의 고객 ID와 같은 불변 속성 데이터는 업데이트 되지 않지만, 고객의 주소와 같은 가변 속성 데이터는 변경 될 수 있습니다.
마스터 테이블의 가변 속성 변화 이력을 관리하기 위해 별도의 이력 테이블(History table) 존재하는 경우가 많습니다.

요약정리

트랜잭션, 마스터 테이블 예시 - 출처: 빅데이터를 지탱하는 기술(니시다 케이스케 지음, 정인식 옮김, 2018, 제이펍) 79페이지

트랜잭션 테이블

  • 시간과 함께 생성되는 데이터를 기록한 것
  • 한 번 기록하면 시간과 함께 생성되기에 변하지 않음
  • 예) 판매 테이블

마스터 테이블

  • 트랜잭션에서 참고되는 각종 정보(매핑 용도)
  • 상황에 따라 일부 컬럼이 업데이트됨 (거의 최신 정보를 유지)
  • 업데이트되지 않는 컬럼: 불변 속성으로 고객 ID와 같은 컬럼
  • 업데이트되는 컬럼: 가변 속성으로 고객 주소, 나이와 같은 컬럼
  • 예) 고객, 상품, 점포 테이블

참고자료

  • 책: 빅데이터를 지탱하는 기술(니시다 케이스케 지음, 정인식 옮김, 2018, 제이펍)
  • 길은 가면, 뒤에 있다님 블로그, [대용량DB] 데이터 테이블의 종류 및 특성, https://12bme.tistory.com/200
  • 데이터 엔지니어를 꿈꾸는 Spidy web블로그, [Data] 마스터 데이터 vs 트랜잭션 데이터, fact테이블 vs dimension 테이블, 시계열 데이터란?, https://spidyweb.tistory.com/264

[Data] 마스터 데이터 vs 트랜잭션 데이터, fact테이블 vs dimension 테이블, 시계열 데이터란?

마스터 데이터란? 트랜잭션 데이터란? 트랜잭션 데이터(transaction data): 시간과 함께 생성되는 데이터를 기록한 것 한 번 기록하면 시간과 함께 생성되기에 변화하지 않는다. ex) 판매 이력 마스터

spidyweb.tistory.com

[대용량DB] 데이터 테이블의 종류 및 특성

본 포스팅은 학습 용도로 작성되었습니다. 원본 출처는 http://blog.daum.net/hadmond/7 입니다. DW 시스템 구축시, 구축 대상이 되는 업무계(기간계)시스템의 테이블(table) 종류와 그 특성을 올바로 파악

12bme.tistory.com

반응형

이 글을 공유합시다

facebook twitter kakaoTalk kakaostory naver band