Kimball definition
데이터 마트
- 1개 이상의 스타 스키마
데이터 웨어하우스
- 데이터 마트의 집합
- 모든 데이터 마트의 소스
큐브
- 다차원 데이터 오브젝트
큐브 사용 장점
- 정의에 따라 주어진 정보에 아주 빠르게 응답한다.
- 드릴다운 경로가 동적이다. 큐브에서 깔끔하고 구조화된 aggregation이 나온다.
- 질의가 간단하다. 조인이 없음. 팩트 기반으로 만들어졌기 때문에 세부 정보를 몰라도 됨.
큐브 사용 단점
- Ad-hoc 질의로 알맞지 않다.
- 실시간성이 떨어진다.
- 드릴다운은 저수준으로만 가능하다.
- 크기: 큐브에 넣는 속성은 절대 작지 않다.
- 소스 데이터 크기: 속성이 많을 쓰로 가져다 사용할 데이터가 많다.
- 유지보수: 일간 데이터 생성에 수시간이 걸린다면 큐브 생성에도 오래걸린다.
- 복잡도: 큐브 질의에 SQL을 사용할 수 없다. MDX(Multidimensional Expression)을 사용해야 한다.
원본: http://www.seemoredata.com/en/entry.php?10-Differences-between-CUBES-and-Star-Schema
'Summary' 카테고리의 다른 글
[요약] Druid (0) | 2016.10.20 |
---|---|
[요약] 데이터 마이닝 방법론/프로세스 CRISP-DM (0) | 2016.09.28 |
[요약] 추천시스템의 핵심기술 (0) | 2016.09.28 |
[요약] 노트 7 소셜 반응 분석 & 구현하기 / 빅쿼리,제플린 사용 (0) | 2016.09.28 |