728x90
반응형
보통 행정기관의 자료를 받아보면 엑셀에 이런 형식으로 데이터가 저장되어 있다.
예) 강남 상가의 연도별 매출액
2023 2022 2021 2020 2019 ........
스타벅스
바나에스프레소
이 경우는 자료가 행방향으로 저장되는데 이러한 자료를 와이드 형식이라고 한다.
이러한 와이드 형식의 자료가 DB로 들어오는 경우 JOIN도 되지 않고 GROUPING도 되지 않는다.
한 컬럼을 추출하게 되면 2023년도의 각각 다른 상가들의 자료가 추출되어 효율적이지 않다.
스타벅스 자료를 읽으려면 모든 행열의 자료를 다 불러와야하기 때문에 DISK I/O도 크다.
728x90
스타벅스 바나에스프레소
2023
2022
2021
2020
2019
이런 컬럼형으로 된다면 한 가게 당 데이터를 추출할 수 있기 때문에 자료를 더 효율적으로 가공할 수 있다.
전직장에서 일할 때마다 가로 세로에 어떤 데이터를 담을 것인지 고민이 많았는데 그 물음표가 명확해졌다.
728x90
반응형
'배우기 > 기록의 중요성' 카테고리의 다른 글
[R] NA와 NULL의 차이 (0) | 2023.11.23 |
---|---|
[R] 이해한대로 써보는 차원축소 (0) | 2023.11.23 |
[R]key-value를 이해하기 위한 과정 (0) | 2023.11.22 |
[SQL, Oracle] 이해한대로 써보는 delete와 truncate의 차이(High Water Mark, HWM) (0) | 2023.11.12 |
[SQL, Oracle] DML(Data Manipulation Language)의 lock 발생 관련 내용 정리 (0) | 2023.11.10 |