본문 바로가기

배우기/기록의 중요성

[R]데이터 저장 방법(행 방향 저장? 열 방향 저장?)

728x90
반응형

보통 행정기관의 자료를 받아보면 엑셀에 이런 형식으로 데이터가 저장되어 있다.

 

예) 강남 상가의 연도별 매출액

 

                            2023          2022         2021        2020         2019  ........

스타벅스

바나에스프레소

 

이 경우는 자료가 행방향으로 저장되는데 이러한 자료를 와이드 형식이라고 한다.

이러한 와이드 형식의 자료가 DB로 들어오는 경우 JOIN도 되지 않고 GROUPING도 되지 않는다.

한 컬럼을 추출하게 되면 2023년도의 각각 다른 상가들의 자료가 추출되어 효율적이지 않다.

스타벅스 자료를 읽으려면 모든 행열의 자료를 다 불러와야하기 때문에 DISK I/O도 크다.

 

 

728x90

 

 

                스타벅스        바나에스프레소

2023

2022

2021

2020

2019

 

이런 컬럼형으로 된다면 한 가게 당 데이터를 추출할 수 있기 때문에 자료를 더 효율적으로 가공할 수 있다.

전직장에서 일할 때마다 가로 세로에 어떤 데이터를 담을 것인지 고민이 많았는데 그 물음표가 명확해졌다.

728x90
반응형