본문 바로가기

배우기/기록의 중요성

[R]key-value를 이해하기 위한 과정

728x90
반응형

key-value를 이해하기 위해서는 앞에서 공부해온 sql의 table과 비교가 필요할 것 같다.

oracle인 RDBMS는 행 기반으로 자료를 찾는다.

RDBMS에서 테이블이라고 부르는 구조는 R과 Python에서는 데이터 프레임이라고 한다.

RDBMS는 key-value 구조가 아니다. 위에서 언급하였듯이 RDBMS는 자료를 찾을 때 한 행씩 읽어가며 자료를 가져오는데, 한 행에는 다양한 형식을 가진 데이터가 존재한다. 이름은 문자, 학번은 숫자, 가입일은 날짜 등등. 

그렇게 자료를 읽어오게되면 속도가 느린 반면 column 별로 자료를 읽게 되면 한 column은 데이터 타입이 하나 이기 때문에 빠른 속도로 자료를 불러올 수 있다.

R에서의 데이터 프레임이 key-value 구조로 이루어졌다. column 베이스로 저장된 자료는 검색하고 추출하는 데이터 색인이 빠르다. 

수업에서 나온 용어 중 OLTP(Online Realtime Transaction Processing)이 있는데, 이 OLTP성 업무로 특화된 DB는 RDBMS이며 개개인의 데이터를 조회하여야 하므로 속도가 느리다. 이와 반대되는 개념이 데이터웨어하우스(Data Warehouse)이다. DW용 DB는 NoSQL인데 비정형 자료는 row 베이스로 저장하는 것이 어렵기 때문이다. 데이터웨어하우스로 저장된 자료는 key 색인이 용이하여 데이터를 저장하거나 선택하는 것이 빠르다.

 

 우리가 데이터를 불러올 때 emp$DEPTNO 처럼 불러오는 것을 key indexing이라고 한다. 참고로 key-value 는 R의 list라는 자료구조에도 있다. 

 

key = column으로 이해하라고 하셨다.

 

key-value가 무엇이며 왜 key-value 구조가 왜 필요한지 궁금하여 선생님 설명과 이것저것 내용 찾아보며 작성해보았다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

728x90
반응형