전체 글 (315) 썸네일형 리스트형 [R]데이터 저장 방법(행 방향 저장? 열 방향 저장?) 보통 행정기관의 자료를 받아보면 엑셀에 이런 형식으로 데이터가 저장되어 있다. 예) 강남 상가의 연도별 매출액 2023 2022 2021 2020 2019 ........ 스타벅스 바나에스프레소 이 경우는 자료가 행방향으로 저장되는데 이러한 자료를 와이드 형식이라고 한다. 이러한 와이드 형식의 자료가 DB로 들어오는 경우 JOIN도 되지 않고 GROUPING도 되지 않는다. 한 컬럼을 추출하게 되면 2023년도의 각각 다른 상가들의 자료가 추출되어 효율적이지 않다. 스타벅스 자료를 읽으려면 모든 행열의 자료를 다 불러와야하기 때문에 DISK I/O도 크다. 스타벅스 바나에스프레소 2023 2022 2021 2020 2019 이런 컬럼형으로 된다면 한 가게 당 데이터를 추출할 수 있기 때문에 자료를 더 효.. [R]key-value를 이해하기 위한 과정 key-value를 이해하기 위해서는 앞에서 공부해온 sql의 table과 비교가 필요할 것 같다. oracle인 RDBMS는 행 기반으로 자료를 찾는다. RDBMS에서 테이블이라고 부르는 구조는 R과 Python에서는 데이터 프레임이라고 한다. RDBMS는 key-value 구조가 아니다. 위에서 언급하였듯이 RDBMS는 자료를 찾을 때 한 행씩 읽어가며 자료를 가져오는데, 한 행에는 다양한 형식을 가진 데이터가 존재한다. 이름은 문자, 학번은 숫자, 가입일은 날짜 등등. 그렇게 자료를 읽어오게되면 속도가 느린 반면 column 별로 자료를 읽게 되면 한 column은 데이터 타입이 하나 이기 때문에 빠른 속도로 자료를 불러올 수 있다. R에서의 데이터 프레임이 key-value 구조로 이루어졌다. c.. [실습문제] 2023. 11. 21.(화) (2문제) 실습문제 1. emp.csv 파일을 읽고 1) 10번 부서원의 이름을 출력하여라 2) 이름이 SMITH 또는 SCOTT의 이름, SAL, HIREDATE를 출력하여라 3) 10번 부서원 중 급여가 2000 이상이면서 입사일이 81년 8월 31일 이후인 사람의 이름, 입사일, 부서번호, 급여를 출력하여라 4) 월요일에 입사한 사람의 전체 컬럼 정보를 출력하여라(단, mgr, deptno 컬럼 제외) 이 문제에서 mgr, deptno 컬럼을 제외하기 위해서는 각 컬럼 위치를 하나씩 세어서 번호를 알아낸 뒤에 - 를 붙여야 했다. 선생님께서 더 편한 방법을 알려주셨는데 이는 아래와 같다. 여기서 이해가 안 되었던 게 대괄호의 콤마 뒤 컬럼을 불러오는 곳에서 항상 c를 붙이고 컬럼 이름을 불러왔는데, 이는 컬럼.. 2일차 - [1일 1문제] 등급 구하기(SQL) EMP, DEPT 테이블을 이용하여 사원번호, 이름, 부서이름을 출력하여라 첫 번째 풀이는 JOIN을 이용하여 풀었다. 다음은 스칼라 서브쿼리를 이용한 풀이이다. 1일차 - [1일 1문제] 등급 구하기(SQL) EMP 테이블과 SALGRADE 를 이용하여 사원번호, 이름, 각 SAL에 대한 등급을 구하여라. 첫 번째 풀이 두 번째 풀이 스칼라 서브쿼리로 작성하였다. 이전 1 ··· 44 45 46 47 48 49 50 ··· 63 다음