전체 글 (315) 썸네일형 리스트형 [실습문제] 2023. 12. 1.(금) (4문제) 실습문제 1. 2000-2013년_연령별실업율_40-49세.csv 파일을 읽고 1) 연도별 실업률 평균을 구하여라 이 문제는 열별 평균을 구하는 문제이다. 2) 월별 실업률 평균을 구하여라 이 문제는 행별 평균을 구하는 문제이다. 3) 모든 데이터를 소수점 둘 째 자리까지 표현하여라 이 문제에서는 sprintf를 사용하게 된다. 우선 값 하나를 대입하면 sprintf('%.2f', df1[1,1]) 이런 형식으로 작성하게 된다. 그렇게 되면 바로 apply에 대입을 할 수가 없다. 왜냐하면, 일단 apply에 대입하게 되면 아래와 같이 작성하게 되는데, apply(df1, c(1,2), sprintf, '%.2f') 이 함수를 해석하면 sprintf의 첫 인수가 df1이 된다는 의미이다. 하지만 문법을 .. [실습문제] 2023. 11. 30.(목) (2문제) 실습문제 1. emplyment.csv 파일을 읽고 1) 연도별 총 근로일수의 평균을 구하여라 2) 고용형태별 월급여액 평균을 구하여라(전체근로자와 전체근로자(특수형태포함)이 다른 그룹이 되도록) 실습문제 2. student, exam_01 데이터를 사용하여 각 학년별 최고 성적자의 이름, 학년, 성적을 출력하여라. 8일차 - [1일 1문제] 각 부서의 최소 급여자 중에서 20번 부서의 최소 급여자보다 많은 급여를 받는 부서의 부서번호와 부서의 최소급여 찾기 1. EMP테이블에서 부서별 최소급여가 20번 부서의 최소급여보다 많은 부서의 부서번호와 부서의 최소급여를 조회하여라. R에서의 Oracle DB Connect 방법 현업에서는 보통 분석할 모든 데이터들은 외부 서버로 떨어져 있다. 즉 분석서버 및 분석 DB 서버가 분리되어 있을 가능성이 크다. DBMS가 설치되어 있는 서버가 따로 있을 것이라는 의미이다. 그래서 이 게시글에서는 R에서 DB로 접속을 하여 원하는 데이터를 가져오는 방법을 기록해두려고 한다. R은 데이터가 저장되는 공간이 없는 SW이므로 DB연결 후 데이터를 불러와야 한다. R에서의 통신 담당인 RJDBC패키지(64bit)와 oracle에서의 통신담당인 ojdbc.jar 파일이 필요하다(ojdbc.jar 는 oracle 설치 시 자동 생성된다). 그리고 RJDBC 버전과 ojdbc.jar 버전이 일치하여야 한다(64bit). 집에서 테스트 할 수 있는 방법으로, 내 PC에 있는 R에서 내 PC에 있는 .. [복습] R(programming language) Group by 연산 함수(tapply, aggregate, ddply) + 하루끝(20231201) SQL에서 group by 연산처럼 수행을 도와주는 형태가 R에는 함수로 존재한다. 우선 group by 연산은 분리(그룹별) - 연산(적용) - 결합 의 매커니즘으로 구성되어 있다. 세 가지 정도 소개하려고 한다. 1. tapply tapply(vector, # 연산대상 index, # 그룹핑 대상 function # 적용함수, .....) # 함수의 추가 인수 위와 같은 문법으로 되어있다. 문법이 심플한 장점이 있으며, 비교적 단순한 문법이긴 하나 벡터로 리턴이 되는 것이 단점이다(data.frame 리턴 불가). oracle에서는 group by 후 max(), count() 이렇게 여러 개 들어올 수 있는데 tapply는 하나의 연산 대상만 전달이 가능하다. Line 2처럼 학년별 키의 평균을 구.. 이전 1 ··· 35 36 37 38 39 40 41 ··· 63 다음