본문 바로가기

728x90
반응형

전체 글

(315)
8일차 - [1일 1문제] 업무별 평균급여가 가장 적은 급여 조회(SQL) 1. EMP 테이블에서 업무별 평균급여가 가장 적은 급여를 조회하여라.
[복습] R(programming language)에서의 순위(rank, dense_rank) + 하루끝(20231204) 1. rank 바로 rank 의 문법을 확인하여보자. rank(x, # 대상(벡터, 하나만 전달 가능, 역순일 경우 -x) na.last = T, # NA 마지막 배치 여부 ties.method = 'average' , # 순위의 평균값으로 동순위 부여 (1.5, 1.5, 3.0, 4.0, 5.0) 'first', # 동순위로 처리하지 않고 각각 다른 순위 부여 (1,2,3,4,5) 'last', # 동순위로 처리하지 않고 각각 다른 순위 부여 (2,1,3,4,5) 'random', # 변동(동순위로 처리하지 않음. 각각 서로 다른 순위를 랜덤하게 부여) 'min', # 동순위로 처리하지 않고 낮은값(높은순위)로 동순위 처리(1,1,3,4,5) 'max') # 동순위로 처리하지 않고 큰값(낮은순위)로 동..
[복습] R(programming language)에서의 정렬(order, sort, orderBy, arrange) 정렬의 개념 중 1차 정렬, 2차 정렬의 개념을 명확히 알아야 한다. 특히 2차 정렬은, 1차 정렬 결과에서 같은 값을 가질 경우 그 데이터를 추가 정렬을 수행하는 것이다. 예를 들면, 위와 같이 성별 정렬 후 이름을 정렬하게 되면 우측 결과처럼 출력이 된다. 성별 이름별 정렬을 하라고 한다면 언어적 느낌상 group by 후 sort를 하라는 것 같지만 그렇게 착각하여서는 안된다. 성별을 1차로 정렬하고 이름을 2차로 정렬하라는 의미이다. 정렬 함수는 여러 개가 있는데 쓰임의 빈도에 맞게 ★를 달아보자. 1.order ★ ★ ★ - 직접 정렬된 결과로 리턴해주지 못한다 - 정렬된 순서대로 위치 값을 리턴한다 → 위치를 색인으로 전달하여 원하는 순서를 보장한다. 문법은 다음과 같다. order(....,..
[복습] R(programming language) 그룹 연산 정리(aggregate, ddply) https://metime.tistory.com/142 [복습] R(programming language) Group by 연산 함수(tapply, aggregate, ddply) + 하루끝(20231201) SQL에서 group by 연산처럼 수행을 도와주는 형태가 R에는 함수로 존재한다. 우선 group by 연산은 분리(그룹별) - 연산(적용) - 결합 의 매커니즘으로 구성되어 있다. 세 가지 정도 소개하려고 한다. 1. metime.tistory.com 여기서 배운 그룹 연산을 정리해보도록 하겠다. tappy는 데이터 프레임으로 output이 출력되지 않기 때문에 잘 사용하지 않으므로 넘어가겠다. 1. aggregate 1번 문법 - 연산 대상 컬럼이 많을 경우 유리하다. - 외부 객체를 사용할 ..
[복습] R(programming language) 그룹 연산 기능인 aggregate 함수가 갖는 장점(외부 객체로의 그룹 연산) aggregate 함수는 두 가지 문법이 있다. 자세한 내용은 아래 링크를 우선 참고하자. https://metime.tistory.com/142 [복습] R(programming language) Group by 연산 함수(tapply, aggregate, ddply) + 하루끝(20231201) SQL에서 group by 연산처럼 수행을 도와주는 형태가 R에는 함수로 존재한다. 우선 group by 연산은 분리(그룹별) - 연산(적용) - 결합 의 매커니즘으로 구성되어 있다. 세 가지 정도 소개하려고 한다. 1. metime.tistory.com emp.csv 자료로 예시를 들어보겠다. emp의 직원을 두 그룹으로 나누어 급여 평균을 계산하여보자. 단, 그룹 모집은 선착순이다(1~7번까지 1번 그룹,..

728x90
반응형