본문 바로가기

배우기/복습노트[R과 분석]

[복습] R(programming language) 그룹 연산 기능인 aggregate 함수가 갖는 장점(외부 객체로의 그룹 연산)

728x90
반응형

aggregate 함수는 두 가지 문법이 있다. 자세한 내용은 아래 링크를 우선 참고하자.

https://metime.tistory.com/142

 

[복습] R(programming language) Group by 연산 함수(tapply, aggregate, ddply) + 하루끝(20231201)

SQL에서 group by 연산처럼 수행을 도와주는 형태가 R에는 함수로 존재한다. 우선 group by 연산은 분리(그룹별) - 연산(적용) - 결합 의 매커니즘으로 구성되어 있다. 세 가지 정도 소개하려고 한다. 1.

metime.tistory.com

 

emp.csv 자료로 예시를 들어보겠다.

 

emp의 직원을 두 그룹으로 나누어 급여 평균을 계산하여보자.

단, 그룹 모집은 선착순이다(1~7번까지 1번 그룹, 8~14번까지 2번 그룹)

이것이 바로 aggregate가 갖는 장점이다.

잘 살펴보면, c1은 emp 내부의 객체가 아니라 외부 객체이다.

외부 객체를 활용하여 그룹핑을 한 것이다.

 

그런데 aggregate가 다른 문법도 가지고 있는데, 다음 문법으로는 외부 객체를 활용할 수 없디ㅏ.

aggregate(SAL ~ g1, emp, mean) 이런 식으로 활용할 수가 없다.

 

728x90
반응형