전체 글 (315) 썸네일형 리스트형 [복습] R(programming language) 이전값 가져오기(zoo::na.locf) v1이 다음과 같이 정의되었을 때 (v1 [복습] R(programming language) 반복 제어문(next, break, quit) 반복 제어문이랑 반복문 내에서 사용할 수 있는 제어문으로, 어떠한 조건을 만나면 그 부분만 skip하게하거나(중간에 특정 케이스만 반복하고싶지 않은 경우), 조건이 무한히 진행되다가 어떤 조건을 만나면 반복을 끝나게 하는 것들이다. 반복 제어문을 통하여 반복문의 중간 제어 시점을 정의할 수 있다. 1. next: next를 만나면 반복문 내부에 있는 명령어의 실행을 skip 한다. 예를 들어 위와 같은 R 코드가 있다고 가정했을 때 cmd1은 10번 수행되나 next 다음에 오는 cmd2, cmd3은 next가 포함된 if문과 같은 depth이므로 실행을 skip 한다. 즉 여기서도 같은 depth인 cmd4에만 영향을 미친다. 2. break: 예외 처리를 위하여 주로 사용되는 문장으로, break를 .. [복습] R(programming language)에서 SQL 작성하기(sqldf 패키지) R 내부에서 SQL을 사용하여 데이터 처리를 도와주는 패키지/함수명이 sqldf 이다. SQLite 문법을 사용하기 때문에 Oracle의 함수가 작동되지 않는다(decode 등). 그러나 Oracle join문법을 지원하며 ANSI 표준도 당연히 지원된다. https://metime.tistory.com/120 [복습] R(programming language) R의 join + 복습후기(20231127) 우선 join이란 참조 테이블에 참조 조건을 걸어 값을 가져오는 행위이다. join 메커니즘은 아래와 같다. step 1) 원본 table에서 참조 조건을 걸 대상(상수) 선택 step 2) 참조 table에서 참조 대상과의 조 metime.tistory.com 이 게시물에서 한번 다룬 적이 있으나 오.. [복습] R(programming language)의 숫자(수학/통계) 함수 숫자(수학/통계) 함수는 na.rm 옵션을 사용하여 NA를 제외한 연산이 가능하다. 기본적으로 sum, mean, min, max가 있다. 그런데 count는 없는데 이는 length로 대체 가능하기 때문이다. length(emp$DEPTNO)하면 벡터의 개수, 원소의 개수가 추출된다. dplyr패키지를 설치하면 count()를 사용할 수 있기는 하다. var(1:10): 분산 sd(1:10): 표준편차 (파이썬에서는 std) sqrt(4): 스퀘어루트, 루트 log10(): 밑이 10인 로그 함수 log2(): 밑이 2인 로그함수 log(x, base = exp(1)): 베이스는 선택 가능하며 default는 자연지수인 exp(1) 이다. exp(1): 자연지수(e) exp(10): e^10 이 정도 .. [실습문제] 2023. 11. 27.(월) (3문제) 실습문제 1. emp.csv 파일을 읽고 각 직원의 총 급여를 출력하여라. 단, 총 급여는 SAL + COMM이며, COMM은 NA의 경우 500, 나머지는 10% 증가값으로 계산하여라. 실습문제 2. read_test.csv 파일을 읽고 1) a컬럼의 총 합을 구하여라. Line 4처럼 데이터 타입 변환할 때 NA는 타입 변환에 영향을 주지 않는다. Line 6에서 na.rm 옵션을 TRUE로 주면 NA는 제외하고 합을 구한다. 2) a 컬럼의 값 중 180이 초과하는 데이터는 잘못 들어온 것이라 가정하고 이 값들을 이들을 제외한 a컬럼의 평균값으로 대치한 후 a 컬럼의 총 합을 소수점 둘 째 자리까지 표현하여라. 1)에서 a를 숫자 타입으로 바꿨기 때문에 바로 평균을 계산하였다. 실습문제 3. stu.. 이전 1 ··· 39 40 41 42 43 44 45 ··· 63 다음