728x90
반응형
1. 보스턴 데이터(boston.csv) 범죄율 컬럼(CRIM) top 10 중 10번째 범죄율 값으로 1~10위의 범죄율 값을 변경 후 AGE 변수 80 이상의 범죄율 평균을 산출하여라.
STEP 2의 Line 9와 11 중 앞으로는 Line 9와 같은 문법을 사용하라고 하셨다. 파이썬에서는 Line 11과 같은 문법이 먹히지 않기 때문이다.
2. 주어진 housing.csv 데이터 첫 번째 행부터 순서대로 80%까지의 데이터를 추출 후 'total_bedrooms' 변수의 결측값(NA)을 'total_bedrooms' 변수의 중앙값으로 대체하고 대체 전 표준편차와 대체 후의 표준편차 차이(양수)를 출력하여라.
3. insurance.csv 파일을 읽고 데이터의 특정 컬럼(bmi, charges)의 이상치를 찾아 두 컬럼의 이상치들의 합의 제곱근을 산출하여라 (이상치 기준: 평균 + (표준편차 * 1.5) 이상)
4. ex_test1.csv 파일을 읽고
1) 각 구매마다 포인트를 확인하고 point 컬럼을 생성하여라.
point는 주문금액 50000 미만 1%, 5만 이상 10만 미만 2%, 10만 이상 3%
2) 회원번호별 총 주문금액과 총 포인트 금액을 확인하여라
3) 회원별 주문금액을 확인하고 총 주문금액 기준 상위 30%의 회원을 확인하여라
728x90
반응형
'배우기 > 복습노트[R과 분석]' 카테고리의 다른 글
[복습] 분석 / 데이터 분석 과정과 데이터 전처리 + 하루끝(20231215) (0) | 2023.12.15 |
---|---|
[복습] 분석 / 회귀분석 (0) | 2023.12.14 |
[복습] 분석 / 데이터마이닝과 예측모델링, 지도학습과 비지도학습 + 하루끝(20231213) (0) | 2023.12.13 |
[복습] R(programming language) 시각화(5) 시각화 기타 옵션 (0) | 2023.12.13 |
[복습] R(programming language) 시각화(4) (ggplot2를 이용한 산점도, 선그래프, 막대그래프, 상자그림, 히스토그램, 확률밀도함수(KDE) 및 여러 옵션) (0) | 2023.12.13 |