본문 바로가기

배우기/복습노트[R과 분석]

[실습문제] 2023. 12. 13.(수) (4문제)

728x90
반응형

1. 보스턴 데이터(boston.csv) 범죄율 컬럼(CRIM) top 10 중 10번째 범죄율 값으로 1~10위의 범죄율 값을 변경 후 AGE 변수 80 이상의 범죄율 평균을 산출하여라.

 

STEP 2의 Line 9와 11 중 앞으로는 Line 9와 같은 문법을 사용하라고 하셨다. 파이썬에서는 Line 11과 같은 문법이 먹히지 않기 때문이다.

 

 

2. 주어진 housing.csv 데이터 첫 번째 행부터 순서대로 80%까지의 데이터를 추출 후 'total_bedrooms' 변수의 결측값(NA)을 'total_bedrooms' 변수의 중앙값으로 대체하고 대체 전 표준편차와 대체 후의 표준편차 차이(양수)를 출력하여라.

 

 

 

3. insurance.csv 파일을 읽고 데이터의 특정 컬럼(bmi, charges)의 이상치를 찾아 두 컬럼의 이상치들의 합의 제곱근을 산출하여라 (이상치 기준: 평균 + (표준편차 * 1.5) 이상)

 

 

 

4. ex_test1.csv 파일을 읽고

1) 각 구매마다 포인트를 확인하고 point 컬럼을 생성하여라.

point는 주문금액 50000 미만 1%, 5만 이상 10만 미만 2%, 10만 이상 3%

 

 

2) 회원번호별 총 주문금액과 총 포인트 금액을 확인하여라

 

 

3) 회원별 주문금액을 확인하고 총 주문금액 기준 상위 30%의 회원을 확인하여라

 

 

 

728x90
반응형