본문 바로가기

배우기/복습노트[Python과 분석]

[실습문제] 2024. 1. 24.(수) (1문제)

728x90
반응형

1. movie_ex1.csv 파일을 읽고

 

1) 지역-시도별로 영화 이용비율이 가장 높은 지역-시군구 확인

sol 1) transform

STEP 1) 요약데이터(지역-시도별, 지역-시군구별 이용비율 확인)

 

STEP 2) 지역-시도별 이용비율 최대값 출력(transform)

 

STEP 3) 이용비율과 이용비율 최대가 일치하는 행 선택

 

 

sol 2) merge

STEP 1) 요약데이터(지역-시도별, 지역-시군구별 이용비율 확인)

 

STEP 2) 지역-시도별 이용비율 최대값을 데이터프레임으로 생성

 

STEP 3) 이용비율과 이용비율 최대가 일치하는 행 선택

 

 

 

 

2) 성별로 평균이용비율에 못미치는 연령대 확인

평균이용비율보다 낮은 것을 구하는데 merge로는 작거나 크다는 연산은 불가하다.

1)은 merge로도 풀이가 가능했다.

 

STEP 1) 성별, 연령대별 이용비율 총합

 

STEP 2) 성별 이용비율 평균

 

 

STEP 3) 이용비율 평균이용비율 비교

 

728x90
반응형