728x90
반응형
1. movie_ex1.csv 파일을 읽고
1) 지역-시도별로 영화 이용비율이 가장 높은 지역-시군구 확인
sol 1) transform
STEP 1) 요약데이터(지역-시도별, 지역-시군구별 이용비율 확인)
STEP 2) 지역-시도별 이용비율 최대값 출력(transform)
STEP 3) 이용비율과 이용비율 최대가 일치하는 행 선택
sol 2) merge
STEP 1) 요약데이터(지역-시도별, 지역-시군구별 이용비율 확인)
STEP 2) 지역-시도별 이용비율 최대값을 데이터프레임으로 생성
STEP 3) 이용비율과 이용비율 최대가 일치하는 행 선택
2) 성별로 평균이용비율에 못미치는 연령대 확인
평균이용비율보다 낮은 것을 구하는데 merge로는 작거나 크다는 연산은 불가하다.
1)은 merge로도 풀이가 가능했다.
STEP 1) 성별, 연령대별 이용비율 총합
STEP 2) 성별 이용비율 평균
STEP 3) 이용비율 평균이용비율 비교
728x90
반응형
'배우기 > 복습노트[Python과 분석]' 카테고리의 다른 글
[복습] Python numpy용 수학/통계 함수 및 메서드 정리 (0) | 2024.01.26 |
---|---|
[복습] Python 자료구조(5) (array) (0) | 2024.01.26 |
[복습] Python | 분석 | 의사결정나무(Decision Tree) (1)+ 하루끝(20240124) (0) | 2024.01.26 |
[복습] Python | 분석 | 데이터 분석 들어가기 (0) | 2024.01.26 |
[복습] Python 자료구조(4) (array) (0) | 2024.01.26 |