728x90
반응형
emp.fillna(value,
method,
axis = 0)
위와 같은 데이터프레임을 설정하자.
1) 특정 값으로의 치환
모든 NA에 같은 값을 치환하려면 위와 같은 방법을 취하면 된다.
2) 컬럼별 서로 다른 값으로 치환
위와 같은 방법으로 진행하면 각 컬럼별 치환값을 서로 다르게 전달할 수 있다.
3) 이전/이후 값 치환
axis = 0이므로 method = 'ffill' 옵션을 사용하면 이전 행의 값을 가져온다. 즉 이전 행의 값으로 치환된다.
method = 'bfill' 옵션을 사용하면 이후 행의 값으로 치환된다.
위 데이터프레임은 이후 값을 가져올 것이 없어서 치환이 되지 않았다.
axis = 1 이므로 이후 컬럼의 값으로 치환된다.
연습문제를 풀어보자.
subway2.csv 파일을 읽고
1) '전체' 컬럼의 NA를 치환하여라
또는 아래와 같이 ffill 의 단독메서드가 존재한다.
2) 승차와 하차 데이터를 각각 sub1, sub2에 저장하여라
3) 역별 승차 총 합을 구하여라
sub1에는 승차만 있으므로 구분의 승차 컬럼을 모두 지워주고, 역이름을 index로 설정 후 sum을 하면 되겠다.
4) 시간대별 하차 총 합
728x90
반응형
'배우기 > 복습노트[Python과 분석]' 카테고리의 다른 글
[복습] Python multi-index(1) (0) | 2024.01.17 |
---|---|
[실습문제] 2024. 1. 16.(화) (3문제) (0) | 2024.01.17 |
[복습] Python dropna 메서드(NA를 포함한 행/컬럼 제거) (0) | 2024.01.16 |
[복습] Python numpy / pandas 수학통계 함수(메서드) 차이 (0) | 2024.01.16 |
[복습] Python 결측치 확인(isnan, isnull), 수정(fillna), 삭제(dropna) (0) | 2024.01.16 |