본문 바로가기

배우기/복습노트[Python과 분석]

[복습] Python fillna (NA치환)

728x90
반응형

emp.fillna(value,

                method,

                axis = 0)

 

 

위와 같은 데이터프레임을 설정하자.

 

 

 

1) 특정 값으로의 치환

 

모든 NA에 같은 값을 치환하려면 위와 같은 방법을 취하면 된다.

 

 

 

2) 컬럼별 서로 다른 값으로 치환

위와 같은 방법으로 진행하면 각 컬럼별 치환값을 서로 다르게 전달할 수 있다.

 

 

 

 

3) 이전/이후 값 치환

axis = 0이므로 method = 'ffill' 옵션을 사용하면 이전 행의 값을 가져온다. 즉 이전 행의 값으로 치환된다.

 

 

 

method = 'bfill' 옵션을 사용하면 이후 행의 값으로 치환된다.

위 데이터프레임은 이후 값을 가져올 것이 없어서 치환이 되지 않았다.

 

 

 

axis = 1 이므로 이후 컬럼의 값으로 치환된다.

 

 

 

 

연습문제를 풀어보자.

subway2.csv 파일을 읽고

 

1) '전체' 컬럼의 NA를 치환하여라

 

또는 아래와 같이 ffill 의 단독메서드가 존재한다.

 

 

 

 

 

2) 승차와 하차 데이터를 각각 sub1, sub2에 저장하여라

 

 

 

 

 

 

 

3) 역별 승차 총 합을 구하여라

 

 

sub1에는 승차만 있으므로 구분의 승차 컬럼을 모두 지워주고, 역이름을 index로 설정 후 sum을 하면 되겠다.

 

 

 

4) 시간대별 하차 총 합

728x90
반응형