[R] NA와 NULL의 차이
---------------------------------------
| | |
| | |
---------------------------------------
| | |
| NULL | |
---------------------------------------
다음과 같은 자료 구조가 있다고 하자
여기서 한 자리에 NULL이 발생하였다
그러나 아래와 같은 자료구조는 존재하지 않는다.
---------------------------------------
| | |
| | |
---------------------------------------
| |
| |
--------------------
그렇기 때문에 NA라는 값이 새로 등장하게 된 것이다.
---------------------------------------
| | |
| | |
---------------------------------------
| | |
| NA | |
---------------------------------------
결국 NA와 NULL의 차이는 length가 있느냐 없느냐의 차이이다.
SQL에서는 null은 length가 있으나 R에서의 NULL은 length가 없다. 실체가 없기 때문이다.
그래서 NULL은 삭제할 때 주로 쓰인다.
자리는 갖고 있으나 데이터가 없으면 NA라고 들어오게 되며 이를 결측치라고 부른다.
측정이 됐으나 자료가 못 들어왔거나 잘못 들어온 경우가 될 수 있다.
이러한 결측치 처리에 따라 분석 결과가 달라지므로 결측치 처리에 신중하여야 한다.