본문 바로가기

배우기/기록의 중요성

[R] NA와 NULL의 차이

728x90
반응형

---------------------------------------

|                      |                      |

|                      |                      |

---------------------------------------

|                      |                      |

|     NULL        |                      |

---------------------------------------

 

다음과 같은 자료 구조가 있다고 하자

여기서 한 자리에 NULL이 발생하였다

그러나 아래와 같은 자료구조는 존재하지 않는다.

---------------------------------------

|                      |                      |

|                      |                      |

---------------------------------------

                       |                      |

                       |                      |

                       --------------------

 

그렇기 때문에 NA라는 값이 새로 등장하게 된 것이다.

---------------------------------------

|                      |                      |

|                      |                      |

---------------------------------------

|                      |                      |

|     NA            |                      |

---------------------------------------

 

결국 NA와 NULL의 차이는 length가 있느냐 없느냐의 차이이다.

SQL에서는 null은 length가 있으나 R에서의 NULL은 length가 없다. 실체가 없기 때문이다.

그래서 NULL은 삭제할 때 주로 쓰인다.

자리는 갖고 있으나 데이터가 없으면 NA라고 들어오게 되며 이를 결측치라고 부른다.

측정이 됐으나 자료가 못 들어왔거나 잘못 들어온 경우가 될 수 있다.

 

이러한 결측치 처리에 따라 분석 결과가 달라지므로 결측치 처리에 신중하여야 한다.

 

 

 

728x90
반응형