---------------------------------------
| | |
| | |
---------------------------------------
| | |
| NULL | |
---------------------------------------
다음과 같은 자료 구조가 있다고 하자
여기서 한 자리에 NULL이 발생하였다
그러나 아래와 같은 자료구조는 존재하지 않는다.
---------------------------------------
| | |
| | |
---------------------------------------
| |
| |
--------------------
그렇기 때문에 NA라는 값이 새로 등장하게 된 것이다.
---------------------------------------
| | |
| | |
---------------------------------------
| | |
| NA | |
---------------------------------------
결국 NA와 NULL의 차이는 length가 있느냐 없느냐의 차이이다.
SQL에서는 null은 length가 있으나 R에서의 NULL은 length가 없다. 실체가 없기 때문이다.
그래서 NULL은 삭제할 때 주로 쓰인다.
자리는 갖고 있으나 데이터가 없으면 NA라고 들어오게 되며 이를 결측치라고 부른다.
측정이 됐으나 자료가 못 들어왔거나 잘못 들어온 경우가 될 수 있다.
이러한 결측치 처리에 따라 분석 결과가 달라지므로 결측치 처리에 신중하여야 한다.
'배우기 > 기록의 중요성' 카테고리의 다른 글
oracle(19c) 오라클 설치 방법 (0) | 2023.12.02 |
---|---|
R 과 R Studio 설치하기(os: windows) (0) | 2023.12.02 |
[R] 이해한대로 써보는 차원축소 (0) | 2023.11.23 |
[R]데이터 저장 방법(행 방향 저장? 열 방향 저장?) (0) | 2023.11.22 |
[R]key-value를 이해하기 위한 과정 (0) | 2023.11.22 |