본문 바로가기

프로젝트 & 챌린지/프로젝트 연습

회귀 과제) big mart 자료를 이용하여 분석하기(설명1)

728x90
반응형

모델 선택 / 변수 연구(선택, 가공(변환), 파생변수 등) / 이상치 / 결측치 

 

라벨 인코딩 방법

 

문자 → 수치 변환

 

방법 1. 서로 다른 숫자로 변경(수치의 크기는 의미를 갖고 있지 않음)

 

방법2. 사용자 정의 순서대로 숫자 변환(순서형 자료 일 때 가능, ordered factor)

 

방법 3. 빈도수를 사용한 변환 방식(규모를 반영하기 좋음)

 

주의 train과 test가 나뉘어 있는 경우 라벨 인코딩 결과는 같아야 한다.

즉, 각 레벨이 갖는 매핑된 숫자는 train / test가 모두 일치하여야 한다.

 

 

728x90
반응형