728x90
반응형
모델 선택 / 변수 연구(선택, 가공(변환), 파생변수 등) / 이상치 / 결측치
라벨 인코딩 방법
문자 → 수치 변환
방법 1. 서로 다른 숫자로 변경(수치의 크기는 의미를 갖고 있지 않음)
방법2. 사용자 정의 순서대로 숫자 변환(순서형 자료 일 때 가능, ordered factor)
방법 3. 빈도수를 사용한 변환 방식(규모를 반영하기 좋음)
주의 train과 test가 나뉘어 있는 경우 라벨 인코딩 결과는 같아야 한다.
즉, 각 레벨이 갖는 매핑된 숫자는 train / test가 모두 일치하여야 한다.
728x90
반응형
'프로젝트 & 챌린지 > 프로젝트 연습' 카테고리의 다른 글
회귀 과제) 변수 분석(2) - Outlet 변수들 분석 (0) | 2024.01.08 |
---|---|
회귀 과제) 변수 분석 (1) | 2024.01.07 |
회귀 과제) big mart 자료를 이용하여 분석하기(설명2) (1) | 2024.01.04 |