728x90
반응형
- 설명변수들끼리의 교차곱 상태의 새로운 파생 변수 생성 기법
- 변수가 각각 종속변수에 영향을 주지는 않지만 두 개 이상의 변수가 교차곱 형태로 종속변수에 영향을 줄 수 있음
- 유효한 교호작용을 모를 경우 발생 가능한 모든 교호 작용을 출력 → 변수 중요도 확인(y가 factor) 또는 유의성 검정(y가 수치) 수행
- 스케일링 조정 후 변수 변환 필요
- 수치형 설명변수들에 대해 교차곱 생성이 의미를 가짐
예)
y = x1 x2 x3 .... x10
x1^2 x2^2 ... x10^2
x1*x2 x1*x3 .... x1*x10
x1^3 x2^3 ... x10^3
x1*x2*x3 .... x1*x2*x10
예제 - iris data에서의 유의미한 interaction effect 찾기
1. 데이터 로딩
2. 스케일링
3. interaction effect 생성
리턴: 기존 데이터 + x1^2, x1x2, x1x3, x1x4, x2^2, x2x3, x2x4, ...
4. 변수 중요도 확인
5. 선택된 변수로 모델링 진행
728x90
반응형
'배우기 > 복습노트[Python과 분석]' 카테고리의 다른 글
[복습] Python | 분석 | 연관분석(2) (0) | 2024.03.04 |
---|---|
[복습] Python | 분석 | 연관분석(1) + 하루끝(20240214) (0) | 2024.02.14 |
[복습] Python | 분석 | 데이터 불균형(클래스 불균형) (0) | 2024.02.13 |
[복습] Python | 분석 | 결측치 처리 (0) | 2024.02.12 |
[복습] Python | 분석 | 부스팅 이론(2) (0) | 2024.02.12 |