[복습] 통계/분석 용어 정리
머신러닝(기계학습) 1. 지도학습(Y 존재) R 1) 분류분석 2) 회귀분석 2. 비지도학습(Y존재 하지 않음): 클러스터링, 장바구니분석이 대표적 Python 1) 군집분석 2) 연관분석 머신러닝(기계학습) 알고리즘 분류 1. 거리기반 모델(k-nn, kmeans) 2. 통계기반 모델(나이브베이즈) 3. 트리기반 모델(의사결정나무, random forest, GB, XGB, light GBM) 4. 신경망 기반 모델(ANN, DNN, CNN, RNN, ...) 여기서 보다 발전해서 어떠한 시점 이후부터 딥러닝이라고 표현함. 시대가 텍스트, 이미지, 영상 등의 처리를 요구하게 되면서 다차원 데이터를 처리하게 되고, 모델이 복잡하게 되며 이걸 잘 패턴화 하기 위하여 연구된 것이 인간의 뇌구조를 따라오게 된..
[복습] R(programming language)에서의 순위(rank, dense_rank) + 하루끝(20231204)
1. rank 바로 rank 의 문법을 확인하여보자. rank(x, # 대상(벡터, 하나만 전달 가능, 역순일 경우 -x) na.last = T, # NA 마지막 배치 여부 ties.method = 'average' , # 순위의 평균값으로 동순위 부여 (1.5, 1.5, 3.0, 4.0, 5.0) 'first', # 동순위로 처리하지 않고 각각 다른 순위 부여 (1,2,3,4,5) 'last', # 동순위로 처리하지 않고 각각 다른 순위 부여 (2,1,3,4,5) 'random', # 변동(동순위로 처리하지 않음. 각각 서로 다른 순위를 랜덤하게 부여) 'min', # 동순위로 처리하지 않고 낮은값(높은순위)로 동순위 처리(1,1,3,4,5) 'max') # 동순위로 처리하지 않고 큰값(낮은순위)로 동..