[복습] R(programming language) 시각화(1)(선그래프) + 하루끝(20231208)
시각화에는 기본 시각화 함수와 ggplot2 패키지가 있다. 우선 기본 시각화 함수로 여러 그래프를 출력해보도록 하겠다. 1. 선 그래프(산점도): 분포를 확인하거나 x축과 y축의 상관관계를 시각화하는 기법 중 하나로, 고른 분포를 띄는지, 특정한 분포를 보이는지, x와 y가 어떤 관계를 보이는지 등을 알 수 있다. plot(x, # x축 좌표 y= NULL, # y축 좌표 type ='p', # 그래프 타입(p: 산점도, l: 선그래프, ....) xlim = NULL, # x축 좌표 범위(예: 1~100중 50~60만 보고 싶을 때) ylim = NULL, # y축 좌표 범위(예: 1~100중 50~60만 보고 싶을 때) log = '', # y축 좌표를 log로 쓸 것인가 main = NULL, #..
[복습] 통계/분석 용어 정리
머신러닝(기계학습) 1. 지도학습(Y 존재) R 1) 분류분석 2) 회귀분석 2. 비지도학습(Y존재 하지 않음): 클러스터링, 장바구니분석이 대표적 Python 1) 군집분석 2) 연관분석 머신러닝(기계학습) 알고리즘 분류 1. 거리기반 모델(k-nn, kmeans) 2. 통계기반 모델(나이브베이즈) 3. 트리기반 모델(의사결정나무, random forest, GB, XGB, light GBM) 4. 신경망 기반 모델(ANN, DNN, CNN, RNN, ...) 여기서 보다 발전해서 어떠한 시점 이후부터 딥러닝이라고 표현함. 시대가 텍스트, 이미지, 영상 등의 처리를 요구하게 되면서 다차원 데이터를 처리하게 되고, 모델이 복잡하게 되며 이걸 잘 패턴화 하기 위하여 연구된 것이 인간의 뇌구조를 따라오게 된..