R의 시각화 마지막 게시글이다.
1. 화면분할: facet_grid
Line 16과 Line 19의 차이점은 화면 분할을 1X3으로 했는가, 아니면 3X1로 했는가이다.
분석할 때에는 저 둘의 차이도 중요하다. 먼저 두 그림을 살펴보자.
상 하의 그래프를 살펴보면, 같은 그래프지만 해석하기로는 두 번째 그래프가 용이하다. 왜냐하면 세 그래프 모두 같은 x축을 공유하고 있기 때문에 x축을 같은 선상에 둔다면 좀 더 보기 좋은 시각화가 될 것이다.
이것은 정답이 아니라 분석마다 다른 것이다.
Line 19처럼 구를 행의 위치에 둘 때에는 formular의 물결 오른쪽(열 위치)에는 .을 찍는다. 열 부분은 생략될 수 없다고 한다.
2. 테마 변경: theme~
theme_bw(), theme_void(), theme_grey(), theme_classic(),
theme_dark(), theme_gray(), theme_light(), theme_linedraw(),
theme_minimal() 등
위의 여러 옵션들이 있다. 하나하나 다 사용해보지 못했으나 필요시 적절히 사용해야 할 듯하다.
한 가지만 예를 들어보겠다.
기본 옵션인 뒤의 회색 배경이 사라졌다.
3. 제목: plot.title, axis.title.x, axis.title.y
위의 옵션을 준 그래프는 아래와 같이 출력된다.
4. x축/y축 범위 설정: ylim
5. 눈금 변경: scale_x_continuous, scale_y_continuous
6. 범례: legend
삭제(Line 17) / 위치 변경 (Line 23) / 배경, 테두리 변경 (Line 29~) 은 모두 아래에 차례로 출력하였다.
연습문제
병원현황.csv 데이터를 사용하여 연도별 표시과목에 대한 병원 수 증감 추이를 시각화하여라
5개 표시과목: 정형외과, 내과, 신경과, 정신건강의학과, 성형외과
4사분기 기준으로 stack 처리
시각화 끝 !
결국 시각화는 전부 옵션싸움인 것 같다.
'배우기 > 복습노트[R과 분석]' 카테고리의 다른 글
[실습문제] 2023. 12. 13.(수) (4문제) (0) | 2023.12.14 |
---|---|
[복습] 분석 / 데이터마이닝과 예측모델링, 지도학습과 비지도학습 + 하루끝(20231213) (0) | 2023.12.13 |
[복습] R(programming language) 시각화(4) (ggplot2를 이용한 산점도, 선그래프, 막대그래프, 상자그림, 히스토그램, 확률밀도함수(KDE) 및 여러 옵션) (0) | 2023.12.13 |
[실습문제] 2023. 12. 12.(화) (2문제) (0) | 2023.12.13 |
[복습] R(programming language) 시각화(3) (box plot, histogram, polygon, ggplot2) + 하루끝(20231212) (0) | 2023.12.12 |