본문 바로가기

728x90
반응형

전체 글

(315)
[복습] Python | 분석 | SVM(Support Vector Machine) (3) 연습문제 iris data set을 SVM 모형을 사용하여 분류 모형 설계하기 1. 데이터 로딩 2. 데이터 분리 3. 모델링(스케일링은 생략, 원래는 스케일링 해야 함) 4. 평가 5. 튜닝(C와 gamma 같이 튜닝) 위 표에서는 잘렸지만, score가 좋게 나오는 구간이 발생한다. 간단히 해석하자면, 고차원성을 강화하면 새로운 데이터는 걸러지지 않는 예측 불가능한 오버핏이 발생한다. 모델은 복잡해질수록 문제가 발생할 수밖에 없기 때문이다. C보다도 gamma 때문에 과대적합이 심하게 발생한다. 이를 시각화하여 보면 한눈에 확인이 가능하다. 튜닝 결과 시각화(히트맵) heatmap(values, # 값 xlabel, # x 이름 ylabel, # y 이름 xticklabels, # x눈금 ytickl..
[복습] Python 시각화(6) 파이차트(pie chart)와 히스토그램(histogram) pie chart plt.pie(x, # 각 파이 숫자 labels = labels, # 각 파이 이름 autopct = '%.1f%%', # 값의 표현 선택 startangle = 260, # 시작위치 radius = 0.8, # 파이 크기 counterclock = False, # 시계방향 진행 여부 explode = explode, # 증심에서 벗어나는 정도 설정(각각 서로 다른 숫자 전달 가능) colors = colors, # 컬러맵 전달 가능 shadow = False, # 그림자 설정 wedgeprops = wedgeprops) # 부채꼴 모양 설정 예) pie chart 그려보기 histogram - 수치형 자료들의 분포를 파악할 목적으로 시각화 - 정규성 검정 위의 코드 말고도 다음과 같..
[복습] Python 시각화(5) 막대그래프(bar plot) - 범주형 자료(의 수치값)에 대한 비교 시각화 df.plot(kind = 'bar') 예) kimchi_test.csv 파일을 읽고 막대그래프로 시각화 하여라. 교차표 생성 막대그래프 생성 movie_ex1.csv 파일을 읽고 영화 이용 현황에 대해 요일별로 성별에 대한 이용비율의 비교 시각화 STEP 1) 요일 구하기 STEP 2) wide data STEP 3) 막대그래프 그리기 그래프 배경색을 변경하고 싶다면, fit.set_facecolor('gray')
[복습] Python 시각화(4) 산점도(scatter) - x축, y축 좌표 전달(수치형) - 두 변수의 상관관계 파악 가능 - 분류과제일 때(y가 factor일 때), y의 값 별로 색을 표현하여 종속변수 예측의 중요도가 높은 변수 식별 목적 plt.plot('scatter')로 표현한다. 예) iris data 산점도 그리기(colorbar 표현) STEP 1) 데이터 로딩 STEP 2) 화면 분할 예) iris data 산점도 그리기(y색 표현) 1) 컬러 자동 결정 2) 컬러맵 사용 3) 사용자 정의 색 지정
[복습] Python 시각화(3) plot의 세부옵션 등 plot의 세부 옵션 1) plot 내 옵션 전달 df3.plot(data, x, y, kind, ....) 2) plot 박에서 옵션 전달 → plt 내 함수식으로 사용 dir(plt) # plt 함수 목록 확인 plt.xticks? # xticks 만의 메뉴얼 확인 가능 x축 눈금 라벨 설정 plt.xticks(ticks, # 각 눈금 위치 labels. # 각 눈금 이름 rotation) # 회전 각도 눈금 세부 설정 plt.tick.params(axis = 'both', # 이게 default, 적용 대상 direction, length, # 눈금 길이 width, # 눈금 너비 color, # 눈금 색 pad, # 눈금과 눈금 라벨 사이 간격 labelsize, # 라벨 크기 labelcolor..

728x90
반응형