본문 바로가기

728x90

분류 전체보기316

[복습] Python | 분석 | 딥러닝(CNN) 이미지 분석 + 하루끝(20240401) input이 이미지가 될 수는 있으나 output이 이미지가 될 수는 없다(정형 데이터화되어 수치로 들어감). 딥러닝 구현으로 얻게 된 데이터 특성을 가지고 이미지를 찾아부는 검색 엔진까지 들어가야지 이미지가 출력된다. 1. KNN : 이미지를 비교할 때 픽셀 별 단순 차이만 가지고 거리를 계산한다. 어떤 픽셀이 보다 강조되어야 하는지 측정하기가 어려운 것이 단점이다. (이미지 유사도가 높은 = 거리가 짧은) 2. KNN + PCA: 변동성이 가장 많은 픽셀에 초점을 맞춰(PCA), 높은 가중치를 부여한 픽셀을 조합하여 인공변수를 만들어 거리를 계산하는 것이 효과적이어서 이렇게 보완되어 발전하였다. 인근 픽셀 유사도를 찾아야 하는데 머신러닝이므로 flatten 할 수밖에 없다. 위-아래 구성된 픽셀이 f.. 2024. 4. 1.

[복습] Python | 분석 | 딥러닝(ANN) - stopping rule 적용 https://metime.tistory.com/386 위 게시글에 이어서 cancer data 분석에 대하여 stopping rule을 적용해보겠다. epoch 설정 시 stopping rule 적용은 오차, 정확도가 일정 이상 변화나 개선이 없을 때 자동으로 stop 되도록 설계하는 것이다. epoch가 많아질수록 과대적합되며, epoch 수를 관측하여 많아지기 전에 중단 시키는 것이 좋다. 1. 데이터 로딩 2. 스케일링 3. Y 더미 변수 변경 4. train/test split 5. 모델링 1) seed값 고정 2) 모델 정의 3) 오차함수, 최적화 함수 정의 4) 정지 규칙 생성 monitor 설정이 중요하다. 정지 규칙을 만드는 측정 대상이다. patience 는 모니터링 횟수이다(5로 지정.. 2024. 4. 1.

[복습] Python | 분석 | 딥러닝(ANN) ANN에 들어가기에 앞서 딥러닝 정리를 한번 더 해보겠다. 딥러닝 - 머신러닝의 일종(신경망 기반 모델) - 비정형 데이터 분석 수요 증가에 따른 딥러닝 모델 발전 - 지도학습(Y가 존재하는 모형) - 종류: ANN(회귀, 분류(2진 class 등에 따라 출력층 변경 가능), CNN(이미지(output이 이미지는 될 수 없음, 라벨링 결과에 맞게 이미지의 특성을 텍스트로 반환함), RNN, LSTM,... (RNN, LSTM은 시계열로도 사용하고 텍스트 마이닝에서도 주로 사용함) - 구현 프레임 워크 1) tensorflow(tf): 구글사 개발, 확장성은 좋으나 어려움(또 다른 언어를 배우는 느낌, 그래서 사용자가 사용하기에 버겁다는 느낌을 받음). 즉 문법이 다소 복잡하나 확장성이 강함 2) kera.. 2024. 4. 1.

[Python] 파이썬(아나콘다) 설치 방법 (os: linux ubuntu) 기본적으로 리눅스에 파이썬이 설치되어 있다. 콘솔창에 $ python3 이라고 치면 작업 창이 뜬다. 리눅스용 파이썬(아나콘다)를 설치해보겠다. https://repo.anaconda.com/archive/ Index of / repo.anaconda.com 위에 접속하여 최신 버전 및 설치할 os를 확인한다. (설치 당시 버전은 2024.02-1-Linux-x86_64) $ wget https://repo.anaconda.com/archive/Anaconda3-2024.02-1-Linux-x86_64.sh $ bash Anaconda3-2024.02-1-Linux-x86_64.sh Please, press ENTER to continue 에서 엔터 치면 END USER LICENSE AGREEMENT가.. 2024. 3. 29.

R 과 R Studio 설치하기(os: Linux Ubuntu) 1. R-base 설치 $ sudo apt-get update $ sudo apt-get install r-base 잘 구동 되는 걸 확인할 수 있다. 2. R studio 설치 https://www.rstudio.com/products/rstudio/download-server/ Posit The best data science is open source. Posit is committed to creating incredible open-source tools for individuals, teams, and enterprises. posit.co 위 사이트에 접속하여 os에 맞는 r studio에 대한 최신 버전을 확인한다. 내가 설치하려는 os는 ubuntu 22 이며, 작성 당시 버전은 rstu.. 2024. 3. 28.

Oracle Linux(7.6)에 Oracle Database(12c) 설치 https://metime.tistory.com/381 Linux Ubuntu 설치하기(vmware) 1. Ubuntu 설치 파일 다운로드 https://ubuntu.com/download/desktop https://ubuntu.com/download/desktop ubuntu.com 2. Ubuntu 22.04.4 LTS 다운로드(다운로드 오래 걸림) 리눅스는 OS의 일종이며, ubuntu는 종류 중 하나이다. 윈 metime.tistory.com 위 글에서 설치한 Oracle Linux에서 Oracle Database를 설치하려고 한다. 먼저 Oracle 설치 전 준비사항 1) root user 변경 관리자 권한 없는 경우) sudo su - root 관리자 권한 있는 경우) su - root 2).. 2024. 3. 24.

이전 1 ··· 3 4 5 6 7 8 9 ··· 53 다음

728x90

티스토리툴바