본문 바로가기

728x90
반응형

배우기/복습노트[Python과 분석]

(107)
[복습] Python 원소별 반복과 사용자 정의 함수(1) 반복이 필요한 순간 - 리스트의 모든 벡터 연산 - if문 가장 기본이 되는 자료 구조 자체가 막혀버리니 R보다 파이썬에서 반복문의 필요성이 더 중요할 수 밖에 없다. 원소별 반복의 방법 1) 반복문 사용(for, while) 대용량의 자료구조에는 적합하지 않다. 2) 적용함수(map사용: 원소별 반복을 도와줌) 잠시 적용함수 전에 사용자 정의 함수를 살펴보자. 사용자 정의 함수 생성에는 1. lambda 2. def 두 가지가 있다. lambda는 축약형으로 input value와 output value와의 관계가 단순한 경우 사용된다. def는 보다 복잡한 프로그래밍 기능을 지원한다(객체를 생성하거나, 반복문이나 조건문을 사용하거나 하는 기타 등등의 로직을 가져야지만 output value가 나오는 ..
[복습] Python 리스트와 리스트의 메서드 (함수와 메서드의 차이 포함) 리스트는 R의 벡터와 유사한 자료구조이다. 다른 점이 있다면 단순하게 여러 개를 묶는 과정이라 중첩구조도 가능하며, 서로 다른 데이터 타입이 들어가기도 한다. 1차원이라고 하면 리스트도 가능하고 시리즈도 가능하다. 그러나 대용량 자료를 처리하려면 자료구조가 단순할수록 좋다. 그래서 1차원 자료구조를 선택하라고 한다면 가벼운 리스트부터 고려하는 것이 좋겠다. 리스트의 불편한 점으로는, 모든 게 안된다고 보면 된다. 단순히 쌓는 것 외에는 어떠한 것도 되지 않는다. R에서는 벡터 연산이 되는데 리스트는 벡터 연산이 되지 않는다(시리즈는 가능). c(1, 3, 5) + 10 가 11, 13, 15 이렇게 되지 않는다는 의미이다. 리스트는 리스트만 연산이 가능하다. 이렇게 10을 더하면 에러가 난다. 차근차근 ..
[복습] Python 자료구조(1) R과 비교하며 공부하였다. 1. 리스트(R에서 벡터와 비슷) - 1차원 - 서로 다른 데이터 타입을 허용함(R은 서로 다른 데이터 타입을 허용하지 않음) - 중첩 구조 가능 2. 딕셔너리 - key-value 구조 3. 배열(R에서 행렬, 배열) - 다차원 구조 - 같은 데이터 타입만 허용(대체적으로 수치 데이터 저장) - numpy 모듈에서 제공하는 자료 구조 4. 시리즈(R과는 다른 구조, 그러나 R의 벡터처럼 사용 가능) 데이터 프레임에서 특정 컬럼이나 특정 행 하나를 선택하려면 pandas 모듈에서 호출하여야 하므로 pandas 모듈에서 제공 - 1차원 - pandas - 제공되는 모듈이 달라서 파이썬에서는 1번과 4번을 구분함 - 같은 데이터 타입만 허용함 - 중첩 구조 불가 5. 데이터 프레임..
[복습] Python 산술연산자 파이썬에서의 산술연산자는 +, -, *, / 사용이 가능하다. 거듭제곱의 경우 주의해야 할 점이 있다. R에서처럼 2^4는 불가하다. 2**4 로 사용하거나, 아니면 math 모듈 안에 있는 ma.pow(2,4) 를 하여야 한다. 몫: 9//2 나머지: 9%2
[복습] Python 모듈, 모듈 호출하기 모듈이란, - 함수의 집합 - 라이브러리, 패키지 등으로도 표현 - 외부 패키지의 경우에는 최초 한 번은 설치하여야 함 - 이미 설치된 패키지의 경우는 로딩 후 사용 - 모듈 전체를 호출할 수도 있고 모듈 내의 함수를 따로 호출할 수도 있음 예를 들어 trunc 함수를 써보고자 한다. 1) 모듈 전체 호출 import math 또는 알리아스 붙여서 import math as ma ★ 모듈 안의 function 목록 보기 dir(ma) 이렇게 사용할 수 있다. 또는 함수를 직접 호출 할 수도 있다. 2) 함수 직접 호출 from 모듈명 import 함수 [as 별칭] from math import frunc trunc(11.1) 3) 모듈 내 함수 전체 호출 from math import * floor(3..
[복습] Python 변수 변수: 값의 변동이 가능한 객체로, 숫자, 문자, 날짜, 기타 자료구조 등을 저장할 수 있다. 변수의 명명규칙 - 숫자 시작 불가 - 예약어 사용 불가(완전 불가는 아니지만 권하지 않음) - 특수기호 사용 지양(언더바_ 가능) - .(점) 사용 불가(.은 호출의 의미를 가지고 있음) 1. 생성 S2 처럼 다중라인 문자열 선언시 작은따옴표를 연속 세 개를 사용하거나('''), 큰따옴표를 연속 세 개를 사용한다("""). 2. 타입 확인 문자열 1. 문자열 선언 2. 문자열 추출 세 번째 라인 처럼 슬라이스 색인이 가능하지만 파이썬에서는 마지막 숫자의 색인은 출력되지 않는다. 즉, 파이썬에서의 n:m 범위의 선택은 n~(m-1) 범위가 선택된다. 3. 문자열 결합 4. 문자열 반복
[복습] Python Intro. 라이브러리 = 패키지 = 모듈 다 같은 맥락이다. 언어마다 함수의 묶음으로 라이브러리, 패키지, 모듈이라고 달리 부르는데, R에서는 패키지, 파이썬에서는 모듈이라고 부른다. 하지만 섞어 불러도 소통에는 크게 문제가 없다. 파이썬에서 분석에 쓰이는 모듈에는 numpy, pandas 모듈이 있다. pandas를 가장 많이 사용하는데, 데이터 프레임을 표현해 줄 수 있는 모든 function들이 pandas에 들어있다. 비정형자료도 결국 정형으로 변환하여 사용하므로 pandas를 많이 사용한다. array를 지원해주는 모듈이 numpy, data frame을 지원해주는 모듈이 pandas 이다. 기본 파이썬은 numpy와 pandas를 지원해주지는 않는다. 파이썬은 C라는 개발도구로 만들어진 언어이다보니 모듈..

728x90
반응형