본문 바로가기

728x90
반응형

전체 글

(315)
[복습] 분석 / 모델의 저장 모델을 수행하였다면 해당 모델을 저장하려면 다음과 같이 수행히면 된다. 예) Decision Tree 모델 수행 후 저장 library(rpart) m1
[복습] Python 자료구조(4) (array) - 다차원 - 단 하나의 데이터 타입만 허용(수치연산) - 일상적으로는 잘 사용하지 않으나(데이터프레임 사용), 딥러닝 코드 구현시 사용 1. 생성 1차원 array 생성 2차원 array 생성 위와 같은 방법으로 array 생성이 가능하다. 2. 주요 메서드 차원수는 ndim으로 확인할 수 있다. shape 메서드를 사용하면 몇 곱하기 몇으로 이루어진 array인지 알 수 있다. 따라서 shape 메서드를 사용하면 행의 수, 열의 수를 따로 추출할 수 있다. 위에서 정의한 a3 배열에 대하여, 배열 모양을 변경하려면 reshape 메서드를 사용하면 된다. 파이썬은 행 우선순위어서 컬럼을 우선 채우게 된다. 디폴트는 order = 'C' 인데, 이는 C언어 순서라는 의미이다. order = 'F' 옵션을..
[복습] Python 집합연산자(union, intersection, difference, np.union1d, np.intersect1d, np.setdiff1d, pd.merge) 파이썬에서의 집합연산자를 살펴보자. 테스트를 위하여 위와 같은 데이터프레임을 만들어두었다. 이 결과는 union all 결과와 같다. 이 결과는 union 결과와 같다. 데이터프레임에서는 union, union all에 대한 메서드나 함수가 없기 때문에 위와 같은 방법을 써야 한다. 1. index object 위의 두 데이터프레임으로 테스트를 해보겠다. index를 변수에 저장한다. 합집합: union 중복을 제거하며, union all이 아닌 union이 리턴된다. index object에서 제공하는 메서드에는 union all은 없다. 교집합: intersection 차집합: difference 차집합은 순서가 중요하다. A-B, B-A가 결과가 다르기 때문이다. 2. numpy 집합연산자 함수 -..
[복습] Python 중복값 처리(unique, duplicated, drop_duplicates) 1. unique - 중복 제거값(distinct value 확인) - 정렬 동반 2. duplicated - 중복 여부를 리턴(boolean) - 중복 여부를 확인하는 용도 처음 값은 맨 처음에 나온 값이므로 중복이 되지 않아 False로 리턴된다. 두 번째 값도 첫 번째와 다른 값이므로 False가 나온다. 그런데 세 번째는 SALESMAN은 두 번째와 값이 같으므로 True로 리턴된다. 위 메서드를 이용하여 unique value를 추출하기 위해서는 다음과 같이 코드를 짜면 된다. unique 메서드가 존재하므로 잘 사용하지는 않을 것이다. 3. drop_duplicates - 중복값 제거 ★ emp.drop_duplicates(subset, # 대상(중복 체크 할 대상). 여러 개 나열 가능(리스..
[복습] Python 데이터 병합(pd.concat) 데이터를 병합하기 위하여 두 데이터 프레임을 가정하였다. 두 데이터프레임을 병합하기 위해서는 concat을 사용할 수 있다. 두 데이터 프레임을 전달할 때에는 위처럼 넣으면 안되고 묶어야 할 대상을 대괄호 안에 넣어야 한다. 위처럼 묶으면 되겠다. axis = 0이 default이므로 행으로 붙여넣기가 된다. pd.concat 함수를 자세히 살펴보자. pd.concat(objs, # 병합할 대상(리스트로 전달) axis = 0, # 병합 방향 join = 'outer', # ignore_index = False) # index 재생성 여부 예) 시리즈의 결합 위와 같은 시리즈를 정의하였다. 시리즈의 원소 추가는 append로는 불가하다. 위처럼 없는 자리를 열어놓고 데이터 삽입을 하는 것은 가능하지만 권..

728x90
반응형