본문 바로가기

728x90
반응형

분류 전체보기

(304)
[복습] Python 형 변환 함수 및 몇 가지 연습문제 데이터 타입(문자/숫자(정수, 실수) / 날짜)을 변환하는 함수 - 파이썬에서는 날짜로의 형 변환 함수를 제공해주지 않음 → 날짜 함수 사용 - 묵시적 형 변환 불가 1. int 2. float 3. str 연습문제 ename = ['SMITH', 'ALLEN', 'SCOTT'] tel = ['02)345-6789', '031)333-1111', '055)999-2222'] sal = ['8,800', '9,600', '5,600'] comm = [300, 200, 500] 1. 이름을 모두 소문자로 변경하여라. 2. 전화번호에서 국번(345, 333, 999)을 추출하여라. 3. 10% 인상된 급여를 추출하여라. 4. comm을 소수점 둘 째 자리로 표현하여라.
[복습] Python 문자열 메서드 모든 메서드 목록은 dir 함수에 객체를 전달한다. import pandas as pd from pandas import Series dir(pd) # 함수 목록 dir(Series) # 시리즈가 호출 가능한 메서드 목록 dir(str) # 문자열이 호출 가능한 메서드 목록 dir에 객체를 주게 되면 객체에 전달 가능한 메서드가 나옴 1. 대소 치환 upper: 대문자 lower: 소문자 title: camel 표기법 2. 문자열 추출(메서드 아님) 색인으로 가능 a1[:3] # 0부터 2까지 라는 뜻. 앞에서 3개. 시작범위 또는 끝범위 생략 가능. 둘 다 생략도 가능 3. 시작 / 끝 여부 startswith / endswith 4. 문자열 포함 여부 포함자 in 대상 → 하나의 논리값만 출력 단순히..
[Python] Spyder IDE에서 내 작업 디렉토리 확인 및 변경 방법 작업 디렉토리 확인 os 모듈을 import 한 후에 os.getcwd() 하면 내 working directory 경로가 뜬다. 파일을 read 할 때 기본적으로 경로 지정을 하지 않으면 이 곳에 있는 파일이 읽힌다. 작업 디렉토리 변경 Tools > Preferences 로 들어간다. 왼쪽 메뉴 중 Working directiry 들어가서 설정 변경하면 되겠다.
[Python] 파이썬(아나콘다) 설치 방법 (os: windows) 1. https://www.anaconda.com/ 에 접속하여 오른쪽 상단의 Free Download 를 클릭 2. Download를 한번 더 클릭하면 설치 파일이 다운로드 된다. 3. 설치 파일 클릭하면 제일 먼저 뜨는 창, Next 클릭 4. Agree 클릭 5. Just me, 선택 후 Next 6. 설치 파일 경로 설정 후 Next 7. 아래와 같이 체크 설정 후 Install. Not recommanded. 지만 체크하는 이유는 파이썬의 Path를 자동 등록하기 위함이며 기존에 파이썬이 설치되어 있다면 충돌할 수도 있기 때문에 체크를 했다. 8. 설치 진행 중. 약 5분에서 10분 걸리는 것 같다. 9. Completed가 뜨면 Next 10. 설치 완료. Next 11. Finish 눌러주면 끝
회귀 과제) 변수 분석(2) - Outlet 변수들 분석 1. Outlet Type에 따른 Outlet Location Type 분석 Supermarket Type 1 : Tier 1, Tier 2, Tier 3 Supermarket Type 2 : Tier 3 Supermarket Type 3 : Tier 3 Grocery Store : Tier 1, Tier 3 여기서 알 수 있는 것: Tier 2는 Supermarket Type 1에만 있다. 2. Outlet Type에 따른 Outlet Size 분석 Supermarket Type 1 : High, Medium, Small 그리고 NA Supermarket Type 2 : Medium Supermarket Type 3 : Medium Grocery Store : Small, NA 여기서 알 수 있는 것:..
회귀 과제) 변수 분석 bigmart_train.csv 파일을 열어보았다. 1. Item_Identifier: Item 식별번호로 해석(factor), 종류는 1559개 (ChatGPT: 제품을 고유하게 식별하는 식별자. 열에 값에 따라 고유한 코드를 가짐) 내가 분석한 결과 다섯자리 글자 중 앞 두 글자와 뒤 세 글자를 분리하면 특정한 패턴을 띄는 것을 발견하였다. 예를 들어 ABC12 라는 Item_Identifier에서, AB는 따로 분리하고, C 자리는 A~Z로 구성되어 있고, 12는 01~60으로 구성되어 있으며, C12 자리만 떼어서 정렬하면 A01~Z60까지 구분자가 출력된다. 그리고 각 구분자마다 Item_Type이 하나씩 들어가게 된다. 그리고 일관된 패턴은 아니지만 같은 숫자 안에는 같은 Item_Type이 ..
[복습] Python 원소별 반복과 사용자 정의 함수(1) 반복이 필요한 순간 - 리스트의 모든 벡터 연산 - if문 가장 기본이 되는 자료 구조 자체가 막혀버리니 R보다 파이썬에서 반복문의 필요성이 더 중요할 수 밖에 없다. 원소별 반복의 방법 1) 반복문 사용(for, while) 대용량의 자료구조에는 적합하지 않다. 2) 적용함수(map사용: 원소별 반복을 도와줌) 잠시 적용함수 전에 사용자 정의 함수를 살펴보자. 사용자 정의 함수 생성에는 1. lambda 2. def 두 가지가 있다. lambda는 축약형으로 input value와 output value와의 관계가 단순한 경우 사용된다. def는 보다 복잡한 프로그래밍 기능을 지원한다(객체를 생성하거나, 반복문이나 조건문을 사용하거나 하는 기타 등등의 로직을 가져야지만 output value가 나오는 ..
[Python] 메뉴얼과 함수 소스코드 확인 함수의 메뉴얼 보기 f1? # 물음표 하나 붙이기 함수의 소스코드 확인하기 f1?? # 물음표 두 개 붙이기 캡쳐 화면 추후 붙이기 미리 메모
[복습] Python 리스트와 리스트의 메서드 (함수와 메서드의 차이 포함) 리스트는 R의 벡터와 유사한 자료구조이다. 다른 점이 있다면 단순하게 여러 개를 묶는 과정이라 중첩구조도 가능하며, 서로 다른 데이터 타입이 들어가기도 한다. 1차원이라고 하면 리스트도 가능하고 시리즈도 가능하다. 그러나 대용량 자료를 처리하려면 자료구조가 단순할수록 좋다. 그래서 1차원 자료구조를 선택하라고 한다면 가벼운 리스트부터 고려하는 것이 좋겠다. 리스트의 불편한 점으로는, 모든 게 안된다고 보면 된다. 단순히 쌓는 것 외에는 어떠한 것도 되지 않는다. R에서는 벡터 연산이 되는데 리스트는 벡터 연산이 되지 않는다(시리즈는 가능). c(1, 3, 5) + 10 가 11, 13, 15 이렇게 되지 않는다는 의미이다. 리스트는 리스트만 연산이 가능하다. 이렇게 10을 더하면 에러가 난다. 차근차근 ..
[복습] Python 자료구조(1) R과 비교하며 공부하였다. 1. 리스트(R에서 벡터와 비슷) - 1차원 - 서로 다른 데이터 타입을 허용함(R은 서로 다른 데이터 타입을 허용하지 않음) - 중첩 구조 가능 2. 딕셔너리 - key-value 구조 3. 배열(R에서 행렬, 배열) - 다차원 구조 - 같은 데이터 타입만 허용(대체적으로 수치 데이터 저장) - numpy 모듈에서 제공하는 자료 구조 4. 시리즈(R과는 다른 구조, 그러나 R의 벡터처럼 사용 가능) 데이터 프레임에서 특정 컬럼이나 특정 행 하나를 선택하려면 pandas 모듈에서 호출하여야 하므로 pandas 모듈에서 제공 - 1차원 - pandas - 제공되는 모듈이 달라서 파이썬에서는 1번과 4번을 구분함 - 같은 데이터 타입만 허용함 - 중첩 구조 불가 5. 데이터 프레임..

728x90
반응형