728x90
반응형
dir(np) 는 numpy 함수 목록
dir(array) 는 array에서 호출 가능한 메서드 목록
dir(pd) 는 pandas 함수 목록
dir(Series) 는 Series 목록이 호출 가능한 메서트 목록
dir(DataFrame) dataframe에서 호출 가능한 메서드 목록
a1이 어떤 array 목록이라고 하자.
a1.sum()
a1.mean()
a1.min()
a1.max()
a1.var() #numpy 분산(n으로 나눈 결과)
a1.var(ddof = 1) #numpy 분산(n-1로 나눈 결과)
표준편차도 마찬가지로,
a1.std() # 수학적 표준편차
a1.std(ddof=1) # 통계적 표준편차
주의해야 할 점이 있다.
a1.sqrt() 라는 메서드는 없다
np.sqrt(a1) 그러나 함수에는 있다.
중앙값과 최빈값은 호출해서 사용하여야 한다.
from statistics import mode
from statistics import median
mode(a1) 최빈값 확인 가능
median(a1) 중앙값 확인 가능
np.percentile(a1, '25') 1사분위수
np.percentile(a1, '75') 3사분위수
np.log(16) 밑이 10인 로그
np.log2(16) 밑이 2인 로그
이 정도 알고 있으면 빅데이터 분석기사에서 연산 대응이 가능할 것이다.
728x90
반응형
'배우기 > 복습노트[Python과 분석]' 카테고리의 다른 글
[복습] python 업무 능력 향상에 좋은 연습문제(라벨인코딩에 대하여) (0) | 2024.01.26 |
---|---|
[복습] Python 데이터프레임에서 호출 시 연산 방향 (0) | 2024.01.26 |
[복습] Python 자료구조(5) (array) (0) | 2024.01.26 |
[실습문제] 2024. 1. 24.(수) (1문제) (0) | 2024.01.26 |
[복습] Python | 분석 | 의사결정나무(Decision Tree) (1)+ 하루끝(20240124) (0) | 2024.01.26 |