본문 바로가기

배우기/복습노트[Python과 분석]

[복습] Python numpy용 수학/통계 함수 및 메서드 정리

728x90
반응형

dir(np)  는 numpy 함수 목록

dir(array)   는 array에서 호출 가능한 메서드 목록

 

dir(pd)   는 pandas 함수 목록

dir(Series)  는 Series 목록이 호출 가능한 메서트 목록

dir(DataFrame)  dataframe에서 호출 가능한 메서드 목록

 

a1이 어떤 array 목록이라고 하자.

 

a1.sum()   

a1.mean()

a1.min()

a1.max()

a1.var()   #numpy 분산(n으로 나눈 결과)

a1.var(ddof = 1)   #numpy 분산(n-1로 나눈 결과)

표준편차도 마찬가지로,

a1.std()  # 수학적 표준편차

a1.std(ddof=1)  # 통계적 표준편차

 

주의해야 할 점이 있다.

a1.sqrt() 라는 메서드는 없다 

np.sqrt(a1)  그러나 함수에는 있다.

 

중앙값과 최빈값은 호출해서 사용하여야 한다.

from statistics import mode

from statistics import median

 

mode(a1)  최빈값 확인 가능

median(a1) 중앙값 확인 가능

 

np.percentile(a1, '25')  1사분위수

np.percentile(a1, '75')  3사분위수

 

np.log(16)  밑이 10인 로그

np.log2(16)  밑이 2인 로그

 

 

이 정도 알고 있으면 빅데이터 분석기사에서 연산 대응이 가능할 것이다.

 

 

728x90
반응형