1. 비모수 통계학
모수 통계학은 모집단이 정규분포라는 가정이 필요하지만, 비모수 통계학은 분포에 대한 가정없이 가설검정을 할 수 있다.
- 모수 데이터 : 알려진 확률분포를 지닌 모집단에서 나온 데이터
- 비모수 데이터 : 확인되지 않은 확률분호를 지닌 모집단에서 나온 데이터
모수 통계학에서는 평균이 중요하고, 비모수 통계학에서는 median이 중요하다.
검정하는 내용도 둘 이상의 데이터셋이 같은 평균을 가지는지 확인하는 모수 통계학과는 달리,
비모수 통계학에서는 둘 이상의 데이터셋의 중심 위치가 같은지를 검정한다.
데이터가 먼저 정규분포를 따르는지 확인하고 따르지 않으면 비모수 통계학의 방법을 사용하면 된다.
2. 정규성 확인
먼저 데이터가 정규분포를 따르는지 확인해야 한다.
확인하는 방법에는 여러가지가 있는데 Quantile-Quantile plot 방법을 주로 사용한다.
정규 분포를 따르지 않는다면 비모수 통계학을 사용하여 순위를 주로 사용한다.
3. 비모수 검정
- Mann-Whiney U test : 두 집단의 관측치가 같은 분포(median 동일)를 가지는지 검정한다. 모수검정일때 two sample t-test와 같다.
- Wilcoxon Signed-rank test : 두 집단의 짝지어진 관측치가 같은 분포를 가지는지 검정한다. 모수검정일때 paired sample t-test와 같다.
- Friedman test : 셋 이상 집단의 관측치가 같은 분포를 가지는 검정한다. 모수검정일때 two way ANOVA와 같다.
'DataScience > Statistics' 카테고리의 다른 글
Effect size (3) | 2022.05.23 |
---|---|
유사도(Similarity) (1) | 2021.01.20 |
댓글