분산과 표준편차, 유의 수준, 유의 확률, 통계적유의성이란?
통계학에서 “유의 수준”, “유의 확률”, 그리고 “통계적 유의성”은 연구 결과의 해석에 있어 중요한 개념들입니다. 이 용어들은 연구 결과가 우연에 의한 것인지 아니면 실제 효과에 의한 것인지를 평가하는 데 사용됩니다.
유의 수준 (Significance Level) a 알파
유의 수준(보통 알파(α)로 표시)은 연구자가 실험에서 얻은 결과가 우연에 의한 것이라고 결론내리기 전에 허용할 최대 확률입니다. 즉, 통계적 검정을 실시할 때, 우리가 얻은 결과가 우연히 발생할 확률이 유의 수준보다 낮다면, 우리는 그 결과를 통계적으로 유의하다고 간주합니다. 일반적으로 사용되는 유의 수준은 0.05(5%) 또는 0.01(1%)입니다.
- 예시: 유의 수준이 0.05라면, 100번의 실험 중 5번은 우연히 결과가 나타날 수 있음을 의미합니다.
유의 확률 (P-value)
유의 확률(보통 P값으로 표시)은 연구 결과가 귀무 가설(null hypothesis)이 참일 때, 우연히 관측될 수 있는 확률입니다. 다시 말해, P값은 실험 결과가 우연에 의한 것일 확률을 수치로 나타낸 것입니다. P값이 유의 수준보다 낮으면, 우리는 귀무 가설을 기각하고 결과가 통계적으로 유의하다고 결론 내립니다.
- 예시: P값이 0.03이고 유의 수준이 0.05라면, 결과는 우연히 발생할 확률이 3%이며, 이는 5% 유의 수준보다 낮으므로 통계적으로 유의하다고 간주됩니다.
통계적 유의성 (Statistical Significance)
통계적 유의성은 연구 결과가 우연히 발생한 것이 아니라 실제 효과나 차이에 의한 것임을 나타냅니다. 통계적 유의성이 있다는 것은, 연구 결과가 특정 유의 수준 하에서 우연히 발생할 확률이 매우 낮다는 것을 의미합니다. 이는 P값이 유의 수준보다 낮을 때 결론 내려집니다.
- 예시: 연구 결과의 P값이 0.02이고 유의 수준을 0.05로 설정했다면, 이 결과는 통계적으로 유의하다고 간주됩니다. 이는 결과가 우연히 발생할 확률이 매우 낮으며, 실제로 의미 있는 차이나 효과가 있음을 나타냅니다.
- 통계적 유의성은 연구 결과가 우연히 발생한 것이 아니라 실제로 의미 있는 차이나 관계를 나타낸다고 간주될 수 있는 정도를 말합니다. 이는 주로 P-값과 유의 수준(α)을 통해 평가됩니다. P-값이 설정된 유의 수준(α, 일반적으로 0.05나 0.01)보다 낮을 경우, 결과는 통계적으로 유의하다고 판단됩니다.
유의 수준인 알파 (α)와 검증력을 나타내는 베타 (β)
- 알파(α): 유의 수준을 나타냅니다. 이는 제1종 오류(Type I error)의 확률로, 귀무 가설이 참일 때 이를 잘못 기각하는 오류입니다. 예를 들어, 유의 수준이 0.05라면, 5%의 확률로 귀무 가설이 참인데도 불구하고 이를 기각하는 잘못을 범할 수 있음을 의미합니다.
- 베타(β): 제2종 오류(Type II error)의 확률로, 귀무 가설이 거짓일 때 이를 잘못 채택하는 오류를 나타냅니다. 즉, 실제로는 효과가 있음에도 불구하고 그 효과를 감지하지 못하는 경우의 오류입니다.
파워 (1 – β)
- 파워는 제2종 오류를 범하지 않을 확률, 즉 귀무 가설이 거짓일 때 이를 정확하게 기각할 수 있는 연구의 능력을 나타냅니다. 따라서 파워가 높을수록, 실제로 의미 있는 차이나 관계를 감지할 가능성이 높아집니다.
요약하자면, “베타(β)”는 통계적 유의성 자체를 나타내는 것이 아니라 제2종 오류의 확률과 관련된 용어입니다. 통계적 유의성은 P-값과 유의 수준(α)을 통해 평가되며, “베타”와 “파워”는 주로 연구의 민감도나 능력과 관련된 개념입니다.