비즈니스 서식, 문서, 다운로드 사이트 위폼

Docly

상관분석 이론, 공식, 검증절차

Estimated reading: 1 minute 0 views

상관분석 필수 체크 포인트
상관계수(r)를 구한다 (상관계수 구하는 공식) > 이를 위해서는. SSx, SSy, SSxy 구하는 표를 작성해야한다.
검증통계량(t)을 구한다 (검증 통계량 공식)
d.f = n-2
T crit(a/2; n-2)

상관분석(correlation analysis)은 두 변수 간의 관계의 방향성과 강도를 측정하기 위한 통계적 방법입니다. 이 분석은 변수들 사이의 연관성을 이해하려는 연구에서 흔히 사용됩니다. 상관계수(correlation coefficient)는 두 변수 간의 상관관계의 정도를 -1에서 +1 사이의 값으로 나타내며, 이를 통해 변수들 사이의 관계가 얼마나 강한지를 알 수 있습니다.

상관계수의 종류

  1. 피어슨 상관계수 (Pearson correlation coefficient): 두 변수가 모두 연속적이고 정규 분포를 따를 때 사용합니다. 선형 관계의 강도를 측정합니다.
  2. 스피어만 순위 상관계수 (Spearman’s rank correlation coefficient): 두 변수가 완벽한 정규 분포를 따르지 않거나, 순위척도일 때 사용합니다. 비선형 관계도 측정할 수 있습니다.

상관계수의 해석

  • 1 또는 -1에 가까울수록: 두 변수 간에 강한 선형 관계가 있음을 의미합니다. 1은 완벽한 양의 선형 관계, -1은 완벽한 음의 선형 관계를 나타냅니다.
  • 0에 가까울수록: 두 변수 간에 선형 관계가 없음을 의미합니다.

상관분석의 단계

  1. 가설 설정:
  • 귀무가설(H0): 두 변수 간에는 상관관계가 없다. (상관계수 = 0)
  • 대립가설(H1): 두 변수 간에는 상관관계가 있다. (상관계수 ≠ 0)
  1. 데이터 수집 및 정리: 연구에 필요한 두 변수의 데이터를 수집하고 정리합니다.
  2. 상관계수 계산: 선택한 상관계수에 따라 데이터의 상관관계를 계산합니다.
  3. 결과 해석: 상관계수의 값과 방향을 해석하고, 통계적 유의성을 검증합니다. 통계적 유의성은 주로 p-값을 통해 결정되며, 일반적으로 p-값이 0.05(5%) 미만일 경우 귀무가설을 기각하고 상관관계가 통계적으로 유의미하다고 결론지을 수 있습니다.

주의사항

상관관계는 인과관계(causality)를 의미하지 않습니다. 두 변수가 서로 상관관계를 가지고 있다고 해서 하나가 다른 하나를 유발한다고 결론지을 수는 없습니다. 상관분석은 변수들 사이의 관계를 설명하는 데 유용하지만, 이 관계의 원인을 규명하기 위해서는 추가적인 연구와 분석이 필요합니다.

광고비 지출과 매출액 간의 관계를 조사하기 위해 10개월 간의 자료를 수집했고, 그 결과 표와 같이 나왔다.

1 단계 : 상관계수 구하기

위 식을 도출하기 위해서는 표 정리가 필요합니다.

SSxy (xy의 공분산)은 23.34이고

SSx (x의 분산)은 0.444

SSy (y의 분산) 은 1600.9

입니다.

이 값에 대입을 하면 23.34/0.444X1600.9(루트) = 0.875가 나오게 됩니다. 즉 상관계수 (r)은 0.875입니다.

2. 가설설정

H0: 광고비와 매출액 간에는 상관관계가 없다.

H1: 광고비와 매출액 간에는 상관관계가 있다.

3. 통계량 도출(T obs)

r은 0.875이고, n은 10입니다. d.f는 n-2 이므로 8이 나오겠죠

이를 바탕으로 계싼해주면 5.12이 도출됩니다.

4. 임계치와 비교 후 결론 도출

상관분석의 임계치는 T crit (a/2;n-2)로, T crit(0.025; 8)=2.306입니다.

통계량 5.12로 이 더 크므로 귀무가설은 기각됩니다. 즉 광고비와 매출액 간에는 상관관계가 있습니다.

왜 상관관계 임계치에서 a/2를 해주는가?

상관분석에서 사용되는 임계값 T crit (a/2;n-2)은 두 변수 간의 상관관계가 통계적으로 유의미한지를 결정하기 위해 사용됩니다. 여기서 a는 유의수준을 의미하고, (n-2)는 자유도를 의미합니다. 유의수준 a를 2로 나누는 이유는 두 변수 간의 상관관계를 양쪽 꼬리(two-tailed) 검정으로 평가하기 때문입니다.
양쪽 꼬리 검정(Two-tailed Test)
양쪽 꼬리 검정은 연구 가설이 변수 간의 상관관계가 양의 상관관계(positive correlation)일 수도 있고, 음의 상관관계(negative correlation)일 수도 있다는 것을 고려할 때 사용됩니다. 즉, 우리는 두 변수가 서로 관련이 있다는 것만을 증명하려고 하며, 이 관계가 양의 방향인지 음의 방향인지에 대한 구체적인 가정은 하지 않습니다.

결론
따라서T crit (a/2;n-2)를 사용하는 것은 통계적 검정에서 양쪽 방향의 극단적인 결과를 모두 고려하겠다는 의미입니다. 이를 통해 두 변수 간의 상관관계가 우연히 발생한 것이 아니라 통계적으로 유의미하다는 것을 보다 신중하게 결정할 수 있습니다.

Leave a Comment

공유하기
CONTENTS