데이터의 종류와 척도의 종류
‘데이터의 종류와 척도’는 통계학의 기본적인 개념 중 하나입니다. 이 개념을 이해하는 것은 통계 분석을 시작하기 전에 매우 중요합니다.
통계학에서 데이터의 종류와 척도를 이해하는 것은 매우 중요한데, 이는 데이터 분석의 정확성과 적절성을 결정하는 기본적인 단계입니다.
추후에 가게 되면 자료를 분석하는 다양한 통계 검증 기법을 배우게 되는데, 데이터의 종류와 척도에 종류에 따라 다른 방식을 써야 하기 때문에 반드시 잘 익혀 놓는 것이좋아요.
- 적절한 분석 방법 선택: 데이터의 종류와 척도를 알면, 적절한 통계적 방법을 선택할 수 있습니다. 예를 들어, 명목 데이터에는 카이제곱 검정 같은 비모수적 방법이 적합할 수 있고, 연속 데이터에는 T-검정이나 ANOVA 같은 방법이 적합할 수 있습니다. 데이터의 척도에 맞지 않는 분석 방법을 사용하면 잘못된 결론을 내릴 수 있습니다.
- 데이터의 해석: 데이터의 종류와 척도를 이해하면, 분석 결과의 의미를 올바르게 해석할 수 있습니다. 예를 들어, 서열 척도의 데이터에서 중앙값은 의미가 있지만 평균은 그렇지 않을 수 있습니다. 비율 척도에서는 평균, 중앙값, 모드 모두 의미가 있습니다.
- 데이터의 표현: 데이터의 종류에 따라 가장 적절한 시각화 방법을 선택할 수 있습니다. 예를 들어, 연속형 데이터에는 히스토그램이나 상자 그림이 적합하고, 범주형 데이터에는 막대 그래프나 원형 그래프가 더 적합할 수 있습니다.
- 측정의 정밀성: 척도는 데이터를 측정하는 정밀성을 나타냅니다. 비율 척도는 간격 척도보다 더 높은 정밀성을 제공하며, 이는 분석의 정확도에 영향을 미칩니다.
- 연구 설계: 데이터의 종류와 척도는 연구 설계 단계에서 중요한 역할을 합니다. 연구자는 데이터의 종류를 고려하여 적절한 측정 도구를 선택하고, 연구 목적에 맞는 데이터 수집 방법을 결정해야 합니다.
- 통계적 가정의 검증: 특정 통계적 방법은 데이터가 특정 척도에서 측정되었다는 가정 하에 사용됩니다. 예를 들어, 정규 분포를 가정하는 방법들은 연속형 데이터에만 적합합니다.
결론적으로, 데이터의 종류와 척도를 정확히 이해하는 것은 통계적 분석의 출발점이며, 이는 데이터 수집에서부터 분석, 해석, 그리고 최종 보고에 이르기까지 연구의 모든 단계에서 중요한 역할을 합니다.
1. 데이터의 종류:

정성적 데이터(범주형 데이터): 숫자로 표현되지 않는 데이터로, 특성이나 속성을 분류하기 위해 사용됩니다. 예를 들어, 사람의 성별(남성, 여성), 혈액형(A, B, AB, O) 등이 이에 해당합니다. 정성적 데이터는 또한 명목 데이터와 서열 데이터로 세분화될 수 있습니다.
- 명목 데이터: 순서나 등급 없이 단순히 범주나 그룹으로 분류된 데이터입니다. 예: 성별, 혈액형.
- 서열 데이터: 범주 사이에 순서나 등급이 있는 데이터입니다. 예: 교육 수준(초등학교, 중학교, 고등학교, 대학교), 만족도(매우 불만족, 불만족, 보통, 만족, 매우 만족).
정량적 데이터(수치 데이터): 숫자로 표현되는 데이터로, 양을 측정하기 위해 사용됩니다. 정량적 데이터는 연속형 데이터와 이산형 데이터로 나뉩니다.
연속형 데이터: 어떤 범위 안에서 어떤 값이든 취할 수 있는 데이터입니다. 예를 들어, 키, 몸무게, 온도 등이 이에 해당합니다.
이산형 데이터: 특정 값, 주로 정수로만 표현되는 데이터입니다. 예를 들어, 사람 수, 자동차 수 등이 있습니다.
2. 척도의 종류

- 명목 척도: 데이터를 단순히 분류하기 위해 사용되는 척도입니다. 이 척도는 숫자를 사용할 수 있지만, 이 숫자들은 단지 레이블일 뿐이며, 숫자간의 크기나 순서를 의미하지 않습니다. 예: 성별(1 = 남성, 2 = 여성), 혈액형(A, B, AB, O).
- 서열 척도: 데이터의 순서나 등급을 나타내지만, 사이의 정확한 차이는 알 수 없습니다. 예를 들어, 설문조사에서 “만족도”를 평가할 때 사용됩니다(1 = 매우 불만족, 2 = 불만족, 3 = 보통, 4 = 만족, 5 = 매우 만족).
- 간격 척도: 데이터 사이의 정확한 간격이나 차이를 나타내며, 절대적인 0점(진정한 부재를 의미하는 0)은 없습니다. 예를 들어, 온도(섭씨, 화씨)가 이에 해당합니다.
- 비율 척도: 간격 척도와 유사하지만, 절대적인 0점을 갖는 척도입니다. 이는 데이터의 모든 수학적 연산이 가능하다는 것을 의미합니다. 예를 들어, 길이, 무게, 시간 등이 있습니다.
명목척도 (분류)
단순히 데이터를 분류하기 위해 사용되는 척도이며, 여기서 숫자를 사용한다고 해도 단지 분류를 위한 레이블을 나타낼 뿐입니다. +,-,나눗셈,곱셈이 적용 될 수 없습니다. 예시로는 성별 (남/녀), 혈액형(A,B,O형) 이 있습니다.
서열척도 (순서, 서열)
명목척도보다 약간 더 발전하여서 데이터의 순서나 서열을 나타냅니다. 하지만 각 데이터간의 정확한 차이는 알 수 없습니다. 예를 들어서 수학 성적 석차가 1,2,3,4등으로 나뉘어졌다고 해서 각 석차 끼리 점수차이가 1점씩이라는 것은 아닙니다. 단순히 순서를 나타냈을 뿐이니까요.
간격척도 (데이터 사이의 간격, 차이)
명목, 서열에서 더 발전해서 이제 데이터 사이의 간격도 알 수 있습니다. 예를 들어 온도가 1도에서 2도로 올랐다면 정확히 1도가 더 오른것이 그 예라고 할 수 있어요. 대신 절대 0점이 존재하지 않습니다. 이 말이 무엇이냐 하면 온도가 0 도라고 해서 온도가 없다 라고 해석할 수 없다는 것입니다. 그냥 온도 자체가 0도라는 것이지, 온도가 없는 것은 아니에요.
비율척도 (절대 0점)
간격척도와 유사하지만 비율척도에는 절대 0점이 존재합니다. 즉, 모든 수학적 연산이 가능함을 의미합니다. 예를 들어 월급이 있습니다. 100만원 101만원 0만원이 있을때 월급 0만원은 월급이 없다 라고 해석할 수 있어요. (절대 0점이 존재함)