변수의 종류 (연속형 변수, 범주형 변수)와 쉬운 예시
변수는 크게 두 가지로 분류할 수 있습니다: 연속형 변수와 범주형 변수입니다.
범주형 변수 (Categorical Variable)
정의: 범주형 변수는 개체를 구분하고 분류하는 데 사용되는 변수입니다. 이러한 변수는 숫자로 표현될 수 있지만, 숫자가 수학적인 의미를 갖지는 않습니다. 즉, 범주형 변수의 숫자는 ‘레이블’이나 ‘이름’처럼 작동합니다.
예시:
색깔: 빨강, 파랑, 노랑 같은 색깔입니다. ‘빨강’은 ‘파랑’보다 크거나 작다고 할 수 없습니다. 여기서 각 색깔은 데이터를 분류하는 데 사용되는 하나의 범주입니다.
혈액형: A, B, AB, O 등의 혈액형입니다. 혈액형은 사람들을 여러 그룹으로 나눕니다, 하지만 이 그룹들 사이에는 순서가 없습니다.
실생활 예시: 설문 조사에서 “좋아하는 음식 종류”를 물었을 때: ‘한식’, ‘중식’, ‘일식’, ‘양식’ 등의 응답을 받는 경우, 이는 범주형 데이터입니다.
연속형 변수 (Continuous Variable)
정의: 연속형 변수는 숫자로 측정되며, 일정 범위 안에서 어떠한 값도 취할 수 있습니다. 이 변수들은 무한히 세분화될 수 있으며, 실수의 형태를 띠게 됩니다.
예시:
키: 사람의 키는 170.1cm, 170.2cm, 170.25cm처럼 끊임없이 세분화될 수 있습니다. 이처럼 연속형 변수는 무한한 수의 가능한 값들을 가질 수 있습니다.
온도: 온도 역시 -20.3°C, 0°C, 36.5°C와 같이 다양한 값을 가질 수 있으며, 끊임없이 변화합니다.
실생활 예시: 자동차의 속도계를 보면, 속도는 0km/h에서 시작해 점차 증가합니다. 이때 속도는 35km/h, 35.5km/h, 35.55km/h와 같이 연속적으로 측정될 수 있습니다. 여기서 속도는 연속형 변수입니다.
요약

범주형 변수는 ‘분류’와 ‘레이블’에 사용됩니다. 색깔이나 혈액형처럼 측정할 수 없는 특성을 가진 것들입니다.
연속형 변수는 ‘측정’에 사용됩니다. 키나 온도처럼 더 작은 단위로 쪼개서 측정할 수 있는 것들입니다.
이렇게 각각의 변수 유형을 이해하고 구분하는 것은 데이터를 적절히 분석하고 해석하는 데 매우 중요합니다.