데이터의 흩어진 정도: 범위 및 표준 편차
중심 경향 측정값은 전형적인 값을 설명하는 반면, 흩어진 정도 측정값은 데이터 값이 중심에서 얼마나 떨어져 있는지를 설명합니다. 범위는 가장 간단한 그림을 보여줍니다. 즉, 가장 높은 값과 가장 낮은 값 사이의 간격을 나타냅니다. 표준 편차는 각 데이터 포인트가 평균에서 얼마나 떨어져 있는지를 평균적으로 나타내어 데이터의 변동성을 더 풍부하게 이해할 수 있도록 해줍니다.
범위 및 표준 편차의 구성 요소
이 섹션에서는 흩어진 정도의 주요 측정값을 다룹니다.
- 범위: 데이터 세트에서 최대값과 최소값의 차이: 범위 = 최대값 - 최소값.
- 분산: 평균으로부터의 제곱 차이의 평균으로, 전체적인 흩어진 정도를 측정합니다.
- 표준 편차: 분산의 제곱근으로, 측정값을 데이터의 원래 단위로 되돌립니다.
- 흩어진 정도 해석: 표준 편차가 작으면 데이터가 평균 근처에 밀집되어 있음을 의미하고, 표준 편차가 크면 데이터가 넓게 흩어져 있음을 의미합니다.
범위 및 표준 편차의 예시
범위 예시
- 시험 점수: 65, 72, 88, 91, 95. 범위 = 95 - 65 = 30점.
- 일일 온도: 58°F, 62°F, 65°F, 70°F, 72°F. 범위 = 72 - 58 = 14°F.
- 두 반 모두 평균 80점을 받았지만, A 반은 범위가 10(밀집), B 반은 범위가 40(넓게 흩어짐)입니다.
분산 예시
- 데이터: 4, 8, 6, 2, 10. 평균 = 6. 제곱 차이: (4-6)² + (8-6)² + (6-6)² + (2-6)² + (10-6)² = 4 + 4 + 0 + 16 + 16 = 40. 분산 = 40/5 = 8.
- 데이터: 5, 5, 5, 5. 평균 = 5. 모든 차이가 0이므로 분산 = 0 (전혀 흩어져 있지 않음).
- 데이터: 1, 10, 1, 10. 평균 = 5.5. 제곱 차이의 합은 81이므로 분산 = 81/4 = 20.25 (변동성이 높음).
표준 편차 예시
- 첫 번째 분산 예시(분산 = 8)에서: 표준 편차 = √8 ≈ 2.83.
- 시험 점수: 80, 82, 78, 84, 76. 평균 = 80. 제곱 차이: 0 + 4 + 4 + 16 + 16 = 40. 분산 = 8. 표준 편차 = √8 ≈ 2.83점.
- 키(cm): 160, 165, 170, 175, 180. 평균 = 170. 제곱 차이: 100 + 25 + 0 + 25 + 100 = 250. 분산 = 50. 표준 편차 = √50 ≈ 7.07 cm.
흩어진 정도 해석 예시
- 기계 A는 평균 10mm, 표준 편차 0.1mm인 볼트를 생산합니다. 기계 B는 평균은 같지만 표준 편차가 0.5mm입니다. 기계 A가 더 일관성이 있습니다.
- 시험 점수의 평균이 75점이고 표준 편차가 10점이라면, 학생의 약 68%가 65점과 85점 사이(표준 편차 1개 이내)를 받습니다.
- 두 농구 선수의 경기당 평균 득점은 모두 20점입니다. 한 선수의 표준 편차는 2(일관성 있음), 다른 선수의 표준 편차는 8(변동성이 매우 큼)입니다.