변량 : 자료의 수치
계급 : 일정한 기준으로 변량을 나눈 구간
도수 : 계급에 속하는 변량의 수
상대 도수 : 계급에 속하는 변량의 비율
도수분포표 : 계급, 도수, 상대 도수 표시 (시각화 → 히스토그램)
산술 평균 : mean, 변량의 합을 변량의 수로 나눈 값
분산 : variance, 변량이 평균(중간)에서 얼마나 떨어져 있는가. 편차 제곱을 모두 더한
편차 : deviation, 변량 - 평균
표준 편차 : 얼마나 흩어져 있는지를 표준화할 수 있는 통계량
정규 분포 : 독립적인 확률 변수들의 평균은 항상 정규 분포에 가까워진다. 연속성 데이터들이 종모양을 띤다.
L 중심 극한 정리
표준화 : 다양한 형태의 정규 분포를 표준 정규 분포로 변환. (다양한 데이터를 균일한 기준으로 비교할 수 있음)
표준 정규 분포 : 평균 0, 표준편차 1 인 정규분포. 기준을 세워 한눈에 봄
모집단 : 조사 대상인 전체 집함
모수 : 모집단에 대한 요약된 수치, 값에 대한 평균이나 비율 ✓
표본 : 모집단을 대표하는 모집단의 일부
통계량 : 표본에 대한 수치적 요약, 통계량을 바탕으로 모수를 추정하는 것이 추론통계라 할 수 있다.
모평균 : 모집단의 평균
표본평균 : 모집단의 일부인 표본에 대한 평균
모분산 : 모집단의 분산
표본 분산 : 모집단의 일부인 표본에 대한 평균
최빈값 : 가장 빈번한 값.
중앙값 : 자료의 크기 순으로 나열했을 때 가운데 위치하는 값.
산술 평균 : 자료의 값을 모두 더한 다음 자료의 수로 나눈 값/ 주로 연속형 자료에 사용.
가중평균 : 자료의 중요도에 따라 가중치를 부여한 평균
기하평균 : Geometric Mean, 성장률 등 이전 시점에 대한 비율에 대한 평균을 구할 때 유용 (ex. 주가 상승률)
'CS > 수학 지식' 카테고리의 다른 글
[ 통계 지식 ] 상관 분석과 피어슨 상관 계수 (0) | 2023.09.01 |
---|