728x90
통계의 이해
표본 조사
일부만 추출하여 모집단 분석
표본 추출 방법
- 단순 랜덤 추출법: 무작위 추출
- 계통 추출법: 번호 부여하여 일정 간격으로 추출
- 집락 추출법(군락 추출법)
- 여러 군집으로 나눈 뒤 군집을 선택하여 랜덤 추출
- 군집 내 이질, 군집 간 동질
- 층화 추출법
- 군집 내 동일, 군집간 이질
- 모집단과 같은 비율 추출 시, 비례 층화 추출법
척도
- 측정 후 숫자로 나타내도록 일정한 규칙을 정하여 바꾸는 도구
- 종류
- 질적 척도
- 명목 척도: 어느 집단에 속하는지
- 순서 척도: 서열 관계
- 양적 척도
- 구간 척도: 구간 사이의 간격이 의미가 있다(덧셈, 뺄셈 가능)
- 비율 척도: 절대적 기준 0이 존재(사칙연산 가능)
- 질적 척도
기술 통계, 추리통계
- 기술 통계: 표본 자체의 속성, 특징 파악 중점 / 최솟값, 최댓값, 중위수 등의 통계량
- 추리 통계(추론 통계): 수집한 데이터를 바탕으로 추론 및 예측하는 통계 기법
확률과 확률분포
- 확률: 특정 A 개수 / 전체
- 조건부확률: 특정 B가 발생했을 때 A가 발생할 확률
- 독립사건: A와 B가 공통부분이 존재해도 서로 영향이 없는 사건
- 배반사건: A와 B가 서로 동시에 일어나지 않는 사건(공통부분 존재하지 않음)
이산확률분포
- 베르누이분포: 확률변수 X가 취할 수 있는 값이 2가지일때 / 동전던지기, 시험 합/불
- 이항분포: N번 베르누이 시행에서 K번 성공할 확률분포 / 동전 20번 던져서 앞면 나올 확률
- 기하분포: 성공확률 P인 베르누이 시행에서 처음 성공할 때까지는 시행횟수 분포
- 다항분포: N번 실행에서 각 시행이 여러 개의 결과를 가질 수 있는 확률 분포 / 주사위 20번 던져서 각 면이 나오는 횟수
- 포아송 분포: 단위 시간 내에서 발생할 수 있는 사건의 발생 횟수에 대한 확률 분포 / 하룻동안 발생하는 출생자 수
- 이산확률변수: 확률변수가 취할 수 있는 실수값의 수를 셀 수 있는 변수
연속확률분포
- 균일분포
- 정규분포
- t분포: 자유도 n, 평균 0, 정규분포보다 두꺼운 꼬리가짐, t가 커질수록 표준정규분포와 가까워짐
- 카이제곱분포: 독립적인 정규분포를 따르는 변수들의 제곱합으로 구성된 분포 / 두 집단간의 동질성 검정, 모분산 검정에 활용
- F분포: 두 개의 서로 다른 카이제곱 분포의 비율 / 두 집단간의 분산 동질성 검정
- 연속확률변수: 값을 셀 수 없는 분포, 확률밀도함수
기댓값 분산, 표준편차
- 기댓값
- 분산
- 표준편차
첨도와 왜도
- 첨도: 뾰족 정도, 3에 가까울수록 정규분포이고 정비례
- 왜도: 비대칭 정도, 0에 가까울수록 정규분포

점추정
- 모평균 추정할 때 모평균을 하나의 특정한 값으로 예측
- 불편 추정량: 모수 추정값과 실제 모수 값의 차이 0
구간추정
- 모집단을 특정한 구간으로 추정
- 신뢰도: 95, 99%
가설검정
- 모집단의 특성에 대한 주장 또는 가설을 세우고 표본에서 얻은 정보를 이용해 가설이 옳은지 판정
- 귀무가설: 일반적으로 생각하는 가설
- 대립가설: 귀무가설 기각 가설 증명하고자 하는 가설
- 제 1, 2종 오류
- 제1종 오류: 귀무가설 사살인데 오류로 결정하는 오류
- 제2종 오류: 귀무가설 사실이 아닌데 귀무가설이 옳다고 하는 오류

- 검정통계량: 귀무가설 옳고 그름을 판단할 수 있는 값
- 기각역: 귀무가설 기각하게 될 검정통계량 영역
- 유의수준: 귀무가설이 참인데도 잘못 기각할 오류 범활 확률의 최대 허용 한계 (1, 5%)
- 유의 확률(p-value): 귀무가설 지지 정도 확률 값
- p-value > 유의 수준: 귀무가설 채택
- p-value < 유의 수준: 대립가설 채택
비모수 검정
- 모수검정: 정규성 갖는다는 모수적 특성 이용
- 비모수검정:정규성X
- 부호검정, 순위합검정, 크루스칼-윌리스검정, 프리먼드 검정, 카이제곱 검정
'자격증 > ADSP' 카테고리의 다른 글
| R기초와 데이터마트 (1) | 2025.10.27 |
|---|---|
| 분석 마스터 플랜 (0) | 2025.10.27 |
| 분석 기획과 분석 방법론 (0) | 2025.10.27 |
| 데이터 가치와 미래 (0) | 2025.10.22 |
| 데이터 이해 (0) | 2025.10.20 |