자격증/ADSP

통계 분석

말감공 2025. 10. 28. 15:48
728x90

통계의 이해

표본 조사

일부만 추출하여 모집단 분석

표본 추출 방법

  • 단순 랜덤 추출법: 무작위 추출
  • 계통 추출법: 번호 부여하여 일정 간격으로 추출
  • 집락 추출법(군락 추출법)
    • 여러 군집으로 나눈 뒤 군집을 선택하여 랜덤 추출
    • 군집 내 이질, 군집 간 동질
  • 층화 추출법
    • 군집 내 동일, 군집간 이질
    • 모집단과 같은 비율 추출 시, 비례 층화 추출법

척도

  • 측정 후 숫자로 나타내도록 일정한 규칙을 정하여 바꾸는 도구
  • 종류
    • 질적 척도
      • 명목 척도: 어느 집단에 속하는지
      • 순서 척도: 서열 관계
    • 양적 척도
      • 구간 척도: 구간 사이의 간격이 의미가 있다(덧셈, 뺄셈 가능)
      • 비율 척도: 절대적 기준 0이 존재(사칙연산 가능)

기술 통계, 추리통계

  • 기술 통계: 표본 자체의 속성, 특징 파악 중점 / 최솟값, 최댓값, 중위수 등의 통계량
  • 추리 통계(추론 통계): 수집한 데이터를 바탕으로 추론 및 예측하는 통계 기법

확률과 확률분포

  • 확률: 특정 A 개수 / 전체
  • 조건부확률: 특정 B가 발생했을 때 A가 발생할 확률
  • 독립사건: A와 B가 공통부분이 존재해도 서로 영향이 없는 사건
  • 배반사건: A와 B가 서로 동시에 일어나지 않는 사건(공통부분 존재하지 않음)

이산확률분포

  • 베르누이분포: 확률변수 X가 취할 수 있는 값이 2가지일때 / 동전던지기, 시험 합/불
  • 이항분포: N번 베르누이 시행에서 K번 성공할 확률분포 / 동전 20번 던져서 앞면 나올 확률
  • 기하분포: 성공확률 P인 베르누이 시행에서 처음 성공할 때까지는 시행횟수 분포
  • 다항분포: N번 실행에서 각 시행이 여러 개의 결과를 가질 수 있는 확률 분포 / 주사위 20번 던져서 각 면이 나오는 횟수
  • 포아송 분포: 단위 시간 내에서 발생할 수 있는 사건의 발생 횟수에 대한 확률 분포 / 하룻동안 발생하는 출생자 수
  • 이산확률변수: 확률변수가 취할 수 있는 실수값의 수를 셀 수 있는 변수

연속확률분포

  • 균일분포
  • 정규분포
  • t분포: 자유도 n, 평균 0, 정규분포보다 두꺼운 꼬리가짐, t가 커질수록 표준정규분포와 가까워짐
  • 카이제곱분포: 독립적인 정규분포를 따르는 변수들의 제곱합으로 구성된 분포 / 두 집단간의 동질성 검정, 모분산 검정에 활용
  • F분포: 두 개의 서로 다른 카이제곱 분포의 비율 / 두 집단간의 분산 동질성 검정
  • 연속확률변수: 값을 셀 수 없는 분포, 확률밀도함수

기댓값 분산, 표준편차

  • 기댓값
  • 분산
  • 표준편차

첨도와 왜도

  • 첨도: 뾰족 정도, 3에 가까울수록 정규분포이고 정비례
  • 왜도: 비대칭 정도, 0에 가까울수록 정규분포

왜도

점추정

  • 모평균 추정할 때 모평균을 하나의 특정한 값으로 예측
  • 불편 추정량: 모수 추정값과 실제 모수 값의 차이 0

구간추정

  • 모집단을 특정한 구간으로 추정
  • 신뢰도: 95, 99%

가설검정

  • 모집단의 특성에 대한 주장 또는 가설을 세우고 표본에서 얻은 정보를 이용해 가설이 옳은지 판정
  • 귀무가설: 일반적으로 생각하는 가설
  • 대립가설: 귀무가설 기각 가설 증명하고자 하는 가설
  • 제 1, 2종 오류
    • 제1종 오류: 귀무가설 사살인데 오류로 결정하는 오류
    • 제2종 오류: 귀무가설 사실이 아닌데 귀무가설이 옳다고 하는 오류

제 1,2 종 오류

  • 검정통계량: 귀무가설 옳고 그름을 판단할 수 있는 값
  • 기각역: 귀무가설 기각하게 될 검정통계량 영역
  • 유의수준: 귀무가설이 참인데도 잘못 기각할 오류 범활 확률의 최대 허용 한계 (1, 5%)
  • 유의 확률(p-value): 귀무가설 지지 정도 확률 값
    • p-value > 유의 수준: 귀무가설 채택
    • p-value < 유의 수준: 대립가설 채택

비모수 검정

  • 모수검정: 정규성 갖는다는 모수적 특성 이용
  • 비모수검정:정규성X 
    • 부호검정, 순위합검정, 크루스칼-윌리스검정, 프리먼드 검정, 카이제곱 검정

'자격증 > ADSP' 카테고리의 다른 글

R기초와 데이터마트  (1) 2025.10.27
분석 마스터 플랜  (0) 2025.10.27
분석 기획과 분석 방법론  (0) 2025.10.27
데이터 가치와 미래  (0) 2025.10.22
데이터 이해  (0) 2025.10.20