정규 분포(Normal distribution)와 이항 분포(Binomial distribution)의 차이점: 데이터 사이언스의 필수 요소 이해하기

Posted by

정규 분포 (Normal Distribution)

  • 정의: 정규 분포, 또는 가우스 분포는 연속 확률 분포로서, 자연과 사회 과학 전반에 걸쳐 다양한 현상에서 나타난다. 이 분포는 대칭적이고 종 모양을 가지고 있다.
  • 특징:
    • 평균(\mu)과 표준편차(\sigma) 두 매개변수로 완전히 정의된다.
    • 평균 주위에서 대칭적이며, 평균(Mean), 중앙값(Median), 모드(Mode)가 모두 같다.
    • 데이터의 대부분은 평균 주위에 집중되어 있으며, 평균으로부터 멀어질수록 빈도가 감소한다.
    • 연속형 데이터에 적용된다.

이항 분포 (Binomial Distribution)

  • 정의: 이항 분포는 고정된 수의 독립적인 시행에서 각 시행이 특정 성공 확률로 결과를 낼 때의 이산 확률 분포이다.
  • 특징:
    • 시행 횟수(\text{n})와 성공 확률(\text{p}) 두 매개변수로 정의된다.
    • 각 시행은 ‘성공’ 또는 ‘실패’의 결과만을 가지며, 이는 베르누이 시행으로 알려져 있다.
    • 이항 분포는 성공 횟수의 분포를 나타낸다. 예를 들어, 동전 던지기에서 10번 중 6번이 앞면인 경우와 같은 상황을 모델링한다.
    • 이산형 데이터에 적용된다.

주요 차이점

  • 연속성 vs. 이산성:
    • 정규 분포는 연속형 데이터에 사용되는 반면, 이항 분포는 이산형 데이터에 적용된다.
  • 데이터의 종류:
    • 정규 분포는 자연스럽게 발생하는 많은 현상을 모델링하는 데 사용되지만, 이항 분포는 특정 조건(성공/실패) 하에 고정된 횟수의 독립 시행을 분석하는 데 사용된다.
  • 모양과 매개변수:
    • 정규 분포는 평균과 표준편차에 의해 형태가 결정되며, 대칭적인 종 모양을 가진다.
    • 이항 분포는 시행 횟수와 성공 확률에 따라 모양이 달라지며, 대칭적일 수도 있고 비대칭적일 수도 있다.

이 두 분포는 통계학에서 매우 중요하며, 다양한 종류의 데이터를 이해하고 해석하는 데 자주 사용된다.
정규 분포는 많은 자연 현상과 사회 과학적 데이터가 따르는 분포로 알려져 있고, 이항 분포는 특정 조건 하에 발생하는 이산적 사건들을 모델링하는 데 유용하다.

Leave a Reply

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다