본문 바로가기

확률, 통계

이항분포, Binomial distribution

반응형
SMALL

동전 던지기
동전이 있다. 앞면과 뒷면이 있다.
던져서 동전이 똑바로 서는 경우도 있겠지만, 이런 경우는 없다고 가정하자.
그러면 앞면이 나오거나, 뒷면만 나올것이다.
던져서 앞면이 나올 확률은 1/2이다.
뒷면이 나올 확률은 전체 확률 1에서 앞면이 나올 확률을 뺀 것, 즉 1 - 1/2 = 1/2 이다.

앞면이 나오는 횟수
동전을 5번 연속해서 던져본다.
앞면이 1번 나오면, 나머지는 당연히 뒷면이 4개 나올 것이다.
반대로 앞면이 4번 나오면, 뒷면은 1번 나올 것이다.
이제, 동전의 앞면이 몇 번 나올지 그 확률을 계산해 보자.

ㅇ 극단적인 경우
동전을 10번 던진다고 하자.
앞면이 10번 다 나오거나, 0번, 즉 한 번도 나오지 않는 경우도 있을까?
이런 일은 극히 드물게 일어나지만, 일어나는 경우도 있다.
이는 마치, 내가 로또를 샀는데, 당첨되는 일과 마찬가지다.
극히 드물게 일어나지만, 어쨌든 일어난다.

ㅇ 동전 앞면이 나오는 경우
          동전을 또 10번 던진다고 하자.
10번 다 앞면이 나오는 경우와 5번만 앞면이 나오는 경우를 생각해보자.
상식적으로 생각했을 때, 5번만 앞면이 나오는 경우가 훨씬 발생할 가능성이 많을 것이다.
5번이 나오는 경우를 생각해 보자.
가장 쉽게, 던지자마자, 5번 연속해서 앞면이 나오고, 그 다음 5번은 줄기차게 뒷 면만 나오는 경우가 있다.
또는 그 반대의 경우 뒷면만 5번 연속해서 나오고, 그 다음은 쭉 앞면.
일반적으로는 앞면과 뒷면이 막 섞여서 나오는 경우가 대부분일 것이다.

ㅇ 앞면이 나올 확률
동전을 1번만 던진다고 하자.
앞면이 1번 나올 확률은 얼마인가? 생각할 필요도 없이 1/2이다.
동전을 2번 던진다고 하자.
앞면이 1번 나올 확률은 얼마인가? 이건 좀 생각해 봐야한다.
우선 나타날 수 있는 모든 경우의 수를 생각해 보자.
총 4가지 경우를 생각할 수 있다.
앞앞, 앞뒤, 뒤앞, 뒤뒤
이 중에서 1번 앞면이 나올 확률은 2가지다.
앞뒤, 뒤앞.
따라서 2번 던져, 1번 앞면이 나올 확률은 2/4 = 1/2이다.
앞면이 0번 나올 확률은 얼마인가?
1/4이다.
앞면이 2번 나올 확률은 얼마인가?
1/4이다.
동전을 3번 던진다고 하자.
앞앞앞, 앞앞뒤, 앞뒤앞, 앞뒤뒤, 뒤앞앞, 뒤앞위, 뒤뒤앞, 뒤뒤뒤
앞면이 1번 나올 확률은 얼마인가?
앞면 1번은 3번 나온다. 확률은 3/8

ㅇ 쉽게 계산해보자. 앞면이 나올 확률
동전을 10번 던져보자.
이 중에서 앞면이 5번 나오는 경우를 생각해보자.
앞면이 5번이 나오는데, 처음에 연속해서 나올 확률은 얼마인가?
(1/2)(1/2)(1/2)(1/2)(1/2)(1-1/2)(1-1/2)(1-1/2)(1-1/2)(1-1/2)
나중에 몰아서 연속해서 나올 확률은 얼마인가?
(1-1/2)(1-1/2)(1-1/2)(1-1/2)(1-1/2)(1/2)(1/2)(1/2)(1/2)(1/2)
순서는 상관없이,
10번중 앞면이 5번 나오는 경우는 모두 몇 번 일어나는가?
조합 (combination)으로 계산하면 된다.
10C5 = 10!/ 5! (10-5)!
따라서 확률은 10C5 * (1/2)^10

ㅇ Binomial distribution
이러한 동전던지기와 관련된 확률을 계산하는 것이다.
Bin (n, p).
n은 시도하는 전체 횟수
p는 원하는 일이 발생할 확률
원하는 일이 n번중 x번 발생할 확률 계산은
nCx * p^x * (1-p)^(n-x)

ㅇ 동전을 20번 던졌을 때, 앞면이 나올 확률 그래프.
x축은 앞면이 나올 횟수
y축은 해당하는 확률
20번 중 10번 앞면이 나올 확률이 가장 크다.
`

ㅇ 던지는 회수가 늘어날 때, 앞면이 10번 나올 확률 그래프.
동전던지는 총 회수에 따른 확률
x축은 동전던지는 회수
총20번 던졌을 때, 10번 앞면이 나올 확률이 제일 높다.


ㅇ 불량동전 던지기
불량동전이라서 앞면이 나올 확률이 1/2이 아니다.
20번 던졌을 때, 10번 앞면이 나올 확률을 계산하자.
x축은 동전 앞면이 나올 확률.
재미있는 사실. 앞면이 나올 확률이 1.0이 되면, 20번 중에 앞면이 10번 나올 확률은 0이 된다.
이유는, 20번 다 앞면이 나오기 때문에.











 

반응형
LIST