확률 개념
확률이 100%에 가까울수록 발생할 가능성이 많은 것이며, 확률이 0%에 가까울수록 발생할 가능성이 없다는 의미
- 발생할 가능성이 있는 전체 경우의 수를 부분 집합인 사건 A 경우의 수로 나누어 계산
- 동등발생정의 : 2가지 경우의 수가 있을 때 각각이 나올 가능성이 동일하다는 가정
- 경험적인 확률 : 모의 실험을 수없이 반복하여 구한 확률
= P(A)
조건부 확률
사건 B가 일어났을 때, A의 조건부 확률로 두 사건 A, B에 대하여 사건 B가 일어났다는 조건에서 사건 A가 일어날 확률
예제)
전체 인원이 1000명, 컴퓨터 공학과 학생이 50명, 여학생이 600명, 컴공 여학생이 20명일 경우,
from sympy import *
cs_student, students, cs_women = symbols("cs_student students cs_women")
cs_women_proba = cs_women / students
cs_student_proba = cs / students
cs_and_women_proba = cs_women_proba / cs_student_proba
cs_and_women_proba.subs({cs_women:20, cs_student:50})
#result
독립사건과 종속사건
종속사건(Dependent event)
한 사건의 발생이 다음에 발생할 사건에 영향을 주는 경우
독립사건(Independent event)
처음에 어떤 결과가 나왔느냐 하는 것이 다음에 어떤 사건이 발생할 확률에 아무 영향을 주지 않는 경우
사건 A 또는 B가 나올 확률은 다른 사건과 관계없이 언제나 같음
이산확률변수와 연속확률변수
이산확률변수
표본 공간에서 모든 사건을 정수와 일대일로 대응할 수 있는 변량을 가지는 변수
ex) 동전을 세 번 던져서 앞면이 나오는 횟수는 0, 1, 2, 3 중 하나의 변량을 가지게 됨
연속확률변수
어떤 구간의 모든 실수값을 가지는 확률 변수
ex) 내년 입학생 중 키가 165cm 보다는 같거나 크고, 170cm 보다 작은 학생이 입학할 확률을 구함
확률분포와 확률함수
이산확률분포(discrete probability distribution)
이산확률변수가 가지는 확률분포
이산확률함수(=확률질량함수) 는 P(Xi)
막대그래프의 높이로 각 확률변수의 확률을 표현할 수 있음
예) 주사위 두 개를 던졌을 때 나오는 숫자 합에 대한 이산확률분포
연속확률분포(continuous probability distribution)
연속확률변수가 가지는 확률분포
- 확률밀도함수를 통해 분포를 표현할 수 있음
- 확률밀도함수의 표현 : f(X)
- 연속확률분포에서의 확률 계산 : 밀도 함수 f(X)와 X축 사이의 어느 구간의 넓이
기대값
각 사건이 벌어졌을 때의 이득(확률변수)과 그 사건이 벌어질 확률을 곱한 것을 전체 사건에 대해 합한 값으로 어떤 확률적 사건에 대한 평균
기대값 E(X)의 식 : E(X) = Σ Xi * P(Xi)
예제) 동전을 한번 던져서 앞면이 나오면 친구에게 500원을 주기로 하고 뒷면이 나오면 1000원을 받기로 했다. 동전을 던졌을 때의 기대값은 얼마일까?
E(X) = P(앞면) x -500원 + P(뒷면) x 1000원
= 0.5 x -500원 + 0.5 x 1000원
= -250원 + 500원
= 250원
'23년 이전 글 > 통계' 카테고리의 다른 글
통계학이란? (0) | 2022.06.06 |
---|---|
가설검정 (0) | 2022.06.06 |
정규분포와 표준화 (0) | 2022.06.06 |
기초 통계량, 확률 (0) | 2022.06.05 |
통계학 중요 용어 및 개념 간단 정리 (0) | 2022.06.05 |