23년 이전 글/통계

    통계학이란?

    통계학을 공부해야 하는 이유 어디서든 데이터가 수집되고, 그 정보를 유용하게 쓰기 위해서는 통계적 지식이 요구됨 전문적이거나 개인적인 의사결정을 하는데 통계적 기법이 사용됨 직업에 상관없이 세상을 이해하고 본인의 직업에 정통하기 위해서는 통계학 지식이 필요함 요약하면, 통계학은 좀 더 효과적인 개인적 및 전문적 의사결정에 기여 통계학은 무엇을 의미하는가 통계 수치적인 사실 분석의 대상이 되는 집단에 대하여 실시한 조사나 실험의 결과로 얻은 결과치 또는 결과치들의 요약된 형태 예제 연간 물가상승률은 0.7%다. 당신의 학점평균은 3.5이다 통계학 효과적인 의사결정을 도와주는 데이터의 수집, 정리, 표현, 분석 및 해석에 대한 과학 불확실성 하의 의사결정 주어진 자료에 근거하여 여러 가지 자연현상 또는 사회..

    가설검정

    귀무가설과 대립가설 통계적 가설 통계학에서 사용하는 용어로, 하나의 특정 주장을 모수를 이용해 나타낸 형태를 지칭 귀무가설(null hypothesis, 기호 Ho), 영가설 통계학에서 처음부터 버릴 것을 예상하는 가설 ex) 새로운 감기약을 투여한 환자 평균 치료 기간에 변화가 없다 대립가설(alternative hypothesis, 기호 H1), 연구가설 연구자가 연구를 통해 입증되기를 기대하는 예상이나 주장하는 내용 ex) 새로운 감기약 투여한 환자 평균 치료 기간의 변화가 있다 단측 대립가설 : 관련성을 검정할 때, 그 방향이 미리 어느 한쪽으로 결정되어 있는 경우 양측 대립가설 : 차이가 존재하는가? 라는 면에서만 관심, 그 방향은 따지지 않는 가설 귀무가설 채택 시 대립가설은 기각, 귀무가설 ..

    정규분포와 표준화

    정규분포(Normal distribution) 가우시안분포(Gaussian distribution)이라고도 부르며, 연속확률분포 중 하나 정규분포의 모양은 평균과 표준편차에 의해 결정되며, 이때의 분포를 N(μ, σ^2)로 표기한다 평균(μ)을 중심으로 좌우대칭인 종모양(bell shape)이다 확률변수 X가 취할 수 있는 값의 범위는 -∞ < X < ∞이다. 양극단으로 갈수록 X축에 무한히 접근하지만 X축에 닿지는 않는다. 분포의 평균(μ)과 표준편차(σ)가 어떤 값을 갖더라도, 정규분포의 곡선과 X축 사이의 전체 면적은 1이다. 관찰값의 99.7%가 +- 3σ안에 속해 있다 중심극한정리 모집단에서 취한 표본의 평균값들의 분포는 평균값을 중심으로 하는 정규분포에 가까워진다 한 번 추출한 표본수가 클수록..

    확률 이론

    확률 개념 확률이 100%에 가까울수록 발생할 가능성이 많은 것이며, 확률이 0%에 가까울수록 발생할 가능성이 없다는 의미 발생할 가능성이 있는 전체 경우의 수를 부분 집합인 사건 A 경우의 수로 나누어 계산 동등발생정의 : 2가지 경우의 수가 있을 때 각각이 나올 가능성이 동일하다는 가정 경험적인 확률 : 모의 실험을 수없이 반복하여 구한 확률 = P(A) 조건부 확률 사건 B가 일어났을 때, A의 조건부 확률로 두 사건 A, B에 대하여 사건 B가 일어났다는 조건에서 사건 A가 일어날 확률 예제) 전체 인원이 1000명, 컴퓨터 공학과 학생이 50명, 여학생이 600명, 컴공 여학생이 20명일 경우, from sympy import * cs_student, students, cs_women = sym..