23년 이전 글/통계

    기초 통계량, 확률

    집중화 경향 대표값, 평균 평균(mean, 산술평균)으로 주어진 수의 합을 수의 개수로 나눈 값 모집단의 평균 : μ, 표본의 평균 : x̄ 단점 : 이상치가 있을 시 영향을 크게 받음 중앙값 어떤 주어진 값들을 크기의 순서대로 정렬했을 때, 가장 중앙에 위치하는 값, 이상치 영향을 피할 수 있음 ex) 값이 홀수인 경우 : 1, 2, 100 중앙값은 2 ex) 값이 짝수인 경우 : 1, 2, 90, 100 (2 + 90) / 2 = 46, 중앙값은 46 최빈값 가장 많이 관측되는 수, 즉 주어진 값 중에서 가장 자주 나오는 값 ex) [1, 3, 6, 6, 6, 7, 7, 12, 12, 17]의 최빈값은 6 연속형 변수 일 경우? 50

    통계학 중요 용어 및 개념 간단 정리

    모집단과 표본 모집단 정보를 얻고자 하는 관심 대상의 전체 집합 표본 전체 집합의 데이터를 수집하는 것이 불가능하므로 모집단 데이터 일부만 수집한 것 모수와 통계량 모수(parameters) 모집단의 특성을 수치로 나타낸 것 평균 : μ(mu) 표준편차 : σ(sigma) 통계량(statistics), 또는 대표값 표본의 특성을 수치로 나타낸 것 평균: x̄(x-bar) 표본표준편차 : s(sigma) 표본을 추출하여 표본의 통계량으로 모집단 모수를 추정하는 이유? 모집단의 모든 값에 대한 전수 조사가 실용적이지 않거나 불가능한 경우 ex) 당뇨병 환자에 대한 데이터 분석 시 세계의 모든 당뇨병 환자가 모집단이고, 이를 전수 조사 하기엔 불가능 변수와 관측값 행(row) 각 데이터를 관측한 값 열(col..