목록BF 2024/통계 (18)

************************************************************************************************************ INDEX 이산형 확률 분포 ** 이산형 확률분포에서의 균등 분포 ( discrete uniform distribution ) ** 베르누이 시행 , Bernoulli trial : 각 시행의 결과가 성공, 실패 단 두가지 결과만 존재하는 시행. ** 베르누이 분포 ( Bernoulli distribution ) ** 이항분포 ( Binomial distribution ) ** 포아송 분포 ( Poisson distribution ) ** 이항 분포의 포아송 근사 ** 포아송 분포의 조건 ** 기하 분포 ** 음..

************************************************************************************************************ INDEX ** 확률 ( 기대값, 분산 , 공분산 ) ** 확률 분포 ************************************************************************************************************ ** 확률 ( 기대값, 분산 , 공분산 ) * 확률 변수란? > random variable, 표본공간에서 각 사건에 실수를 대응시키는 함수 > 확률 변수 값은 하나의 사건에 대해서 하나의 값을 가지며, 실험 결과에 의해서 변한다 > 일반적으로 확률 변..

************************************************************************************************************ INDEX ** 확률 ** 확률과 집합 ** 베이즈 정리 ************************************************************************************************************ ** 확률 ( probability ) > 모든 경우의 수에 대해서 특정 사건이 발생하는 비율. > 대체로 수학 외에서는 0과 1 사이의 소수 혹은 분수나 순열등으로 나타내기 보다는, 0과 100사이의 백분율(%)로 나타내거나 옛날 처럼 할푼리로 나타내기도 한다. ..
** 통계량이란? >통계량(statistics)은 표본으로 산출한 값으로, 기술통계량으로 표현함 > 통계량을 통해 데이터(표본이)가 갖는 특성을 이해할 수 있음 ** 중심경향치 > 표본(데이터)를 이해하기 위해서는 표본의 중심에 대해서 관심을 갖기 떄문에 표본의 중심을 설명하는 값을 대표값이라고 하며, 이를 중심경향치라고 한다. > 대표적으로는 중심 경향치는 평균, 중앙값, 최빈값, 절사 평균 등이 있음 * 평균 ( mean ) * 평균은 모집단으로 부터 관측된 N개의 x가 주어 졌을때 아래와 같이 정의됨 * 평균은 포본으로 추출된 표본 평균(sample mean, _x으로 표기)이라고 하며, 모집단의 평균을 모평균이라고 하며, u(뮤)라고 표기함. * 수식 첨부 * 중앙값 ( median ) * 평균과..

** 데이터와 그래프 * 변수 ( variable ) 수학 : 수학에서의 변수란, 정해지지 않은 임의의 값을 표현하기 위해 사용된 기호. 변하는 숫자라는 개념이다. 통계학 : 조사 목적에 따라 관측된 자료값을 변수라고 한다. 해당 변수에 관측된 값들이 자료(data)이다. * 변수의 종류 질적 변수 : 관측된 데이터가 성별, 주소지 등 몇 개의 범주로 구분하여 표현될 수 있는 자료. 입력시 숫자로 원-핫 인코딩이 가능하다 숫자 자체의 의미는 없음, 그저 구별하기 위함 양적 변수 : 관측된 데이터가 숫자의 형태로, 숫자의 크기가 의미를 가지고 있음 * 척도 (질)명목 척도 : 남자, 여자 등 category, 범주로 구별할 수 있는 변수. (질)서열 척도 : 순서의 의미만 있는 자료 (양)등간 척도 : 숫..
** 통계학이란? > 산술적 방법을 기초로 하여, 주로 다량의 데이터를 관찰하고 정리 및 분석하는 방법을 연구하는 수학의 한 분야이다. 근대 과학으로서의 통계학은 19세기 중반 벨기에의 케틀레가 독일의 "국상학 - Staatenkunde, 넓은 의미의 국가학)"과 영국의 "정치 산술 - Political Arithmetic, 정치 사회에 대한 수량적 연구 방법)"을 자연과학의 "확률 이론"과 결합하여, 수립한 학문에서 발전되었다. ** 데이터를 통해 통계적으로 분석하여 예측 및 의사 결정 *** 통계학의 큰 갈래 ** 기술통계학 : descriptive statistics 데이터를 수집하고 수집한 데이터를 쉽게 이해하고 설명할 수 있도록 정리 요약 설명하는 방법론 ** 추론통계학 : inferential..