본문 바로가기

INTRO 본문

BF 2024/통계

INTRO

jaegomhoji 2022. 2. 11. 16:49

** 통계학이란?

> 산술적 방법을 기초로 하여, 주로 다량의 데이터를 관찰하고 정리 및 분석하는 방법을 연구하는 수학의 한 분야이다. 근대 과학으로서의 통계학은 19세기 중반 벨기에의 케틀레가 독일의 "국상학 - Staatenkunde, 넓은 의미의 국가학)"과 영국의 "정치 산술 - Political Arithmetic, 정치 사회에 대한 수량적 연구 방법)"을 자연과학의 "확률 이론"과 결합하여, 수립한 학문에서 발전되었다. 

 

** 데이터를 통해 통계적으로 분석하여 예측 및 의사 결정

 

*** 통계학의 큰 갈래 

** 기술통계학 : descriptive statistics 데이터를 수집하고 수집한 데이터를 쉽게 이해하고 설명할 수 있도록 정리 요약 설명하는 방법론

** 추론통계학 : inferential statistics 모집단으로부터 추출한 표본 데이터를 분석하여 모집단의 여러가지 특성을 추측하는 방법론

 

** 시대 변화 트레드 

전통적인 방법론

통계 : 가설 -> 검증 , 기술 / 추론 통계 

 

90년대 

데이터 마이닝 : 군집, 연관 분석 , 예측 모델링, 텍스트 마이닝

 

00년대 

빅데이터 : 머신러닝( 지도 / 비지도 학습 ), 딥러닝 

00년대 self BI 툴 등장 , tableau 등 많이 기업에서 요구 

3v : velocity volume variety 

 

<-------------------------------> 컴퓨팅 파워가 증가하면서 기존의 neural network 분야도 급격히 발전 

<-------------------------------> 기존에는 사람들이 직접 , AI 이후에는 기계가 자동으로 ~ 

최근

AI : 빅데이터, 머신러닝, 딥러닝 

 

수집 및 처리 

oracle 등 rdbms -> hadoop / spark 

분석툴

sas(90's) -> R / python -> Tenserflow ..

 

** 업무 scope에 따라 다르겠지만, 현업에서 기본적으로 기초적인 통계는 다 안다고 생각하고 커뮤. 

Comments