INTRO 본문
** 통계학이란?
> 산술적 방법을 기초로 하여, 주로 다량의 데이터를 관찰하고 정리 및 분석하는 방법을 연구하는 수학의 한 분야이다. 근대 과학으로서의 통계학은 19세기 중반 벨기에의 케틀레가 독일의 "국상학 - Staatenkunde, 넓은 의미의 국가학)"과 영국의 "정치 산술 - Political Arithmetic, 정치 사회에 대한 수량적 연구 방법)"을 자연과학의 "확률 이론"과 결합하여, 수립한 학문에서 발전되었다.
** 데이터를 통해 통계적으로 분석하여 예측 및 의사 결정
*** 통계학의 큰 갈래
** 기술통계학 : descriptive statistics 데이터를 수집하고 수집한 데이터를 쉽게 이해하고 설명할 수 있도록 정리 요약 설명하는 방법론
** 추론통계학 : inferential statistics 모집단으로부터 추출한 표본 데이터를 분석하여 모집단의 여러가지 특성을 추측하는 방법론
** 시대 변화 트레드
전통적인 방법론
통계 : 가설 -> 검증 , 기술 / 추론 통계
90년대
데이터 마이닝 : 군집, 연관 분석 , 예측 모델링, 텍스트 마이닝
00년대
빅데이터 : 머신러닝( 지도 / 비지도 학습 ), 딥러닝
00년대 self BI 툴 등장 , tableau 등 많이 기업에서 요구
3v : velocity volume variety
<-------------------------------> 컴퓨팅 파워가 증가하면서 기존의 neural network 분야도 급격히 발전
<-------------------------------> 기존에는 사람들이 직접 , AI 이후에는 기계가 자동으로 ~
최근
AI : 빅데이터, 머신러닝, 딥러닝
수집 및 처리
oracle 등 rdbms -> hadoop / spark
분석툴
sas(90's) -> R / python -> Tenserflow ..
** 업무 scope에 따라 다르겠지만, 현업에서 기본적으로 기초적인 통계는 다 안다고 생각하고 커뮤.
'BF 2024 > 통계' 카테고리의 다른 글
이산형 확률 분포 ( 균등, 베르누이, 이항, 포아송, 기하, 음이항 분포 ) (0) | 2022.02.14 |
---|---|
확률과 변수 (0) | 2022.02.13 |
확률 (0) | 2022.02.13 |
자료의 기초 통계량 (0) | 2022.02.11 |
데이터 이해와 기본적인 시각화 종류 (0) | 2022.02.11 |