반응형
Notice
Recent Posts
Recent Comments
관리 메뉴

꿈꾸는 사람.

통계학에서 기술 통계학 본문

Data Science

통계학에서 기술 통계학

현무랑 니니 2021. 7. 21. 17:44
반응형

이전 글에 "확률과 베이지안 확률"을 알아보았다.

이번 글은 통계학에 대한 것이다.

통계학(統計學, Statistics)

통계학은 데이터를 관찰, 정리 및 분석하는 학문으로 자연과학 뿐만 아니라 사회과학에서도 중요한 학문이다.

통계학의 종류

기술 통계학(記述 統計學, descriptive statistics)

- 모집단의 데이터의 특징을 파악 및 요약하는 방법

- 측정이나 실험으로 수집된 데이터에서 객관적 사실을 나타내는 통계적 방법이다.

추측 통계학 (inferential statistics)

- 모집단의 특징을 관측 데이터인 표본에서 파악하는 통계학

- 일반적인 통계학인 빈도주의 통계학과 지식, 경험 또는 새로운 데이터를 통해 분석 및 예측하는 베이즈 통계학 등이 있다.

기술 통계학(記述 統計學, descriptive statistics)

데이터의 특징(평균과 분산 등)과 경향을 규명하고 많은(표본의 크기가 큰) 데이터를 대상으로 하는 통계적 방법이다.

기술 통계학은 자료의 설계, 수집, 검증, 분석 및 재검증의 단계로 이루어진다.

다음은 데이터의 특징 중 평균, 데이터의 분산 및 변수의 관련성에 대한 내용이다.

여러 가지 평균(平均)

중심 경향 측정은 전체 데이터의 요약을 설명한다.

중심 경향의 가장 중요한 측정은 평균, 중앙값, 모드 및 범위이다.

평균은 데이터에 있는 숫자의 평균을 정의한다.

산술 평균 (算術平均, arithmetic mean)

일상에서 평균이라 부르는 것으로 합의 평균이다.

기하 평균 (幾何平均, geometric mean)

기하 평균은 "n개의 수를 모두 곱한 것의 n 제곱근"으로 곱의 평균이며 물가 상승률 이나 펀드 수익률과 같은 성장률에 일반적으로 사용되는 평균의 유형이다.

곱의 평균을 기하 평균이라고 부르는 이유는, 기하의 비례식에서 유래하였기 때문이다.

기하 평균은 산술 평균보다 언제나 작거나 같으며, 모든 숫자가 같을 때는 두 평균이 같아진다.

 

주식 투자 수익률을 예를 들어보자.

$3인 주식을 구매해서 첫 해 2배의 수익을 얻어 $6이 되었다.

다음 해에 8배의 대박이 나서 $48이 되었다.

평균 투자 수익률을 산술 평균과 기하 평균으로 계산해보자.

산술 평균 = 1/2 (2 + 8) = 5

기하 평균 = √(2*8) = 4

산술평균을 적용한 값이 기하평균을 적용한 값보다 크며, 정확한 값은 기하평균을 적용해야 구할 수 있다.

조화 평균 (調和平均, harmonic mean)

조화평균은 주어진 수들의 '역수의 산술 평균의 역수'이다.

즉, 역수의 차원에서 평균을 구하고 이를 다시 역수를 적용해 원래 차원으로 복원하는 것이다.

조화 평균을 적용하는 경우는 일정한 거리를 이동할 때, 평균속도를 구하는데 이용한다.

 

조화 평균의 예

전체 거리를 2 km라 하고

절반을 시속 6 km로 달리고 나머지 절반을 시속 12 km로 달렸다면, 평균 속력은 얼마일까?

2km를 1/6 + 1/12 = 1/4 시간에 이동하므로 2 ÷ 1/4 = 8 km/h 이다.

이것은 조화평균의 수식으로 아래와 같이 구하면 8km/h와 동일하다.

산술평균은 (6 + 12) /2로 9 km/h이고 조화평균은 8km/h이다.

반응형

'Data Science' 카테고리의 다른 글

'NFL Big Data Bowl 2024' 캐글 경진대회 참여하기 (1)  (0) 2023.10.27
확률과 베이지안 확률  (0) 2021.04.30
Comments