금요일 모닝커피 2011~2013

통계에 관한 소고(小考)- 2013. 1. 11

jaykim1953 2013. 1. 11. 08:56

지난 해 말에 전셋값이 0.01% 상승하였다는 기사가 있었습니다. (관련기사: 서울신문_2012_12_3_전셋가) 기사 내용 가운데 일부 지역에서는 4억원 하던 전셋값이 1천만원 상승하였다고 합니다. 4억원에서 1천만원이 오르면 상승률은 (1천만원 ¸ 4억원) 2.5%입니다. 그런데 전반적인 상승률은 0.01%라고 합니다. 0.01%라고 하면 그리 큰 뉴스 거리가 아닌 듯이 보입니다. 그런데도 굳이 이를 전셋값이 상승하였다고 신문에서 보도하였습니다. 게다가 제 친구 한 사람이 제게 질문을 하였습니다. 실제로는 전셋값이 5~10%씩 뛰는데 언론에서는 0.1~ 0.2% 밖에 안 올랐다고 하니 어찌 된 영문이냐는 것입니다.

이 상황을 간단히 되짚어 보겠습니다;

일반적으로 전세 기간은 2, 24개월입니다. 따라서 매 달 만기가 도래하는 전세 물량은 평균적으로 전체 전세 물량의 1/24이 될 것입니다. 전체 물량의 1/24 2.5% 상승하면 평균 적으로 2.5% x (1/24) = 0.104…% 가 됩니다. 따라서 해당 지역의 전체 물량에 대하여서는 약 0.1% 상승이라는 결과가 나오게 됩니다. 이는 한 지역에 대한 것이고 서울 지역 전체를 계산해 보면 전셋값이 오르지 않거나 상대적으로 덜 오른 곳도 있을 테니 통계상으로는 0.01%가 상승하였을 수도 있습니다. 전세 가격의 상승률과 시장에서의 실제 금액 변화 사이에서 체감상의 차이가 있을 수가 있습니다.

기왕에 통계 이야기를 하였으니, 지난 연말에 자주 인용되었던 또 한 가지의 통계 사례를 살펴 보겠습니다. 대통령 선거에 대한 여론 조사와 투표 출구 조사입니다. 여기에서는 오차 범위라는 용어로 인하여 오해를 불러 일으키기도 하였습니다. 예를 들어 95%의 신뢰 구간에서 박근혜 후보의 예상 득표율이 50.1% ± 0.8% 이고 문재인 후보의 예상 득표율이 48.9% ± 0.8% 라고 발표하면서 언론에서는 오차 범위 내 초접전이라고 보도합니다.  (관련기사: 출구조사오차범위내접전_2012.12.19._조선일보) 95%의 신뢰 구간은 전문 용어를 빌리면 (평균 ± 2 δ) 구간 (δ: 표준편차, standard deviation)이므로 ± 0.8%의 오차 범위라는 것은 곧 표준편차가 0.4%라는 것입니다. 이 경우에 과연 초접전 상황이라고 할 수 있는지, 또 두 후보의 예상 득표율 범위 안에서 문재인 후보가 박근혜 후보를 앞설 수 있는 확률은 얼마나 되는지 살펴 보겠습니다.

문재인 후보가 이길 수 있는 득표 구간은 두 후보가 모두 49.3%~49.7%의 득표를 할 때입니다. 이 구간은 박근혜 후보의 평균 예상득표율 50.1% 에서 (0.4% ~ 0.8%)을 뺀 수치의 구간으로 {평균 - (1δ ~ 2 δ)}의 구간에 해당합니다. 마찬가지로 문재인 후보의 경우에는 평균 예상 득표율인 48.9% + (0.4% ~ 0.8%) 구간으로서 {평균 + (1 δ ~ 2 δ)} 구간입니다

 

정규분포.pdf

위에 있는 첨부의 표에서 보듯이 이 구간에 들어갈 확률은 두 후보 공히 13.59%입니다. 따라서 두 후보가 동시에 이 구간에 들어갈 확률은 (13.59% x 13.59%) = 1. 85% 입니다. 이 구간에서 박근혜 후보가 문재인 후보를 이길 확률은 1.42% 이고, 문재인 후보가 박근혜 후보를 이길 확률은 0.43% 입니다. (이에 대한 자세한 계산 방법은 생략하겠습니다.) 이 구간을 벗어나면 항상 박근혜 후보가 이기는 결과가 되므로, 결국 문재인 후보가 이길 확률은 통틀어 0.43%에 불과합니다. 이런 상황에서 오차 범위 내의 혼전이라고 표현하는 것은 그리 정확한 상황 설명은 아닐 것입니다. 오히려 오차 범위 내에서 박근혜 후보의 승리가 예상된다고 표현하는 것이 옳을 것입니다. 또는 ‘95%의 신뢰도에서 문재인 후보가 승리할 가능성은 0.43%입니다라고 하여야 합니다. 0.43%에 불과한 가능성을 두고 초접전또는 혼전이라고 표현하는 것은 통계의 결과를 오도할 가능성이 있습니다.

지난 대통령 선거에서 득표율 조사가 실제 투표 결과와 차이가 꽤 있었습니다. 이러한 차이가 발생하는 이유는 여러 가지가 있을 수 있습니다. 주로 통계 표본 (population)의 선정 과정에서 발생한 오류입니다. 표본 사이즈가 충분히 크지 않거나, 표본 추출 과정에 대한 보정에서 오류가 발생하였을 가능성 등입니다. 예를 들어, 출구 조사 대상 유권자의 숫자가 너무 적어서도 안 되고, 어느 한 지역, 한 계층, 한 연령대에 치우쳐서도 안 됩니다. 또한 표본 추출 과정의 보정도 중요합니다. 예를 들어, 전체 인구 분포에 비하여 30 대의 표본 숫자가 너무 많다면 이를 전체 인구 분포에 따라 일부 보정을 하게 됩니다. 이 과정에서 각 연령별 투표율도 반영되어야 하고, 지역별 연령 분포, 학력별 연령 분포 등 보정에 고려하여야 할 사항들이 많은데 이를 모두 제대로 반영하지 못하게 되면 통계의 결과에 오류가 발생할 가능성이 커집니다. 우리에게 주어진 통계의 결과치는 이러한 과정을 거치면서 오류의 함정에 빠졌을 수도 있다는 것을 염두에 두어야 합니다. 아마도 대통령 선거 득표율 예측에서 발생한 오차는 표본 조사의 오류에서 기인한 부분이 컸을 것으로 추측됩니다.

금융에서도 통계를 사용하는 경우가 많습니다. 대표적으로 통계에 의존하는 금융상품은 보험입니다. 보험은 보험금을 지급할 사건(event)이 발생하는 확률 (trigger chance)에 크게 의존하게 되므로 통계에 절대적으로 영향을 받습니다. 통계의 정확성이 보험 계리 (actuary)의 가장 중요한 요소가 됩니다. 생명보험의 통계에서 가장 중요한 것이 생명표 (mortality table)입니다. 현재 살아 있는 인구의 평균 생존 기대 연령을 표로 만든 것입니다. 이 표에 의하여 보험에 가입하는 사람이 앞으로 얼마나 생존하여서 보험료를 납입하고 언제쯤 보험금이 지급되게 될 것인가를 통계적으로 예측하여서 보험료를 산정하는 것입니다. 현재 우리나라에서 사용하는 생명표는 지난 해(2012) 4월부터 사용되고 있으며, 평균적으로 약 2~3년마다 수정 갱신하고 있습니다.

보험뿐만 아니라 금융의 다른 분야에서도 통계를 많이 사용합니다. 그 가운데 하나가 리스크 관리입니다. Value at Risk (VaR)도 대표적인 예 가운데 하나입니다. 이는 철저하게 과거에 일어났던 사건의 발생 통계를 현재의 포트폴리오에 대입하여 리스크 수치를 추정하는 것입니다. (제 개인적으로는 VaR 에 크게 의존하는 것을 썩 바람직하게 생각하지는 않으나 뚜렷하게 이를 대체할 수단이 있는 것도 아닙니다.) VaR 의 결과치는 절대적인 수치보다는 상대적인 비교의 대상으로 사용하는 것이 더 효과적입니다. VaR 가 큰 포트폴리오는 VaR 가 작은 포트폴리오보다 리스크에 더 많이 노출되어 있음은 부정할 수 없는 사실입니다. 이런 면에서 VaR 의 효용가치는 충분합니다.

일찍이 통계를 이용한 리스크 관리와 트레이딩을 가장 성공적으로 하였던 사람은 정크 본드의 왕 (Junk Bond King)이라고 알려졌던 마이클 밀컨 (Michael Milken)입니다. (2012. 1. 27. 금요일 모닝커피 참조: Michael Milken의 Noblesse Oblige) 그는 정크 본드의 실제 부도율과 정크 본드에 부과된 신용 프리미엄을 비교 분석하여 정크 본드의 리스크 프리미엄이 과도하게 부과되어 있어 가격이 불합리하게 저평가 되어 있음을 통계적으로 밝혀냈습니다. 그는 자신의 논리에 따라 정크 본드의 매입을 서슴지 않았고 그 결과 그는 상당한 수익을 냈습니다. 후에 다른 이유로 인하여서 감옥에까지 가는 신세가 되었으나 통계의 이용에 관한 한 그는 매우 정확하고 명석한 두뇌를 가졌음을 보여 주었습니다.

통계는 금융에서 빼어 놓을 수 없는 중요한 한 영역입니다. 그러나 무엇보다도 중요한 것은 통계의 올바른 이용 방법과 정확한 이해입니다. 우리의 금융에서도 보다 정확한 통계의 올바른 이용 방법이 발전되기를 기대합니다.

정규분포.pdf
0.06MB

'금요일 모닝커피 2011~2013' 카테고리의 다른 글

Let it be.- 2013. 1. 25.  (0) 2013.01.25
옛날 이야기- 2013. 1. 18.  (0) 2013.01.18
새해- 2013. 1. 4.  (0) 2013.01.04
광주은행 1989 - 2012. 12. 28.  (0) 2012.12.28
Greed & Fear - 2012. 12. 21.  (0) 2012.12.21