금요일 모닝커피

통계의 미학- 2021. 8. 13.

jaykim1953 2021. 8. 13. 05:49

 

지난 주말 말도 많고 탈도 많았던 토쿄 올림픽이 폐막하였습니다. 우리나라는 금메달 6 개를 포함하여 총 20 개의 메달을 따내면서 나름 선전하였습니다. 특히나 17세의 어린 나이에 국가 대표로 선발되어 선전한 탁구의 신유빈 선수라던가 양궁에서 금메달을 따낸 동갑내기 김제덕 선수 등은 이번 올림픽에서 많은 관심과 사랑을 받았습니다. 이런 젊은 선수들의 선전은 우리나라 스포츠의 미래를 밝게 합니다.

세계적인 스타 김연경 선수가 분전한 여자 배구는 4강의 문턱에서 한 발자국 앞으로 더 나가지 못하여 메달 획득에는 실패하였으나 세계의 높은 벽 앞에서 선전하였다는 것만으로도 박수갈채를 받았습니다. 거기에 비하면 연봉 수억씩을 받는 선수들로 구성된 야구 대표팀은 6개 출전 팀 가운데에서 4위를 하면서 많은 사람들의 비난과 조롱을 받기도 하였습니다. 사실 경기에 임하는 선수만큼 승리를 간절히 기원하는 사람은 없을 것입니다. 그런데도 야구 대표팀은 여러 가지 주변 상황으로 인하여 사람들의 질타를 면치 못하였습니다.

그런데 야구 팀의 경기 결과와 관련하여 우리나라 야구 대표팀이 지난 4일 일본 대표팀에게 패한 다음에 신문에 보도된 기사는 저의 눈을 의심하게 만들었습니다. (관련기사: 야구 아직 끝 아니다···두 번만 이기면 금, 우승 확률 25% _joins.com_8/4/2021) 기사의 제목부터 독자들로 하여금 혼선을 야기하게 만듭니다. 독특한 경기 방식으로 인하여 준결승에서 패하였다고 하더라도 패자부활전에서 승리하면 결승 상대와 다시 경기를 할 수가 있으므로 패자부활전과 결승 시합에서 두 경기 모두 이기면 금메달이 가능하다는 것은 이해할 수 있습니다. 그런데 문제는 그 다음에 있는 ‘우승 확률 25%’라는 언급입니다. 기사 내용을 보면 아마도 이 기사를 쓴 사람은 패자 부활전에서 이길 확률 50%, 그리고 다시 결승전에 올라가서 이길 확률 50%이니 두 경기를 모두 이길 확률은 25%라고 이야기한 것으로 보입니다.

이 기사를 쓴 기자의 논리대로 하면 모든 경기의 이길 확률은 50%입니다. 그렇다면 월드컵 축구 경기에서 16강에 들어간 팀들은 모두 똑같이 우승할 확률은 6.125%가 됩니다. 매 경기에서 이길 확률은 50%이고, 16강에서 결승전까지 4번의 시합을 이기면 우승을 하므로 50% X 50% X 50% X 50% = 6.125%가 되는 것입니다. 그러나 운동 경기의 승패는 단순히 50%의 확률로 결정되는 것은 아닙니다. 이기지 않으면 지는 것이므로 50대 50이라고 생각한다면 이는 통계의 기본을 무시한 논리입니다.

통계에서 가장 기초적인 수단은 모집단 (母集團, population)의 추출입니다. 흔히 이야기하는 대수의 법칙 (law of large numbers)에 따라 모집단이 크면 클수록, 그리고 모집단의 정확한 분류가 통계의 신뢰도를 높여줍니다. 우리나라 야구 대표팀의 금메달 가능성을 25%라고 추정한 기사는 아무런 통계의 뒷받침이 없습니다. 그런데 아이러니컬하게도 야구에는 최근 엄청난 통계의 기법을 이용하여 데이터를 분석하고 선수의 기량을 파악합니다. 그러한 통계를 바탕으로 상대 투수에 따른 공격 패턴과 선수 구성을 바꾸기도 하고, 상대 공격수의 타격 통계를 바탕으로 수비팀은 수비 시프트(shift)를 적용하여 수비의 확률을 높입니다. 투수와 포수는 타자의 과거 타격 패턴을 통계를 이용하여 분석합니다. 그리고는 어떤 구질의 어느 코스의 공으로 타자를 공략할 것인지를 결정합니다. 야구에서 이러한 통계의 데이터가 계속 축적되면서 엄청난 양의 정보를 제공합니다. 그러다 보니 그라운드에서 플레이를 하고 있는 선수가 이를 다 제대로 소화하지 못하는 경우가 있습니다. 방대한 데이터를 이용한 전략을 실행하기 위하여 선수들의 리스트 밴드 (wrist band)에 각종 정보를 기록하고 이를 차고 출전하기도 합니다. (야구 포수의 리스트 밴드 참조)

과거에는 타자의 타율이 공격력의 지표로 많이 쓰였으나 이제는 OPS (On-base plus slugging)이 더 많이 쓰입니다. OPS는 출루율 + 장타율로서 단순히 타석에서 안타를 치는 것만으로 선수의 기량을 판단하는 것이 아니고 설사 안타를 치지 못하더라도 출루를 많이 하여 팀에 공헌하는 것도 파악하고, 안타를 하나 치더라도 장타를 쳐서 득점을 쉽게 만들어주는 공헌도를 참작하는 것입니다. 이와 같이 새로운 지표들이 나오면서 야구는 통계학의 블루 오션으로 부각되고 있습니다.

스포츠뿐 아니라 금융에도 통계는 매우 중요한 정보를 제공합니다. 여신을 제공하면서 신용도를 조사할 때에 과거의 통계를 이용한 신용 평가는 이미 널리 알려져 있고 평가 기법은 계속 발전하고 있습니다. 신용도의 평가는 이자율 적용을 위한 기본적인 정보가 됩니다. 신용도가 높으면 상대적으로 낮은 이자율을 적용하고 신용도가 낮으면 높은 이자율을 적용합니다. 이는 신용도에 따른 리스크의 보상이라는 아주 단순하지만 가장 중요한 원칙을 적용한 것입니다.

그런데 이미 십 여 년 전부터 신용도에 대한 통계에 새로운 개념을 추가하였습니다. 영어로는 migration risk라고 부르는 개념입니다. 국가 리스크 레이팅(risk rating)에 보면 아웃 룻 (outlook)이라는 항목이 추가되어 있는 것을 볼 수 있습니다. 예를 들어 우리나라가 발행한 국체는 AA 등급이고 아웃 룩은 스테이블 (stable: 안정적)이라고 표현하는 것입니다. 이는 장래에 크레딧 레이팅이 변하지 않을 것으로 전망된다는 것입니다. 긍정적인 아웃 룩은 positive outlook이라 표현하고 이는 향후 크레딧 레이팅이 개선될 것으로 기대한다는 의미입니다. 반대로 부정적인 아웃 룩은 negative outlook 이라 표현하고 향후 크레딧 레이팅이 떨어질 것으로 보인다고 해석할 수 있습니다.

이러한 아웃 룩은 일반 개인이나 기업에도 적용됩니다. 향후 신용도에 변화가 예상된다거나 이상 징후가 감지되는 경우에는 특히나 주의하여야 합니다. 이런 경우에 사용하는 표현으로 downgrade migration risk 라고 합니다. Migration 이란 이주(移住), 이동(移動) 또는 이민(移民)을 의미하는 것으로 어느 하나의 신용도에서 다른 신용도를 옮겨간다는 의미로 사용하는 단어입니다. Migration risk는 당장 현재의 신용도 문제가 아니라 향후 신용도의 변화에 대한 리스크를 보는 것입니다. 이를 측정하기 위하여 상당히 많은 양의 데이터를 그동안 축적하여 왔고 이제는 migration risk의 징후를 사전에 걸러내는 여러 리스크 관리 모듈 (module)이 개발되어 있습니다. 이제는 신용도를 검토하는 과정에도 거래 상대방의 외모, 인상, 말씨 등을 보는 것이 아니라 그 동안 축적된 데이터를 바탕으로 마련한 모듈에 상대방이 제시한 데이터를 입력하여 객관적인 신용 평가를 합니다. 이러한 객관적인 평가는 통계학이 없었더라면 불가능하였을 것입니다. 그리고 통계학의 발전은 이러한 신용 평가의 정확성을 더욱 높여줍니다. 현재의 신용도뿐 아니라 앞으로의 신용도의 변화에 대한 리스크까지 분석합니다.

금융에서 사용하는 통계의 최고봉은 아마도 보험일 것입니다. 보험은 시작부터 통계가 없었다면 시작이 불가능한 상품입니다. 상품 구조가 철저하게 통계에 의존하고 있습니다. 보험 상품 가운데에는 골프의 홀인원 보험이라던가 특정 팀 혹은 특정 선수의 승리에 따른 보상을 판매하는 보험도 있습니다. 이러한 스포츠와 관련된 보험도 철저히 통계에 의존하고 있습니다. 만약 준결승전에서 패하고 패자 준결승전을 치르게 되는 우리나라 야구 대표팀의 승리에 대한 보험료를 보험회사에게 의뢰하였다면 정확한 승률을 계산하여냈을 것입니다. 앞의 기사를 쓴 기사는 25%의 확률이라고 하였으나 과거의 기록과 경기를 치른 상대팀들과의 간접비교 등을 통하여 많은 데이터를 모아서 정확한 통계 분석을 한다면 우리나라 야구 대표팀의 우승 확률을 계산할 수 있을 것입니다. 이 기사의 기자가 언급한 논리의 25%는 결코 아닐 것입니다.

금융뿐 아니라 거의 모든 사업분야에서 통계는 중요한 한 부분을 차지합니다. 심지어는 스포츠에서도 통계는 중요한 역할을 담당하고 있습니다. 통계는 매우 논리적이고 정확합니다. 이를 이해하지 못하고 주먹구구식으로 이용하고 해석한다면 아름다운 미술품을 벽지로 사용하는 것이나 다를 바 없습니다. 통계에 대한 지식과 이해가 없이 통계를 들먹이는 것은 통계를 욕보이는 것에 불과합니다. 통계의 결과를 제대로 이해하고 이용한다면 보다 더 정확한 결과를 예측할 수 있고, 바람직한 전략을 세울 수도 있을 것입니다. 통계는 현대의 여러 분야에서 매우 유용하게 쓰이는 훌륭한 Art 입니다.

 

'금요일 모닝커피' 카테고리의 다른 글

스롱 피아비- 2021. 8. 27.  (0) 2021.08.27
Melting Pot - 2021. 8. 20.  (0) 2021.08.20
경쟁 - 2021. 8. 6.  (0) 2021.08.06
상상 속의 미래- 2021. 7. 30.  (0) 2021.07.30
브랜드 이름 - 2021. 7. 23.  (0) 2021.07.23