생활 속 통계…요금 인상률·예매율 등
눈에 보이는 통계에 속지 말아야
지식정보사회에‘통계적 사고능력’필수

사람들은 보통 데이터들을 수치화 한 통계라 하면 어렵고 딱딱한 학문이며, 단순히 수치를 비교한 것에 그친다고 생각하기 쉽다. 하지만 통계처럼 일상생활에 밀접한 영향을 주고 있는 것도 없다. 수많은 데이터와 정보가 쏟아지는 정보화 시대에 꼭 필요한 통계, 그 속에 어떤 흥미로움이 숨어 있는지 알아보자.

집단현상을 집계해 하나의 수치로 집약한 통계는 통계 대상에 따라 날씨예보나 생물의 생태변화도 등 자연현상에 관한 ‘자연통계’와 서울 인구수, GDP 등의 사회현상에 관한 ‘사회통계’로 나눠진다.

또 통계는 인구 수, 기업체 수와 같이 집단의 한 시점에 관한 것인 정태통계와 1년 간의 출생 수, 사망 수 등과 같이 어떤 기간에 관한 동태통계가 있다. 이밖에 집단의 전체에 걸치는 전수통계와 일부분을 관찰한 부분통계로 나누는 수도 있는데, 전수통계는 비교적 소박한 기술적 수리처리에 따른 방법으로 기술통계라고 불리며, 부분통계는 부분에서 전체로의 추측기법을 포함하기 때문에 추측통계라고 한다. 그러나 한 개인의 신체치수라든가 지리산의 높이 등 어떤 개체에 관한 수적 기술은 아무리 구체적이더라도 통계의 범주에 들지 않는다.

흔히 실생활에서 접할 수 있는 그래프나 퍼센트, 평균 등은 모두 통계를 나타내는 것들이다. 그러나 이런 것들을 무비판적으로 본다면 필요나 정보를 얻기는커녕 왜곡된 결론에 도달하기 쉽다.

◇일반적으로 보기 쉬운 그래프 통계
먼저 복잡하고 다양한 수치들을 효과적으로 나타낼 때 사용하는 ‘그래프’의 경우, 단지 보는 것만으로 숫자들 안에 포함된 사실을 파악할 수 있다는 장점이 있다. 하지만 이런 그래프들의 왜곡에 가장 흔하게 쓰이는 것이 그래프 밑 부분을 잘라내는 것으로 이는 나타내고자 하는 의도를 강조하기 위해 사용된다. 예를 들어 1937년도 미국 공무원의 총 급여액이 1,950만 달러에서 2,000만 달러로 불과 4%증가했는데(왼쪽 그래프), 눈금이 바뀐 오른쪽 그래프에선 무려 400% 증가로 과장돼 공무원 봉급이 급상승하고 있다는 잘못된 인상을 제공하고 있다. 똑같은 자료를 가지고도 오른쪽 그래프로는 공무원 봉급이 급상승 중이라고 주장할 수도 있게 된다. 왜곡된 그래프들이 난무하는 실생활에서 그래프의 공정성을 평가하려면 그래프의 밑 부분이 잘려있는지 살펴봐야 할 것이다.

그래프와 마찬가지로 우리에게 친숙한 개념으로 사용되는 ‘퍼센트(%)’에도 함정이 숨어있는 경우가 많다. 더욱이 퍼센트는 ‘이미 계산을 다 해 알려주는 것이므로 그냥 받아들이면 된다’는 것을 은연중 강요함으로써 퍼센트로 인한 왜곡이나 속임수에 쉽게 속아넘어가기 마련이다.

한 예로 어떤 상품의 가격이 100원에서 150원으로 올랐다면 인상률은 얼마일까? 인상률을 계산할 때는 원래 가격을 기준으로 퍼센트를 계산해야 한다. 원래 가격보다 몇 퍼센트 올랐는지가 관심 대상이기 때문이다. 따라서 이 상품은 50원 100원=0.5로 즉, 50%인상된 것이다. 그러나 50% 인상률이라면 가격이 너무 많이 올랐다는 인상을 준다. 때문에 흔히들 원래가격(100원) 대신 오른 가격(150원)을 기준으로 바꿔치기 해, 50원 150원=0.3으로 인상률을 33%로 낮춰 보이는 효과를 낳게 된다. 많은 사람들이 기준을 따져가면서 실제로 계산하기보다는 계산된 것을 쉽게 수용하므로 인상률을 낮게 보이려는 목적을 쉽게 달성할 수 있는 것이다. 이런 이유 때문에 퍼센트를 대할 때는 무엇에 대한 퍼센트인지, 기준이 제대로 적용돼 있는지를 항상 따져봐야 한다.

또한 영화에 관심 있는 사람이라면 ‘2009년도 9월 셋째 주 개봉작 중 예매율 1위!’이라는 광고들을 많이 봤을 것이다. 하지만 여기에도 함정이 숨어있는데, 광고의 예매율이라는 통계 순위에 붙는 단서조항을 보자면 2009년하고 셋째 주다. 이때 개봉하는 영화가 얼마나 될까? 1년에 보통 개봉 영화수가 200여 개, 그것을 52주로 나누면 평균 4개 정도이다. 4개중에서 1등이 그렇게 광고할 만한 것일까? 적은 투자로 작은 시장을 잠깐 왜곡시키고, 작은 시장임을 교묘한 말로 감춰 광고 효과를 볼 수 있는 것이다. 이런 사례들은 평균을 무시하고 자신의 강점만 부각시키는 통계를 이용한 것이다.

교통사고 통계를 보면, 여러 가지 교통수단에 의한 사망자 수가 많아 겁이 난 적이 있을 것이다. 하지만 통계숫자가 사실과 얼마나 동떨어져 있는가 살펴봐야 한다. ‘오전 7시에 운전하는 것이 오후 7시에 운전할 때보다 생존 확률이 4배가 크다’라고 한다. 오후 7시에 고속도로 위에서 생겨나는 사망자 수가 오전 7시 사망자 수의 4배나 많다는 통계지표를 인용한 것이다. 이는 사실이지만 그렇다고 위와 같은 결론을 내릴 수는 없다. 아침보다 밤에 사망자수가 많은 것은 밤이 되면 고속도로에서 운전하는 사람 수가 많아지기 때문에 교통사고로 죽는 확률도 그만큼 크다는 것뿐이다.

한경수(자연대·통계정보) 교수는 “복잡해 보이지만 통계는 우리 일상생활에서 많이 쓰이고 있다”며 “불확실한 세상에서 통계는 종합적 데이터 분석으로 과학적 의사결정을 내리는데 유용하게 쓰일 수 있다”고 설명했다.

“거짓말에는 세 가지 종류가 있다. 거짓말, 새빨간 거짓말, 그리고 통계”라는 말은 서양에서 자주 쓰이는 말이다. 사람들이 인식하지 못한다는 가정 아래 숫자놀음을 통한 사실 왜곡이나 논리 비약으로 자신의 주장을 합리화하면서 통계에 대한 불신이 쌓여 낳은 결과라고 할 수 있다. 이처럼 데이터와 수치는 통계적 사고 능력의 여부에 따라 무용지물이 될 수도 있고, 예측과 판단의 훌륭한 도구가 될 수도 있다. 정보들이 쏟아지고 또 세상의 모든 현상들이 수치로 표현되는 세상이다. 정보들의 수집과 해석, 통계 자료의 이해와 분석 능력은 지식 경쟁력이 지배하는 이 시대에서 세상을 보는 새로운 시각을 열게 해 줄 것이다.
저작권자 © 전북대학교 신문방송사 무단전재 및 재배포 금지