통계는 오랫동안 불신을 받아왔는데도 왜 여전히 활용될까. 통계 없이는 현재에 대한 정확한 판단도, 미래를 위한 올바른 결정도 어렵기 때문이다. 감(感)으로 의사결정을 하는 조직이 위태로울 것은 명약관화하다.
하지만 통계는 이해하기에 꽤 어렵다. 유명 베스트셀러 '불변의 법칙'에서는 통계나 그래프를 책에 담을 때마다 책의 매출이 절반씩 줄 것이라고 경고했다. 통계를 접한 독자 대부분이 통계의 개념과 의미를 살피기보다는 결과치만 받아들이려 하기 때문이다. 그 결과 통계를 오해할 위험이 항상 잠재되어 있다.
통계에 대한 흔한 오해로는 공식 통계가 체감과 다르면 문제가 있다고 보는 것이다. 대표적인 것이 물가 통계다. 소비자물가는 소비자가 구입하는 대표적인 품목의 평균적인 가격 변동을 알려주는 지표이며, 품목은 5년마다 소비 패턴의 변화 등을 반영해 갱신한다. 그런데 체감물가는 개별 소비자가 많이 사용하거나 가격이 급등한 품목에 좀 더 무게를 둔 물가일 것이다. 야구로 이야기해 보면 타자의 타격 능력에 대한 통계로 흔히 타율을 사용한다. 하지만 홈구장에서 타율이 떨어지는 타자의 경우, 공식 타율이 홈팬에게는 체감되기 어려울 것이다. 이처럼 공식물가와 체감물가가 다를 수 있으며, 체감물가를 설명하기 위해 자주 소비하는 품목들로 구성된 생활물가도 함께 발표 중이다.
통계는 잠정치와 확정치 발표 과정에서 변경되기도 한다. 하지만 대폭 변경되면 불신이 나타날 수 있다. 지난 8월 미국 취업자 수가 기존 발표보다 81만8000명 적었다고 수정하면서 논란이 있었다. 미국은 취업자 규모 파악 시 사업체에서 보고한 자료와 납세 자료를 활용하는데 자료의 신고 주기 및 시기 등에 차이가 있어 불가피하게 여러 번 수정된다. 이 과정에서 경기가 급변동하면 통계가 크게 수정될 수 있다. 만약 수치 변경이 크다는 것만으로 논란이 된다면 시의성 있는 통계 활용에 큰 장애가 될 것이다. 신속한 통계 공표보다 통계가 확실해진 후 공표를 선호할 수 있기 때문이다.
최근 1~2인 가구 증가, 사생활 노출 기피 등으로 현장조사 환경이 악화되면서 불응률이 높아지고 있다. 일부에서는 불응률이 높아지면 통계의 질이 저하되어 신뢰성이 낮아진다고 언급하지만, 불응률이 높다고 해서 반드시 통계의 질이 저하된다고 단정 지을 수는 없다. 불응률이 높더라도 표본 대체 등을 통해 유효표본을 확보하고 무응답 가구의 특성을 고려한 통계 기법을 적용한다면 적정 표본오차 수준을 유지할 수 있으며 신뢰성 있는 통계 생산이 가능하다. 물론 불응률을 낮추기 위해 행정자료 활용, 모바일 조사 확대 등의 노력을 기울이고 있다.
잘 작성된 통계는 거짓말이 아니다. 통계에 대하여 하나의 값만 존재해야 하고, 한 번 발표하면 크게 변하지 않아야 한다는 믿음이나 표본오차를 살피지 않는 관행이 오히려 통계에 대한 오해를 초래하는 것은 아닐까. 통계에 대한 이해력을 높여서 통계를 오해하지 말아야 한다는 것이 트웨인이 우리에게 주고 싶은 메시지가 아닐까 되돌아본다.
[이형일 통계청장]