불확실성과 우연 현상을 다루는 확률은 논리적이고 결정론 적이며 인과 관계가 뚜렷한 다른 수학 주제와 확연히 구별되는 특성을 지닌다. 그런 연유에서 인지 확률에는 유난히 많은 패러독스(paradox, 참이라고도 거짓이라고도 말할 수 없는 모순된 관계)가 존재한다.
확률 및 통계와 관련된 유명한 패러독스 중의 하나가 ‘심슨의 패러독스(Simpson’s paradox)’이다. 심슨의 패러독스란 ‘부분’에서 성립한 대소 관계가 그 부분들을 종합한 ‘전체’에 대해서는 성립하지 않는 모순적인 경우를 말한다.
네이버 지식백과
통계를 이용하다 보면 틀린 말은 아니지만 완전히 다른 내용이 될 수 있다.
통계의 함정으로 유명한 심슨의 역설에 대해 알아보자.
어떤 두 의사의 심혈관 수술과 봉합 수술의 성공률 사례를 보자.
A의사(성공 횟수 / 수술 횟수) | B의사(성공 횟수 / 수술 횟수) | |
심혈관 수술 | 70 / 90 = 성공률 77.8% | 2 / 10 = 성공률 20.0% |
봉합 수술 | 10 / 10 = 성공률 100.0% | 81 / 90 = 성공률 90.0% |
전체 | 80 / 100 = 성공률 80.0% | 83 / 100 = 성공률 83.0% |
심혈관 수술, 봉합 수술 두 분야를 합친 전체 수술 성공률은 B의사가 높다.
하지만 각 수술의 종류 별 성공률은 두 종류 모두 A의사가 높았다.
전체 성공률만 본다면 우리는 B의사를 선택하겠지만, 실제 세부 종류 별 성공률은 A의사가 높다.
그럼 이번에는 ‘심슨의 역설’로 가장 많이 알려진 사례인 버클리 대학의 입학 차별 사례를 보자.
1973년 한 여성이 버클리 대학을 상대로 “여성의 합격률이 남성보다 낮다”고 아래의 평균을 근거로 고소하는 일이 있었다.
지원자 수 | 합격률 | |
남성 | 8442명 | 44.0% |
여성 | 4321명 | 35.0% |
하지만 각 학과 별로 나누어 남성과 여성의 합격률을 계산해보면 전체 85개 학과 중 여성의 합격률이 유의미하게 높은 학과가 6개, 남성의 합격률이 유의미하게 높은 학과가 4개로, “여성의 합격률이 유의미하게 높은 학과가 더 많았다”
남성 – 지원자 수(합격률) | 여성 – 지원자 수(합격률) | |
A학과 | 825(62%) | 108(82%) |
B학과 | 560(63%) | 25(68%) |
C학과 | 325(37%) | 593(34%) |
D학과 | 317(33%) | 375(35%) |
E학과 | 191(28%) | 393(24%) |
이렇듯, 버클리 대학에 지원한 남녀 합격률을 전공 별로 보면 대부분의 전공에서 여학생의 합격률이 남학생보다 높았지만 전체적인 합격률에서는 남학생이 훨씬 높아지는 현상이 나타나면서 주목 받게 되었으나, 만일 여학생이 경쟁이 치열하여 합격률이 낮은 과에 대거 지원하고 남학생은 경쟁이 덜하여 합격률이 높은 과에 다수 지원하면 이런 반전 현상이 나타날 수 있다.
이렇듯 심슨의 역설이란 “쪼개진” 데이터에서 성립하는 관계와 “합쳐진” 데이터에서 성립하는 관계의 형태가 다르게 나타나는 현상을 의미한다.
따라서 위 사례들처럼 데이터를 보는 방법에 따라서 잘못된 의사 결정을 내릴 수 있으니 가능한 다양한 방법으로 데이터의 구조를 살펴보는 습관이 필요하다.