이태원 사망 사건의 성비
지난 22년 10월 29일 이태원에서 압사 사건이 발생했고, 총 154명의 사망자와(이하생략) 발생했는데
저 사진을 보고 "비율로는 2:1 정도인데 압도적이라고 할 수 있나?"라는 의견이 나오길래 계산을 해봤다
먼저 알아볼 것은, "얼마나 나와야 압도적이지 않을까?"일 것이다
참조한 통계는 https://gsis.kwdi.re.kr/statHtml/statHtml.do?orgId=338&tblId=DT_1IN0503
KOSIS
gsis.kwdi.re.kr
통계 DB 기준 2020년의 성비는 위 표와 같으며, 자세한 내용은 사이트 참조
성비에 대한 정의는 "여성 인구에 대한 남성 인구의 비" 이다
20~24세의 성비인 109.7은 여성 100명 당 남성이 109.7명이라는 뜻
즉 성비가 100보다 크다면 남자가 더 많고, 100보다 작다면 여자가 더 많다는 것
이번 사망자는 20대~30대가 절대다수이며, 모두 성비가 105 이상의 남성이 더 높은 비율을 갖는다
좀 더 정확한 기대값을 알아내기 위해
연령대별 사망자 수 × 100 ÷ (100 + 연령대 별 성비)
를 구하였다
연령대가 5세 단위로 끊어지므로 같은 10의 자리에서 평균값을 냈다
그러면 기대값은
이렇게 나온다
연령 미상은 전체 성비인 99.3으로 처리하였다.
합계 73.49...명으로, 성비에 맞다면 여성 사망자는 73~74명의 사망자가 발생 할 것을 예상 할 수 있으며 1
임의의 사망자가 여성 사망자일 확률은 47.7265...%이다
전체 사망자의 수 = 154
여성 사망자의 수 = x
여성 사망자일 확률(p) = 47.73%
남성 사망자일 확률(1-p == q) = (100 - 47.73)%
일 때 P(x) = xCn × 0.4773x × 0.5227n-x
이를 엑셀로 뽑아내면 다음과 같다
앞서 기대치는 73명이었다
73명의 사망자가 발생할 가능성을 보면 약 6.4%이다
이는 점추정을 하였기 때문이며, 보통 95% 확률로 구간추정을 하므로 그 합계를 보면 다음과 같다
대략 61~85명의 사상자가 발생할 확률이 95%이며, 99%까지 늘려본다면 57~89명의 범위를 갖는다
해당 사건의 여성 사망자는 총 98명으로, 99%까지 늘려도 10명 가까이 차이가 나는 것을 알 수 있다
그렇다면 해당 범위까지 벗어날 가능성은? 0.007310%이다
위와 같이 일일이 계산하지 않아도 np와 nq 모두 5보다 크므로 정규분포에 근사할 수도 있다
Z = (X-np)/(npq)^0.5 이므로 Z = 25/(154*0.4773*0.5227)^0.5 = 4.0333...으로, 이를 정규분포표에서 벗어나는 확률로 찾으면 유사한 값이 나옴을 알 수 있다
따라서 뉴스에서 사용한 "압도적인 여성 사망자" 표현은 맞다고 볼 수 있다
- 사실 전체 성비는 70세 이상의 노인 인구에서 남성 성비가 급격하게 감소하여 여성 성비가 더 높아진 것으로, 연령 미상의 사망자는 20~40대임을 예상한다면 기대값은 조금이지만 더 감소했을 것이다. [본문으로]