Scilavinka

<이 글은 幻冬舎plus에 연재중인 ‘計算されたリスクを取ること’ 기사를 번역한 것입니다.>


『인생은 결단의 연속입니다. 그리고 결단의 재료가 되는 정보는, 언제나 부족하며 불확실한 것이 일반적입니다. 하지만, 동전 던지기부터 암 검진, 원전의 안전성에 이르기까지, 우리 모두는 자기 나름대로 납득할 수 있는 판단을 하기 위한 ‘방법’을 가지고 있습니다. 그것이….』


살아가는 동안에는, 큰 결단을 하지 않으면 안되는 것이 있다. 학교에서는 정답이 하나로 결정된 문제만 시험에 제출되지만, 현실의 사회에서는 정답이 없는 것이 많다. 그리고, 문제를 해결하기 위한 재료가 제대로 갖춰져 있다고도 말할 수 없다. 불확실한 정보로 판단하지 않으면 안되는 것은 어떻게 하면 좋은지, 그리고 새로운 정보가 손에 들어 왔을 때, 어떤 기준으로 판단을 수정하면 좋은지. 이번엔, 그 방법에 대해 이야기 해보자.


네가 아직 태어나기 전의 이야기지만 [1], 1994년에 로스 엔젤레스에서 O. J. 심슨 사건이라는 것이 있었다. 축구 선수였던 심슨의 전처인 니콜 브라운이 친구 로널드 콜드먼과 함께 집 앞에서 죽어있는 것이 발견되어, 심슨이 그 범인으로 의심받았다. 심슨은 축구 선수에서 은퇴한 후 배우와 해설자로 활약하고 있던 인기인이었기 때문에, 큰 화제거리가 되었다. 심슨을 위해 전미에서 모인 변호인단은 ‘드림팀’이라 불렸고, 검찰 역시 훌륭한 검사들은 계속 내보냈기 때문에 이 재판은 ‘세기의 재판’ 불리며 재판의 모습이 TV로 생중계 되었다.


검찰측은 심슨이 오랜기간 동안 브라운에게 폭력을 휘둘러 온 증거를 제출했다. 가정내 폭력이 살인으로 이어졌다는 줄거리를 입증하려고 한 것이다. 그런데, 변호단의 1명이었던 하버드대 로스쿨 교수 앨런 다슈비츠는 미연방수사국의 통일 범죄 보고서를 인용해, 아내를 학대하고 있던 남편들 중에서 실제로 아내를 살해하게 된 경우는 2,500명당 1명 밖에 없기 때문에, 가정내 폭력의 증거는 무시해야한다고 주장했다.


검찰측은 이에 대해 제대로 반박하지 못해, 심슨이 폭력을 행사했던 증거 만으로는 배심원의 심증을 얻을 수 없었다. 하지만 다슈비츠 교수의 주장은 궤변이다. 그리고 이것을 단호히 반박할 수 있는 것은 수학의 언어이다.


형사 재판에서 문제 되고 있는 것은 유죄의 ‘확률’이다. 범죄가 일어나고 있는 것을 눈 앞에서 보고 있는 경우가 아니라면 100% 유죄라고 말할 수 없다. 검찰측에 요구되고 있는 것은 무죄일 확률이 제로에 가까움을 보여주는 것, 법률용어로는 ‘합리적인 의심이 끼어들 여지가 없는 입증’해 보이는 것이다. 어느 정도로 제로에 가까우면 합리적 의심을 할 수 없다고 말 할 수 있는가는, 주관적인 문제로 수학만으로는 판단할 수 없다.


이는 그 판단을 하는 판사와 배심원의 역할이다. 하지만 확률을 사용하면 의심의 정도를 수학적으로 나타낼 수 있기 때문에, 합리적 의심이 남아 있는지의 여부를 판가름 할 수 있는 재료가 된다. 그것이 수학의 역할이다.


확률의 언어를 사용한 다슈비츠 교수는, 가정내 폭력을 저지르고 있던 남편이 아내를 죽일 확률은 2,500분의 1로 너무나 작기 때문에 증거로서의 의미가 없다고 말하고 있다. 하지만 판단을 하는 경우에는 모든 정보를  보지 않으면 안된다. 사실, 다슈비츠 교수가 무시하고 있는 중요한 정보가 있다. 그것은 니콜 브라운이 이미 죽은 것이다. 이 정보를 사용하면 확률의 계산은 완전히 뒤바뀌고만다. 이것을 설명하는 것이 오늘 이야기의 목적 중 하나이다.


미리 말해 두자면, 이번 이야기에서는 대력적인 계산을 한다. 곱셈과 나눗셈을 한 후, 단수를 적당히 버리거나, 올림 하는 식이다. 가령, 1/3을 0.3이라고 쓰기로 한다. 



우선은 주사위 이야기부터


확률이란 어떤 주장이 얼마나 확실한 것인가를 숫자로 나타내는 방법이다. 예를 들어, 주사위를 굴렸을 때, ‘1의 눈이 나올 것’이라고 주장했다고 하자. 이것은 얼마나 확실한 것일까? 주사위는 1에서 6까지 6개의 눈이 있고, 어떤 눈이 특별히 나오기 쉬운 경우가 없다면, 1의 눈이 나오는 것은 주사위를 6번 던졌을 때 그 중에 한 번. 여기서 ‘1의 눈이 나올’ 경우의 ‘확실한 정도’를 1/6의 분수로 나타낸다. 이것이 확률이다.


지금의 계산은 1에서 6까지 어떤 눈도 같은 정도로 나오기 쉬울 것이라 가정했다. 하지만, 주사위에는 나쁜 버릇이 있어 1의 눈이 나오기 쉬워지고 있을지도 모른다. 이 경우엔 1/6은 확실성의 기준에서는 정확하지 않다.


나쁜 버릇이 있는 이 주사위의 확률을 구하기 위해서 우리는 실험을 하면 된다. 가령, 주사위를 1,000번 던졌을 때, 1의 눈이 497번 나왔다고 하자. 이것은 6번 중에 1번 보다 많다. 697/1000 = 0.497 은 1/6= 0.167 로 더 크기 때문이다. 확률이 1/6보다 크기 때문에 이 주사위는 1의 눈이 나오기 쉽다는 단서가 붙는다. 주사위의 상태가 변하지 않는다면 다음에 1,000번 던졌을 때도 같은 정도의 확률로 1의 눈이 나올 것이다. 하지만 주사위의 눈 방향은 우연에 좌우 됨으로, 이전의 1,000번 던졌을 떄와 같이 딱 떨어지게 497번이 나올지는 알 수 없다. 그래서 0.497 이라는 확률도 정확한 숫자는 아니다. 보다 정확한 확률을 알고 싶다면, 실험의 횟수를 늘릴 필요가 있다. 횟수를 늘리면 늘릴 수록 확률의 값은 정확하게 결정되어진다. 이번에는 설명할 수 없지만, 이것은 수학적으로 증명할 수 있는 사실로, ‘대수의 법칙’으로 알려져 있다.


확률의 계산 방법에는 두 가지 방법이 있음을 말했다. 정리해 두면,


(A)주사위의 눈이 나오는 경우(1부터 6까지)를 모두 생각해, 어떤 경우든 같은 확률로 일어난다고 가정하면, 가능성은 6가지가 존재하기 때문에, 확률은 1/6이 된다.


(B) 주사위를 실제로 던졌을 때, 실험 결과로부터


(1번 눈이 나온 횟수)/(던진 횟수) 를 사용해서 확률을 계산


주사위에 나쁜 버릇이 없다면, (A)의 계산 방법은 정확한 확률을 전해준다. 이때, (B)의 방법으로 던진 횟수를 늘려나가면 ‘대수의 정리’에 의해, (A)의 결과에 가까워져 나간다.


하지만, (A)의 방법으로는, 어떤 가능성도 동일한 확률로 일어날 것이라고 가정하고 있음으로, 나쁜 버릇이 있는 주사위에는 쓸 수 없다. 한편, (B)의 방법으로는 정확한 확률은 알 수 없다. 나쁜 버릇의 정도를 고려하려고 하면, 실험의 횟수를 늘려 나가지 않으면 안된다. 상황에 따라 (A)와 (B)를 구분하여 사용할 필요가 있다. 지금부터 할 이야기도, (A)를 사용할 경우와 (B)를 사용할 경우가 있다.


이번에는 두 개의 주사위를 던졌을 경우를 생각해 보자. 이때 2개의 주사위 모두 1의 눈이 나올 확률은 얼마일까? (A)의 사고 방식을 응용하면 가능성을 모두 생각해 보는 것이 된다. 어느쪽의 주사위도 눈의 수는 6개 임으로, 2개의 주사위에서 나오는 눈의 조합은 6×6=36 가지다. 이 36가지의 조합이 모두 같은 확률로 일어날 것이라고 생각 한다면, 두 주사위 모두 1의 눈이 나올 확률은 36번 중에 1번의 비율 이므로 확률은 1/36이 된다. 이 1/36이라는 것은 1/6×1/6 이기도 하다. 다시 말해, 한 주사위가 1이 나올 확률 1/6과 다른 주사위에서 1이 나올 확률 1/6을 곱하면 2개의 주사위가 1을 내는 확률이 된다.


두 일이 일어날 확률은 각 확률의 곱이 된다. 이것은 확률의 중요한 성질이지만, 언제나 성립하는 것은 아니다. 이것이 사용될 때는, 두 일이 독립적으로 일어날 때 뿐이다. 지금의 경우를 말하자면, 하나의 주사위가 어떤 눈을 나타내는지의 여부가 다른 주사위에 영향을 주지 않았다는 것이다.



베이즈 정리란 무엇인가?


지금까지 독립적으로 일어날 확률에 대해 생각했다. 두 가지 일이 독립적으로 시행된다면 그 확률은 각 확률의 곱이 된다. 가령, 확률 p로 앞면이 나온 동전을 2번 던졌을 때, 2번 모두 앞면이 나올 확률은 p×p이다. 하지만 두 가지 일이 모두 독립이 아닌 경우도 있다.


예를 들어, 너네 학교의 교실에 36명의 학생이 있을 때, 그 중 1/3이 과학에 소질이 있고, 1/2이 수학에 소질이 있다고 하자. 학생 1명을 무작위로 골랐을 때, 그 학생이 과학과 수학 모두 소질이 있을 확률은 얼마일까? 두 경우가 독립이라면 확률은 1/3×1/2=1/6 가 된다. 하지만, 과학 공부에는 수학이 많이 쓰이기 때문에, 과학에 소질이 있는 학생은 수학에도 소질이 있을 확률이 높다. 따라서 이 두 경우는 독립이 아니다.


학생 36명을, 과학과 수학에 소질이 있는지, 소질이 없는지를 분류하면, 다음과 같았다고 하자.


 

 수학에 소질 있음

수학에 소질 없음 

 과학에 소질 있음 

 10

 2

과학에 소질 없음

 8

 16


이 표를 사용해 이 이야기의 처음에 나왔던 (B)의 방법으로 확률을 계산해보자. 36명의 학생들 중에 과학과 수학에 모두 소질이 있는 학생은 10명이 있으므로, 그 확률은 10/36=0.28이다. 이것은 대략 계산해 1/6=0.17 보다 크다.


과학에 소질이 있을 경우에, 수학도 소질이 있을 확률은 P(과학→수학)이라 적기로 하자. 위의 표를 이용해서 계산하면, 과학에 소질이 있는 학생의 수는 10+2=12명이다. 여기서 10명이 수학에도 소질이 있으므로, P(과학→수학)=10/12=5/6 이 된다. 한편, 과학에 소질이 없으나 수학에 소질이 있을 확률은 8/24=1/3이다. 즉, 과학에 소질이 있는지 없는가 수학에 소질이 있을 확률에 영향을 미친다. 두 경우는 독립이 아니라는 것이다.


이 P(과학→수학)의 경우를, 조건대 확률이라고 한다. ‘과학에 소질이 있다’는 조건의 하위에 있는 확률이기 때문이다.


그럼, 수학에 소질이 있는 경우, 과학에 소질이 있을 확률은 어떨까? 위의 표를 이용해 계산하면, P(수학→과학)=10/18=5/9이다. 이것은, P(과학→수학)=5/6 와는 다르다. 이 두 확률은, 비슷하다고 생각할지도 모르나 서로 다른 것이다.


P(수학)P(수학→과학)=P(과학)P(과학→수학)


여기서, P(수학)은 수학에 소질이 있을 확률 = 1/2 로, P(과학)은 과학에 소질이 있을 확률 = 1/3 이다. 이 식이 옳다는 것은 수학을 적용시켜보면 알 수 있다. : 1/2×5/9=1/3×5/6


이것은 우연히히 일치 된 것은 아니다. 그것을 이해하기 위해 다음과 같이 써 보자.


P(수학)=(수학에 소질이 있는 학생 수)/(학급 전원의 수)

P(과학)=(과학에 소질이 있는 학생 수)/(학급 전원의 수)

P(수학→과학)=(수학과 과학에 모두 소질이 있는 학생 수)/(수학에 소질이 있는 학생 수)

P(과학→수학)=(수학과 과학에 모두 소질이 있는 학생 수)/(과학에 소질이 있는 학생 수)


이 식을 사용하면, P(수학)P(수학→과학)과 P(과학)P(과학→수학)의 어느쪽을 계산해도,


(수학과 과학에 모두 소질이 있는 학생 수)/(학급 전원의 수)


가 되는 것을 알 수 있다. 다시 말해 좌변과 우변 모두, 수학과 과학 모두에 소질이 있는 확률을 계산하고 있으므로 일치한 것이다.


이 식, P(수학)P(수학→과학)=P(과학)P(과학→수학)은, 수학의 세계에서 ‘베이즈의 정리’라고 알려져있다. 토마스 베이즈는 영국의 목사 였지만 이 식은 생전에 발표되어지진 못하고 하수 반세기가 지난 뒤에야 프랑스의 피에로 시몬 라프랑스 라는 수학자가 쓴 확률 책에 소개되어져 유명해졌다.



유방암 검진은 얼마나 정확한가?


확률을 사용할 때는, 조건대 확률의 계산이 열쇠가 되는 경우가 많다. 그리고 베이즈의 정리를 사용하면, 그 계산을 명백히 알 수 있다. 유방암 검진에 대한 비시 논쟁을 예로 이것을 설명해 보자.


건강하게 장수 할 수 있을 확률 p를 어느 정도 조절할 수 있지만, p를 늘리려면 매년 제대로된 건강검진을 받는 것도 중요하다. 미국 암 협회는 유방암의 조기 발견을 위해, 여성은 40세부터 매년 유방 X선 검진을 받는 것을 권장하고 있다. 그런데 2009년에 미국정부의 예방의학 실무진이 ‘40대의 여성에게는 정기적인 검진을 받는 것을 권장하지 않는다.’ 라는 권고를 발표해 화제가 되었다.


만약 유방암에 걸려 있으면, 유방 X선 검진에서 양성의 결과가 나올 확률은 90% 라고 한다. 하지만 음성이 나올 확률도 있다. 유방암에 걸리지 않았는데, 양성으로 검진될 확률은 7%다. 확률의 언어로 쓰면,


P(유방암 있음 → 양성) = 0.9

P(유방암 없음 → 양성) = 0.07


확률 90%라면, 검진 받는 편이 좋다고 생각할지도 모른다. 하지만, 예방의학 실무진은 왜 검진을 추천하지 않은 것일까?


유방 X선으로 진찰한 결과가 양성이라고 하자. 이때 알고 싶은 것은, 양성이었던 자신이 실은 암에 걸리지 않았을 확률, 즉 P(양성 → 유방암 있음)이다. 여기서, 방금 말한 것처럼, P(양성 → 유방암 있음)과 P(유방암 있음 → 양성)은 서로 같지 않다.  


앞서 사용한 베이즈의 정리를


P(수학)P(수학→과학)=P(과학)P(과학→수학)


라고 적었지만, 이 식에서 ‘수학’을 ‘양성’, ‘과학’을 ‘유방암 있음’으로 바꿔 쓰면,


P(양성)P(양성→유방암 있음)=P(유방암 있음)P(유방암 있음→양성)


이 된다. 이것을 사용해 P(양성→유방암 있음)을 계산하기 위해서는, P(유방암 있음)과 P(양성)이 필요하다.


40대의 여성이 유방암에 걸릴 확률은 0.8% 라고 한다. 즉,


P(유방암 있음)=0.008


이다.


한편, 40대 여성이 유방 X선 검진을 받아 양성이 나올 확률 P(양성)은 0.08이다. 이것은, 통계를 직접 조사해보면 알 수 있지만, 우리가 이미 알고있는 정보로부터 계산해서 얻을 수도 있다. 여기서 잠시 계산해 보일테지만, 귀찮다면 P(양성)=0.08 임을 믿고 다음 단계로 건너뛰어도 좋다.


P(양성)을 계산으로 구하기 위해서는,


P(양성)=P(유방암 있음)P(유방암 있음 → 양성)+P(유방암 없음)P(유방암 없음 → 양성)


를 사용한다. 이 식을 설명하면, 앞서 P(수학)P(수학 → 과학)은 수학과 과학 모두 소질이 있을 확률이라는 이야기를 했다. 이와 동일하게, P(유방암 있음)P(유방암 있음 → 양성)은, 유방암이 있어서 양성으로 검진될 확률, P(유방암 없음)P(유방암이 없음 → 양성)은, 유방암이 아니지만 양성으로 검진될 확률이다. 유방암은 ‘있음’이나 ‘없음’의 둘 중 하나만 있음으로, 이 두 경우의 확률을 더하면, P(양성)이 된다는 것이 위 식이다. 우리는 이미,


P(유방암 있음) = 0.008

P(유방암 없음) = 1-0.008 = 0.992

P(유방암 있음 → 양성) = 0.9

P(유방암 없음 → 양성) = 0.07


임을 알고 있으므로, 이를 사용하면


P(양성)=0.008×0.9 + 0.992×0.07 = 0.08


이 된다. 즉, 40대 여성이 유방 X선 검진으로부터 그 결과가 양성이 될 확률은 8% 라는 것이다.


이것으로 P(유방암 있음)=0.008, P(양성)=0.08, P(유방암 있음 → 양성)=0.9임을 알았다면, 베이즈의 정리를 쓸 수 있다.


P(양성 → 유방암 있음) = [ P(유방암 있음)P(유방암 있음 → 양성) ] / P(양성) 

= (0.008×0.9) / 0.08=0.09


즉, ‘양성의 결과가 나올 경우, 유방암에 걸려있을 확률’은 9%에 불과하다. 바꿔 말하면, 음성일 확률이 9% 이상이나 있다.


이것을 듣고, 네가 어떻게 생각할까. 의외의 숫자에 놀라지 않았을까? 왠지 속은 것 같은 기분이 들지도 몰라, 다른 방법으로도 한 번 더 계산을 해보자.


가령, 40대 여성 1,000명이 있다고 하자. P(유방암 있음) = 0.008 임으로, 이때의 8명이 유방암에 걸려있다. 이 8명의 여성이 유방 X선 검진을 받았다고 할 때, P(유방암 있음 → 양성)=0.9 이므로, 약 7명이 양성으로 검진될 것이다.


한편, 1,000-8=992명은 유방암에 걸리지 않았다. 그녀들이 유방 X선 검진을 받았을 때, P(유방암 없음 → 양성)=0.07 임으로, 약 70명이 양성으로 검진된다. 이것을 표로 정리하면 다음과 같다.


 

양성

음성

 유방암 있음 

7

1

유방암 없음

70

992

    

이 표를 보면, 양성의 여성은 7+70 = 77명이다. 이떄, 정말 유방암에 걸려있는 여성은 7명 밖에 없으므로, 확률은 7/77 = 0.09 가 된다. 이것은 앞서 베이즈 정리를 사용한 결과와 동일하다.


예방의학 실무진은, 검진을 받은 여성의 8%가 양성으로 검진되지만, 그 9% 이상의 사람들은 실제 유방암에 걸려있지 않으므로, 검진 받는 것을 추천하지 않는다고 말 한 것이다. 양성으로 판별되면 생체조직검사 등의 보다 부담이 큰 검사를 받게 되어, 심리적인 충격이 커진다. 음성임을 알게된 3개월 뒤에는, 2명 중 1명은 건강 불안을 염려하고 있다는 조사도 있다. 또, 미국정부로서는, 어디까지 보험으로 보장할 것인지를 판단하는 기준도 필요한 것이다. 검진을 받지 않으면 암을 놓칠 위험이 있지만, 검진을 받는 것에도 위험이 있다.


하지만, 본인에게 있어서는 한 번 밖에 없는 목숨이기에 암 조기 발견을 위해서라면 암이 없음에도 양성의 결과가 나올 위험을 감수하고서도 검진을 받을지도 모른다. 실제 40대 여성의 유방 X선 검진을 장려한 미국 암협회는 예방의학 실무진의 권고에 반대하는 성명을 발표하고 있다.


검진을 받는 위험과 받지 않는 위험, 확률은 그것을 숫자로 나타내준다. 그 숫자의 의미를 잘 이해한 뒤에 판단 해야한다는 것이, ‘계산된 위험을 감수하는 것’이라는 타이틀의 의미이다.



한 번 더 검사를 받는다면


‘양성의 결과가 나왔을 때, 유방암에 걸려있을 확률이 9%’ 라고 하는 것은, 정말 작은 숫자인 것일까? 40대 여성이 유방암에 걸려있을 확률은, 검진전에는 0.8% 였지만, 검진으로 양성임이 나타났다면 9%, 다시 말하면 10% 이상이 된다. 유방 X선 검진을 받았을 때, 확실히 새로운 정보를 얻을 수 있다. 이 새로운 정보의 의미를 수학을 이용해 생각해보자.


만약, 검사를 받아 양성의 결과가 나왔다면, 이전보다 더 많이 검사를 받게 될 것이다. 여기서, 한 번 더 양성의 결과가 나온다면, 그때 유방암이 있을 확률은 어떠할까? 계산을 간단히 하기위해, 두 번째 검사의 신뢰도도 첫 번째 유방 X선 검진과 같다고 하자.


앞서, 40대의 여성에 대해 베이즈의 정리를 사용했을 때, 확률 P(양성 → 유방암 있음)을 계산했다. 이번에는 첫 번째 검진으로 양성의 결과를 얻은 여성의 그룹에 대해 같은 계산을 해보자. 베인즈 정리는


P(양성)P(양성 → 유방암 있음) = P(유방암 있음)P(유방암 있음 → 양성)


그대로 이지만, 첫 번째 검진으로 양성의 결과를 얻은 그룹은 P(양성)이나 P(유방암 있음)의 값이 다르다. 첫 번째 검진으로 양성이 나온 경우, 유방암의 확률은 9% 였다. 그래서 이 그룹에 대해서는 P(유방암 있음)=0.09를 사용한다. 그럼 이 그룹의 여성이 두 번째 검진으로 양성이 나올 확률 P(양성)은 어떤지를 보면


P(양성) = P(유방암 있음)P(유방암 있음 → 양성) + P(유방암 없음)P(유방암 없음 → 양성) 

= 0.09×0.9 + 0.91×0.07 = 0.14


이 된다. 이 계산으로, 첫 번째도 두 번째도, 검진의 신뢰도는 같으므로 P(유방암 있음 → 양성)=0.9, P(유방암 없음 → 양성)=0.07 으로 가정했다.


이 값에 대해 베인즈 정리를 쓰면


P(양성 → 유방암 있음) = [ P(유방암 있음) P(유방암 있음 → 양성) ] / P(양성) 

= ( 0.09×0.9 ) / 0.14 = 0.58


첫 번째 검진으로 양성의 결과가 나온 것은, 유방암이 있을 확률 9% 밖에 되지 않지만, 재검사로 양성의 결과를 얻었다면 유방암이 있을 확률은 58%나 된다.


검사 하기 전의 유방암의 확률은 0.8%다. 검사를 통해 양성이 나왔을 경우의 확률은 9%이다. 두 번째 검사를 통해 양성이 나왔다면, 유방암이 있을 확률은 58%. 베이즈의 정리를 이용해, 새로운 정보를 손에 넣는 것에 확률이 어느정도 수정되는지 알 수 있다. ‘경험에서 배운다’ 라는 말을 수학적이 표현하는 것이 가능하다.




[1] 딸 아이에게 수학에 대한 이야기를 하고 있다. 자세한 이야기는 이 글의 인트로인 ‘はじめに ―― 娘に語る数学’에 설명되어있다.



1 ··· 93 94 95 96 97 98 99 100 101 ··· 133