베이즈 정리의 출발은 사건 $A$와 $B$의 **결합 확률(joint probability)**을 **확률의 곱의 법칙(production rule)**에 따라 **조건부 확률(conditional probability)**로 나타낸 $P(A \cap B) = P(A)P(B|A) = P(B)P(A|B)$를 변형해서 만들어졌습니다.
베이즈 정리의 본래의 목적은 사건 $A$가 발생했을 때 사건 $B$가 발생할 확률인 $P(B|A)$를 알 때, 선후 관계가 바뀐 역확률(inverse probability) $P(A|B)$를 구하는 것이었습니다. 예를 들어, COVID-19에 걸린 사람들을 대상으로 PCR 검사를 진행했더니, 99% 확률로 양성이 나왔다고 합시다. 상당히 정확한 검사라고 볼 수 있죠. 그렇다면 PCR 검사가 양성이 나왔다면, 99%의 확률로 COVID-19에 감염되었을까요?
정답은 **"그렇지 않다"**입니다. COVID-19 감염자 중 PCR 양성 확률은 $P(\text{positive}|\text{COVID-19}) = 0.99$로 나타낼 수 있습니다. 반면, PCR 양성 중 실제 COVID-19 감염 확률은 $P(\text{COVID-19}|\text{positive})$로, 둘은 다르다는 것을 볼 수 있습니다. 이 문제에 대한 정답을 찾아가보도록 하겠습니다~
$$ P(B|A)=\frac{P(A \cap B)}{P(A)}=\frac{P(B)P(A|B)}{P(A)} \propto P(B)P(A|B) $$
우선 위 식에 있는 각각의 의미를 잘 알고 있어야 하는데요, 하나씩 차근차근 살펴볼게요!
일반적으로 전체 확률을 정확히 구하기는 쉽지가 않으므로, 단순히 $P(B|A)$를 최대화하는 문제에서는 무시하게 됩니다! 전체 확률이 일정과 관계 없이, 분자에 위치한 $P(B)P(A|B)$ 각각을 최대화하게 됩니다! 따라서 $P(B|A)$를 최대화하는 문제가 $P(B)$와 $P(A|B)$ 둘을 각각 최대화하는 문제로 바뀌게 됩니다~
그런데 만약 정확한 분포(distribution)를 알아야 하는 경우라면 전체 확률 $P(A)$를 계산해야겠죠? 만약 전체 확률을 계산하지 않는다면, $P(B)P(A|B)$로 계산된 값들의 총합 또는 적분값이 1이 되지 않으므로 "확률"로 해석할 수가 없게 됩니다! 분모에 위치한 $P(A)$를 일종의 **표준화 상수(normalizing factor)**로 해석할 수도 있겠죠?
<aside> 💡 대학교 캠퍼스에 되게 수줍어 하는 남학생에게 말을 걸고자 한다. 해당 남학생은 MBA 학생 또는 수학과 박사과정 학생이라고 할 때, 둘 중에서 어떠한 확률이 더 높은가?
</aside>