匹配的概率估计
所有人用集合S表示,有个用户群记为A, A是属于S的非空真子集。
已知罪犯a的生日是 (d_1),出生城市(c_1), 在A中只有用户b的生日和出生地和罪犯a相同,
那么罪犯a就是用户b的概率P是?
分析
- S 表示名字和罪犯a相同的所有用户,假定全国15万, A 表示关注的用户群, 假定5万个。
- 用户出生于(d_1)的概率是1/10000
- 出生在城市(c_1)的概率是1/1000
- 在A的余集中不出现相同生日和出生地的人概率记为 $ P_0 = (1-P(d_1)P(c_1))^n = (1-1/10000 * 1/1000)^{100000} = 0.99 $
- 在A的余集中出现相同生日和出生地的k人概率记为 $ P_k = C_n^k (1-P(d_1)*P(c_1))^{n-k} (P(d_1)P(c_1))^k ll P_0 $
- 若$ P_0 > .99 $, 那么 $ P ge P_0 = 99% $