[关闭]
@semprelibera 2020-02-03T04:18:16.000000Z 字数 2468 阅读 2157

关于自我隔离14天的概率分析

Fermi-problems


引言

由于新型冠状病毒有一定的潜伏期,为了防止其进一步传播,一般要求从疫区回程后自行隔离14天。如果我们从概率的角度看这个问题,可以表述为:假如旅客在归程那一天(称为第0天)已经被感染,但是身体状况良好,没有出现任何症状,那么14天后还未发病的概率非常小。因此直观上我们知道,如果14天后还没有发病,我们有很大的把握认为在第0天是没被感染的。

那么很自然的一个问题是,假设我们已经知道经过t天后一直没有发病,那么在第0天被感染的概率是多少?这个问题可以用贝叶斯推断来分析。

结论和讨论

利用贝叶斯推断和一系列初步的粗略假设,计算得到上述问题的答案。假设该旅客从疫情较严重的区域(如武汉)归程,我们以时间t(天数)为横坐标,在第0天被感染的概率(已知经过t天后一直没发病)为纵轴,得到下图
prob.png-19kB
此病毒的潜伏期一般认为为5天左右,可以看到,在潜伏期以前,第0天被感染的概率下降缓慢,在潜伏期以后,第0天被感染的概率迅速下降。
可以看到,如果第11天的时候还未发病,在第0天已经被感染的概率约为,与被闪电击中的概率相当;如果到第14天还未发病,在第0天已经被感染的概率约为,与民航飞机失事的概率相当;一周后还未发病的话,在第0天已经被感染的概率约为,与由于车祸而丧生的概率相当。
对于从疫情较轻的回去的旅客,此曲线向下平移,如下图所示
compProb.png-31.2kB
一周后还未发病的话,在第0天已经被感染的概率约为

接下来我们详细介绍一下如何通过贝叶斯推断的方法和一些粗略的估计得到上述结论。

贝叶斯推断

我们首先定义两个事件,


我们想要的概率是已知事件的条件下,事件发生的概率,利用条件概率公式,我们知道这两个事件同时发生的概率有两种表示方式

稍作变形我们可以把已知事件的条件下,事件发生的概率表示为

这个公式就是贝叶斯公式。我们希望从等式右边算到等式左边,为此需要进行一系列的假设和估计。

问题假设和粗略估计

首先是事件发生的概率,这取决于旅客从哪里出发,以及什么时候出发,作为最保守的估计,我们假设该旅客从武汉出发。作为粗略的估算,这个概率可以用当前已经感染的人数除以武汉总人口数来计算,根据约翰霍普金斯大学收集的数据,到2020年2月1日,湖北省确认感染的人数约为1万,且仍然处在上升趋势。同样处于保守考虑,我们假设1万人全都在武汉,而武汉的总人数约为1000万,那么P(B)的估计值为


注意到这是一个比较保守的估计,因为考虑到从2020年1月下旬以来的一系列政府措施,很多感染者都已经在医院被隔离,而到2月1日已经被感染但身体状况依然良好人数占比应该要小于此估计值。对于从疫情较轻的区域回去的人,的值会进一步减小。
第二个需要估计的概率是,即已知旅客在第天被感染,天后一直未发病的概率。由于该病毒有潜伏期,当天发病的概率很小,那么我们可以估计;而另一方面我们知道,感染者14天后未发病的概率很小,这样的人虽然被感染,却一直没有症状,在前一阵子新闻中出现过几例这样的报道,而到2月1日为止,全球范围内被确认的感染者一共有1.4万左右,那么这样特殊体质的人大约占比为1/(1.4万),所以我们可以估计

------这一段删除----
假设随着天数呈指数下降可以得到


------这一段删除----
经过和我一个基友的讨论,这个假设可以进一步完善

该病毒的潜伏期一般为3到5天,因此在一直到第3天还未发病的概率都会接近于1,而不仅仅是第一天;在4到6天的窗口期内未发病的概率迅速下降,我们可以用双曲正切函数来描述这样的趋势。我们估计发病期的均值为5天,结合,可以得到


此概率关于的函数图像如下所示
pAtB.png-18.5kB
最后可以用全概公式计算

其中为时间的逆事件,代表在第天没有被感染,因此,那么,表示已知在第天没被感染,天后一直未发病的概率,如果该旅客在归程后一直都在自行隔离,那么我们有十足的把握说这位旅客不会发病,因此。据此可以得到

现在我们可以回答一开始提出的问题了:已知经过天后一直没有发病,那么旅客在第0天被感染的概率为

为了初步检验此结论的合理性,先带入一些极端的情况来看看这个公式会给我们怎样的答案。
第一种极端加入我们非常确信此旅客在第天没有感染,,带入上述结论我们得到,符合预期。另一方面,如果我们确信旅客在第天已经感染,,那么,符合预期。

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注