[关闭]
@Bruce1Tone 2020-10-19T15:11:26.000000Z 字数 1119 阅读 684

疫情回归分析

计量报告

基于时间序列数据的SIR模型

模型的建立

模型将人群分为以下三类:

  • S(Susceptible)易感染者
  • I(Infective)感染者
  • R(Removal)移出者

其中,N为总人数

为了方便研究,我们将其单位统一,即:

引入两个参数:

:感染率系数,物理意义是:原有感染者与易感者混合后,新增感染者占前两者乘积的比例。定义为:


:恢复率系数,物理意义是:新增康复者(含死亡)占原有感染者的比例。定义为:

由此可以得到以下s,i,r三个参数增量的计算方法:

建立回归模型为:


其中:

  • :截距
  • :第t天新增的感染者
  • :第t-1天的感染者i×易感者s
  • :第t-1天的感染者×-1

模型的结果

引入再生比率来表示疫情的传播情况,其中:

显然可以得出,当再生比率小于1时,疫情的传染速度小于治愈(包括死亡)速度,疫情得到控制

数据处理

 我们有195天的样本,首先我们以10天为一个时间窗口,以1天为步长滑动窗口抽取样本,得到195-10=185组数据,每组数据分别对进行线性回归,具体过程如下:

  1. 首先,将原始数据归一化得到s,i,r:
    image_1el0dn5gg18kd1g05kqc1hrr1dhi2a.png-47.8kB
  2. 每10天为1组,分别对进行线性回归,得到185组数据:

    beta
    部分
    beta

    gamma
    部分
    gamma
  3. 算出
    R_0
    然而很明显,存在误差较大的噪声点,我们用t检验去除置信度为95%以下的噪声点后,后得到修正后的
    R_0修正后
    其中,明显等于0的点为空白数据(原噪声数据),橘色为的参考线

回归检验

根据置信区间检验公式,我们构造出95%的置信区间:


得到的置信区间为:
以下为部分:
image_1el0j16a0avbk306u3lf76n55i.png-8.2kB


基于截面数据的SIR模型

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注