@BruceWang
2018-12-25T08:02:28.000000Z
字数 3797
阅读 2685
课题
睡眠阶段评分 (也: 睡眠分期) 过程大部分时间仍由训练有素的技术人员手动执行, 因此非常繁琐和耗时;
虽然已经有很多公司(飞利浦、)可以提供自动睡眠分期服务,主要原因是他们的不可靠并且软件的高费用,直到今天, 研究人员和临床医生都没有开放源码的实施或软件包;
所以我们提出了一种自动睡眠分期的神经网络模型,并与传统方法的对比
睡眠质量可以与许多与健康有关的问题, 如心血管疾病, 糖尿病或肥胖;
我们依据把记录的eeg数据,分成每30s一段,看形状、算频率等。。。依据AASM分期规则;

理想分期图

许多方法已经提出来自动化睡眠评分程序,但这些方法面临以下问题和缺点:
频谱特征: 采用傅里叶变换或小波转换等方法从信号中提取频率分量;
通常使用的频率来自 0.5-50 Hz, 它被分为 ;
时序特征:用来解释随着睡眠时间的推移大脑激活的变化。
由于每个睡眠阶段都依赖于以前的大脑状态, 所以包含时态特征提供了有关分类的重要信息。
统计特征: 信号通常可以用简单的统计特性来描述, 例如信号的最小和最大值或零交叉点的个数, 例如检测眼球运动。其他统计指标为中值、峰值和信号偏斜度的标准差。
那么现在要做到的就是自动提取特征, 我们想到神经网络的优点;
即在没有人的偏见的情况下, 网络可以找到一组最佳特征。
缺点是这些特征可以是抽象和不可理解的为人和晦涩的决定过程 (黑盒过程)。
根据(睡眠评分自动化与评分标准问题)提到的缺点,我们的目标也就明确了:
- 自动特征提取可以代替手动提取特征方法吗?
- 哪些通道有助于分类,如何确保数据的平衡性?
- 除去常用到的三通道 (EEG-脑电、EMG-眼电、EOG-肌电) 是否可以得到很好地结果?
- 如果不考虑时序特征对模型有多大的影响?
- 数据的泛华性能怎么样(是否适用于其他数据)?
在这里我们使用 8个 采样频率为 512 通道的数据;
18065920 = Durations*SampleFre = 35285s*512fs
| 序号 | size | Label |
|---|---|---|
| 0 | 18065920 | LOC-A2 |
| 1 | 18065920 | ROC-A2 |
| 3 | 18065920 | F4-A1 |
| 4 | 18065920 | C4-A1 |
| 5 | 18065920 | O2-A1 |
| 6 | 18065920 | F3-A2 |
| 7 | 18065920 | C3-A2 |
| 8 | 18065920 | O1-A2 |


总的数据量结构:9036 @ (8*30x512)= 8*15360
模拟医师分期时的分期办法,不可能只看一个通道的数据;
所以是8个通道数据齐头并进, 也即: INput = N@(8x15360),通过网络模型,对原始数据进行卷积提取特征。

我们可以根据混淆矩阵看得出5个分类的准确率分别是:
| Stage | W | N1 | N2 | N3 | R | Ave Acc |
|---|---|---|---|---|---|---|
| Acc | 81.9 | 34.1 | 78.5 | 80.9 | 72.1 | 69.5 |
看得出结果刚刚“及格”,确实不是那么令人满意,不过相对与这点数据,已经是很不错的效果了。
再则我也得出了模型结果的混淆矩阵:
| Stage | W | N1 | N2 | N3 | R |
|---|---|---|---|---|---|
| W | 81.9 | 10.6 | 4.1 | 1.4 | 2.1 |
| N1 | 10.8 | 34.1 | 27.2 | 2.4 | 25.5 |
| N2 | 1.9 | 3.2 | 78.5 | 9.6 | 6.8 |
| N3 | 2.7 | 2.0 | 13.3 | 80.9 | 1.2 |
| R | 5.3 | 12.9 | 8.4 | 1.4 | 72.1 |
由于医师的分类是依据AASM规则来分期的,所以AASM规则一定程度上决定着分期准确性也即---标签的准确性
从分期结果来看, 经过仔细对比模型的结果,和原始标签(医师)结果, 也就是 混淆矩阵(confusion matirx):
| Stage | W | N1 | N2 | N3 | R |
|---|---|---|---|---|---|
| W | 81.9 | 10.6 | 4.1 | 1.4 | 2.1 |
| N1 | 10.8 | 34.1 | 27.2 | 2.4 | 25.5 |
| N2 | 1.9 | 3.2 | 78.5 | 9.6 | 6.8 |
| N3 | 2.7 | 2.0 | 13.3 | 80.9 | 1.2 |
| R | 5.3 | 12.9 | 8.4 | 1.4 | 72.1 |
可以看出除了其他结果都很好,但是N1的结果真的是差强人意,不过一半;
紧接着分析,看一看模型把N1都分到了哪里,看得出多数分到了W stage 和 REM stage。结合 附录的分期特征与波型表,我们也可以看出确实有一些特征重合。
从这 7个eeg信号的9036个 30s 的数据分布可以看出数据分布是极不平衡的, 对于N3只有 202 个30s数据:

再则仔细剖析了数据的标签属性,可以看到有很多“? ” 的标签,也就是“UNKNOW”, 当然这里指的是 “5”
这一类,因为01234分别代表 W,N1,N2,N3,R, stages;

30s 是否正确?
历史上,使用30秒间隔是因为纸张速度为10 mm / s,非常适合观看alpha和锭,一页相当于30秒
N1期 — N1期睡眠是从觉醒状态到睡眠的典型过渡期。其特征是低振幅混合性脑电波频率,处于θ波范围(4-7Hz),占一帧的至少50%。眼动通常缓慢且为旋转运动。N1期是最浅的睡眠期,可说是在清醒期与睡眠期之间的一个过渡阶段;

首先N1期是由WK期过度到Ni期的一个衔接期,相对于其他期来说,期间特征非常不明显,再则“首夜效应(first night effect)”对于医师的分类首先就是一个极大的干扰;
由于监督学习的结果是由标签决定的,最高准确率也就是标签的准确率,所以就产生一个悖论,如果想超越标签肯定是不可能的,而改善标签的准确率,又是由医师决定的,结果可想而知。


| 波型 | 波段 | 期特征 |
|---|---|---|
| (0.5-4 hz)、 有些资料是0.5-2hz | WK、N3 | |
| (4-8 hz)、 | N1、N2 | |
| (8-12 hz)、 | WK、REM | |
| (12-40 hz)、 | N2(部分) | |
| (40-100 hz), | 不多用,因为在睡眠分期主要考虑0.5-50hz | |
| K复合波 | (12-16 hz) | N2 |
| 序号 | size | Label |
|---|---|---|
| label:01 | 18065920 | LOC-A2 |
| label:02 | 18065920 | ROC-A2 |
| label:03 | 9032960 | Chin1-Chin2 |
| label:04 | 18065920 | F4-A1 |
| label:05 | 18065920 | C4-A1 |
| label:06 | 18065920 | O2-A1 |
| label:07 | 18065920 | F3-A2 |
| label:08 | 18065920 | C3-A2 |
| label:09 | 18065920 | O1-A2 |
| label:10 | 4516480 | ECG1-ECG2 |
| label:11 | 1129120 | AIRFLOW |
| label:12 | 4516480 | Nasal Pressur |
| label:13 | 1129120 | THOR |
| label:14 | 1129120 | ABDO |
| label:15 | 9032960 | Snore |
| label:16 | 564560 | Pos Sensor |
| label:17 | 564560 | SpO2 |
| label:18 | 564560 | Ox Status |
| label:19 | 4516480 | LEG/L |
| label:20 | 4516480 | LEG/R |
| label:21 | 564560 | Pulse |
| label:22 | 1129120 | CPAP Flow |
| label:23 | 2258240 | HR |
| label:24 | 2258240 | PTT |
| label:25 | 564560 | CPAP Press |
| label:26 | 9032960 | Pleth |