@zhoujj2013
2017-09-14T05:16:49.000000Z
字数 1426
阅读 1129
service
加权基因网络表达分析需要多个样品的数据,从而对基因在多样品中的表达规律进行总结,所以对样品数有一定的要求(>10)。
多样品表达列表如下:
| 基因id | 样品1 | 样品2 | ... | 样品N |
|---|---|---|---|---|
| Myod1 | 20 | 50 | ... | 80 |
| Myog | 5 | 70 | ... | 130 |
| ... | ... | ... | ... | ... |
此部分包括两步:
数据过滤后,对每一个样品的基因表达普进行聚类,查看各个样品的差异性:

加权网络构建的参数图,当所构建的网络符合powerlaw分布的时候,参数最为合适;从右图中,可以看到选择不一样的参数,节点的度的平均数:

依据已经构建好的加权基因网络,用层次聚类算法对所有基因进行聚类,并计算每一个类对于每一个表型的关联重要性。
不同的颜色表示不一样的modular,聚类结果表示不同modular间的距离,检测结果如下图:
(加一个modular检测的图)
每一个modular对每一个表型的贡献是不一样的,通过分析加权网络聚类与表型的关联性,通过基因的共有性,可以计算modular与每一个表型间的关联显著性(p-value)。

采用超几何检验对每一个modular的基因进行功能富集分析,用多重检验较正pvalue。
(加一个top5 modular的GO柱形图)
功能富集结果: gene_enrichment.xlsx
我们的网络分析采用两种方法对网络进行可视化:
通过heatmap聚类图可以查看整体网络,并查看相互关系紧密的基因modular。如下图所示,横轴和纵轴不同的颜色表示不同的modular,树型图表示不同的modular间的距离,图内的颜色越深表示相互作用越强。

同样,对于每一个modular,我们可以进行同样的分析,一方面通过聚类图查看整体的相互作用,另一方面通过网络图直接查看相关基因的相互作用。

每一个modular对每一个表型的关系。
Cytoscape输出:
1.
2.
3.
