@zhoujj2013
2017-08-12T07:58:36.000000Z
字数 751
阅读 538
service
基因共表达网络分析要求在多样品中计算各个基因间的关联性,所以对样品数有一定的要求。如果样品过少,基因间的共表达对数会过多,造成极大的false positive; 如果样品过多,基因间的共表达对数会过多,噪音信号过大。
多样品表达列表如下:
| 基因id | 样品1 | 样品2 | ... | 样品N |
|---|---|---|---|---|
| Myod1 | 20 | 50 | ... | 80 |
| Myog | 5 | 70 | ... | 130 |
利用R中的cor.test函数,对每一对基因进行pearson关联系数计算,如果pearson关联系数大于0.8,我们认为这两个基因共表达,反之,两个基因没有共表达关系。
共表达计算结果(pearson关联系数 >= 0.8): pearson_rho_cal.xlsx
统计每一个基因的邻近基因数目,对未知基因(例如lncRNA)进行功能预测分析。
每一个基因的邻近基因数目统计表: neighbor_stat.xlsx
功能预测分析结果: gene_enrichment.xlsx