@zhoujj2013
2017-08-10T16:03:41.000000Z
字数 519
阅读 774
service
主成分分析(Principal Component Analysis,PCA), 是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。主成分分析试图在力保数据信息丢失最少的原则下,用较少的综合变量代替原本较多的变量,而且综合变量间互不相关。
因为原始数据的异质性较大,所以我们的PCA分析是在差异表达数据中进行的,这样可以高效利用有用的数据信息。
各主成分的重要性。以差异表达基因为两组数据的主要差异,并进行PCA。如下图:

用两个主成分对样品进行分类:

上图,红色点表示UC组的样品,黑色点表示正常的对照样品。PC1 和 PC2并不能够清晰把两组数据分开。从红点的分布上看,Corhn组存在一些outliner样品, 有待进一步结合临床数据确认。
PCA分析scatter plot:PCA2d.pdf,PCA2d.png
PCA的权重分析:pcaBarplot.pdf,pcaBarplot.png