目的 :PCA分析可以得到样本之间的相关性和离散程度。
内容:
1 . 基因表达量数据进行标准化,用tpm和fpkm两种方法进行相对定量,后续分析我们一般会用tpm。
2 . 使用标准化后的tpm数据做主成分分析(PCA)
数据 :RNASEQ上游分析得到的read count矩阵。
工具 :Rstudio。
步骤:
TPM=(Ni/Li)*1000000/sum(Ni/Li+……..+ Nm/Lm)
Ni:mapping到基因i上的read数; Li:基因i的外显子长度的总和