WGCNA
为了探究组织间的共表达网络的保守性和多样性,我们进行了加权共表达网络的构建。本部分使用R语言的WGCNA包进行分析(Langfelder and
Horvath, 2008)。
首先我们进行数据整理,在每个组织中随机选取2000个表达基因,通过“goodSamplesGenes”函数检验缺失值并对缺失值处理,随后通过样本聚类分析剔除离群样本,从而减少样本因素导致的误差。
其次,我们对样本进行了层次聚类,进一步使用bicor相关系数进行基因间的表达相关系数的计算,后选取拟合曲线第一次接近0.9时的软阈值参数,将基因分类构成基因共表达模块,并验证共表达网络是否符合无尺度网络,即出现连接度为k的节点的对数log(k)与该节点出现的概率的对数log(P(k))要负相关,且相关系数要大于0.85。本研究通过“pickSoftThreshold”函数进行筛选最佳软阈值筛选。
(SoftThreshold)
再次,我们将表达矩阵转换成邻接矩阵,然后再将邻接矩阵转换成拓扑矩阵(TOM),基于TOM,我们使用average-linkage层次聚类法对基因进行聚类,按照混合动态剪切法在确定基因模块后,我们依次计算每个模块的特征向量值(eigengenes),然后对模块进行聚类分析,将距离较近的模块合并成新的模块,本部分使用“blockwiseModules”函数进行分析,设置mergeCutHeight =0.1、deepSplit=2、minModuleSize=30、pamStage=F。