Nat Genet. | 玉米多组学整合网络图谱
随着技术发展,生命科学进入大数据时代。中心法则的提出和发展表明从DNA序列到表型之间存在多个层次的调控过程。利用多组学数据构建整合网络为解析复杂性状的遗传调控提新的有效途径,结合机器学习挖掘生物大数据更为解析表型变异的分子调控网络提供便利。“A multi-omics integrative network map of maize”这篇文献以玉米为例构建多组学网络,挖掘重要农艺性状基因和调控网络。
构建多组学网络
作者收集了不同组织、时期的多个样本,使用多种方法分别构建了基因组网络、共表达网络、共翻译网络以及蛋白质互作网络。其中基因组网络由ChIA-PET方法构建,共表达网络由31个组织时期的转录组数据构建,共翻译网络由21个组织时期的Ribo-seq数据构建,蛋白质互作网络使用RLL-Y2H构建。最终构建了一个包含407,721个功能元件(node)、多于2,800,000个边(edge)的综合网络。
重复基因功能分化
基因复制(基因组加倍WGD、串联重复tandem duplication、近端重复proximal duplication、转座重复transposition duplication、散在重复dispersed duplication)为基因功能进化提供契机。相较于非旁系同源基因,玉米重复基因,尤其是串联重复、近端重复以及基因组加倍重复基因更倾向于富集在相同的模块中,且具有更小的SD(节点间最短距离),表明其功能的保守性。进而根据基因间相似性和差异性将其分为I ~ V5类,其相似性逐渐降低而差异性增加,分别代表保守的(I)、亚功能化(II)、新功能化(III和IV)以及无功能化/特化(V)。重复基因更倾向于富集在代表功能保守的类别中,表明其在网络中的功能相似性。从共表达到共转录再到互作组网络重复基因在I ~ V类中的比例各不相同且存在重新分组的现象。最后根据重复基因起源的时间和I ~ V类中的分布比例发现,新生成的基因倾向于更保守。
玉米亚基因组间非对称调控
玉米是一种异源四倍体物种,两套亚基因组中maize1保留了更多的基因,且maize1中的基因表达量比maize2基因表达量更高。通过比较两个亚基因组中同源基因的连接度(Degree)发现,从共表达到共翻译再到互作组网络,其连接度差异愈发明显,到互作组网络中存在显著差异。滑窗统计方法表明maize1中由更多的优势bins。
重要基因的功能网络
处于同一个网络中的基因可能具有相似的功能。因此作者搜集功能已知的基因并找到其所处的子网络,通过对子网络的分析鉴定了调控相同性状的新的功能基因。
花期新基因的预测
花期是重要的农艺性状。作者搜集已知的玉米花期基因和其他物种花期基因的同源基因,结合多组学整合网络使用机器学习的方法建立预测模型,进而预测玉米花期基因。最终预测了2,651个花期相关基因,以及鉴定到8个子网络和花期相关,这8个子网络分别代表了不同的调控途径。对其中20个基因进行基因敲除并考察突变体和野生型的表型,作者验证了其在花期表型中的功能。
原文链接