Nat Commun. | 黄瓜graph-based pangenome与黄瓜农艺性状和驯化相关结构变异

黄瓜(Cucumis sativus L.)是主要的蔬菜作物之一,也是植物性别决定和维管发育研究的模式植物。通过将自然群体重测序数据比对到单个基因组鉴定了黄瓜群体变异信息,以此研究了黄瓜的驯化历史和挖掘重要农艺性状相关基因。然而大片段结构变异(SV)的鉴定和研究仍然欠缺,需要进一步构建泛基因组增强SV的检测效果,进而促进黄瓜驯化和重要农艺性状相关SV研究。

不同黄瓜的果实

11个黄瓜品种的基因组组装

作者根据115个黄瓜品种的进化关系从中选取了11个代表性黄瓜品种,包括2个东亚品系(XTMC和Cu2)、三个欧洲品系(Cuc37、Gy14和9110gt)、一个西双版纳品系(Cuc80)和五个印度品系(Cuc64、W4、W8、Hx14和Hx117)。综合利用Pacbio测序数据、HiC数据、二代全基因组测序数据、10X Genomics数据以及遗传连锁图数据组装其参考基因组并对重复序列和蛋白质编码基因进行注释。

组装结果

黄瓜核型进化

通过基因组间比对分析,在4和、5号和7号染色体上鉴定到7个染色体倒位变异(inversion)。这些倒位变异存在于部分野生中,结合进化分析确定了这些变异发生在野生种进化过程中。大片段倒位变异抑制重组的发生,因此鉴定黄瓜倒位图谱可以为野生黄瓜和栽培黄瓜选择亲本进行杂交构建分离群体提供指导意见。

黄瓜核型进化

基于蛋白编码基因构建泛基因组

将11个组装基因组和9930基因组的299,692个蛋白编码基因聚类得到26,822个非冗余的泛基因簇,包括18,651个核心(core)基因簇和8171个非核心(dispensable)基因簇。GO富集分析表明两者之间之间存在功能差异,核心基因簇更多富集在重要的生物学过程。核心基因簇和非核心基因簇相比CDS更长、表达量更高,而且更加保守。

protein-coding gene-based的泛基因组

基因组间遗传变异和graph-based泛基因组构建

基于11个组装的基因组和9930基因组比对,作者综合鉴定了基因组间遗传变异,包括SNPs、InDels以及SVs。通过将SVs整合到9930线性基因组,作者构建了graph-based泛基因组。Graph-based泛基因组可以增加二代数据鉴定SVs基因型的准确性,作者以此对115个品种的黄瓜群体进行SVs基因型鉴定并对主枝雌花率、果棘/果瘤密度和分枝树进行SV-GWAS。

graph-based的泛基因组

结构变异对黄瓜基因功能的影响

为探索结构变异对农艺性状的影响,作者筛选了2624个可能影响基因CDS的结构变异。进一步作者详细分析了国刺果瘤和花期相关基因的结构变异,鉴定可能影响基因功能的变异,分析不同地区黄瓜品种中的分布并推测其演化历程。

黄瓜果刺果瘤发育相关基因的等位变异
CsFT基因的进化轨迹

与黄瓜驯化相关的结构变异

作者鉴定了2578个位于受选择区域的结构变异和8651个在野生黄瓜和栽培黄瓜品种中基因频率显著变化的结构变异,其中1611个结构变异可能和临近基因表达量变化相关。经过人工驯化,栽培黄瓜的根生长速率高于野生祖先种的根生长速率。拟南芥AT5G09530PELPK1)是根发育的正调控因子,PELPK7.1PELPK7.2是拟南芥PELPK1的同源基因,通过比较其启动子和内含子上鉴定到的结构变异在不同地区黄瓜品种中的分布推测这两个基因可能收到驯化选择。表达量和表型分析表明,不同单倍型的基因表达量以及主根长和根重有显著差异。

两个驯化相关结构变异可能影响黄瓜根发育


原文链接

Li H, Wang S, Chai S, et al. Graph-based pan-genome reveals structural and sequence variations related to agronomic traits and domestication in cucumber. Nat Commun. 2022;13(1):682. Published 2022 Feb 3. doi:10.1038/s41467-022-28362-0


Nat Commun. | 黄瓜graph-based pangenome与黄瓜农艺性状和驯化相关结构变异
https://laowang2023.cn/2023/08/15/20230815-cucumberGraphBasedPanGenome/
作者
老王
发布于
2023年8月15日
许可协议