@lakesea
2018-10-08T03:20:21.000000Z
字数 2070
阅读 602
文献解读
Title: The sunflower genome provides insights into oil metabolism, flowering and Asterid evolution
背景
向日葵(Helianthus annuus L.),是菊科向日葵属的一年生植物。因其花常朝着太阳而得名。英文名“sunflower”虽与其向日特性多少有些关联,其名称主要还是来源于其金色花朵开放时酷似骄阳的形态。向日葵原产南美洲,驯化种由西班牙人于1510年从北美带到欧洲,最初为观赏用。19世纪末,又被从俄国引回北美洲。中国均有栽培。向日葵种子叫葵花籽,常炒制之后做为零食食用,味美,也可以榨葵花籽油用于食用,油渣可以做饲料。作为油料作物的一种,向日葵因其突出的抗逆性而备受关注。但是,向日葵的基因组研究尚处于初级阶段,严重制约了其品种培育工作。
法国卡斯塔内托洛桑国家农业研究院的研究人员对驯化向日葵总长3.6Gb的全基因组进行了测序分析。由于向日葵基因组由高度相似的相关序列组成,研究人员利用单分子实时测序技术完成了基因组组装。比较基因组分析结果也构建了菊科植物的演化史,而向日葵是2900万年前菊科植物基因组倍增的结果。此外,利用数量遗传、表达和多样性数据的整合分析,研究人员还重构了花期和油脂代谢这两大育种性状的遗传网络,并找到了新的候选基因,并重构了花期和油脂代谢这两大育种性状的遗传网络,并发现花期网络是由最近的全基因组倍增塑造的。这意味着,在数千万年中,古老的横向同源基因(基因组中由于倍增产生的同源基因)都能在同一调控网络中保留下来。
该研究成果对逆境胁迫和油脂代谢相关遗传位点的挖掘及性状改良,以及加快向日葵育种工作具有重要的推动作用。
研究方法:
基因组测序和组装:采用PacBio RS II平台,对自交系XRQ基因型的向日葵进行测序,利用WGS 8.3组装流程进行组装。
蛋白质编码基因和重复序列注释:利用EuGene 4.2预测基因结构,利用Interpro对蛋白编码区域进行功能注释,利用LTRharvest 和LTRdigest对重复序列进行注释。
向日葵进化史和全基因组复制研究:用向日葵、朝鲜蓟、咖啡、和莴笋以及葡萄作为外群进行比较分析。通过同义替换水平评估分化距离和时间,进一步鉴定直系和旁系关系。通过染色体共线性(synteny)和Ks分析来识别基因组加倍事件。
花期和油脂代谢遗传网络:运用GWAS、QTL方法重构了花期和油脂代谢这两大育种性状的遗传网络,找到了新的候选基因。
结果
组装结果
研究通过纯三代基因组测序(PacBio RS II platform,102×)总共组装得到13,957contigs, contig N50为399kb,共组装得到了3Gb的基因组数据,占预估基因组大小的80%。研究人员利用4个高密度遗传图和1个物理图谱,构建出了17条假染色体,挂载率为97%;通过对基因组组装结果分析,发现向日葵基因组中超过75%的序列为长末端重复逆转录转座子(Long Terminal Repeat Retrotransposons,LTR-RTs),LTR-RTs以非随机的模式分布。
向日葵的进化史和全基因组复制事件(WGD)
基于基因组组装的结果,研究人员比较了向日葵、莴笋、朝鲜蓟、葡萄、咖啡的基因组,评估了菊科植物的演化史。研究人员通过与全基因组加倍事件的经典研究物种之间的比较分析发现,向日葵、生菜、朝鲜蓟都经历了一次全基因组三倍化事件(WGT);此外,向日葵在2900万年前还发生了一次全基因组二倍化事件(WGD-2),在此过程中染色体经过多次断裂及融合,最终形成向日葵现在的17条染色体。
花期和油脂农艺性状研究
研究人员通过转录组测序获得了不同组织器官(根、茎、叶和8个花器官)的表达谱数据,同时构建了不同激素水平和逆境压力下的基因共表达网络;共预测出了52,232个编码基因、5803个lncRNA、123个miRNA;其中67个lncRNA及1,020个mRNA被鉴定为miRNA的靶基因。
研究通过转录组测序获得了不同组织器官的表达谱数据,同时构建了不同的激素水平和逆境压力下的基因共表达网络;通过拟南芥花期相关数据库,在向日葵中共找到了270个与拟南芥花期相关的旁系同源基因;通过对480个F1代个体进行GWAS分析,在基因组上找到了与花期相关的35个候选区域。这些区域与通过QTL定位获得的区间相吻合,证实了结果的准确性。另外,研究发现花期网络是由最近的全基因组倍增塑造的,这意味着,在数千万年中,古老的橫向同源基因(基因组中由于倍增产生的同源基因)都能在同一调控网络中保留下来。
研究构建了全基因组范围内的油脂代谢网络,在向日葵基因组中找到了与油脂合成相关的12条代谢通路,包含429个基因。通过对产油及不产油两个群体的80份材料进行FST分析,研究人员发现了与油脂代谢通路相关的基因在差异区域中能被富集;有9个油脂代谢相关基因在高油和低油品系中分化明显,在驯化后的育种过程中受到了人工选择。