专栏:从浅入深系统了解高通量测序
前面我们通过“二代测序常见问题:基础篇(二)”二代测序常见问题:基础篇(二)了解了二代测序的基础问题,本期我们将继续深入探讨常见的测序数据如何分析。
1.SNP(单核苷酸多态性)和SNV(单核苷酸变异)的区别?
答:顾名思义,两者都与单核苷酸的畸变有关。
SNP是发生在基因组中特定位置的单个核苷酸的替代,其中每个变异在种群中都以超过1%的水平存在;例如,在人类基因组的一个特定的碱基位置上,大多数个体可能会出现C核苷酸,但在少数个体中,这个位置被一个A所占据。这意味着在这个特定的位置上有一个SNP,而C或A这两种可能的核苷酸变异被称为该位置的等位基因。单核苷酸多态性强调了我们对多种疾病易感性的差异(如镰状细胞性贫血、β-地中海贫血和囊性纤维化由单核苷酸多态性引起)。疾病的严重程度和身体对治疗的反应方式也是遗传变异的表现。例如,APOE(载脂蛋白E)基因的单碱基突变与阿尔茨海默病的低风险相关。
SNV是单个核苷酸中不受任何频率限制的变异,发生了变异的位置还没有被很好的描述,例如,它只在一个个体身上出现,可出现在体细胞中。体细胞单核苷酸变异(例如,由癌症引起)也可称为单核苷酸变异。
2.MutMap分析指的是什么?
答:MutMap即突变位点图谱,针对有参考基因组的突变体物种,通过目标性状差异构建两个极端的子代DNA池,检测功能性突变位点。比如将分离群体(如F2代)中具有突变性状的个体进行混池测序,同时对野生型亲本进行基因组测序,然后进行序列比对找出突变位点snp/indel。
MutMap指的是DNA全基因组重测序,EcMutMap是基于外显子组捕获的MutMap。
3.常说的功能注释中的GO、KEGG都是什么?
答:GO的全称是GeneOntology,是一套国际标准化的基因功能描述的分类系统。GO分为三大类:1)细胞组分(CellularComponent):用于描述亚细胞结构、位置和大分子复合物,如核仁、端粒和识别起始的复合物;2)分子功能(MolecularFunction):用于描述基因、基因产物个体的功能,如与碳水化合物结合或ATP水解酶活性等;3)生物过程(BiologicalProcess):用来描述基因编码的产物所参与的生物过程,如有丝分裂或嘌呤代谢等。GO数据库三大分类统计结果如下图:
注:图表示GO数据库的注释结果每根柱子代表1个GOTerm分类,每个颜色代表1个GOClass分类
KEGG全称为KyotoEncyclopediaofGenesandGenomes。系统分析基因产物和化合物在细胞中的代谢途径以及这些基因产物的功能的数据库。它整合了基因组、化学分子和生化系统等方面的数据,包括代谢通路(KEGGPATHWAY)、药物(KEGGDRUG)、疾病(KEGGDISEASE)、功能模型(KEGGMODULE)、基因序列(KEGGGENES)及基因组(KEGGGENOME)等等。KO(KEGGORTHOLOG)系统将各个KEGG注释系统联系在一起,KEGG已建立了一套完整KO注释的系统,可完成新测序物种的基因组或转录组的功能注释。绘制KEGG数据库中注释基因数目统计图如下:
注:纵坐标为KEGG代谢通路的名称,横坐标为注释到该通路下的基因数目及其数目占被注释上的基因总数的比例
如有相关问题,可在评论区留言,小编会一一为大家解答~