描述
“简化基因组”这个词最早来源于简化基因组测序(reduced representation genome sequencing),而简化基因组测序是一个笼统的概念,属于一类测序方法的合称。简化基因组测序的最初目的是为了发现SNP位点以及基因组作图等。
实际上在历史上出现数个目前看来是属于“简化基因组”的测序方法之前,所发明的方法都是以其各自的特色命名,直到有多种类似方法诞生后,人们才从中总结出一些共性,把它们统一称作“简化基因组测序法”。这共性便是:所有这类方法所获得的文库都不是全基因组文库,但基于研究目的所需,认为所获得的文库足以代表整个基因组,涵盖了尽可能多的全基因组信息,且新文库在全基因组范围内分布较均匀。
技术优势
简化基因组之所以简化,就是因其对复杂的基因组进行筛选,得到了涵盖较多信息的文库,并基于此分析。因此简化基因组大幅降低测序成本,于是针对简化基因组文库,可适当增加测序深度,有利于微小突变的挖掘;此外,数据量小了,方便分析。
技术路线
限制性酶切位点关联 DNA 测序(RAD-seq)文库是RAD标签的集合(图2)。获得过程简单来说是对酶切后DNA片段加上可与酶切所得黏性末端序列互补的接头1,随机打断后,再加上非特异性接头2,利用识别接头1和接头2上的引物对进行PCR反应,只有分别带有接头1和接头2的酶切位点周边的DNA片段会得到有意义的扩增,即为RAD标签
描述
研究内容
常用于动物基因组研究的简化基因组测序技术主要有简化代表文库测序(reduced-representation libraries sequencing,RRLs)和限制性酶切位点关联 DNA 测序(restriction-site-associated DNA sequencing,RAD-seq),而后者在植物基因组与进化研究中也颇为频繁[1]。下面简单介绍这两种方法的原理。
信息分析内容
1.处理原始raw GBS数据
步骤 1:解析raw reads
步骤 2: 根据质量和接头进行过滤
步骤 3: Demultiplex (将multiplexed的reads根据index从不同或者同一个lane中分出,生成sample对应的fastg文件)
2.建立 Mock Reference
。步骤 4: 通过Reads聚类建立Mock Reference
3进行reads映射、标准比对
步骤 5: 用BWA-mem、SAMtools比对和 组装
·步骤 6:解析输出内容,生成variants矩阵
4.基因组变异检测和鉴定出个体的每个变异位点的基因型
步骤 7: 过滤变异和鉴定出个体的每个变异位点的基因型