参考:

https://zhuanlan.zhihu.com/p/61963366

一、目的

讲解二代测序如何从很短的reads拼接为一个完整的基因组(双端测序,如何对 paired-end 进行拼接)

二、单端测序

测序中最简单的办法,只有一种测序引物,使得PCR只能沿着这个引物的方向进行,所有的reads都只能按照一个方向进行读取。但是这带来了一些问题,以illumina为例,测序的质量会随着测序的进行而下降,所以reads越向后越不准确;后来,研究者们想出来的解决办法就是双端测序,对一个长为500bp的序列,单端测序下游质量会很差,但是从两个方向上分别测250bp-300bp然后再拼接起来,就可以大大提高测序的准确率了。

初学生信——双端测序原理-风君雪科技博客

三、双端测序

双端测序的接头序列比较复杂,首先在两个方向上分别进行测序,就需要有两个不同方向的测序引物(下图Rd1 SP和Rd2 SP);其次,为了区别两个方向的reads(分为read1和read2),其中一个测序引物前面要添加一小段index序列进行标记。

初学生信——双端测序原理-风君雪科技博客

在双端测序中,每一个read的长度都要超过整个待测序列的一半。所以。可以根据两个reads重合的部分进行拼接:

初学生信——双端测序原理-风君雪科技博客