背景:
单倍型的推断,或沿着相同染色体的等位基因序列,是遗传学中的基本问题,并且是许多分析的关键组分,包括混合物图谱,通过下降和插补识别身份区域。
基于测序读数的单倍型定相引起了很多关注。
已经广泛研究了两种单倍型互补的二倍体单倍型定相。
在这项工作中,我们专注于多倍体单倍型定相,我们的目标是从测序数据同时分阶段超过两个单倍型。
随着搜索空间变得更大并且单倍型不再需要互补,问题要复杂得多。
结果:
我们提出了两种算法,
(1)Poly-Harsh,一种基于Gibbs采样的算法,它可以替代地对单倍型和读取分配进行采样,以最小化读取和定相单倍型之间的错配,
(2)将单倍型区块连接成连续单倍型的有效算法。
结论:
我们的实验表明,与现有技术相比,我们的方法能够提高定相单倍型的质量。
据我们所知,
我们的单倍型块连接算法是第一种利用多个个体共享信息构建连续单倍型的算法。
我们的实验表明它既有效又有效。