【GS文献】植物育种中基因组选择的方法、模型及展望

zoukankan html css js c++ java

【GS文献】植物育种中基因组选择的方法、模型及展望
目录
1. GS/GP在植物育种中的角色
2. GP模型应用
3. GP模型的准确性
4. 植物育种的GS展望
5. 小结
Genomic SelectioninPlant Breeding: Methods,Models,and Perspectives
国际玉米小麦改良中心（CIMMYT）José Crossa 2017年发表在《Trends in Plant Science》上的综述。

1. GS/GP在植物育种中的角色
- 过去的植物育种主要借助分子标记辅助选择法（MAS）来进行表型选择（Phenotype selection， PS)。对于简单性状，使用QTL关联标记具有主效应，但对复杂性状、多环境及不同遗传背景的应用则显得困难。QTL定位的连锁分析主要基于双亲群体，与性状关联的标记效应较低（染色体重组率低）。
- 研究者又开始专注于非双亲群体和染色体片段的精细定位（高重组率），但针对的是一些重要的经济性状。微效的QTL受环境影响大，但高密度SNP芯片给了标记性状关联准确性的希望。
- 基因组选择（Genomic selection，GS）或基因组预测（Genomic-enabledprediction，GP）利用了所有的分子标记来进行表型的选择。
- GS/GP有两个方面应用：一是育种程式中早期世代的加性效应预测（比如双亲杂交的F2代选择），这种方法育种家更关注加性值（Additive values，BVs），而非整个遗传值，因此利用加性线性模型来评估标记效应就够了；另一个应用是预测个体的全部遗传值，同时考虑加性效应和非加性效应（显性和上位性效应）来评价品种的表现。使用多个环境的试验来预测品系的遗传值。
- G矩阵特点是分子标记远大于群体数目（在机器学习中就是特征大于案例），预测的难度和训练群体大小、性状遗传力、分子标记数目有关。
- GS流程：TRN训练群体（又称参考群体）需要表型和基因型，TST测试群体（又称候选群体）只需基因型。
- GS和玉米常规DH育种比较：一年两季
2. GP模型应用

GP准确性受几个遗传因素影响：
- 训练群的大小和遗传多样性，以及与测试群的亲缘关系；
- 性状的遗传力。低遗传力和低标记效应的复杂性状对GS是适用的，但高遗传力的复杂性状很少能用高效应的少量标记来预测。
- 针对不具有LD的大量分子标记控制的复杂性状，GP准确性较低，当遗传力和训练群体大小增加时，准确性上升。
将环境因素考虑进模型，构建多性状、多环境的方差-协方差矩阵与环境、性状及其互作之间的遗传相关性。

GP模型中p>>n（标记远远大于群体）的特点使得鉴定困难，易出现过拟合，可通过惩罚回归、变量选择、降维以及赋予GP模型权重等方法来优化。（作者在文章附件中提供了GS模型复杂度及解决办法，但我没找到）

从GBLUP到神经网络，一堆废话描述。

3. GP模型的准确性

RR-BLUP，KinshipGAUSS，BayesCp，BayesB，BaysianLASSO，random forest，regression，RFR等各种模型对于目标性状的预测准确性还算好，也没有太大差异，但把群体结构等因素考虑进去，准确性并没有提升多少。

动物育种中GP的模型一般是基于单一环境，但在植物育种中GxE互作是影响非常大的。

GxE 互作：基因型与环境互作

MxE 互作：分子标记与环境互作
分解标记效应到每一个环境中，环境视为固定效应（不知道理解的是否正确，详细信息只有在附件中查看）

机器学习：
一些研究应用机器学习中的分类器，如多层感知机MLP、概率神经网络PNN等来预测个体表现（如分类上、中、下三等），AUC评价指标。

CIMMYT的实践：
与传统育种相比，GS目的就是以更低的成本和更少的时间来实现更大的遗传增益，CIMMYT已经在玉米的双亲和多亲群体中进行了GS实施，来快速提升遗传增益。（*具体如何实施需要找更详细的资料**）

4. 植物育种的GS展望

将多性状多环境的GS与高通量表型相结合：
高通量表型平台（High-ThroughputPhenotyping，HTP）减少表型调查的成本，同时与系谱结合起来提升准确性。

种质资源的GS应用：
种质资源骨干材料选择，结合多性状、多环境选择，提高种质资源基因库，以便后续直接使用。

5. 小结
- 线性模型（如GBLUP）和机器学习算法已经能识别复杂模式，做出正确决策；基于核的方法（如RKHS）已广泛应用于植物基因组预测；在GBLUP基础上结合基因组和系谱的GxE，优化的几种统计模型在预测个体的准确性方面有了提升。
- 使用HTP如高强度高光谱图像技术，结合早期测试中的基因组和系谱信息，共同用于统计模型，通过增加选择强度来加速遗传增益。
- 深度学习，如神经网络的方法似乎有望提高基因组预测。基因组选择超过了家系繁育和MAS增强复杂性状的遗传增益，具有明显的优势。
- 开发基因库登录的GP模型对于未开发的访问以及繁殖计划的多样性将很重要，以加快发展并释放新基因型。
这篇综述有点长，有点啰嗦，本身没提供太多信息，最有价值的部分可能是它的附件。当有需要时，可查看其中引用的相应文献。
查看全文

相关阅读:
论二级域名收集的各种姿势
 我喜欢你是寂静的-聂鲁达
 早晨充满-聂鲁达
 KALI Linux更新源
 lodash throttle和debounce
lodash capitalize 首字母大写
 C# 格式化百分比
 c# PadLeft,PadRight用法
 对象名 XXX 无效。
lambda 分组后的count

原文地址：https://www.cnblogs.com/jessepeng/p/14044485.html

【GS文献】植物育种中基因组选择的方法、模型及展望

1. GS/GP在植物育种中的角色

2. GP模型应用

3. GP模型的准确性

4. 植物育种的GS展望

5. 小结