GGE 可以理解为在主成分分析时, 分解的是G+GbyE,然后根据PC1和PC2作双标图,称为GGE Biplot。双标图经常用于农作物多点试验的数据分析,今天给大家介绍一下如何用GenStat实现GGE双标图。
l 做基因表达数据
l QTL效应——环境两向表
l 品种——性状两向表
l 双列杂交两向表
l 寄主——病原物两向表
l 基因型——遗传标记数据
l 环境条件——作物性状两向表
l 试验地点——气候土壤因素两向表
数据:论文中的原始数据,来源于1993年安大略冬小麦区试试验的数据,18个小麦品种在9个环境中的产量表现。第一列是18个小麦品种,第一行是9个不同的环境。
有四个双标图类型,下面讲解怎么通过GenStat来达到相同的效果?
1、Which-Won-Where View/哪个品种哪个环境中是最好的
2、Environmental VectorView/环境之间的关系
3、DiscriminatingAbility VS Representativeness View/区分力和代表性
4、Mean vs StabilityView/高产性和稳产性
它可以解决品种生态区划分、品种评价和试验点评价这三大问题。
GenStat具体实现如下:
首先对数据进行整理,数据分为三列内容:品种名、环境和产量三部分内容。
1、Which-Won-Where View/就是哪个品种哪个环境中是最好的
对应GenStat模型:
作图结果如下:
结果解读:
这张图主要是按照品种与环境的互作来说明各地点产量最高的品种。
1、 把各个方向上距离最远的点用直线连接起来,比如G8~G18~G7~G12~G13构成了一个五边形,通过中心对五条边做五条垂线,将双标图分为五个扇区,品种在五个扇区都有分布,品种分为两个扇区,E5和E7为一组,其它为一组。
2、 这张图可以得出:位于五边形顶角的品种是扇区内个环境下产量最高的品种,比如G18在环境E5和E7产量最高,品种G8在另外7个试验点产量最高。
2、Environmental Vector View/环境之间的关系
对应GenStat模型如下:
将产量(value)导入到Y-variate框中,将品种(cul)导入到Genotype框里面,将环境(env)导入到Environments框里面,在Options里面勾选Connect environment scores with origin。
作图如下:
结果解读:
1、 本图主要是分析各试验点之间在品种评价上的相似性。从中心到各个环境做一条线段,线段间的夹角和线段本身的长度都有一定的代表意义。
2、 两环境线段之间的夹角的余弦值是它们的相关系数,夹角小于90度表示正相关,说明两环境对品种排序相似,大于90度表示负相关,表示两环境对品种排序相反,等于90度说明两环境不相关。夹角较小说明试验点是重复设置的,去掉一个不影响对品种的评价。
3、 环境线段的长度是试验点对品种的区分能力,线段越长,区分能力越强。
4、 本图可以知道环境E1、E2、E3和E4存在正相关。E5和E7比其它点有较强的品种区分能力。
3、Discriminating Ability VS Representativeness View/区分力和代表性
对应GenStat模型:
作图结果如下:
本图一个显著的特征是它增加了两条直线,其中带箭头的直线为平均环境轴(Average Environment Axis),通过平均环境(箭头前面的圆圈)和中心点的连线。
结果解读:
1、 试验点线段和平均环境轴的角度是其对目标环境的代表性的度量,角度越小,代表性越强。如果一个试验点和平均环境轴夹角为钝角,则它不适合作为试验点。
2、 平均环境轴上箭头所指的方向是对试验点区分力和代表性两方面的评价。
3、 就区分力来说,E5和E7(线段最长)最好,就代表性而言,E1、E2、E3、E4最好(与平均轴夹角最小)。
4、 没有区分能力的试验点是无用的。
5、 有区分力但没有代表性的试验点可以淘汰不稳定的品种,但不能用于优良品种的选择。
6、 只有既有区分力又有代表性的试验点才能最好的选择高产稳产的品种。因此这张图是对试验点的一个综合评价。
4、Mean vs Stability View/即高产性和稳产性
对应GenStat模型:
作图结果如下:
结果解读:
1、 高产稳产功能图也需要环境平均轴(带箭头的直线),和平均环境值(直线上圆圈表示)。还有一条通过中心与环境平均轴垂直的直线。将品种点和平均环境轴做一条垂线。
2、 环境平均轴所指的方向是品种在所有环境下的近似平均产量的走向。可知G8平均产量株高,后面依次是G4、G10、G18,产量最低的是G12,后面依次是G14、G7、G13。品种G17的平均产量接近试验总平均。
3、 通过中心(原点)与平均轴垂直的线代表各品种与各环境相互作用的倾向性。品种与平均环境轴之间的垂线越长,表示品种越不稳定。可知G13(线段最长)最不稳定,其次是G8、G17、G7。比较稳产的是G12、G15、G16、G6、G4(与平均环境轴的垂线较短)。
4、 综合品种产量和稳定的指标,可以看出G4是一个比较高产稳产的品种,G8也高产,但是不稳产。虽然G12很稳产(它几乎就在平均环境轴上面),但是产量最低。
GGE双标图存在的问题及其解决方法:
双标图GGE是基于传统的固定效应模型,它有一些假定和局限性:
1、它要求数据平衡,即不能存在缺失值。
2、它要求各试验点各区组内条件完全一致。在区组较大时(如大于10个区组),假定很难实现。
3、固定效应模型假定各试验环境的误差同质
解决方法:
1、用混合线性模型或析因设计(FA),将品种当成随机效应,可以解决以上问题。
2、先用随机效应模型估计出各品种在各环境下的无偏估计值(BLUP),将BLUP值代替各环境品种的平均值作为基本数据进行GGE分析。
GenStat软件中GGE的优势
1、GenStat基于REML的混合线性模型可以将品种当成随机效应。
2、GenStat可以计算品种的BLUP值和BLUE值。
GenStat其它类型的GGE图:
以上内容是关于如何使用Genstat 实现GGE双标图,如果您也对此感兴趣,欢迎联系我们申请试用。