摘要:双单倍体(DH)技术在玉米育种中得到了有效的应用。该技术在时间和纯合度方面均优于传统玉米育种。 DH技术的重要过程之一是单倍体种子的选择。选择单倍体的最常用方法是 R1-nj(纳瓦霍)颜色标记。这种颜色标记出现在种子胚乳和胚胎中。仅选择胚乳有色种子并持续到发芽阶段。这种选择通常是手动完成的。单倍体种子选择的自动化将增加成功率并减少劳动力和时间。在这项研究中,我们使用了 87 个单倍体和 326 个二倍体玉米种子作为数据集。使用了玉米种子胚的质地特征。这些特征是从灰度共生矩阵中获得的。特征向量使用决策树、k-最近邻和人工神经网络进行分类。机器学习技术的分类性能通过使用 10 折交叉验证方法进行测试。测试结果表明,决策树的性能最好,分类成功率为84.48%。
关键词:玉米;单倍体识别;纹理特征;GLCM;决策树;kNN;ANN
在这项研究中,使用了为之前的工作创建的数据集。该数据集包括 413 粒玉米种子,共 87 个单倍体和 326 个二倍体。 所有样品均作为玉米研究所2016年“国家玉米育种研究”项目的一部分收获。所有样品均来自RWS、RWK-76和“RWSxRWK-76”母源单倍体诱导剂150个基因型的杂交结果。样品的选择在胚胎和胚乳中具有不同的R1-nj表达(浅深色,无密色)。 根据 R1-nj 颜色标记手动完成样本的类别标签分配。 图 1 给出了数据集中单倍体和二倍体玉米种子的样本图像。
图1.(I)单倍体和(II)二倍体玉米种子的样本图像
确定在对数据集中随机选择的80粒玉米种子进行的测量中,统计学上的35像素半径代表胚孔。图2显示了二倍体玉米种子样本的种子质心和特征提取区域。
图2.样品种子、种子的质心和分割的胚区
单倍体和二倍体玉米种子在结构上彼此不同。纹理特征经常用于解决许多不同的模式识别问题。在这项研究中,纹理特征用于分离单倍体和二倍体玉米种子。从数据集中,样品单倍体和二倍体玉米种子胚的图像已在图3中给出。
图3.(I)单倍体和(II)二倍体玉米种子的胚胎图像
总共使用了48个纹理特征来表示数据集中的每个图像。带有边缘直方图的数据集中样本的分布如图4所示。单倍体样本用蓝色强调,而二倍体样本用橙色突出显示。可以看出,单倍体和二倍体标本是交织在一起的。这意味着将解决具有挑战性的分类任务。
图4.考虑总共48个纹理特征的记录分布