Aprendizagem de máquina para classificação de populações de soja para variáveis industriais com base em caracteres agronômicos

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Maik Oliveira Silva
Orientador(a): Larissa Pereira Ribeiro Teodoro
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Fundação Universidade Federal de Mato Grosso do Sul
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufms.br/handle/123456789/4485
Resumo: Soybean is an important food alternative in human nutrition, because it has a high protein quality. The great current challenge of genetic improvement programs is to increase grain yield and protein content and at least maintain oil content. Hence the importance of getting the oil or protein content with a high percentage of correct classification. One of the promising approaches for classifying variables and/or complex data sets is machine learning (AM). The objective was to classify groups of soybean genotypes according to industrial variables based on agronomic characters using AM techniques. The experiment was conducted in the 2019/2020 harvest at the Federal University of Mato Grosso do Sul, in Chapadão do Sul and at the State University of Mato Grosso do Sul, in Aquidauana. A randomized block design with two replications and 206 F2 soybean populations was used. The agronomic characters evaluated were: days to maturation (DM), height of insertion of the first pod (AIV, cm), plant height (AP, cm), number of branches (NR), diameter of the main stem (DHP, cm), mass of one hundred grains (MCG, g) and grain yield (PROD, kg ha-1). The models tested were: support vector machine (SVM), artificial neural networks (ANN), decision tree models J48 and REPTree (RT) and random forest (RF). Using AM techniques, accurate models were generated for classifying more complex variables that require more time to obtain them as oil and proteins in soybeans, based on agronomic traits, which are easier to measure. RF was the technique with the best performance and can be used to contribute to soybean breeding programs by classifying genotypes for industrial traits such as oil and protein content.
id UFMS_3de76fdd177133714476d71a4e105659
oai_identifier_str oai:repositorio.ufms.br:123456789/4485
network_acronym_str UFMS
network_name_str Repositório Institucional da UFMS
repository_id_str
spelling 2022-03-17T12:24:29Z2022-03-17T12:24:29Z2022https://repositorio.ufms.br/handle/123456789/4485Soybean is an important food alternative in human nutrition, because it has a high protein quality. The great current challenge of genetic improvement programs is to increase grain yield and protein content and at least maintain oil content. Hence the importance of getting the oil or protein content with a high percentage of correct classification. One of the promising approaches for classifying variables and/or complex data sets is machine learning (AM). The objective was to classify groups of soybean genotypes according to industrial variables based on agronomic characters using AM techniques. The experiment was conducted in the 2019/2020 harvest at the Federal University of Mato Grosso do Sul, in Chapadão do Sul and at the State University of Mato Grosso do Sul, in Aquidauana. A randomized block design with two replications and 206 F2 soybean populations was used. The agronomic characters evaluated were: days to maturation (DM), height of insertion of the first pod (AIV, cm), plant height (AP, cm), number of branches (NR), diameter of the main stem (DHP, cm), mass of one hundred grains (MCG, g) and grain yield (PROD, kg ha-1). The models tested were: support vector machine (SVM), artificial neural networks (ANN), decision tree models J48 and REPTree (RT) and random forest (RF). Using AM techniques, accurate models were generated for classifying more complex variables that require more time to obtain them as oil and proteins in soybeans, based on agronomic traits, which are easier to measure. RF was the technique with the best performance and can be used to contribute to soybean breeding programs by classifying genotypes for industrial traits such as oil and protein content.A soja é uma importante alternativa alimentar na nutrição humana, por apresentar alto teor de qualidade proteica. O grande desafio atual dos programas de melhoramento genético é aumentar a produtividade de grãos e o teor de proteína e, pelo menos, manter o teor de óleo. Por isso a importância de se alcançar classificações acuradas de genótipos para teor de óleo e proteína com alta porcentagem de classificação correta. Uma das abordagens promissoras para classificação de variáveis e/ou conjunto de dados complexos é a aprendizagem de máquina (AM). O objetivo foi classificar grupos de genótipos de soja quanto a variáveis industriais com base em caracteres agronômicos utilizando técnicas de AM. O experimento foi conduzido na safra 2019/2020 na Universidade Federal de Mato Grosso do Sul, em Chapadão do Sul e na Universidade Estadual de Mato Grosso do Sul, em Aquidauana. Foi utilizado o delineamento de blocos casualizados com duas repetições e 206 populações F2 de soja. Os caracteres agronômicos avaliados foram: dias para maturação (DM), altura de inserção da primeira vagem (AIV, cm), altura de plantas (AP, cm), número de ramificações (NR), diâmetro da haste principal (DHP, cm), massa de cem grãos (MCG, g) e produtividade de grãos (PROD, kg ha-1). Os modelos testados foram: máquina de vetor suporte (SVM), redes neurais artificiais (ANN), os modelos de árvores de decisão J48 e REPTree (RT) e floresta aleatória (RF). Utilizando técnicas de AM, gerou-se modelos acurados de classificação de variáveis mais complexas que demandam maior tempo para a sua obtenção como óleo e proteínas em soja, com base em caracteres agronômicos, que são de mais fácil mensuração. O RF foi a técnica com melhor desempenho e pode ser utilizada para contribuir com programas de melhoramento genético de soja por meio da classificação de genótipos quanto a caracteres industriais como teor de óleo e proteína.Fundação Universidade Federal de Mato Grosso do SulUFMSBrasilAprendizagem de máquina, Classificação de soja, Caracteres industriais, Caracteres agronômicos.Aprendizagem de máquina para classificação de populações de soja para variáveis industriais com base em caracteres agronômicosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisLarissa Pereira Ribeiro TeodoroMaik Oliveira Silvainfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMSinstname:Universidade Federal de Mato Grosso do Sul (UFMS)instacron:UFMSTHUMBNAILDissertação_Maik-Oliveira-Silva.pdf.jpgDissertação_Maik-Oliveira-Silva.pdf.jpgGenerated Thumbnailimage/jpeg1313https://repositorio.ufms.br/bitstream/123456789/4485/3/Disserta%c3%a7%c3%a3o_Maik-Oliveira-Silva.pdf.jpga68646dde7a303cfc2ae2c658592896bMD53TEXTDissertação_Maik-Oliveira-Silva.pdf.txtDissertação_Maik-Oliveira-Silva.pdf.txtExtracted texttext/plain34709https://repositorio.ufms.br/bitstream/123456789/4485/2/Disserta%c3%a7%c3%a3o_Maik-Oliveira-Silva.pdf.txt63f53dc11db72001c1972a02176604d7MD52ORIGINALDissertação_Maik-Oliveira-Silva.pdfDissertação_Maik-Oliveira-Silva.pdfapplication/pdf1013986https://repositorio.ufms.br/bitstream/123456789/4485/1/Disserta%c3%a7%c3%a3o_Maik-Oliveira-Silva.pdf5375cf8418368e79003c68b8948083c1MD51123456789/44852022-03-18 03:01:29.69oai:repositorio.ufms.br:123456789/4485Repositório InstitucionalPUBhttps://repositorio.ufms.br/oai/requestri.prograd@ufms.bropendoar:21242022-03-18T07:01:29Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)false
dc.title.pt_BR.fl_str_mv Aprendizagem de máquina para classificação de populações de soja para variáveis industriais com base em caracteres agronômicos
title Aprendizagem de máquina para classificação de populações de soja para variáveis industriais com base em caracteres agronômicos
spellingShingle Aprendizagem de máquina para classificação de populações de soja para variáveis industriais com base em caracteres agronômicos
Maik Oliveira Silva
Aprendizagem de máquina, Classificação de soja, Caracteres industriais, Caracteres agronômicos.
title_short Aprendizagem de máquina para classificação de populações de soja para variáveis industriais com base em caracteres agronômicos
title_full Aprendizagem de máquina para classificação de populações de soja para variáveis industriais com base em caracteres agronômicos
title_fullStr Aprendizagem de máquina para classificação de populações de soja para variáveis industriais com base em caracteres agronômicos
title_full_unstemmed Aprendizagem de máquina para classificação de populações de soja para variáveis industriais com base em caracteres agronômicos
title_sort Aprendizagem de máquina para classificação de populações de soja para variáveis industriais com base em caracteres agronômicos
author Maik Oliveira Silva
author_facet Maik Oliveira Silva
author_role author
dc.contributor.advisor1.fl_str_mv Larissa Pereira Ribeiro Teodoro
dc.contributor.author.fl_str_mv Maik Oliveira Silva
contributor_str_mv Larissa Pereira Ribeiro Teodoro
dc.subject.por.fl_str_mv Aprendizagem de máquina, Classificação de soja, Caracteres industriais, Caracteres agronômicos.
topic Aprendizagem de máquina, Classificação de soja, Caracteres industriais, Caracteres agronômicos.
description Soybean is an important food alternative in human nutrition, because it has a high protein quality. The great current challenge of genetic improvement programs is to increase grain yield and protein content and at least maintain oil content. Hence the importance of getting the oil or protein content with a high percentage of correct classification. One of the promising approaches for classifying variables and/or complex data sets is machine learning (AM). The objective was to classify groups of soybean genotypes according to industrial variables based on agronomic characters using AM techniques. The experiment was conducted in the 2019/2020 harvest at the Federal University of Mato Grosso do Sul, in Chapadão do Sul and at the State University of Mato Grosso do Sul, in Aquidauana. A randomized block design with two replications and 206 F2 soybean populations was used. The agronomic characters evaluated were: days to maturation (DM), height of insertion of the first pod (AIV, cm), plant height (AP, cm), number of branches (NR), diameter of the main stem (DHP, cm), mass of one hundred grains (MCG, g) and grain yield (PROD, kg ha-1). The models tested were: support vector machine (SVM), artificial neural networks (ANN), decision tree models J48 and REPTree (RT) and random forest (RF). Using AM techniques, accurate models were generated for classifying more complex variables that require more time to obtain them as oil and proteins in soybeans, based on agronomic traits, which are easier to measure. RF was the technique with the best performance and can be used to contribute to soybean breeding programs by classifying genotypes for industrial traits such as oil and protein content.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-03-17T12:24:29Z
dc.date.available.fl_str_mv 2022-03-17T12:24:29Z
dc.date.issued.fl_str_mv 2022
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufms.br/handle/123456789/4485
url https://repositorio.ufms.br/handle/123456789/4485
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Fundação Universidade Federal de Mato Grosso do Sul
dc.publisher.initials.fl_str_mv UFMS
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Fundação Universidade Federal de Mato Grosso do Sul
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMS
instname:Universidade Federal de Mato Grosso do Sul (UFMS)
instacron:UFMS
instname_str Universidade Federal de Mato Grosso do Sul (UFMS)
instacron_str UFMS
institution UFMS
reponame_str Repositório Institucional da UFMS
collection Repositório Institucional da UFMS
bitstream.url.fl_str_mv https://repositorio.ufms.br/bitstream/123456789/4485/3/Disserta%c3%a7%c3%a3o_Maik-Oliveira-Silva.pdf.jpg
https://repositorio.ufms.br/bitstream/123456789/4485/2/Disserta%c3%a7%c3%a3o_Maik-Oliveira-Silva.pdf.txt
https://repositorio.ufms.br/bitstream/123456789/4485/1/Disserta%c3%a7%c3%a3o_Maik-Oliveira-Silva.pdf
bitstream.checksum.fl_str_mv a68646dde7a303cfc2ae2c658592896b
63f53dc11db72001c1972a02176604d7
5375cf8418368e79003c68b8948083c1
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)
repository.mail.fl_str_mv ri.prograd@ufms.br
_version_ 1801678651078475776