Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Sant'anna, Isabela de Castro
Orientador(a): Cruz, Cosme Damião lattes
Banca de defesa: Nascimento, Moysés lattes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Viçosa
Programa de Pós-Graduação: Mestrado em Genética e Melhoramento
Departamento: Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me
País: BR
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://locus.ufv.br/handle/123456789/4801
Resumo: The correct classification of individuals has a top importance for the genetic variability preservation as well as to maximize gains. The multivariate statistical techniques commonly used in these situations are the Fisher and Anderson discriminant functions, allowing to allocate an initially unknown individual in a probably g population or predefined groups. However, for higher levels of similarity such as backcross populations these methods has proved to be inefficient. Currently, much has been Said about a new paradigm of computing, artificial neural networks, which can be used to solve many statistical problems as similar subjects grouping, time-series forecasting and in particular, the classification problems. The aim of this study was to conduct a comparative study between the Fisher and Anderson discriminant functions and artificial neural networks through the number of incorrect classifications of individuals known to belong to different simulated backcross with increasing levels of populations similarity. The dissimilarity, measured by Mahalanobis distance, was a concept of fundamental importance in the use of discrimination techniques, due the quantification of how much populations were divergent. Data collection was done through simulation using the software Genes. Each population generated was characterized by a set of elements measured by characteristics of a continuous distribution. The relations of relatives and hierarchical structuring were established considering genetically divergent populations, F1 hybrid and five generations of backcrossing in relation to each of the relatives, establishing measures of effectiveness of the tested methodologies. The phenotypic data of populations were used to establish the Fisher and Anderson discriminant function and the calculation of the apparent error rate (AER), which measures the number of incorrect classifications. The ERA Estimations were compared with those obtained by means of neural networks. The artificial neural network is shown as a promising technique to solve classification problems, once it had a number of incorrect individuals classifications smaller than the data obtained by the discriminant functions.
id UFV_3d60272b63ce0b9389b022f910fd44cf
oai_identifier_str oai:locus.ufv.br:123456789/4801
network_acronym_str UFV
network_name_str LOCUS Repositório Institucional da UFV
repository_id_str
spelling Sant'anna, Isabela de Castrohttp://lattes.cnpq.br/0822371511052579Bhering, Leonardo Lopeshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4764363E6Carneiro, Pedro Crescêncio Souzahttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4728227T6Cruz, Cosme Damiãohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6Nascimento, Moyséshttp://lattes.cnpq.br/65448874984949452015-03-26T13:42:32Z2015-01-212015-03-26T13:42:32Z2014-02-26SANT'ANNA, Isabela de Castro. Artificial neural networks to discriminate backcross populations with different degrees of similarity. 2014. 114 f. Dissertação (Mestrado em Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me) - Universidade Federal de Viçosa, Viçosa, 2014.http://locus.ufv.br/handle/123456789/4801The correct classification of individuals has a top importance for the genetic variability preservation as well as to maximize gains. The multivariate statistical techniques commonly used in these situations are the Fisher and Anderson discriminant functions, allowing to allocate an initially unknown individual in a probably g population or predefined groups. However, for higher levels of similarity such as backcross populations these methods has proved to be inefficient. Currently, much has been Said about a new paradigm of computing, artificial neural networks, which can be used to solve many statistical problems as similar subjects grouping, time-series forecasting and in particular, the classification problems. The aim of this study was to conduct a comparative study between the Fisher and Anderson discriminant functions and artificial neural networks through the number of incorrect classifications of individuals known to belong to different simulated backcross with increasing levels of populations similarity. The dissimilarity, measured by Mahalanobis distance, was a concept of fundamental importance in the use of discrimination techniques, due the quantification of how much populations were divergent. Data collection was done through simulation using the software Genes. Each population generated was characterized by a set of elements measured by characteristics of a continuous distribution. The relations of relatives and hierarchical structuring were established considering genetically divergent populations, F1 hybrid and five generations of backcrossing in relation to each of the relatives, establishing measures of effectiveness of the tested methodologies. The phenotypic data of populations were used to establish the Fisher and Anderson discriminant function and the calculation of the apparent error rate (AER), which measures the number of incorrect classifications. The ERA Estimations were compared with those obtained by means of neural networks. The artificial neural network is shown as a promising technique to solve classification problems, once it had a number of incorrect individuals classifications smaller than the data obtained by the discriminant functions.A correta classificação de indivíduos é de extrema importância para fins de preservação da variabilidade genética existente bem como para a maximização dos ganhos. As técnicas de estatística multivariada comumente utilizada nessas situações são as funções discriminantes de Fisher e de Anderson, que permitem alocar um indivíduo inicialmente desconhecido em uma das g populações prováveis ou grupos pré-definidos. Entretanto, para altos níveis de similaridade como é o caso de populações de retrocruzamentos esses métodos tem se mostrado pouco eficientes. Atualmente, muito se fala de um novo paradigma de computação, as redes neurais artificiais, que podem ser utilizadas para resolver diversos problemas da Estatística, como agrupamento de indivíduos similares, previsão de séries temporais e em especial, os problemas de classificação. O objetivo desse trabalho foi realizar um estudo comparativo entre as funções discriminantes de Fisher e de Anderson e as redes neurais artificiais quanto ao número de classificações incorretas de indivíduos sabidamente pertencentes a diferentes populações simuladas de retrocruzamento, com crescentes níveis de similaridade. A dissimilaridade, medida pela distância de Mahalanobis, foi um conceito de fundamental importância na utilização das técnicas de discriminação, pois quantificou o quanto as populações eram divergentes. A obtenção dos dados foi feita através de simulação utilizando o programa computacional Genes. Cada população, gerada por simulação, foi caracterizada por um conjunto de elementos mensurados por características de natureza contínua. Foram geradas considerados 50 locos independentes, cada qual com dois alelos. As relações de parentescos e a estruturação hierárquica foram estabelecidas considerando populações genitoras geneticamente divergentes, híbrido F1 e cinco gerações de retrocruzamento em relação a cada um dos genitores, permitindo estabelecer parâmetros de eficácia das metodologias testadas. Os dados fenotípicos das populações foram utilizados para estabelecimento da função discriminante de Fisher e Anderson e para o cálculo da taxa de erro aparente (TEA), que mede o xi número de classificações incorretas. As estimativas de TEA foram comparadas com as obtida por meio das Redes Neurais Artificiais. As redes neurais artificiais mostraram-se uma técnica promissora no que diz respeito a problemas de classificação, uma vez que apresentaram um número de classificações incorretas de indivíduos menor que os dados obtidos pelas funções discriminantes.Conselho Nacional de Desenvolvimento Científico e Tecnológicoapplication/pdfporUniversidade Federal de ViçosaMestrado em Genética e MelhoramentoUFVBRGenética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; MeMelhoramento genéticoAnálise discriminanteInteligência artificialRedes neuraisBreedingDiscriminant analysisArtificial intelligenceNeural networksCNPQ::CIENCIAS BIOLOGICAS::GENETICA::GENETICA QUANTITATIVARedes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridadeArtificial neural networks to discriminate backcross populations with different degrees of similarityinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdfapplication/pdf1270776https://locus.ufv.br//bitstream/123456789/4801/1/texto%20completo.pdf45ceec810d57392774ec214a30c1e3a3MD51TEXTtexto completo.pdf.txttexto completo.pdf.txtExtracted texttext/plain222116https://locus.ufv.br//bitstream/123456789/4801/2/texto%20completo.pdf.txtf5f3c00cb41a1450d9202be0cd36e438MD52THUMBNAILtexto completo.pdf.jpgtexto completo.pdf.jpgIM Thumbnailimage/jpeg3709https://locus.ufv.br//bitstream/123456789/4801/3/texto%20completo.pdf.jpgf4fdc54128ea8a0f76e60e72998c66e7MD53123456789/48012016-04-10 23:16:30.758oai:locus.ufv.br:123456789/4801Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452016-04-11T02:16:30LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false
dc.title.por.fl_str_mv Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade
dc.title.alternative.eng.fl_str_mv Artificial neural networks to discriminate backcross populations with different degrees of similarity
title Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade
spellingShingle Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade
Sant'anna, Isabela de Castro
Melhoramento genético
Análise discriminante
Inteligência artificial
Redes neurais
Breeding
Discriminant analysis
Artificial intelligence
Neural networks
CNPQ::CIENCIAS BIOLOGICAS::GENETICA::GENETICA QUANTITATIVA
title_short Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade
title_full Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade
title_fullStr Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade
title_full_unstemmed Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade
title_sort Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade
author Sant'anna, Isabela de Castro
author_facet Sant'anna, Isabela de Castro
author_role author
dc.contributor.authorLattes.por.fl_str_mv http://lattes.cnpq.br/0822371511052579
dc.contributor.author.fl_str_mv Sant'anna, Isabela de Castro
dc.contributor.advisor-co1.fl_str_mv Bhering, Leonardo Lopes
dc.contributor.advisor-co1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4764363E6
dc.contributor.advisor-co2.fl_str_mv Carneiro, Pedro Crescêncio Souza
dc.contributor.advisor-co2Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4728227T6
dc.contributor.advisor1.fl_str_mv Cruz, Cosme Damião
dc.contributor.advisor1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6
dc.contributor.referee1.fl_str_mv Nascimento, Moysés
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/6544887498494945
contributor_str_mv Bhering, Leonardo Lopes
Carneiro, Pedro Crescêncio Souza
Cruz, Cosme Damião
Nascimento, Moysés
dc.subject.por.fl_str_mv Melhoramento genético
Análise discriminante
Inteligência artificial
Redes neurais
topic Melhoramento genético
Análise discriminante
Inteligência artificial
Redes neurais
Breeding
Discriminant analysis
Artificial intelligence
Neural networks
CNPQ::CIENCIAS BIOLOGICAS::GENETICA::GENETICA QUANTITATIVA
dc.subject.eng.fl_str_mv Breeding
Discriminant analysis
Artificial intelligence
Neural networks
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS BIOLOGICAS::GENETICA::GENETICA QUANTITATIVA
description The correct classification of individuals has a top importance for the genetic variability preservation as well as to maximize gains. The multivariate statistical techniques commonly used in these situations are the Fisher and Anderson discriminant functions, allowing to allocate an initially unknown individual in a probably g population or predefined groups. However, for higher levels of similarity such as backcross populations these methods has proved to be inefficient. Currently, much has been Said about a new paradigm of computing, artificial neural networks, which can be used to solve many statistical problems as similar subjects grouping, time-series forecasting and in particular, the classification problems. The aim of this study was to conduct a comparative study between the Fisher and Anderson discriminant functions and artificial neural networks through the number of incorrect classifications of individuals known to belong to different simulated backcross with increasing levels of populations similarity. The dissimilarity, measured by Mahalanobis distance, was a concept of fundamental importance in the use of discrimination techniques, due the quantification of how much populations were divergent. Data collection was done through simulation using the software Genes. Each population generated was characterized by a set of elements measured by characteristics of a continuous distribution. The relations of relatives and hierarchical structuring were established considering genetically divergent populations, F1 hybrid and five generations of backcrossing in relation to each of the relatives, establishing measures of effectiveness of the tested methodologies. The phenotypic data of populations were used to establish the Fisher and Anderson discriminant function and the calculation of the apparent error rate (AER), which measures the number of incorrect classifications. The ERA Estimations were compared with those obtained by means of neural networks. The artificial neural network is shown as a promising technique to solve classification problems, once it had a number of incorrect individuals classifications smaller than the data obtained by the discriminant functions.
publishDate 2014
dc.date.issued.fl_str_mv 2014-02-26
dc.date.accessioned.fl_str_mv 2015-03-26T13:42:32Z
dc.date.available.fl_str_mv 2015-01-21
2015-03-26T13:42:32Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SANT'ANNA, Isabela de Castro. Artificial neural networks to discriminate backcross populations with different degrees of similarity. 2014. 114 f. Dissertação (Mestrado em Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me) - Universidade Federal de Viçosa, Viçosa, 2014.
dc.identifier.uri.fl_str_mv http://locus.ufv.br/handle/123456789/4801
identifier_str_mv SANT'ANNA, Isabela de Castro. Artificial neural networks to discriminate backcross populations with different degrees of similarity. 2014. 114 f. Dissertação (Mestrado em Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me) - Universidade Federal de Viçosa, Viçosa, 2014.
url http://locus.ufv.br/handle/123456789/4801
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.publisher.program.fl_str_mv Mestrado em Genética e Melhoramento
dc.publisher.initials.fl_str_mv UFV
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me
publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.source.none.fl_str_mv reponame:LOCUS Repositório Institucional da UFV
instname:Universidade Federal de Viçosa (UFV)
instacron:UFV
instname_str Universidade Federal de Viçosa (UFV)
instacron_str UFV
institution UFV
reponame_str LOCUS Repositório Institucional da UFV
collection LOCUS Repositório Institucional da UFV
bitstream.url.fl_str_mv https://locus.ufv.br//bitstream/123456789/4801/1/texto%20completo.pdf
https://locus.ufv.br//bitstream/123456789/4801/2/texto%20completo.pdf.txt
https://locus.ufv.br//bitstream/123456789/4801/3/texto%20completo.pdf.jpg
bitstream.checksum.fl_str_mv 45ceec810d57392774ec214a30c1e3a3
f5f3c00cb41a1450d9202be0cd36e438
f4fdc54128ea8a0f76e60e72998c66e7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)
repository.mail.fl_str_mv fabiojreis@ufv.br
_version_ 1794528716257230848