Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade
Ano de defesa: | 2014 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Viçosa
|
Programa de Pós-Graduação: |
Mestrado em Genética e Melhoramento
|
Departamento: |
Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me
|
País: |
BR
|
Palavras-chave em Português: | |
Palavras-chave em Inglês: | |
Área do conhecimento CNPq: | |
Link de acesso: | http://locus.ufv.br/handle/123456789/4801 |
Resumo: | The correct classification of individuals has a top importance for the genetic variability preservation as well as to maximize gains. The multivariate statistical techniques commonly used in these situations are the Fisher and Anderson discriminant functions, allowing to allocate an initially unknown individual in a probably g population or predefined groups. However, for higher levels of similarity such as backcross populations these methods has proved to be inefficient. Currently, much has been Said about a new paradigm of computing, artificial neural networks, which can be used to solve many statistical problems as similar subjects grouping, time-series forecasting and in particular, the classification problems. The aim of this study was to conduct a comparative study between the Fisher and Anderson discriminant functions and artificial neural networks through the number of incorrect classifications of individuals known to belong to different simulated backcross with increasing levels of populations similarity. The dissimilarity, measured by Mahalanobis distance, was a concept of fundamental importance in the use of discrimination techniques, due the quantification of how much populations were divergent. Data collection was done through simulation using the software Genes. Each population generated was characterized by a set of elements measured by characteristics of a continuous distribution. The relations of relatives and hierarchical structuring were established considering genetically divergent populations, F1 hybrid and five generations of backcrossing in relation to each of the relatives, establishing measures of effectiveness of the tested methodologies. The phenotypic data of populations were used to establish the Fisher and Anderson discriminant function and the calculation of the apparent error rate (AER), which measures the number of incorrect classifications. The ERA Estimations were compared with those obtained by means of neural networks. The artificial neural network is shown as a promising technique to solve classification problems, once it had a number of incorrect individuals classifications smaller than the data obtained by the discriminant functions. |
id |
UFV_3d60272b63ce0b9389b022f910fd44cf |
---|---|
oai_identifier_str |
oai:locus.ufv.br:123456789/4801 |
network_acronym_str |
UFV |
network_name_str |
LOCUS Repositório Institucional da UFV |
repository_id_str |
|
spelling |
Sant'anna, Isabela de Castrohttp://lattes.cnpq.br/0822371511052579Bhering, Leonardo Lopeshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4764363E6Carneiro, Pedro Crescêncio Souzahttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4728227T6Cruz, Cosme Damiãohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6Nascimento, Moyséshttp://lattes.cnpq.br/65448874984949452015-03-26T13:42:32Z2015-01-212015-03-26T13:42:32Z2014-02-26SANT'ANNA, Isabela de Castro. Artificial neural networks to discriminate backcross populations with different degrees of similarity. 2014. 114 f. Dissertação (Mestrado em Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me) - Universidade Federal de Viçosa, Viçosa, 2014.http://locus.ufv.br/handle/123456789/4801The correct classification of individuals has a top importance for the genetic variability preservation as well as to maximize gains. The multivariate statistical techniques commonly used in these situations are the Fisher and Anderson discriminant functions, allowing to allocate an initially unknown individual in a probably g population or predefined groups. However, for higher levels of similarity such as backcross populations these methods has proved to be inefficient. Currently, much has been Said about a new paradigm of computing, artificial neural networks, which can be used to solve many statistical problems as similar subjects grouping, time-series forecasting and in particular, the classification problems. The aim of this study was to conduct a comparative study between the Fisher and Anderson discriminant functions and artificial neural networks through the number of incorrect classifications of individuals known to belong to different simulated backcross with increasing levels of populations similarity. The dissimilarity, measured by Mahalanobis distance, was a concept of fundamental importance in the use of discrimination techniques, due the quantification of how much populations were divergent. Data collection was done through simulation using the software Genes. Each population generated was characterized by a set of elements measured by characteristics of a continuous distribution. The relations of relatives and hierarchical structuring were established considering genetically divergent populations, F1 hybrid and five generations of backcrossing in relation to each of the relatives, establishing measures of effectiveness of the tested methodologies. The phenotypic data of populations were used to establish the Fisher and Anderson discriminant function and the calculation of the apparent error rate (AER), which measures the number of incorrect classifications. The ERA Estimations were compared with those obtained by means of neural networks. The artificial neural network is shown as a promising technique to solve classification problems, once it had a number of incorrect individuals classifications smaller than the data obtained by the discriminant functions.A correta classificação de indivíduos é de extrema importância para fins de preservação da variabilidade genética existente bem como para a maximização dos ganhos. As técnicas de estatística multivariada comumente utilizada nessas situações são as funções discriminantes de Fisher e de Anderson, que permitem alocar um indivíduo inicialmente desconhecido em uma das g populações prováveis ou grupos pré-definidos. Entretanto, para altos níveis de similaridade como é o caso de populações de retrocruzamentos esses métodos tem se mostrado pouco eficientes. Atualmente, muito se fala de um novo paradigma de computação, as redes neurais artificiais, que podem ser utilizadas para resolver diversos problemas da Estatística, como agrupamento de indivíduos similares, previsão de séries temporais e em especial, os problemas de classificação. O objetivo desse trabalho foi realizar um estudo comparativo entre as funções discriminantes de Fisher e de Anderson e as redes neurais artificiais quanto ao número de classificações incorretas de indivíduos sabidamente pertencentes a diferentes populações simuladas de retrocruzamento, com crescentes níveis de similaridade. A dissimilaridade, medida pela distância de Mahalanobis, foi um conceito de fundamental importância na utilização das técnicas de discriminação, pois quantificou o quanto as populações eram divergentes. A obtenção dos dados foi feita através de simulação utilizando o programa computacional Genes. Cada população, gerada por simulação, foi caracterizada por um conjunto de elementos mensurados por características de natureza contínua. Foram geradas considerados 50 locos independentes, cada qual com dois alelos. As relações de parentescos e a estruturação hierárquica foram estabelecidas considerando populações genitoras geneticamente divergentes, híbrido F1 e cinco gerações de retrocruzamento em relação a cada um dos genitores, permitindo estabelecer parâmetros de eficácia das metodologias testadas. Os dados fenotípicos das populações foram utilizados para estabelecimento da função discriminante de Fisher e Anderson e para o cálculo da taxa de erro aparente (TEA), que mede o xi número de classificações incorretas. As estimativas de TEA foram comparadas com as obtida por meio das Redes Neurais Artificiais. As redes neurais artificiais mostraram-se uma técnica promissora no que diz respeito a problemas de classificação, uma vez que apresentaram um número de classificações incorretas de indivíduos menor que os dados obtidos pelas funções discriminantes.Conselho Nacional de Desenvolvimento Científico e Tecnológicoapplication/pdfporUniversidade Federal de ViçosaMestrado em Genética e MelhoramentoUFVBRGenética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; MeMelhoramento genéticoAnálise discriminanteInteligência artificialRedes neuraisBreedingDiscriminant analysisArtificial intelligenceNeural networksCNPQ::CIENCIAS BIOLOGICAS::GENETICA::GENETICA QUANTITATIVARedes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridadeArtificial neural networks to discriminate backcross populations with different degrees of similarityinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdfapplication/pdf1270776https://locus.ufv.br//bitstream/123456789/4801/1/texto%20completo.pdf45ceec810d57392774ec214a30c1e3a3MD51TEXTtexto completo.pdf.txttexto completo.pdf.txtExtracted texttext/plain222116https://locus.ufv.br//bitstream/123456789/4801/2/texto%20completo.pdf.txtf5f3c00cb41a1450d9202be0cd36e438MD52THUMBNAILtexto completo.pdf.jpgtexto completo.pdf.jpgIM Thumbnailimage/jpeg3709https://locus.ufv.br//bitstream/123456789/4801/3/texto%20completo.pdf.jpgf4fdc54128ea8a0f76e60e72998c66e7MD53123456789/48012016-04-10 23:16:30.758oai:locus.ufv.br:123456789/4801Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452016-04-11T02:16:30LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false |
dc.title.por.fl_str_mv |
Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade |
dc.title.alternative.eng.fl_str_mv |
Artificial neural networks to discriminate backcross populations with different degrees of similarity |
title |
Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade |
spellingShingle |
Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade Sant'anna, Isabela de Castro Melhoramento genético Análise discriminante Inteligência artificial Redes neurais Breeding Discriminant analysis Artificial intelligence Neural networks CNPQ::CIENCIAS BIOLOGICAS::GENETICA::GENETICA QUANTITATIVA |
title_short |
Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade |
title_full |
Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade |
title_fullStr |
Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade |
title_full_unstemmed |
Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade |
title_sort |
Redes neurais artificiais na discriminação de populações de retrocruzamento com diferentes graus de similaridade |
author |
Sant'anna, Isabela de Castro |
author_facet |
Sant'anna, Isabela de Castro |
author_role |
author |
dc.contributor.authorLattes.por.fl_str_mv |
http://lattes.cnpq.br/0822371511052579 |
dc.contributor.author.fl_str_mv |
Sant'anna, Isabela de Castro |
dc.contributor.advisor-co1.fl_str_mv |
Bhering, Leonardo Lopes |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4764363E6 |
dc.contributor.advisor-co2.fl_str_mv |
Carneiro, Pedro Crescêncio Souza |
dc.contributor.advisor-co2Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4728227T6 |
dc.contributor.advisor1.fl_str_mv |
Cruz, Cosme Damião |
dc.contributor.advisor1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6 |
dc.contributor.referee1.fl_str_mv |
Nascimento, Moysés |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/6544887498494945 |
contributor_str_mv |
Bhering, Leonardo Lopes Carneiro, Pedro Crescêncio Souza Cruz, Cosme Damião Nascimento, Moysés |
dc.subject.por.fl_str_mv |
Melhoramento genético Análise discriminante Inteligência artificial Redes neurais |
topic |
Melhoramento genético Análise discriminante Inteligência artificial Redes neurais Breeding Discriminant analysis Artificial intelligence Neural networks CNPQ::CIENCIAS BIOLOGICAS::GENETICA::GENETICA QUANTITATIVA |
dc.subject.eng.fl_str_mv |
Breeding Discriminant analysis Artificial intelligence Neural networks |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS BIOLOGICAS::GENETICA::GENETICA QUANTITATIVA |
description |
The correct classification of individuals has a top importance for the genetic variability preservation as well as to maximize gains. The multivariate statistical techniques commonly used in these situations are the Fisher and Anderson discriminant functions, allowing to allocate an initially unknown individual in a probably g population or predefined groups. However, for higher levels of similarity such as backcross populations these methods has proved to be inefficient. Currently, much has been Said about a new paradigm of computing, artificial neural networks, which can be used to solve many statistical problems as similar subjects grouping, time-series forecasting and in particular, the classification problems. The aim of this study was to conduct a comparative study between the Fisher and Anderson discriminant functions and artificial neural networks through the number of incorrect classifications of individuals known to belong to different simulated backcross with increasing levels of populations similarity. The dissimilarity, measured by Mahalanobis distance, was a concept of fundamental importance in the use of discrimination techniques, due the quantification of how much populations were divergent. Data collection was done through simulation using the software Genes. Each population generated was characterized by a set of elements measured by characteristics of a continuous distribution. The relations of relatives and hierarchical structuring were established considering genetically divergent populations, F1 hybrid and five generations of backcrossing in relation to each of the relatives, establishing measures of effectiveness of the tested methodologies. The phenotypic data of populations were used to establish the Fisher and Anderson discriminant function and the calculation of the apparent error rate (AER), which measures the number of incorrect classifications. The ERA Estimations were compared with those obtained by means of neural networks. The artificial neural network is shown as a promising technique to solve classification problems, once it had a number of incorrect individuals classifications smaller than the data obtained by the discriminant functions. |
publishDate |
2014 |
dc.date.issued.fl_str_mv |
2014-02-26 |
dc.date.accessioned.fl_str_mv |
2015-03-26T13:42:32Z |
dc.date.available.fl_str_mv |
2015-01-21 2015-03-26T13:42:32Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SANT'ANNA, Isabela de Castro. Artificial neural networks to discriminate backcross populations with different degrees of similarity. 2014. 114 f. Dissertação (Mestrado em Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me) - Universidade Federal de Viçosa, Viçosa, 2014. |
dc.identifier.uri.fl_str_mv |
http://locus.ufv.br/handle/123456789/4801 |
identifier_str_mv |
SANT'ANNA, Isabela de Castro. Artificial neural networks to discriminate backcross populations with different degrees of similarity. 2014. 114 f. Dissertação (Mestrado em Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me) - Universidade Federal de Viçosa, Viçosa, 2014. |
url |
http://locus.ufv.br/handle/123456789/4801 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.publisher.program.fl_str_mv |
Mestrado em Genética e Melhoramento |
dc.publisher.initials.fl_str_mv |
UFV |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Genética animal; Genética molecular e de microrganismos; Genética quantitativa; Genética vegetal; Me |
publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.source.none.fl_str_mv |
reponame:LOCUS Repositório Institucional da UFV instname:Universidade Federal de Viçosa (UFV) instacron:UFV |
instname_str |
Universidade Federal de Viçosa (UFV) |
instacron_str |
UFV |
institution |
UFV |
reponame_str |
LOCUS Repositório Institucional da UFV |
collection |
LOCUS Repositório Institucional da UFV |
bitstream.url.fl_str_mv |
https://locus.ufv.br//bitstream/123456789/4801/1/texto%20completo.pdf https://locus.ufv.br//bitstream/123456789/4801/2/texto%20completo.pdf.txt https://locus.ufv.br//bitstream/123456789/4801/3/texto%20completo.pdf.jpg |
bitstream.checksum.fl_str_mv |
45ceec810d57392774ec214a30c1e3a3 f5f3c00cb41a1450d9202be0cd36e438 f4fdc54128ea8a0f76e60e72998c66e7 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV) |
repository.mail.fl_str_mv |
fabiojreis@ufv.br |
_version_ |
1794528716257230848 |