Métodos para a avaliação da integração entre caracteres filogenéticos discretos

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Silva, Maria Luiza Matos
Orientador(a): Izbicki, Rafael lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/20.500.14289/21047
Resumo: Phylogenetics is the field that aims to understand the relationships between different organisms in terms of their development and evolution. A key question in this area is how to analyze the integration and modularity of different characteristics of individuals. Integration refers to the association between characteristics, while modularity focuses on the investigation of groups of characters that have greater dependence on some than others. Despite the abundance of papers in this field that use continuous data, there are fewer papers that focus on the discrete case. In this paper, we present an approach for evaluating the integration between discrete phylogenetic characters, for this the methodology consisting of two steps. The first step is to calculate the similarity between characters using simple correlations (Pearson and Spearman) and by utilizing topology (Threshold Model and Phylogenetic Logistic Regression- PLR). In using PLR, we consider the absolute values of the coefficients and the p-value as measures of association. The second step involves using the information obtained in step one to build a hierarchical Cluster, in order to visualize modules. We use simulated datasets from Markov and Threshold models. To compare the results of each technique, we employ three metrics: Rand Index (RI), Normalized Mutual nformation (NMI) e o Fowlkes Mallows Index (FMI). This allows us to assess how incorporating phylogenetic information impacts the analyses through data simulation.
id SCAR_ded1f488ff455a7b093204e255dda580
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/21047
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Silva, Maria Luiza MatosIzbicki, Rafaelhttp://lattes.cnpq.br/9991192137633896http://lattes.cnpq.br/68612271178826702024-11-22T12:27:24Z2024-11-22T12:27:24Z2024-09-24SILVA, Maria Luiza Matos. Métodos para a avaliação da integração entre caracteres filogenéticos discretos. 2024. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21047.https://repositorio.ufscar.br/handle/20.500.14289/21047Phylogenetics is the field that aims to understand the relationships between different organisms in terms of their development and evolution. A key question in this area is how to analyze the integration and modularity of different characteristics of individuals. Integration refers to the association between characteristics, while modularity focuses on the investigation of groups of characters that have greater dependence on some than others. Despite the abundance of papers in this field that use continuous data, there are fewer papers that focus on the discrete case. In this paper, we present an approach for evaluating the integration between discrete phylogenetic characters, for this the methodology consisting of two steps. The first step is to calculate the similarity between characters using simple correlations (Pearson and Spearman) and by utilizing topology (Threshold Model and Phylogenetic Logistic Regression- PLR). In using PLR, we consider the absolute values of the coefficients and the p-value as measures of association. The second step involves using the information obtained in step one to build a hierarchical Cluster, in order to visualize modules. We use simulated datasets from Markov and Threshold models. To compare the results of each technique, we employ three metrics: Rand Index (RI), Normalized Mutual nformation (NMI) e o Fowlkes Mallows Index (FMI). This allows us to assess how incorporating phylogenetic information impacts the analyses through data simulation.Filogenética é a área que busca compreender as relações existentes entre diferentes organismos no que diz respeito ao seu desenvolvimento e evolução. Uma questão fundamental é avaliar a integração e a modularidade de diferentes características de indivíduos. A integração refere-se a associação entre as características e a modularidade trata da investigação de grupos de caracteres que possuem mais dependência com uns do que com outros. Dentro desse campo de estudo, existem uma abundância de trabalhos com dados contínuos, porém há poucos artigos para o caso discreto. Neste trabalho propomos uma abordagem para avaliar a integração entre caracteres filogenéticos discretos, e para isso a metodologia consiste em dois passos. A primeira etapa é calcular a similaridade entre os caracteres, utilizando correlações simples (Pearson e Spearman) e com autilização da topologia (Threshold Model e Phylogenetic Logistic Regression- PLR). Na utilização da PLR consideramos os valores absolutos dos coeficientes e o valor-p como medidas de associação. O segundo passo consiste em utilizar a informação obtida anteriormente para construir o Cluster hierárquico, a fim de se obter a visualização dos módulos. Utilizamos base de dados simulados dos modelos de Markov e Threshold. Para confrontar os resultados de cada técnica, empregamos três métricas: Rand Index (RI), Normalized Mutual nformation (NMI) e o Fowlkes Mallows Index (FMI). Assim, pudemos avaliar como a incorporação da informação sobre a filogenia impacta nas análises por meio da simulação dos dados.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)CAPES: Código de financiamento 001porUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarAttribution-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessIntegraçãoFilogeniaPhylogenetic logistic regressionThreshold modelClusterCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICAMétodos para a avaliação da integração entre caracteres filogenéticos discretosMethods for evaluation the integration between discrete phylogenetic charactersinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARTEXTDissertacaoMestrado_MariaLuizaMatosSilva_defesa_revisado.pdf.txtDissertacaoMestrado_MariaLuizaMatosSilva_defesa_revisado.pdf.txtExtracted texttext/plain72341https://repositorio.ufscar.br/bitstreams/f5a63dea-1da9-4d01-b776-ea99ca6f5b9a/downloadee14ec0c9262d5391b37bdf48cdabb35MD53falseAnonymousREADTHUMBNAILDissertacaoMestrado_MariaLuizaMatosSilva_defesa_revisado.pdf.jpgDissertacaoMestrado_MariaLuizaMatosSilva_defesa_revisado.pdf.jpgGenerated Thumbnailimage/jpeg6387https://repositorio.ufscar.br/bitstreams/3e485b7b-3d39-4159-96f9-689febcaed7c/downloadfb60fe0af9852e7ebde0aa19e231501cMD54falseAnonymousREADORIGINALDissertacaoMestrado_MariaLuizaMatosSilva_defesa_revisado.pdfDissertacaoMestrado_MariaLuizaMatosSilva_defesa_revisado.pdfapplication/pdf1297139https://repositorio.ufscar.br/bitstreams/62438712-f951-4419-9195-d9a4ddb8fe3c/download33d4cb13d9705067bfd3b3f1558a5287MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8804https://repositorio.ufscar.br/bitstreams/1b74fdb4-a92c-4724-aa75-a6fd0a6e37d9/download4774e414fb27824b0dfca5f33e4ff24fMD52falseAnonymousREAD20.500.14289/210472025-02-06 04:10:31.526http://creativecommons.org/licenses/by-nd/3.0/br/Attribution-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/21047https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-06T07:10:31Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Métodos para a avaliação da integração entre caracteres filogenéticos discretos
dc.title.alternative.eng.fl_str_mv Methods for evaluation the integration between discrete phylogenetic characters
title Métodos para a avaliação da integração entre caracteres filogenéticos discretos
spellingShingle Métodos para a avaliação da integração entre caracteres filogenéticos discretos
Silva, Maria Luiza Matos
Integração
Filogenia
Phylogenetic logistic regression
Threshold model
Cluster
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
title_short Métodos para a avaliação da integração entre caracteres filogenéticos discretos
title_full Métodos para a avaliação da integração entre caracteres filogenéticos discretos
title_fullStr Métodos para a avaliação da integração entre caracteres filogenéticos discretos
title_full_unstemmed Métodos para a avaliação da integração entre caracteres filogenéticos discretos
title_sort Métodos para a avaliação da integração entre caracteres filogenéticos discretos
author Silva, Maria Luiza Matos
author_facet Silva, Maria Luiza Matos
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/6861227117882670
dc.contributor.author.fl_str_mv Silva, Maria Luiza Matos
dc.contributor.advisor1.fl_str_mv Izbicki, Rafael
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/9991192137633896
contributor_str_mv Izbicki, Rafael
dc.subject.por.fl_str_mv Integração
Filogenia
topic Integração
Filogenia
Phylogenetic logistic regression
Threshold model
Cluster
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
dc.subject.eng.fl_str_mv Phylogenetic logistic regression
Threshold model
Cluster
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
description Phylogenetics is the field that aims to understand the relationships between different organisms in terms of their development and evolution. A key question in this area is how to analyze the integration and modularity of different characteristics of individuals. Integration refers to the association between characteristics, while modularity focuses on the investigation of groups of characters that have greater dependence on some than others. Despite the abundance of papers in this field that use continuous data, there are fewer papers that focus on the discrete case. In this paper, we present an approach for evaluating the integration between discrete phylogenetic characters, for this the methodology consisting of two steps. The first step is to calculate the similarity between characters using simple correlations (Pearson and Spearman) and by utilizing topology (Threshold Model and Phylogenetic Logistic Regression- PLR). In using PLR, we consider the absolute values of the coefficients and the p-value as measures of association. The second step involves using the information obtained in step one to build a hierarchical Cluster, in order to visualize modules. We use simulated datasets from Markov and Threshold models. To compare the results of each technique, we employ three metrics: Rand Index (RI), Normalized Mutual nformation (NMI) e o Fowlkes Mallows Index (FMI). This allows us to assess how incorporating phylogenetic information impacts the analyses through data simulation.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-11-22T12:27:24Z
dc.date.available.fl_str_mv 2024-11-22T12:27:24Z
dc.date.issued.fl_str_mv 2024-09-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Maria Luiza Matos. Métodos para a avaliação da integração entre caracteres filogenéticos discretos. 2024. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21047.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/20.500.14289/21047
identifier_str_mv SILVA, Maria Luiza Matos. Métodos para a avaliação da integração entre caracteres filogenéticos discretos. 2024. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21047.
url https://repositorio.ufscar.br/handle/20.500.14289/21047
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/f5a63dea-1da9-4d01-b776-ea99ca6f5b9a/download
https://repositorio.ufscar.br/bitstreams/3e485b7b-3d39-4159-96f9-689febcaed7c/download
https://repositorio.ufscar.br/bitstreams/62438712-f951-4419-9195-d9a4ddb8fe3c/download
https://repositorio.ufscar.br/bitstreams/1b74fdb4-a92c-4724-aa75-a6fd0a6e37d9/download
bitstream.checksum.fl_str_mv ee14ec0c9262d5391b37bdf48cdabb35
fb60fe0af9852e7ebde0aa19e231501c
33d4cb13d9705067bfd3b3f1558a5287
4774e414fb27824b0dfca5f33e4ff24f
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688939972198400