Métodos para a avaliação da integração entre caracteres filogenéticos discretos
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/104/104131/tde-03122025-115505/ |
Resumo: | Filogenética é a área que busca compreender as relações existentes entre diferentes organismos no que diz respeito ao seu desenvolvimento e evolução. Uma questão fundamental é avaliar a integração e a modularidade de diferentes características de indivíduos. A integração refere-se a associação entre as características e a modularidade trata da investigação de grupos de caracteres que possuem mais dependência com uns do que com outros. Dentro desse campo de estudo, existem uma abundância de trabalhos com dados contínuos, porém há poucos artigos para o caso discreto. Neste trabalho propomos uma abordagem para avaliar a integração entre caracteres filogenéticos discretos, e para isso a metodologia consiste em dois passos. A primeira etapa é calcular a similaridade entre os caracteres, utilizando correlações simples (Pearson e Spearman) e com a utilização da topologia (Threshold Model e Phylogenetic Logistic Regression - PLR). Na utilização da PLR consideramos os valores absolutos dos coeficientes e o valor-p como medidas de associação. O segundo passo consiste em utilizar a informação obtida anteriormente para construir o Cluster hierárquico, a fim de se obter a visualização dos módulos. Utilizamos base de dados simulados dos modelos de Markov e Threshold. Para confrontar os resultados de cada técnica, empregamos três métricas: Rand Index (RI), Normalized Mutual nformation (NMI) e o Fowlkes Mallows Index (FMI). Assim, pudemos avaliar como a incorporação da informação sobre a filogenia impacta nas análises por meio da simulação dos dados. |
| id |
USP_d17ffec5184883c7bb32ae6a5b52b809 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-03122025-115505 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Métodos para a avaliação da integração entre caracteres filogenéticos discretosMethods for evaluation the integration between discrete phylogenetic charactersClusterClusterFilogeniaIntegraçãoIntegrationPhylogenetic logistic regressionPhylogenetic logistic regressionPhylogenyThreshold modelThreshold modelFilogenética é a área que busca compreender as relações existentes entre diferentes organismos no que diz respeito ao seu desenvolvimento e evolução. Uma questão fundamental é avaliar a integração e a modularidade de diferentes características de indivíduos. A integração refere-se a associação entre as características e a modularidade trata da investigação de grupos de caracteres que possuem mais dependência com uns do que com outros. Dentro desse campo de estudo, existem uma abundância de trabalhos com dados contínuos, porém há poucos artigos para o caso discreto. Neste trabalho propomos uma abordagem para avaliar a integração entre caracteres filogenéticos discretos, e para isso a metodologia consiste em dois passos. A primeira etapa é calcular a similaridade entre os caracteres, utilizando correlações simples (Pearson e Spearman) e com a utilização da topologia (Threshold Model e Phylogenetic Logistic Regression - PLR). Na utilização da PLR consideramos os valores absolutos dos coeficientes e o valor-p como medidas de associação. O segundo passo consiste em utilizar a informação obtida anteriormente para construir o Cluster hierárquico, a fim de se obter a visualização dos módulos. Utilizamos base de dados simulados dos modelos de Markov e Threshold. Para confrontar os resultados de cada técnica, empregamos três métricas: Rand Index (RI), Normalized Mutual nformation (NMI) e o Fowlkes Mallows Index (FMI). Assim, pudemos avaliar como a incorporação da informação sobre a filogenia impacta nas análises por meio da simulação dos dados.Phylogenetics is the field that aims to understand the relationships between different organisms in terms of their development and evolution. A key question in this area is how to analyze the integration and modularity of different characteristics of individuals. Integration refers to the association between characteristics, while modularity focuses on the investigation of groups of characters that have greater dependence on some than others. Despite the abundance of papers in this field that use continuous data, there are fewer papers that focus on the discrete case. In this paper, we present an approach for evaluating the integration between discrete phylogenetic characters, for this the methodology consisting of two steps. The first step is to calculate the similarity between characters using simple correlations (Pearson and Spearman) and by utilizing topology (Threshold Model and Phylogenetic Logistic Regression - PLR). In using PLR, we consider the absolute values of the coefficients and the p-value as measures of association. The second step involves using the information obtained in step one to build a hierarchical Cluster, in order to visualize modules. We use simulated datasets from Markov and Threshold models. To compare the results of each technique, we employ three metrics: Rand Index (RI), Normalized Mutual nformation (NMI) e o Fowlkes Mallows Index (FMI). This allows us to assess how incorporating phylogenetic information impacts the analyses through data simulation.Biblioteca Digitais de Teses e Dissertações da USPIzbicki, RafaelSilva, Maria Luiza Matos2024-09-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/104/104131/tde-03122025-115505/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-12-03T14:01:03Zoai:teses.usp.br:tde-03122025-115505Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-12-03T14:01:03Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Métodos para a avaliação da integração entre caracteres filogenéticos discretos Methods for evaluation the integration between discrete phylogenetic characters |
| title |
Métodos para a avaliação da integração entre caracteres filogenéticos discretos |
| spellingShingle |
Métodos para a avaliação da integração entre caracteres filogenéticos discretos Silva, Maria Luiza Matos Cluster Cluster Filogenia Integração Integration Phylogenetic logistic regression Phylogenetic logistic regression Phylogeny Threshold model Threshold model |
| title_short |
Métodos para a avaliação da integração entre caracteres filogenéticos discretos |
| title_full |
Métodos para a avaliação da integração entre caracteres filogenéticos discretos |
| title_fullStr |
Métodos para a avaliação da integração entre caracteres filogenéticos discretos |
| title_full_unstemmed |
Métodos para a avaliação da integração entre caracteres filogenéticos discretos |
| title_sort |
Métodos para a avaliação da integração entre caracteres filogenéticos discretos |
| author |
Silva, Maria Luiza Matos |
| author_facet |
Silva, Maria Luiza Matos |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Izbicki, Rafael |
| dc.contributor.author.fl_str_mv |
Silva, Maria Luiza Matos |
| dc.subject.por.fl_str_mv |
Cluster Cluster Filogenia Integração Integration Phylogenetic logistic regression Phylogenetic logistic regression Phylogeny Threshold model Threshold model |
| topic |
Cluster Cluster Filogenia Integração Integration Phylogenetic logistic regression Phylogenetic logistic regression Phylogeny Threshold model Threshold model |
| description |
Filogenética é a área que busca compreender as relações existentes entre diferentes organismos no que diz respeito ao seu desenvolvimento e evolução. Uma questão fundamental é avaliar a integração e a modularidade de diferentes características de indivíduos. A integração refere-se a associação entre as características e a modularidade trata da investigação de grupos de caracteres que possuem mais dependência com uns do que com outros. Dentro desse campo de estudo, existem uma abundância de trabalhos com dados contínuos, porém há poucos artigos para o caso discreto. Neste trabalho propomos uma abordagem para avaliar a integração entre caracteres filogenéticos discretos, e para isso a metodologia consiste em dois passos. A primeira etapa é calcular a similaridade entre os caracteres, utilizando correlações simples (Pearson e Spearman) e com a utilização da topologia (Threshold Model e Phylogenetic Logistic Regression - PLR). Na utilização da PLR consideramos os valores absolutos dos coeficientes e o valor-p como medidas de associação. O segundo passo consiste em utilizar a informação obtida anteriormente para construir o Cluster hierárquico, a fim de se obter a visualização dos módulos. Utilizamos base de dados simulados dos modelos de Markov e Threshold. Para confrontar os resultados de cada técnica, empregamos três métricas: Rand Index (RI), Normalized Mutual nformation (NMI) e o Fowlkes Mallows Index (FMI). Assim, pudemos avaliar como a incorporação da informação sobre a filogenia impacta nas análises por meio da simulação dos dados. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-09-24 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/104/104131/tde-03122025-115505/ |
| url |
https://www.teses.usp.br/teses/disponiveis/104/104131/tde-03122025-115505/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865492187702099968 |