Métodos para a avaliação da integração entre caracteres filogenéticos discretos
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
| Programa de Pós-Graduação: |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.ufscar.br/handle/20.500.14289/21047 |
Resumo: | Phylogenetics is the field that aims to understand the relationships between different organisms in terms of their development and evolution. A key question in this area is how to analyze the integration and modularity of different characteristics of individuals. Integration refers to the association between characteristics, while modularity focuses on the investigation of groups of characters that have greater dependence on some than others. Despite the abundance of papers in this field that use continuous data, there are fewer papers that focus on the discrete case. In this paper, we present an approach for evaluating the integration between discrete phylogenetic characters, for this the methodology consisting of two steps. The first step is to calculate the similarity between characters using simple correlations (Pearson and Spearman) and by utilizing topology (Threshold Model and Phylogenetic Logistic Regression- PLR). In using PLR, we consider the absolute values of the coefficients and the p-value as measures of association. The second step involves using the information obtained in step one to build a hierarchical Cluster, in order to visualize modules. We use simulated datasets from Markov and Threshold models. To compare the results of each technique, we employ three metrics: Rand Index (RI), Normalized Mutual nformation (NMI) e o Fowlkes Mallows Index (FMI). This allows us to assess how incorporating phylogenetic information impacts the analyses through data simulation. |
| id |
SCAR_ded1f488ff455a7b093204e255dda580 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/21047 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
Silva, Maria Luiza MatosIzbicki, Rafaelhttp://lattes.cnpq.br/9991192137633896http://lattes.cnpq.br/68612271178826702024-11-22T12:27:24Z2024-11-22T12:27:24Z2024-09-24SILVA, Maria Luiza Matos. Métodos para a avaliação da integração entre caracteres filogenéticos discretos. 2024. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21047.https://repositorio.ufscar.br/handle/20.500.14289/21047Phylogenetics is the field that aims to understand the relationships between different organisms in terms of their development and evolution. A key question in this area is how to analyze the integration and modularity of different characteristics of individuals. Integration refers to the association between characteristics, while modularity focuses on the investigation of groups of characters that have greater dependence on some than others. Despite the abundance of papers in this field that use continuous data, there are fewer papers that focus on the discrete case. In this paper, we present an approach for evaluating the integration between discrete phylogenetic characters, for this the methodology consisting of two steps. The first step is to calculate the similarity between characters using simple correlations (Pearson and Spearman) and by utilizing topology (Threshold Model and Phylogenetic Logistic Regression- PLR). In using PLR, we consider the absolute values of the coefficients and the p-value as measures of association. The second step involves using the information obtained in step one to build a hierarchical Cluster, in order to visualize modules. We use simulated datasets from Markov and Threshold models. To compare the results of each technique, we employ three metrics: Rand Index (RI), Normalized Mutual nformation (NMI) e o Fowlkes Mallows Index (FMI). This allows us to assess how incorporating phylogenetic information impacts the analyses through data simulation.Filogenética é a área que busca compreender as relações existentes entre diferentes organismos no que diz respeito ao seu desenvolvimento e evolução. Uma questão fundamental é avaliar a integração e a modularidade de diferentes características de indivíduos. A integração refere-se a associação entre as características e a modularidade trata da investigação de grupos de caracteres que possuem mais dependência com uns do que com outros. Dentro desse campo de estudo, existem uma abundância de trabalhos com dados contínuos, porém há poucos artigos para o caso discreto. Neste trabalho propomos uma abordagem para avaliar a integração entre caracteres filogenéticos discretos, e para isso a metodologia consiste em dois passos. A primeira etapa é calcular a similaridade entre os caracteres, utilizando correlações simples (Pearson e Spearman) e com autilização da topologia (Threshold Model e Phylogenetic Logistic Regression- PLR). Na utilização da PLR consideramos os valores absolutos dos coeficientes e o valor-p como medidas de associação. O segundo passo consiste em utilizar a informação obtida anteriormente para construir o Cluster hierárquico, a fim de se obter a visualização dos módulos. Utilizamos base de dados simulados dos modelos de Markov e Threshold. Para confrontar os resultados de cada técnica, empregamos três métricas: Rand Index (RI), Normalized Mutual nformation (NMI) e o Fowlkes Mallows Index (FMI). Assim, pudemos avaliar como a incorporação da informação sobre a filogenia impacta nas análises por meio da simulação dos dados.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)CAPES: Código de financiamento 001porUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarAttribution-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessIntegraçãoFilogeniaPhylogenetic logistic regressionThreshold modelClusterCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICAMétodos para a avaliação da integração entre caracteres filogenéticos discretosMethods for evaluation the integration between discrete phylogenetic charactersinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARTEXTDissertacaoMestrado_MariaLuizaMatosSilva_defesa_revisado.pdf.txtDissertacaoMestrado_MariaLuizaMatosSilva_defesa_revisado.pdf.txtExtracted texttext/plain72341https://repositorio.ufscar.br/bitstreams/f5a63dea-1da9-4d01-b776-ea99ca6f5b9a/downloadee14ec0c9262d5391b37bdf48cdabb35MD53falseAnonymousREADTHUMBNAILDissertacaoMestrado_MariaLuizaMatosSilva_defesa_revisado.pdf.jpgDissertacaoMestrado_MariaLuizaMatosSilva_defesa_revisado.pdf.jpgGenerated Thumbnailimage/jpeg6387https://repositorio.ufscar.br/bitstreams/3e485b7b-3d39-4159-96f9-689febcaed7c/downloadfb60fe0af9852e7ebde0aa19e231501cMD54falseAnonymousREADORIGINALDissertacaoMestrado_MariaLuizaMatosSilva_defesa_revisado.pdfDissertacaoMestrado_MariaLuizaMatosSilva_defesa_revisado.pdfapplication/pdf1297139https://repositorio.ufscar.br/bitstreams/62438712-f951-4419-9195-d9a4ddb8fe3c/download33d4cb13d9705067bfd3b3f1558a5287MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8804https://repositorio.ufscar.br/bitstreams/1b74fdb4-a92c-4724-aa75-a6fd0a6e37d9/download4774e414fb27824b0dfca5f33e4ff24fMD52falseAnonymousREAD20.500.14289/210472025-02-06 04:10:31.526http://creativecommons.org/licenses/by-nd/3.0/br/Attribution-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/21047https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-06T07:10:31Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
| dc.title.por.fl_str_mv |
Métodos para a avaliação da integração entre caracteres filogenéticos discretos |
| dc.title.alternative.eng.fl_str_mv |
Methods for evaluation the integration between discrete phylogenetic characters |
| title |
Métodos para a avaliação da integração entre caracteres filogenéticos discretos |
| spellingShingle |
Métodos para a avaliação da integração entre caracteres filogenéticos discretos Silva, Maria Luiza Matos Integração Filogenia Phylogenetic logistic regression Threshold model Cluster CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| title_short |
Métodos para a avaliação da integração entre caracteres filogenéticos discretos |
| title_full |
Métodos para a avaliação da integração entre caracteres filogenéticos discretos |
| title_fullStr |
Métodos para a avaliação da integração entre caracteres filogenéticos discretos |
| title_full_unstemmed |
Métodos para a avaliação da integração entre caracteres filogenéticos discretos |
| title_sort |
Métodos para a avaliação da integração entre caracteres filogenéticos discretos |
| author |
Silva, Maria Luiza Matos |
| author_facet |
Silva, Maria Luiza Matos |
| author_role |
author |
| dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/6861227117882670 |
| dc.contributor.author.fl_str_mv |
Silva, Maria Luiza Matos |
| dc.contributor.advisor1.fl_str_mv |
Izbicki, Rafael |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/9991192137633896 |
| contributor_str_mv |
Izbicki, Rafael |
| dc.subject.por.fl_str_mv |
Integração Filogenia |
| topic |
Integração Filogenia Phylogenetic logistic regression Threshold model Cluster CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| dc.subject.eng.fl_str_mv |
Phylogenetic logistic regression Threshold model Cluster |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| description |
Phylogenetics is the field that aims to understand the relationships between different organisms in terms of their development and evolution. A key question in this area is how to analyze the integration and modularity of different characteristics of individuals. Integration refers to the association between characteristics, while modularity focuses on the investigation of groups of characters that have greater dependence on some than others. Despite the abundance of papers in this field that use continuous data, there are fewer papers that focus on the discrete case. In this paper, we present an approach for evaluating the integration between discrete phylogenetic characters, for this the methodology consisting of two steps. The first step is to calculate the similarity between characters using simple correlations (Pearson and Spearman) and by utilizing topology (Threshold Model and Phylogenetic Logistic Regression- PLR). In using PLR, we consider the absolute values of the coefficients and the p-value as measures of association. The second step involves using the information obtained in step one to build a hierarchical Cluster, in order to visualize modules. We use simulated datasets from Markov and Threshold models. To compare the results of each technique, we employ three metrics: Rand Index (RI), Normalized Mutual nformation (NMI) e o Fowlkes Mallows Index (FMI). This allows us to assess how incorporating phylogenetic information impacts the analyses through data simulation. |
| publishDate |
2024 |
| dc.date.accessioned.fl_str_mv |
2024-11-22T12:27:24Z |
| dc.date.available.fl_str_mv |
2024-11-22T12:27:24Z |
| dc.date.issued.fl_str_mv |
2024-09-24 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
SILVA, Maria Luiza Matos. Métodos para a avaliação da integração entre caracteres filogenéticos discretos. 2024. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21047. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/20.500.14289/21047 |
| identifier_str_mv |
SILVA, Maria Luiza Matos. Métodos para a avaliação da integração entre caracteres filogenéticos discretos. 2024. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21047. |
| url |
https://repositorio.ufscar.br/handle/20.500.14289/21047 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nd/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nd/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.publisher.program.fl_str_mv |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/f5a63dea-1da9-4d01-b776-ea99ca6f5b9a/download https://repositorio.ufscar.br/bitstreams/3e485b7b-3d39-4159-96f9-689febcaed7c/download https://repositorio.ufscar.br/bitstreams/62438712-f951-4419-9195-d9a4ddb8fe3c/download https://repositorio.ufscar.br/bitstreams/1b74fdb4-a92c-4724-aa75-a6fd0a6e37d9/download |
| bitstream.checksum.fl_str_mv |
ee14ec0c9262d5391b37bdf48cdabb35 fb60fe0af9852e7ebde0aa19e231501c 33d4cb13d9705067bfd3b3f1558a5287 4774e414fb27824b0dfca5f33e4ff24f |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688939972198400 |