Detecção de clusters espaciais através de otimização multiobjetivo
| Ano de defesa: | 2009 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Minas Gerais
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://hdl.handle.net/1843/RHCT-7U55SC |
Resumo: | Irregularly shaped spatial disease clusters occur commonly in epidemiological studies, but their geographic delineation is poorly defined. Most current spatial scan software usually displays only one of the many possible cluster solutions with different shapes, from the most compact round cluster to the most irregularly shaped one, corresponding to varying degrees of penalization parameters imposed to the freedom of shape. Even when a fairly complete set of solutions is available, the choice of the most appropriate parameter setting is left to the practitioner, whose decision is often subjective. We propose quantitative criteria for choosing the best cluster solution, through multi-objective optimization, by finding the Pareto-set in the solution space. Two competing objectives are involved in the search: regularity of shape, and scan statistic value. Instead of running sequentially a cluster finding algorithm with varying degrees of penalization, all solutions are found in parallel, employing a genetic algorithm. The method is fast, with good power of detection. The introduction of the concept of Pareto-set in this problem, followed by the choice of the most significant solution, is shown to allow a rigorous statement about what is a best solution, without the need of any arbitrary parameter. The cluster significance concept is extended for this set in a natural way through the use of the attainment function, being employed as a decision criterion for choosing the optimal solution. The Gumbel and Weibull models are used to approximate the empirical scan statistic distribution, speeding up the significance estimation. The multi-objective methodology is compared with the single-objective genetic algorithm. An application to breast cancer cluster detection is discussed. Finally, a knapsack approach is proposed for a relaxed version of the problem, allowing an upper bound to be obtained, in contrast with the lower bounds obtained by the genetic algorithm. |
| id |
UFMG_416c83fa83cf5679ca014cb072f0dc38 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufmg.br:1843/RHCT-7U55SC |
| network_acronym_str |
UFMG |
| network_name_str |
Repositório Institucional da UFMG |
| repository_id_str |
|
| spelling |
2019-08-12T22:20:35Z2025-09-09T00:55:50Z2019-08-12T22:20:35Z2009-03-19https://hdl.handle.net/1843/RHCT-7U55SCIrregularly shaped spatial disease clusters occur commonly in epidemiological studies, but their geographic delineation is poorly defined. Most current spatial scan software usually displays only one of the many possible cluster solutions with different shapes, from the most compact round cluster to the most irregularly shaped one, corresponding to varying degrees of penalization parameters imposed to the freedom of shape. Even when a fairly complete set of solutions is available, the choice of the most appropriate parameter setting is left to the practitioner, whose decision is often subjective. We propose quantitative criteria for choosing the best cluster solution, through multi-objective optimization, by finding the Pareto-set in the solution space. Two competing objectives are involved in the search: regularity of shape, and scan statistic value. Instead of running sequentially a cluster finding algorithm with varying degrees of penalization, all solutions are found in parallel, employing a genetic algorithm. The method is fast, with good power of detection. The introduction of the concept of Pareto-set in this problem, followed by the choice of the most significant solution, is shown to allow a rigorous statement about what is a best solution, without the need of any arbitrary parameter. The cluster significance concept is extended for this set in a natural way through the use of the attainment function, being employed as a decision criterion for choosing the optimal solution. The Gumbel and Weibull models are used to approximate the empirical scan statistic distribution, speeding up the significance estimation. The multi-objective methodology is compared with the single-objective genetic algorithm. An application to breast cancer cluster detection is discussed. Finally, a knapsack approach is proposed for a relaxed version of the problem, allowing an upper bound to be obtained, in contrast with the lower bounds obtained by the genetic algorithm.Universidade Federal de Minas Geraisotimização multiobjetivoconglomerados espaciaisinferência estatísticacomputação evolutivaEngenharia elétricaAlgoritmos genéticosDetecção de clusters espaciais através de otimização multiobjetivoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisAndre Luiz Fernandes Cancadoinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGLuiz Henrique DuczmalRicardo Hiroshi Caldeira TakahashiElizabeth Fialho WannerSueli Aparecida MingotiCarlos M. FonsecaEduardo Gontijo CarranoRodney Rezende SaldanhaClusters espaciais irregulares ocorrem com frequência em estudos epidemiológicos, mas seu delineamento geográfico é mal definido. Os métodos atuais de detecção encontram somente uma dentre as várias soluções possíveis, com formas diferentes, da mais compacta até a mais irregular, correspondentes aos variados graus de penalização impostos à liberdade de forma. E mesmo quando um conjunto completo de soluções está disponível, a escolha do parâmetro mais adequado é deixada a cargo do analista, cuja decisão é subjetiva. Propomos um critério quantitativo para a escolha da melhor solução através de otimização multiobjetivo, encontrando o conjunto Pareto-ótimo. Dois objetivos conflitantes estão envolvidos na busca: regularidade da forma e avaliação da estatística scan. Ao invés de executar sequencialmente um algoritmo de detecção de clusters variando o grau de penalização, todas as soluções são encontradas em paralelo, através de um algoritmo genético multiobjetivo. O método é rápido e apresenta bom poder de detecção. A introdução do conceito de conjunto de Pareto nesse problema, seguido da escolha da solução mais significativa, permite que a escolha da melhor solução seja rigorosa, mas sem a necessidade de nenhum parâmetro arbitrário. O conceito de significância do cluster é estendido de maneira natural através do uso da função de aproveitamento, sendo empregado como critério de decisão para escolha da melhor solução. Os modelos de Gumbel e Weibull são utilizados para aproximar a distribuição empírica da estatística scan, aumentando a velocidade de estimação da significância. Essa metodologia é comparada ao algoritmo genético mono-objetivo. Uma aplicação na detecção de cluster de câncer de mama é discutida. Por fim, o problema de detecção de clusters é relaxado e modelado como um problema knapsack, permitindo que se obtenha uma cota superior, em contraste com a cota inferior obtida pelo algoritmo genético.UFMGORIGINALandr__luiz_fernandes_can_ado.pdfapplication/pdf9126706https://repositorio.ufmg.br//bitstreams/ffbac787-0c24-4764-82fe-156bf61df73f/download190bb3e9ee362dad42bbc347ae3f2a08MD51trueAnonymousREADTEXTandr__luiz_fernandes_can_ado.pdf.txttext/plain192134https://repositorio.ufmg.br//bitstreams/e388779e-693d-41e6-a268-af5bc7286e8d/download39a538fc114b893661f6b1ecc46e93bbMD52falseAnonymousREAD1843/RHCT-7U55SC2025-09-08 21:55:50.818open.accessoai:repositorio.ufmg.br:1843/RHCT-7U55SChttps://repositorio.ufmg.br/Repositório InstitucionalPUBhttps://repositorio.ufmg.br/oairepositorio@ufmg.bropendoar:2025-09-09T00:55:50Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
| dc.title.none.fl_str_mv |
Detecção de clusters espaciais através de otimização multiobjetivo |
| title |
Detecção de clusters espaciais através de otimização multiobjetivo |
| spellingShingle |
Detecção de clusters espaciais através de otimização multiobjetivo Andre Luiz Fernandes Cancado Engenharia elétrica Algoritmos genéticos otimização multiobjetivo conglomerados espaciais inferência estatística computação evolutiva |
| title_short |
Detecção de clusters espaciais através de otimização multiobjetivo |
| title_full |
Detecção de clusters espaciais através de otimização multiobjetivo |
| title_fullStr |
Detecção de clusters espaciais através de otimização multiobjetivo |
| title_full_unstemmed |
Detecção de clusters espaciais através de otimização multiobjetivo |
| title_sort |
Detecção de clusters espaciais através de otimização multiobjetivo |
| author |
Andre Luiz Fernandes Cancado |
| author_facet |
Andre Luiz Fernandes Cancado |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Andre Luiz Fernandes Cancado |
| dc.subject.por.fl_str_mv |
Engenharia elétrica Algoritmos genéticos |
| topic |
Engenharia elétrica Algoritmos genéticos otimização multiobjetivo conglomerados espaciais inferência estatística computação evolutiva |
| dc.subject.other.none.fl_str_mv |
otimização multiobjetivo conglomerados espaciais inferência estatística computação evolutiva |
| description |
Irregularly shaped spatial disease clusters occur commonly in epidemiological studies, but their geographic delineation is poorly defined. Most current spatial scan software usually displays only one of the many possible cluster solutions with different shapes, from the most compact round cluster to the most irregularly shaped one, corresponding to varying degrees of penalization parameters imposed to the freedom of shape. Even when a fairly complete set of solutions is available, the choice of the most appropriate parameter setting is left to the practitioner, whose decision is often subjective. We propose quantitative criteria for choosing the best cluster solution, through multi-objective optimization, by finding the Pareto-set in the solution space. Two competing objectives are involved in the search: regularity of shape, and scan statistic value. Instead of running sequentially a cluster finding algorithm with varying degrees of penalization, all solutions are found in parallel, employing a genetic algorithm. The method is fast, with good power of detection. The introduction of the concept of Pareto-set in this problem, followed by the choice of the most significant solution, is shown to allow a rigorous statement about what is a best solution, without the need of any arbitrary parameter. The cluster significance concept is extended for this set in a natural way through the use of the attainment function, being employed as a decision criterion for choosing the optimal solution. The Gumbel and Weibull models are used to approximate the empirical scan statistic distribution, speeding up the significance estimation. The multi-objective methodology is compared with the single-objective genetic algorithm. An application to breast cancer cluster detection is discussed. Finally, a knapsack approach is proposed for a relaxed version of the problem, allowing an upper bound to be obtained, in contrast with the lower bounds obtained by the genetic algorithm. |
| publishDate |
2009 |
| dc.date.issued.fl_str_mv |
2009-03-19 |
| dc.date.accessioned.fl_str_mv |
2019-08-12T22:20:35Z 2025-09-09T00:55:50Z |
| dc.date.available.fl_str_mv |
2019-08-12T22:20:35Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1843/RHCT-7U55SC |
| url |
https://hdl.handle.net/1843/RHCT-7U55SC |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
| publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
| instname_str |
Universidade Federal de Minas Gerais (UFMG) |
| instacron_str |
UFMG |
| institution |
UFMG |
| reponame_str |
Repositório Institucional da UFMG |
| collection |
Repositório Institucional da UFMG |
| bitstream.url.fl_str_mv |
https://repositorio.ufmg.br//bitstreams/ffbac787-0c24-4764-82fe-156bf61df73f/download https://repositorio.ufmg.br//bitstreams/e388779e-693d-41e6-a268-af5bc7286e8d/download |
| bitstream.checksum.fl_str_mv |
190bb3e9ee362dad42bbc347ae3f2a08 39a538fc114b893661f6b1ecc46e93bb |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
| repository.mail.fl_str_mv |
repositorio@ufmg.br |
| _version_ |
1862105902300004352 |