Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por eng |
| Instituição de defesa: |
Universidade Presbiteriana Mackenzie
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://dspace.mackenzie.br/handle/10899/30606 |
Resumo: | A classificação de dados é um processo automático ou semi-automático que, utilizando Inteligência Artificial (IA), a relação das variáveis descritivas e de classificação de um conjunto de dados é aprendida por um algoritmo para uso a posteriori em situações onde o resultado da classe é desconhecido. Por muitos anos, o trabalho neste tópico tem tido como objetivo aumentar a taxa de acerto dos algoritmos. Entretanto, em aplicações no contexto da saúde, além da preocupação com o desempenho, também é necessário projetar algoritmos com resultado compreensível para o especialista responsável pela tomada de decisão. Dentre os problemas da medicina, um dos grandes focos de pesquisa neste período está relacionado a COVID. E o uso de IA pode auxiliar no diagnóstico precoce. Dentre os dados disponíveis de COVID-19, o exame de sangue é um procedimento típico realizado quando o paciente procura o hospital e o seu uso no diagnóstico permite, entre outras coisas, a reduzir a realização de outros exames de diagnóstico que pode impactar no tempo da detecção e nos gastos dos exames. Neste trabalho propõe-se o uso de redes neurais do tipo Self-Organizing Maps (SOM) como base para descobrir os fatores do exame de sangue que são mais relevantes no diagnóstico de COVID-19. O trabalho propões usar SOM e cálculo de entropia para criação de um modelo hierárquico semi supervisionado explicável, chamado TESSOM (de Tree-based Entropy Structured Self-Organizing Maps), o qual tem como característica ampliar a investigação de grupos de casos em que há maior sobreposição de classes (diagnóstico). Enquadrar o algoritmo TESSOM no contexto de Inteligência Artificial Explicável (XAI) permite que seja possível explicar os resultados ao especialista de uma forma simplificada. É demonstrado no trabalho que o uso do algoritmo TESSOM para identificação de atributos de exames de sangue pode auxiliar nas pesquisas sobre identificação de casos de COVID-19, além de possuir o desempenho 1,489% melhor em multicenários ao analisar uma base de 2207 casos de 3 hospitais no estado de São Paulo, Brasil. Este trabalho é um ponto de partida importante para que pesquisadores possam identificar atributos relevantes de exames de sangue não apenas para COVID-19, mas como apoio para diagnóstico de outras doenças. |
| id |
UPM_c63d9e30eeb201cb0d9695308dc90321 |
|---|---|
| oai_identifier_str |
oai:dspace.mackenzie.br:10899/30606 |
| network_acronym_str |
UPM |
| network_name_str |
Repositório Digital do Mackenzie |
| repository_id_str |
|
| spelling |
Sargiani, VagnerSilva, Leandro Augusto da2022-09-27T14:21:00Z2022-09-27T14:21:00Z2022-08-12https://dspace.mackenzie.br/handle/10899/30606A classificação de dados é um processo automático ou semi-automático que, utilizando Inteligência Artificial (IA), a relação das variáveis descritivas e de classificação de um conjunto de dados é aprendida por um algoritmo para uso a posteriori em situações onde o resultado da classe é desconhecido. Por muitos anos, o trabalho neste tópico tem tido como objetivo aumentar a taxa de acerto dos algoritmos. Entretanto, em aplicações no contexto da saúde, além da preocupação com o desempenho, também é necessário projetar algoritmos com resultado compreensível para o especialista responsável pela tomada de decisão. Dentre os problemas da medicina, um dos grandes focos de pesquisa neste período está relacionado a COVID. E o uso de IA pode auxiliar no diagnóstico precoce. Dentre os dados disponíveis de COVID-19, o exame de sangue é um procedimento típico realizado quando o paciente procura o hospital e o seu uso no diagnóstico permite, entre outras coisas, a reduzir a realização de outros exames de diagnóstico que pode impactar no tempo da detecção e nos gastos dos exames. Neste trabalho propõe-se o uso de redes neurais do tipo Self-Organizing Maps (SOM) como base para descobrir os fatores do exame de sangue que são mais relevantes no diagnóstico de COVID-19. O trabalho propões usar SOM e cálculo de entropia para criação de um modelo hierárquico semi supervisionado explicável, chamado TESSOM (de Tree-based Entropy Structured Self-Organizing Maps), o qual tem como característica ampliar a investigação de grupos de casos em que há maior sobreposição de classes (diagnóstico). Enquadrar o algoritmo TESSOM no contexto de Inteligência Artificial Explicável (XAI) permite que seja possível explicar os resultados ao especialista de uma forma simplificada. É demonstrado no trabalho que o uso do algoritmo TESSOM para identificação de atributos de exames de sangue pode auxiliar nas pesquisas sobre identificação de casos de COVID-19, além de possuir o desempenho 1,489% melhor em multicenários ao analisar uma base de 2207 casos de 3 hospitais no estado de São Paulo, Brasil. Este trabalho é um ponto de partida importante para que pesquisadores possam identificar atributos relevantes de exames de sangue não apenas para COVID-19, mas como apoio para diagnóstico de outras doenças.IPM - Instituto Presbiteriano MackenzieMackPesquisa - Fundo Mackenzie de PesquisaporengUniversidade Presbiteriana MackenzieAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessTESSOMself-organizing mapsentropiaXAIsuporte visualCOVID-19mineração de dadosAlgoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Digital do Mackenzieinstname:Universidade Presbiteriana Mackenzie (MACKENZIE)instacron:MACKENZIEhttp://lattes.cnpq.br/1396385111251741https://orcid.org/0000-0002-8671-3102http://lattes.cnpq.br/9363303337287168https://orcid.org/0000-0003-2144-9037Oliveira, Rogério dehttp://lattes.cnpq.br/3067732992972770Kitani, Edson Caoruhttp://lattes.cnpq.br/6731656353508097Vallim Filho, Arnaldo Rabello de AguiarSassi, Renato Joséhttp://lattes.cnpq.br/2511892257148568http://lattes.cnpq.br/8750334661789610https://orcid.org/0000-0001-5276-4895Data classification is an automatic or semi-automatic process that, utilizing Artificial Intelligence algorithms, learns the variable and class relationships of a data set for use a posteriori in situations where the class result is unknown. For many years, work on this topic has been aimed at increasing the hit rate of algorithms. However, when the problem is restricted to application in health care, besides the concern with performance, it is also necessary to design algorithms whose result is understandable by the specia- list responsible for making the decision. Among the problems in the field of medicine, a current research focus is related to COVID-19, in which AI algorithms may contribute to early diagnosis. Among the available COVID data, the blood test is a typical proce- dure performed when the patient seeks the hospital, and its use in the diagnosis allows reducing the need for other diagnostic tests that can impact the detection time and fi- nancial costs. In this work, we propose using Self-Organizing Maps (SOM) to discover attributes in blood test exams that are more relevant for COVID-19 diagnosis. The work applies SOM and entropy calculation in the definition of a hierarchical, semi-supervised and explainable model named TESSOM (Tree-based Entropy Structured Self-Organizing Maps), in which the main feature is enhancing the investigation of groups of cases with a higher level of class overlapping, as far as the diagnostic outcome is concerned. Framing the TESSOM algorithm in the context of Explainable Artificial Intelligence (XAI) makes it possible to explain the results to the expert in a simplified way. It is demonstrated in the work that the use of the TESSOM algorithm to identify attributes of blood tests can help the identification of COVID-19 cases, in addition to having a performance increase of 1.489% in multi scenarios when analyzing a base of 2207 cases from 3 hospitals in the state of S ̃ao Paulo, Brazil. This work is a starting point for researchers to identify rele- vant attributes of blood tests for COVID-19 and to support the diagnosis of other diseases.TESSOMself-organizing mapsentropyXAIvisual supportCOVID-19data miningBrasilEscola de Engenharia Mackenzie (EE)UPMEngenharia Elétrica e ComputaçãoEngenharia de ComputaçãoORIGINALVAGNER SARGIANI - protegido.pdfVAGNER SARGIANI - protegido.pdfVagner Sargianiapplication/pdf20944632https://dspace.mackenzie.br/bitstreams/8b1f3017-b090-48eb-a0fb-66da4539ae22/download7c6b0589d13c0e237105d92a05ad3ebaMD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://dspace.mackenzie.br/bitstreams/a1ae1624-ec6d-4d94-8510-bd65e0968bbb/downloade39d27027a6cc9cb039ad269a5db8e34MD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81997https://dspace.mackenzie.br/bitstreams/e69c501b-40e7-4b80-855c-c622953822d8/downloadfb735e1a8fa1feda568f1b61905f8d57MD53falseAnonymousREADTEXTVAGNER SARGIANI - protegido.pdf.txtVAGNER SARGIANI - protegido.pdf.txtExtracted texttext/plain209807https://dspace.mackenzie.br/bitstreams/773baf6f-7350-4614-ba43-1bd5980ea983/downloadc7ac793fe6aeb5dbbeb41a9451f06debMD54falseAnonymousREADTHUMBNAILVAGNER SARGIANI - protegido.pdf.jpgVAGNER SARGIANI - protegido.pdf.jpgGenerated Thumbnailimage/jpeg1198https://dspace.mackenzie.br/bitstreams/f9ad052b-7b7c-4587-a8ed-56e56b2a1fa3/download5eaa2f9185db09fcfac1f39adb1f9794MD55falseAnonymousREAD10899/306062023-01-05T06:09:58.524Zhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:dspace.mackenzie.br:10899/30606https://dspace.mackenzie.brBiblioteca Digital de Teses e Dissertaçõeshttp://tede.mackenzie.br/jspui/PRIhttps://adelpha-api.mackenzie.br/server/oai/repositorio@mackenzie.br||paola.damato@mackenzie.bropendoar:102772023-01-05T06:09:58Repositório Digital do Mackenzie - Universidade Presbiteriana Mackenzie (MACKENZIE)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIFByZXNiaXRlcmlhbmEgTWFja2VuemllIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBzZXUgdHJhYmFsaG8gKGluY2x1aW5kbyBvIHJlc3VtbykgcG9yIHRvZG8gbyBtdW5kbyBubyBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBQcmVzYml0ZXJpYW5hIE1hY2tlbnppZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgbyBzZXUgdHJhYmFsaG8gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBQcmVzYml0ZXJpYW5hIE1hY2tlbnppZSBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZG8gc2V1IHRyYWJhbGhvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkbyBzZXUgdHJhYmFsaG8gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc2V1IHRyYWJhbGhvIGNvbnRlbmhhIG1hdGVyaWFsIHF1ZSB2b2PDqiBuw6NvIHBvc3N1aSBhIHRpdHVsYXJpZGFkZSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHZvY8OqIGRlY2xhcmFyIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIFByZXNiaXRlcmlhbmEgTWFja2VuemllIG9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBkZSBwcm9wcmllZGFkZSBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZG8gc2V1IHRyYWJhbGhvIG9yYSBkZXBvc2l0YWRvLgoKQ0FTTyBPIFRSQUJBTEhPIE9SQSBERVBPU0lUQURPIFRFTkhBIFNJRE8gUkVTVUxUQURPIERFIFVNIFBBVFJPQ8ONTklPIE9VIEFQT0lPIERFIFVNQSBBR8OKTkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTyBRVUUgTsODTyBTRUpBIEEgVU5JVkVSU0lEQURFIFBSRVNCSVRFUklBTkEgTUFDS0VOWklFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCkEgVW5pdmVyc2lkYWRlIFByZXNiaXRlcmlhbmEgTWFja2VuemllIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRvIHNldSB0cmFiYWxobywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo= |
| dc.title.pt_BR.fl_str_mv |
Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19 |
| title |
Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19 |
| spellingShingle |
Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19 Sargiani, Vagner TESSOM self-organizing maps entropia XAI suporte visual COVID-19 mineração de dados |
| title_short |
Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19 |
| title_full |
Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19 |
| title_fullStr |
Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19 |
| title_full_unstemmed |
Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19 |
| title_sort |
Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19 |
| author |
Sargiani, Vagner |
| author_facet |
Sargiani, Vagner |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Sargiani, Vagner |
| dc.contributor.advisor1.fl_str_mv |
Silva, Leandro Augusto da |
| contributor_str_mv |
Silva, Leandro Augusto da |
| dc.subject.por.fl_str_mv |
TESSOM self-organizing maps entropia XAI suporte visual COVID-19 mineração de dados |
| topic |
TESSOM self-organizing maps entropia XAI suporte visual COVID-19 mineração de dados |
| description |
A classificação de dados é um processo automático ou semi-automático que, utilizando Inteligência Artificial (IA), a relação das variáveis descritivas e de classificação de um conjunto de dados é aprendida por um algoritmo para uso a posteriori em situações onde o resultado da classe é desconhecido. Por muitos anos, o trabalho neste tópico tem tido como objetivo aumentar a taxa de acerto dos algoritmos. Entretanto, em aplicações no contexto da saúde, além da preocupação com o desempenho, também é necessário projetar algoritmos com resultado compreensível para o especialista responsável pela tomada de decisão. Dentre os problemas da medicina, um dos grandes focos de pesquisa neste período está relacionado a COVID. E o uso de IA pode auxiliar no diagnóstico precoce. Dentre os dados disponíveis de COVID-19, o exame de sangue é um procedimento típico realizado quando o paciente procura o hospital e o seu uso no diagnóstico permite, entre outras coisas, a reduzir a realização de outros exames de diagnóstico que pode impactar no tempo da detecção e nos gastos dos exames. Neste trabalho propõe-se o uso de redes neurais do tipo Self-Organizing Maps (SOM) como base para descobrir os fatores do exame de sangue que são mais relevantes no diagnóstico de COVID-19. O trabalho propões usar SOM e cálculo de entropia para criação de um modelo hierárquico semi supervisionado explicável, chamado TESSOM (de Tree-based Entropy Structured Self-Organizing Maps), o qual tem como característica ampliar a investigação de grupos de casos em que há maior sobreposição de classes (diagnóstico). Enquadrar o algoritmo TESSOM no contexto de Inteligência Artificial Explicável (XAI) permite que seja possível explicar os resultados ao especialista de uma forma simplificada. É demonstrado no trabalho que o uso do algoritmo TESSOM para identificação de atributos de exames de sangue pode auxiliar nas pesquisas sobre identificação de casos de COVID-19, além de possuir o desempenho 1,489% melhor em multicenários ao analisar uma base de 2207 casos de 3 hospitais no estado de São Paulo, Brasil. Este trabalho é um ponto de partida importante para que pesquisadores possam identificar atributos relevantes de exames de sangue não apenas para COVID-19, mas como apoio para diagnóstico de outras doenças. |
| publishDate |
2022 |
| dc.date.accessioned.fl_str_mv |
2022-09-27T14:21:00Z |
| dc.date.available.fl_str_mv |
2022-09-27T14:21:00Z |
| dc.date.issued.fl_str_mv |
2022-08-12 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://dspace.mackenzie.br/handle/10899/30606 |
| url |
https://dspace.mackenzie.br/handle/10899/30606 |
| dc.language.iso.fl_str_mv |
por eng |
| language |
por eng |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Presbiteriana Mackenzie |
| publisher.none.fl_str_mv |
Universidade Presbiteriana Mackenzie |
| dc.source.none.fl_str_mv |
reponame:Repositório Digital do Mackenzie instname:Universidade Presbiteriana Mackenzie (MACKENZIE) instacron:MACKENZIE |
| instname_str |
Universidade Presbiteriana Mackenzie (MACKENZIE) |
| instacron_str |
MACKENZIE |
| institution |
MACKENZIE |
| reponame_str |
Repositório Digital do Mackenzie |
| collection |
Repositório Digital do Mackenzie |
| bitstream.url.fl_str_mv |
https://dspace.mackenzie.br/bitstreams/8b1f3017-b090-48eb-a0fb-66da4539ae22/download https://dspace.mackenzie.br/bitstreams/a1ae1624-ec6d-4d94-8510-bd65e0968bbb/download https://dspace.mackenzie.br/bitstreams/e69c501b-40e7-4b80-855c-c622953822d8/download https://dspace.mackenzie.br/bitstreams/773baf6f-7350-4614-ba43-1bd5980ea983/download https://dspace.mackenzie.br/bitstreams/f9ad052b-7b7c-4587-a8ed-56e56b2a1fa3/download |
| bitstream.checksum.fl_str_mv |
7c6b0589d13c0e237105d92a05ad3eba e39d27027a6cc9cb039ad269a5db8e34 fb735e1a8fa1feda568f1b61905f8d57 c7ac793fe6aeb5dbbeb41a9451f06deb 5eaa2f9185db09fcfac1f39adb1f9794 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Digital do Mackenzie - Universidade Presbiteriana Mackenzie (MACKENZIE) |
| repository.mail.fl_str_mv |
repositorio@mackenzie.br||paola.damato@mackenzie.br |
| _version_ |
1863649743758950400 |