Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Sargiani, Vagner
Orientador(a): Silva, Leandro Augusto da
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
eng
Instituição de defesa: Universidade Presbiteriana Mackenzie
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
XAI
Link de acesso: https://dspace.mackenzie.br/handle/10899/30606
Resumo: A classificação de dados é um processo automático ou semi-automático que, utilizando Inteligência Artificial (IA), a relação das variáveis descritivas e de classificação de um conjunto de dados é aprendida por um algoritmo para uso a posteriori em situações onde o resultado da classe é desconhecido. Por muitos anos, o trabalho neste tópico tem tido como objetivo aumentar a taxa de acerto dos algoritmos. Entretanto, em aplicações no contexto da saúde, além da preocupação com o desempenho, também é necessário projetar algoritmos com resultado compreensível para o especialista responsável pela tomada de decisão. Dentre os problemas da medicina, um dos grandes focos de pesquisa neste período está relacionado a COVID. E o uso de IA pode auxiliar no diagnóstico precoce. Dentre os dados disponíveis de COVID-19, o exame de sangue é um procedimento típico realizado quando o paciente procura o hospital e o seu uso no diagnóstico permite, entre outras coisas, a reduzir a realização de outros exames de diagnóstico que pode impactar no tempo da detecção e nos gastos dos exames. Neste trabalho propõe-se o uso de redes neurais do tipo Self-Organizing Maps (SOM) como base para descobrir os fatores do exame de sangue que são mais relevantes no diagnóstico de COVID-19. O trabalho propões usar SOM e cálculo de entropia para criação de um modelo hierárquico semi supervisionado explicável, chamado TESSOM (de Tree-based Entropy Structured Self-Organizing Maps), o qual tem como característica ampliar a investigação de grupos de casos em que há maior sobreposição de classes (diagnóstico). Enquadrar o algoritmo TESSOM no contexto de Inteligência Artificial Explicável (XAI) permite que seja possível explicar os resultados ao especialista de uma forma simplificada. É demonstrado no trabalho que o uso do algoritmo TESSOM para identificação de atributos de exames de sangue pode auxiliar nas pesquisas sobre identificação de casos de COVID-19, além de possuir o desempenho 1,489% melhor em multicenários ao analisar uma base de 2207 casos de 3 hospitais no estado de São Paulo, Brasil. Este trabalho é um ponto de partida importante para que pesquisadores possam identificar atributos relevantes de exames de sangue não apenas para COVID-19, mas como apoio para diagnóstico de outras doenças.
id UPM_c63d9e30eeb201cb0d9695308dc90321
oai_identifier_str oai:dspace.mackenzie.br:10899/30606
network_acronym_str UPM
network_name_str Repositório Digital do Mackenzie
repository_id_str
spelling Sargiani, VagnerSilva, Leandro Augusto da2022-09-27T14:21:00Z2022-09-27T14:21:00Z2022-08-12https://dspace.mackenzie.br/handle/10899/30606A classificação de dados é um processo automático ou semi-automático que, utilizando Inteligência Artificial (IA), a relação das variáveis descritivas e de classificação de um conjunto de dados é aprendida por um algoritmo para uso a posteriori em situações onde o resultado da classe é desconhecido. Por muitos anos, o trabalho neste tópico tem tido como objetivo aumentar a taxa de acerto dos algoritmos. Entretanto, em aplicações no contexto da saúde, além da preocupação com o desempenho, também é necessário projetar algoritmos com resultado compreensível para o especialista responsável pela tomada de decisão. Dentre os problemas da medicina, um dos grandes focos de pesquisa neste período está relacionado a COVID. E o uso de IA pode auxiliar no diagnóstico precoce. Dentre os dados disponíveis de COVID-19, o exame de sangue é um procedimento típico realizado quando o paciente procura o hospital e o seu uso no diagnóstico permite, entre outras coisas, a reduzir a realização de outros exames de diagnóstico que pode impactar no tempo da detecção e nos gastos dos exames. Neste trabalho propõe-se o uso de redes neurais do tipo Self-Organizing Maps (SOM) como base para descobrir os fatores do exame de sangue que são mais relevantes no diagnóstico de COVID-19. O trabalho propões usar SOM e cálculo de entropia para criação de um modelo hierárquico semi supervisionado explicável, chamado TESSOM (de Tree-based Entropy Structured Self-Organizing Maps), o qual tem como característica ampliar a investigação de grupos de casos em que há maior sobreposição de classes (diagnóstico). Enquadrar o algoritmo TESSOM no contexto de Inteligência Artificial Explicável (XAI) permite que seja possível explicar os resultados ao especialista de uma forma simplificada. É demonstrado no trabalho que o uso do algoritmo TESSOM para identificação de atributos de exames de sangue pode auxiliar nas pesquisas sobre identificação de casos de COVID-19, além de possuir o desempenho 1,489% melhor em multicenários ao analisar uma base de 2207 casos de 3 hospitais no estado de São Paulo, Brasil. Este trabalho é um ponto de partida importante para que pesquisadores possam identificar atributos relevantes de exames de sangue não apenas para COVID-19, mas como apoio para diagnóstico de outras doenças.IPM - Instituto Presbiteriano MackenzieMackPesquisa - Fundo Mackenzie de PesquisaporengUniversidade Presbiteriana MackenzieAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessTESSOMself-organizing mapsentropiaXAIsuporte visualCOVID-19mineração de dadosAlgoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Digital do Mackenzieinstname:Universidade Presbiteriana Mackenzie (MACKENZIE)instacron:MACKENZIEhttp://lattes.cnpq.br/1396385111251741https://orcid.org/0000-0002-8671-3102http://lattes.cnpq.br/9363303337287168https://orcid.org/0000-0003-2144-9037Oliveira, Rogério dehttp://lattes.cnpq.br/3067732992972770Kitani, Edson Caoruhttp://lattes.cnpq.br/6731656353508097Vallim Filho, Arnaldo Rabello de AguiarSassi, Renato Joséhttp://lattes.cnpq.br/2511892257148568http://lattes.cnpq.br/8750334661789610https://orcid.org/0000-0001-5276-4895Data classification is an automatic or semi-automatic process that, utilizing Artificial Intelligence algorithms, learns the variable and class relationships of a data set for use a posteriori in situations where the class result is unknown. For many years, work on this topic has been aimed at increasing the hit rate of algorithms. However, when the problem is restricted to application in health care, besides the concern with performance, it is also necessary to design algorithms whose result is understandable by the specia- list responsible for making the decision. Among the problems in the field of medicine, a current research focus is related to COVID-19, in which AI algorithms may contribute to early diagnosis. Among the available COVID data, the blood test is a typical proce- dure performed when the patient seeks the hospital, and its use in the diagnosis allows reducing the need for other diagnostic tests that can impact the detection time and fi- nancial costs. In this work, we propose using Self-Organizing Maps (SOM) to discover attributes in blood test exams that are more relevant for COVID-19 diagnosis. The work applies SOM and entropy calculation in the definition of a hierarchical, semi-supervised and explainable model named TESSOM (Tree-based Entropy Structured Self-Organizing Maps), in which the main feature is enhancing the investigation of groups of cases with a higher level of class overlapping, as far as the diagnostic outcome is concerned. Framing the TESSOM algorithm in the context of Explainable Artificial Intelligence (XAI) makes it possible to explain the results to the expert in a simplified way. It is demonstrated in the work that the use of the TESSOM algorithm to identify attributes of blood tests can help the identification of COVID-19 cases, in addition to having a performance increase of 1.489% in multi scenarios when analyzing a base of 2207 cases from 3 hospitals in the state of S ̃ao Paulo, Brazil. This work is a starting point for researchers to identify rele- vant attributes of blood tests for COVID-19 and to support the diagnosis of other diseases.TESSOMself-organizing mapsentropyXAIvisual supportCOVID-19data miningBrasilEscola de Engenharia Mackenzie (EE)UPMEngenharia Elétrica e ComputaçãoEngenharia de ComputaçãoORIGINALVAGNER SARGIANI - protegido.pdfVAGNER SARGIANI - protegido.pdfVagner Sargianiapplication/pdf20944632https://dspace.mackenzie.br/bitstreams/8b1f3017-b090-48eb-a0fb-66da4539ae22/download7c6b0589d13c0e237105d92a05ad3ebaMD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://dspace.mackenzie.br/bitstreams/a1ae1624-ec6d-4d94-8510-bd65e0968bbb/downloade39d27027a6cc9cb039ad269a5db8e34MD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81997https://dspace.mackenzie.br/bitstreams/e69c501b-40e7-4b80-855c-c622953822d8/downloadfb735e1a8fa1feda568f1b61905f8d57MD53falseAnonymousREADTEXTVAGNER SARGIANI - protegido.pdf.txtVAGNER SARGIANI - protegido.pdf.txtExtracted texttext/plain209807https://dspace.mackenzie.br/bitstreams/773baf6f-7350-4614-ba43-1bd5980ea983/downloadc7ac793fe6aeb5dbbeb41a9451f06debMD54falseAnonymousREADTHUMBNAILVAGNER SARGIANI - protegido.pdf.jpgVAGNER SARGIANI - protegido.pdf.jpgGenerated Thumbnailimage/jpeg1198https://dspace.mackenzie.br/bitstreams/f9ad052b-7b7c-4587-a8ed-56e56b2a1fa3/download5eaa2f9185db09fcfac1f39adb1f9794MD55falseAnonymousREAD10899/306062023-01-05T06:09:58.524Zhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:dspace.mackenzie.br:10899/30606https://dspace.mackenzie.brBiblioteca Digital de Teses e Dissertaçõeshttp://tede.mackenzie.br/jspui/PRIhttps://adelpha-api.mackenzie.br/server/oai/repositorio@mackenzie.br||paola.damato@mackenzie.bropendoar:102772023-01-05T06:09:58Repositório Digital do Mackenzie - Universidade Presbiteriana Mackenzie (MACKENZIE)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIFByZXNiaXRlcmlhbmEgTWFja2VuemllIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBzZXUgdHJhYmFsaG8gKGluY2x1aW5kbyBvIHJlc3VtbykgcG9yIHRvZG8gbyBtdW5kbyBubyBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBQcmVzYml0ZXJpYW5hIE1hY2tlbnppZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgbyBzZXUgdHJhYmFsaG8gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBQcmVzYml0ZXJpYW5hIE1hY2tlbnppZSBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZG8gc2V1IHRyYWJhbGhvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkbyBzZXUgdHJhYmFsaG8gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc2V1IHRyYWJhbGhvIGNvbnRlbmhhIG1hdGVyaWFsIHF1ZSB2b2PDqiBuw6NvIHBvc3N1aSBhIHRpdHVsYXJpZGFkZSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHZvY8OqIGRlY2xhcmFyIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIFByZXNiaXRlcmlhbmEgTWFja2VuemllIG9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBkZSBwcm9wcmllZGFkZSBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZG8gc2V1IHRyYWJhbGhvIG9yYSBkZXBvc2l0YWRvLgoKQ0FTTyBPIFRSQUJBTEhPIE9SQSBERVBPU0lUQURPIFRFTkhBIFNJRE8gUkVTVUxUQURPIERFIFVNIFBBVFJPQ8ONTklPIE9VIEFQT0lPIERFIFVNQSBBR8OKTkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTyBRVUUgTsODTyBTRUpBIEEgVU5JVkVSU0lEQURFIFBSRVNCSVRFUklBTkEgTUFDS0VOWklFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCkEgVW5pdmVyc2lkYWRlIFByZXNiaXRlcmlhbmEgTWFja2VuemllIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRvIHNldSB0cmFiYWxobywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=
dc.title.pt_BR.fl_str_mv Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19
title Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19
spellingShingle Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19
Sargiani, Vagner
TESSOM
self-organizing maps
entropia
XAI
suporte visual
COVID-19
mineração de dados
title_short Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19
title_full Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19
title_fullStr Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19
title_full_unstemmed Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19
title_sort Algoritmo de árvore de decisão baseado em mapas auto-organizáveis: um estudo de caso em hemogramas de pacientes com COVID-19
author Sargiani, Vagner
author_facet Sargiani, Vagner
author_role author
dc.contributor.author.fl_str_mv Sargiani, Vagner
dc.contributor.advisor1.fl_str_mv Silva, Leandro Augusto da
contributor_str_mv Silva, Leandro Augusto da
dc.subject.por.fl_str_mv TESSOM
self-organizing maps
entropia
XAI
suporte visual
COVID-19
mineração de dados
topic TESSOM
self-organizing maps
entropia
XAI
suporte visual
COVID-19
mineração de dados
description A classificação de dados é um processo automático ou semi-automático que, utilizando Inteligência Artificial (IA), a relação das variáveis descritivas e de classificação de um conjunto de dados é aprendida por um algoritmo para uso a posteriori em situações onde o resultado da classe é desconhecido. Por muitos anos, o trabalho neste tópico tem tido como objetivo aumentar a taxa de acerto dos algoritmos. Entretanto, em aplicações no contexto da saúde, além da preocupação com o desempenho, também é necessário projetar algoritmos com resultado compreensível para o especialista responsável pela tomada de decisão. Dentre os problemas da medicina, um dos grandes focos de pesquisa neste período está relacionado a COVID. E o uso de IA pode auxiliar no diagnóstico precoce. Dentre os dados disponíveis de COVID-19, o exame de sangue é um procedimento típico realizado quando o paciente procura o hospital e o seu uso no diagnóstico permite, entre outras coisas, a reduzir a realização de outros exames de diagnóstico que pode impactar no tempo da detecção e nos gastos dos exames. Neste trabalho propõe-se o uso de redes neurais do tipo Self-Organizing Maps (SOM) como base para descobrir os fatores do exame de sangue que são mais relevantes no diagnóstico de COVID-19. O trabalho propões usar SOM e cálculo de entropia para criação de um modelo hierárquico semi supervisionado explicável, chamado TESSOM (de Tree-based Entropy Structured Self-Organizing Maps), o qual tem como característica ampliar a investigação de grupos de casos em que há maior sobreposição de classes (diagnóstico). Enquadrar o algoritmo TESSOM no contexto de Inteligência Artificial Explicável (XAI) permite que seja possível explicar os resultados ao especialista de uma forma simplificada. É demonstrado no trabalho que o uso do algoritmo TESSOM para identificação de atributos de exames de sangue pode auxiliar nas pesquisas sobre identificação de casos de COVID-19, além de possuir o desempenho 1,489% melhor em multicenários ao analisar uma base de 2207 casos de 3 hospitais no estado de São Paulo, Brasil. Este trabalho é um ponto de partida importante para que pesquisadores possam identificar atributos relevantes de exames de sangue não apenas para COVID-19, mas como apoio para diagnóstico de outras doenças.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-09-27T14:21:00Z
dc.date.available.fl_str_mv 2022-09-27T14:21:00Z
dc.date.issued.fl_str_mv 2022-08-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://dspace.mackenzie.br/handle/10899/30606
url https://dspace.mackenzie.br/handle/10899/30606
dc.language.iso.fl_str_mv por
eng
language por
eng
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Presbiteriana Mackenzie
publisher.none.fl_str_mv Universidade Presbiteriana Mackenzie
dc.source.none.fl_str_mv reponame:Repositório Digital do Mackenzie
instname:Universidade Presbiteriana Mackenzie (MACKENZIE)
instacron:MACKENZIE
instname_str Universidade Presbiteriana Mackenzie (MACKENZIE)
instacron_str MACKENZIE
institution MACKENZIE
reponame_str Repositório Digital do Mackenzie
collection Repositório Digital do Mackenzie
bitstream.url.fl_str_mv https://dspace.mackenzie.br/bitstreams/8b1f3017-b090-48eb-a0fb-66da4539ae22/download
https://dspace.mackenzie.br/bitstreams/a1ae1624-ec6d-4d94-8510-bd65e0968bbb/download
https://dspace.mackenzie.br/bitstreams/e69c501b-40e7-4b80-855c-c622953822d8/download
https://dspace.mackenzie.br/bitstreams/773baf6f-7350-4614-ba43-1bd5980ea983/download
https://dspace.mackenzie.br/bitstreams/f9ad052b-7b7c-4587-a8ed-56e56b2a1fa3/download
bitstream.checksum.fl_str_mv 7c6b0589d13c0e237105d92a05ad3eba
e39d27027a6cc9cb039ad269a5db8e34
fb735e1a8fa1feda568f1b61905f8d57
c7ac793fe6aeb5dbbeb41a9451f06deb
5eaa2f9185db09fcfac1f39adb1f9794
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Digital do Mackenzie - Universidade Presbiteriana Mackenzie (MACKENZIE)
repository.mail.fl_str_mv repositorio@mackenzie.br||paola.damato@mackenzie.br
_version_ 1863649743758950400