Uma abordagem baseada em dados para triagem de transtorno do espectro autista

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Gomes, Maísa Fernandes
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
dARK ID: ark:/33523/001300000vh5n
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.udesc.br/handle/UDESC/20963
Resumo: A evolução da Inteligência Artificial (IA) e do Aprendizado de Máquina (ML) tem impulsionado avanços significativos no setor da saúde, permitindo a automação de tarefas complexas e aprimorando diagnósticos médicos. Diversos estudos na literatura exploram o uso de modelos de ML para auxiliar no diagnóstico precoce, acelerando o processo de tratamento. Um exemplo relevante é o Transtorno do Espectro Autista (TEA), uma condição atípica sem cura, mas cujo tratamento com Terapias Especiais, especialmente em idades iniciais, traz benefícios significativos ao desenvolvimento de pessoas autistas. Atualmente, o diagnóstico formal de TEA é desafiador, pois não existe uma causa única identificada. O processo envolve uma equipe multidisciplinar que realiza testes psicológicos, exames de imagem, genéticos e de sangue para auxiliar na identificação do transtorno. Embora trabalhos existentes na literatura utilizem modelos de ML para apoiar o diagnóstico, muitos dependem de dados extraídos de exames médicos, o que nem sempre reflete a realidade de hospitais e provedores de saúde interessados no rastreamento do TEA. Esses provedores, muitas vezes, não dispõem de dados de diagnóstico for mal, tornando essencial o desenvolvimento de uma base de dados alternativa que possa viabilizar análises preditivas em contextos reais. A adoção de metodologias estruturadas, como o CRISP-DM, é fundamental no desenvolvimento de modelos de ML, pois contribui para maior assertividade, eficiência e organização ao longo de todo o processo. Neste estudo, foi aplicada a metodologia CRISP-ML para o desenvolvimento de um banco de dados voltado à identificação de beneficiários com risco de TEA, sem a necessidade de dados de diagnóstico. Foram identificadas 68 variáveis relevantes a partir de registros de uso de serviços médicos e realizada uma análise exploratória para compreender melhor o perfil dos beneficiários que solicitaram Terapias Especiais. Para o treinamento dos modelos de ML, foram selecionadas 25 variáveis, e a classificação foi abordada de duas formas: classificação binária e classificação de uma classe. Os modelos de classificação binária Random Forest, XGBoost e CatBoost foram empregados para distinguir beneficiários que solicitaram Terapia Especial entre TEA e Não TEA. Já os modelos de classificação de uma classe, Isolation Forest e One-Class SVM, buscaram identificar beneficiários com indicação de solicitação futura de Terapia Especial. Todos os modelos foram comparados em termos de desempenho, utilizando técnicas de tuning de hiperparâmetros e seleção de variáveis. Os modelos de classificação binária XGBoost e Random Forest, com ajuste de hiper parâmetros e seleção de variáveis, apresentaram os melhores resultados, alcançando 8 respectivamente 73.49% e 73.61% de acurácia. Entre os modelos de uma classe, Iso lation Forest obteve 85,90% de acurácia, enquanto One-Class SVM atingiu 83,07%. Os modelos Random Forest e Isolation Forest, que demonstraram melhor desempenho, foram submetidos a um processo de interpretabilidade por meio do SHAP, em conjunto com especialistas da área. A análise revelou que as variáveis mais relevantes para os modelos estavam associadas a consultas com psicólogos, fonoaudiólogos e terapeutas ocupacionais, serviços frequentemente buscados no processo de diagnóstico do TEA. Os resultados demonstram que a aplicação de modelos interpretáveis, combinada com técnicas de seleção de características e ajuste de hiperparâmetros, pode contribuir significativamente para a identificação precoce de beneficiários com risco de TEA. Ademais, a colaboração entre especialistas técnicos e profissionais de saúde reforça a validade e a aplicação dessas abordagens no contexto de operadoras de saúde. Essa validade foi assegurada por meio da participação ativa dos especialistas na revisão das variáveis e na análise dos resultados gerados pelos modelos, garantindo coerência com a prática clínica.
id UDESC-2_a0abc11bf35d520dc0a2a37732028471
oai_identifier_str oai:repositorio.udesc.br:UDESC/20963
network_acronym_str UDESC-2
network_name_str Repositório Institucional da UDESC
repository_id_str
spelling Uma abordagem baseada em dados para triagem de transtorno do espectro autistaAdata-driven approach for autism spectrumdisorder screeningInteligência ArtificialAprendizado de MáquinaTranstorno do Espectro Autista (TEA)Auxílio ao DiagnosticoModelos InterpretáveisA evolução da Inteligência Artificial (IA) e do Aprendizado de Máquina (ML) tem impulsionado avanços significativos no setor da saúde, permitindo a automação de tarefas complexas e aprimorando diagnósticos médicos. Diversos estudos na literatura exploram o uso de modelos de ML para auxiliar no diagnóstico precoce, acelerando o processo de tratamento. Um exemplo relevante é o Transtorno do Espectro Autista (TEA), uma condição atípica sem cura, mas cujo tratamento com Terapias Especiais, especialmente em idades iniciais, traz benefícios significativos ao desenvolvimento de pessoas autistas. Atualmente, o diagnóstico formal de TEA é desafiador, pois não existe uma causa única identificada. O processo envolve uma equipe multidisciplinar que realiza testes psicológicos, exames de imagem, genéticos e de sangue para auxiliar na identificação do transtorno. Embora trabalhos existentes na literatura utilizem modelos de ML para apoiar o diagnóstico, muitos dependem de dados extraídos de exames médicos, o que nem sempre reflete a realidade de hospitais e provedores de saúde interessados no rastreamento do TEA. Esses provedores, muitas vezes, não dispõem de dados de diagnóstico for mal, tornando essencial o desenvolvimento de uma base de dados alternativa que possa viabilizar análises preditivas em contextos reais. A adoção de metodologias estruturadas, como o CRISP-DM, é fundamental no desenvolvimento de modelos de ML, pois contribui para maior assertividade, eficiência e organização ao longo de todo o processo. Neste estudo, foi aplicada a metodologia CRISP-ML para o desenvolvimento de um banco de dados voltado à identificação de beneficiários com risco de TEA, sem a necessidade de dados de diagnóstico. Foram identificadas 68 variáveis relevantes a partir de registros de uso de serviços médicos e realizada uma análise exploratória para compreender melhor o perfil dos beneficiários que solicitaram Terapias Especiais. Para o treinamento dos modelos de ML, foram selecionadas 25 variáveis, e a classificação foi abordada de duas formas: classificação binária e classificação de uma classe. Os modelos de classificação binária Random Forest, XGBoost e CatBoost foram empregados para distinguir beneficiários que solicitaram Terapia Especial entre TEA e Não TEA. Já os modelos de classificação de uma classe, Isolation Forest e One-Class SVM, buscaram identificar beneficiários com indicação de solicitação futura de Terapia Especial. Todos os modelos foram comparados em termos de desempenho, utilizando técnicas de tuning de hiperparâmetros e seleção de variáveis. Os modelos de classificação binária XGBoost e Random Forest, com ajuste de hiper parâmetros e seleção de variáveis, apresentaram os melhores resultados, alcançando 8 respectivamente 73.49% e 73.61% de acurácia. Entre os modelos de uma classe, Iso lation Forest obteve 85,90% de acurácia, enquanto One-Class SVM atingiu 83,07%. Os modelos Random Forest e Isolation Forest, que demonstraram melhor desempenho, foram submetidos a um processo de interpretabilidade por meio do SHAP, em conjunto com especialistas da área. A análise revelou que as variáveis mais relevantes para os modelos estavam associadas a consultas com psicólogos, fonoaudiólogos e terapeutas ocupacionais, serviços frequentemente buscados no processo de diagnóstico do TEA. Os resultados demonstram que a aplicação de modelos interpretáveis, combinada com técnicas de seleção de características e ajuste de hiperparâmetros, pode contribuir significativamente para a identificação precoce de beneficiários com risco de TEA. Ademais, a colaboração entre especialistas técnicos e profissionais de saúde reforça a validade e a aplicação dessas abordagens no contexto de operadoras de saúde. Essa validade foi assegurada por meio da participação ativa dos especialistas na revisão das variáveis e na análise dos resultados gerados pelos modelos, garantindo coerência com a prática clínica.Parpinelli, Rafael StubsGomes, Maísa Fernandes2025-05-12T16:54:44Z2025info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis114 f.application/pdfGOMES, Maísa Fernandes. <b>Uma abordagem baseada em dados para triagem de transtorno do espectro autista</b>. 2025. Dissertação (Pós-Graduação em Computação Aplicada) - Udesc, Joinville, 2025. Disponível em: https://repositorio.udesc.br/handle/UDESC/20963. Acesso em: insira aqui a data de acesso ao material. Ex: 18 fev. 2025.https://repositorio.udesc.br/handle/UDESC/20963ark:/33523/001300000vh5nAttribution-NonCommercial-ShareAlike 4.0 Brazilhttp://creativecommons.org/licenses/by-nc-sa/4.0/br/info:eu-repo/semantics/openAccessengreponame:Repositório Institucional da UDESCinstname:Universidade do Estado de Santa Catarina (UDESC)instacron:UDESC2026-03-13T20:18:36Zoai:repositorio.udesc.br:UDESC/20963Biblioteca Digital de Teses e Dissertaçõeshttps://pergamumweb.udesc.br/biblioteca/index.phpPRIhttps://repositorio-api.udesc.br/server/oai/requestri@udesc.bropendoar:63912026-03-13T20:18:36Repositório Institucional da UDESC - Universidade do Estado de Santa Catarina (UDESC)false
dc.title.none.fl_str_mv Uma abordagem baseada em dados para triagem de transtorno do espectro autista
Adata-driven approach for autism spectrumdisorder screening
title Uma abordagem baseada em dados para triagem de transtorno do espectro autista
spellingShingle Uma abordagem baseada em dados para triagem de transtorno do espectro autista
Gomes, Maísa Fernandes
Inteligência Artificial
Aprendizado de Máquina
Transtorno do Espectro Autista (TEA)
Auxílio ao Diagnostico
Modelos Interpretáveis
title_short Uma abordagem baseada em dados para triagem de transtorno do espectro autista
title_full Uma abordagem baseada em dados para triagem de transtorno do espectro autista
title_fullStr Uma abordagem baseada em dados para triagem de transtorno do espectro autista
title_full_unstemmed Uma abordagem baseada em dados para triagem de transtorno do espectro autista
title_sort Uma abordagem baseada em dados para triagem de transtorno do espectro autista
author Gomes, Maísa Fernandes
author_facet Gomes, Maísa Fernandes
author_role author
dc.contributor.none.fl_str_mv Parpinelli, Rafael Stubs
dc.contributor.author.fl_str_mv Gomes, Maísa Fernandes
dc.subject.por.fl_str_mv Inteligência Artificial
Aprendizado de Máquina
Transtorno do Espectro Autista (TEA)
Auxílio ao Diagnostico
Modelos Interpretáveis
topic Inteligência Artificial
Aprendizado de Máquina
Transtorno do Espectro Autista (TEA)
Auxílio ao Diagnostico
Modelos Interpretáveis
description A evolução da Inteligência Artificial (IA) e do Aprendizado de Máquina (ML) tem impulsionado avanços significativos no setor da saúde, permitindo a automação de tarefas complexas e aprimorando diagnósticos médicos. Diversos estudos na literatura exploram o uso de modelos de ML para auxiliar no diagnóstico precoce, acelerando o processo de tratamento. Um exemplo relevante é o Transtorno do Espectro Autista (TEA), uma condição atípica sem cura, mas cujo tratamento com Terapias Especiais, especialmente em idades iniciais, traz benefícios significativos ao desenvolvimento de pessoas autistas. Atualmente, o diagnóstico formal de TEA é desafiador, pois não existe uma causa única identificada. O processo envolve uma equipe multidisciplinar que realiza testes psicológicos, exames de imagem, genéticos e de sangue para auxiliar na identificação do transtorno. Embora trabalhos existentes na literatura utilizem modelos de ML para apoiar o diagnóstico, muitos dependem de dados extraídos de exames médicos, o que nem sempre reflete a realidade de hospitais e provedores de saúde interessados no rastreamento do TEA. Esses provedores, muitas vezes, não dispõem de dados de diagnóstico for mal, tornando essencial o desenvolvimento de uma base de dados alternativa que possa viabilizar análises preditivas em contextos reais. A adoção de metodologias estruturadas, como o CRISP-DM, é fundamental no desenvolvimento de modelos de ML, pois contribui para maior assertividade, eficiência e organização ao longo de todo o processo. Neste estudo, foi aplicada a metodologia CRISP-ML para o desenvolvimento de um banco de dados voltado à identificação de beneficiários com risco de TEA, sem a necessidade de dados de diagnóstico. Foram identificadas 68 variáveis relevantes a partir de registros de uso de serviços médicos e realizada uma análise exploratória para compreender melhor o perfil dos beneficiários que solicitaram Terapias Especiais. Para o treinamento dos modelos de ML, foram selecionadas 25 variáveis, e a classificação foi abordada de duas formas: classificação binária e classificação de uma classe. Os modelos de classificação binária Random Forest, XGBoost e CatBoost foram empregados para distinguir beneficiários que solicitaram Terapia Especial entre TEA e Não TEA. Já os modelos de classificação de uma classe, Isolation Forest e One-Class SVM, buscaram identificar beneficiários com indicação de solicitação futura de Terapia Especial. Todos os modelos foram comparados em termos de desempenho, utilizando técnicas de tuning de hiperparâmetros e seleção de variáveis. Os modelos de classificação binária XGBoost e Random Forest, com ajuste de hiper parâmetros e seleção de variáveis, apresentaram os melhores resultados, alcançando 8 respectivamente 73.49% e 73.61% de acurácia. Entre os modelos de uma classe, Iso lation Forest obteve 85,90% de acurácia, enquanto One-Class SVM atingiu 83,07%. Os modelos Random Forest e Isolation Forest, que demonstraram melhor desempenho, foram submetidos a um processo de interpretabilidade por meio do SHAP, em conjunto com especialistas da área. A análise revelou que as variáveis mais relevantes para os modelos estavam associadas a consultas com psicólogos, fonoaudiólogos e terapeutas ocupacionais, serviços frequentemente buscados no processo de diagnóstico do TEA. Os resultados demonstram que a aplicação de modelos interpretáveis, combinada com técnicas de seleção de características e ajuste de hiperparâmetros, pode contribuir significativamente para a identificação precoce de beneficiários com risco de TEA. Ademais, a colaboração entre especialistas técnicos e profissionais de saúde reforça a validade e a aplicação dessas abordagens no contexto de operadoras de saúde. Essa validade foi assegurada por meio da participação ativa dos especialistas na revisão das variáveis e na análise dos resultados gerados pelos modelos, garantindo coerência com a prática clínica.
publishDate 2025
dc.date.none.fl_str_mv 2025-05-12T16:54:44Z
2025
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv GOMES, Maísa Fernandes. <b>Uma abordagem baseada em dados para triagem de transtorno do espectro autista</b>. 2025. Dissertação (Pós-Graduação em Computação Aplicada) - Udesc, Joinville, 2025. Disponível em: https://repositorio.udesc.br/handle/UDESC/20963. Acesso em: insira aqui a data de acesso ao material. Ex: 18 fev. 2025.
https://repositorio.udesc.br/handle/UDESC/20963
dc.identifier.dark.fl_str_mv ark:/33523/001300000vh5n
identifier_str_mv GOMES, Maísa Fernandes. <b>Uma abordagem baseada em dados para triagem de transtorno do espectro autista</b>. 2025. Dissertação (Pós-Graduação em Computação Aplicada) - Udesc, Joinville, 2025. Disponível em: https://repositorio.udesc.br/handle/UDESC/20963. Acesso em: insira aqui a data de acesso ao material. Ex: 18 fev. 2025.
ark:/33523/001300000vh5n
url https://repositorio.udesc.br/handle/UDESC/20963
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv Attribution-NonCommercial-ShareAlike 4.0 Brazil
http://creativecommons.org/licenses/by-nc-sa/4.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-ShareAlike 4.0 Brazil
http://creativecommons.org/licenses/by-nc-sa/4.0/br/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 114 f.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UDESC
instname:Universidade do Estado de Santa Catarina (UDESC)
instacron:UDESC
instname_str Universidade do Estado de Santa Catarina (UDESC)
instacron_str UDESC
institution UDESC
reponame_str Repositório Institucional da UDESC
collection Repositório Institucional da UDESC
repository.name.fl_str_mv Repositório Institucional da UDESC - Universidade do Estado de Santa Catarina (UDESC)
repository.mail.fl_str_mv ri@udesc.br
_version_ 1860697702847741952