Uma abordagem baseada em dados para triagem de transtorno do espectro autista

Gomes, Maísa Fernandes

Uma abordagem baseada em dados para triagem de transtorno do espectro autista

Detalhes bibliográficos
Ano de defesa:	2025
Autor(a) principal:	Gomes, Maísa Fernandes
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
dARK ID:	ark:/33523/001300000vh5n
Idioma:	eng
Instituição de defesa:	Não Informado pela instituição
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Inteligência Artificial Aprendizado de Máquina Transtorno do Espectro Autista (TEA) Auxílio ao Diagnostico Modelos Interpretáveis
Link de acesso:	https://repositorio.udesc.br/handle/UDESC/20963
Resumo:	A evolução da Inteligência Artificial (IA) e do Aprendizado de Máquina (ML) tem impulsionado avanços significativos no setor da saúde, permitindo a automação de tarefas complexas e aprimorando diagnósticos médicos. Diversos estudos na literatura exploram o uso de modelos de ML para auxiliar no diagnóstico precoce, acelerando o processo de tratamento. Um exemplo relevante é o Transtorno do Espectro Autista (TEA), uma condição atípica sem cura, mas cujo tratamento com Terapias Especiais, especialmente em idades iniciais, traz benefícios significativos ao desenvolvimento de pessoas autistas. Atualmente, o diagnóstico formal de TEA é desafiador, pois não existe uma causa única identificada. O processo envolve uma equipe multidisciplinar que realiza testes psicológicos, exames de imagem, genéticos e de sangue para auxiliar na identificação do transtorno. Embora trabalhos existentes na literatura utilizem modelos de ML para apoiar o diagnóstico, muitos dependem de dados extraídos de exames médicos, o que nem sempre reflete a realidade de hospitais e provedores de saúde interessados no rastreamento do TEA. Esses provedores, muitas vezes, não dispõem de dados de diagnóstico for mal, tornando essencial o desenvolvimento de uma base de dados alternativa que possa viabilizar análises preditivas em contextos reais. A adoção de metodologias estruturadas, como o CRISP-DM, é fundamental no desenvolvimento de modelos de ML, pois contribui para maior assertividade, eficiência e organização ao longo de todo o processo. Neste estudo, foi aplicada a metodologia CRISP-ML para o desenvolvimento de um banco de dados voltado à identificação de beneficiários com risco de TEA, sem a necessidade de dados de diagnóstico. Foram identificadas 68 variáveis relevantes a partir de registros de uso de serviços médicos e realizada uma análise exploratória para compreender melhor o perfil dos beneficiários que solicitaram Terapias Especiais. Para o treinamento dos modelos de ML, foram selecionadas 25 variáveis, e a classificação foi abordada de duas formas: classificação binária e classificação de uma classe. Os modelos de classificação binária Random Forest, XGBoost e CatBoost foram empregados para distinguir beneficiários que solicitaram Terapia Especial entre TEA e Não TEA. Já os modelos de classificação de uma classe, Isolation Forest e One-Class SVM, buscaram identificar beneficiários com indicação de solicitação futura de Terapia Especial. Todos os modelos foram comparados em termos de desempenho, utilizando técnicas de tuning de hiperparâmetros e seleção de variáveis. Os modelos de classificação binária XGBoost e Random Forest, com ajuste de hiper parâmetros e seleção de variáveis, apresentaram os melhores resultados, alcançando 8 respectivamente 73.49% e 73.61% de acurácia. Entre os modelos de uma classe, Iso lation Forest obteve 85,90% de acurácia, enquanto One-Class SVM atingiu 83,07%. Os modelos Random Forest e Isolation Forest, que demonstraram melhor desempenho, foram submetidos a um processo de interpretabilidade por meio do SHAP, em conjunto com especialistas da área. A análise revelou que as variáveis mais relevantes para os modelos estavam associadas a consultas com psicólogos, fonoaudiólogos e terapeutas ocupacionais, serviços frequentemente buscados no processo de diagnóstico do TEA. Os resultados demonstram que a aplicação de modelos interpretáveis, combinada com técnicas de seleção de características e ajuste de hiperparâmetros, pode contribuir significativamente para a identificação precoce de beneficiários com risco de TEA. Ademais, a colaboração entre especialistas técnicos e profissionais de saúde reforça a validade e a aplicação dessas abordagens no contexto de operadoras de saúde. Essa validade foi assegurada por meio da participação ativa dos especialistas na revisão das variáveis e na análise dos resultados gerados pelos modelos, garantindo coerência com a prática clínica.

Metadados do item

id	UDESC-2_a0abc11bf35d520dc0a2a37732028471
oai_identifier_str	oai:repositorio.udesc.br:UDESC/20963
network_acronym_str	UDESC-2
network_name_str	Repositório Institucional da UDESC
repository_id_str
spelling	Uma abordagem baseada em dados para triagem de transtorno do espectro autistaAdata-driven approach for autism spectrumdisorder screeningInteligência ArtificialAprendizado de MáquinaTranstorno do Espectro Autista (TEA)Auxílio ao DiagnosticoModelos InterpretáveisA evolução da Inteligência Artificial (IA) e do Aprendizado de Máquina (ML) tem impulsionado avanços significativos no setor da saúde, permitindo a automação de tarefas complexas e aprimorando diagnósticos médicos. Diversos estudos na literatura exploram o uso de modelos de ML para auxiliar no diagnóstico precoce, acelerando o processo de tratamento. Um exemplo relevante é o Transtorno do Espectro Autista (TEA), uma condição atípica sem cura, mas cujo tratamento com Terapias Especiais, especialmente em idades iniciais, traz benefícios significativos ao desenvolvimento de pessoas autistas. Atualmente, o diagnóstico formal de TEA é desafiador, pois não existe uma causa única identificada. O processo envolve uma equipe multidisciplinar que realiza testes psicológicos, exames de imagem, genéticos e de sangue para auxiliar na identificação do transtorno. Embora trabalhos existentes na literatura utilizem modelos de ML para apoiar o diagnóstico, muitos dependem de dados extraídos de exames médicos, o que nem sempre reflete a realidade de hospitais e provedores de saúde interessados no rastreamento do TEA. Esses provedores, muitas vezes, não dispõem de dados de diagnóstico for mal, tornando essencial o desenvolvimento de uma base de dados alternativa que possa viabilizar análises preditivas em contextos reais. A adoção de metodologias estruturadas, como o CRISP-DM, é fundamental no desenvolvimento de modelos de ML, pois contribui para maior assertividade, eficiência e organização ao longo de todo o processo. Neste estudo, foi aplicada a metodologia CRISP-ML para o desenvolvimento de um banco de dados voltado à identificação de beneficiários com risco de TEA, sem a necessidade de dados de diagnóstico. Foram identificadas 68 variáveis relevantes a partir de registros de uso de serviços médicos e realizada uma análise exploratória para compreender melhor o perfil dos beneficiários que solicitaram Terapias Especiais. Para o treinamento dos modelos de ML, foram selecionadas 25 variáveis, e a classificação foi abordada de duas formas: classificação binária e classificação de uma classe. Os modelos de classificação binária Random Forest, XGBoost e CatBoost foram empregados para distinguir beneficiários que solicitaram Terapia Especial entre TEA e Não TEA. Já os modelos de classificação de uma classe, Isolation Forest e One-Class SVM, buscaram identificar beneficiários com indicação de solicitação futura de Terapia Especial. Todos os modelos foram comparados em termos de desempenho, utilizando técnicas de tuning de hiperparâmetros e seleção de variáveis. Os modelos de classificação binária XGBoost e Random Forest, com ajuste de hiper parâmetros e seleção de variáveis, apresentaram os melhores resultados, alcançando 8 respectivamente 73.49% e 73.61% de acurácia. Entre os modelos de uma classe, Iso lation Forest obteve 85,90% de acurácia, enquanto One-Class SVM atingiu 83,07%. Os modelos Random Forest e Isolation Forest, que demonstraram melhor desempenho, foram submetidos a um processo de interpretabilidade por meio do SHAP, em conjunto com especialistas da área. A análise revelou que as variáveis mais relevantes para os modelos estavam associadas a consultas com psicólogos, fonoaudiólogos e terapeutas ocupacionais, serviços frequentemente buscados no processo de diagnóstico do TEA. Os resultados demonstram que a aplicação de modelos interpretáveis, combinada com técnicas de seleção de características e ajuste de hiperparâmetros, pode contribuir significativamente para a identificação precoce de beneficiários com risco de TEA. Ademais, a colaboração entre especialistas técnicos e profissionais de saúde reforça a validade e a aplicação dessas abordagens no contexto de operadoras de saúde. Essa validade foi assegurada por meio da participação ativa dos especialistas na revisão das variáveis e na análise dos resultados gerados pelos modelos, garantindo coerência com a prática clínica.Parpinelli, Rafael StubsGomes, Maísa Fernandes2025-05-12T16:54:44Z2025info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis114 f.application/pdfGOMES, Maísa Fernandes. <b>Uma abordagem baseada em dados para triagem de transtorno do espectro autista</b>. 2025. Dissertação (Pós-Graduação em Computação Aplicada) - Udesc, Joinville, 2025. Disponível em: https://repositorio.udesc.br/handle/UDESC/20963. Acesso em: insira aqui a data de acesso ao material. Ex: 18 fev. 2025.https://repositorio.udesc.br/handle/UDESC/20963ark:/33523/001300000vh5nAttribution-NonCommercial-ShareAlike 4.0 Brazilhttp://creativecommons.org/licenses/by-nc-sa/4.0/br/info:eu-repo/semantics/openAccessengreponame:Repositório Institucional da UDESCinstname:Universidade do Estado de Santa Catarina (UDESC)instacron:UDESC2026-03-13T20:18:36Zoai:repositorio.udesc.br:UDESC/20963Biblioteca Digital de Teses e Dissertaçõeshttps://pergamumweb.udesc.br/biblioteca/index.phpPRIhttps://repositorio-api.udesc.br/server/oai/requestri@udesc.bropendoar:63912026-03-13T20:18:36Repositório Institucional da UDESC - Universidade do Estado de Santa Catarina (UDESC)false
dc.title.none.fl_str_mv	Uma abordagem baseada em dados para triagem de transtorno do espectro autista Adata-driven approach for autism spectrumdisorder screening
title	Uma abordagem baseada em dados para triagem de transtorno do espectro autista
spellingShingle	Uma abordagem baseada em dados para triagem de transtorno do espectro autista Gomes, Maísa Fernandes Inteligência Artificial Aprendizado de Máquina Transtorno do Espectro Autista (TEA) Auxílio ao Diagnostico Modelos Interpretáveis
title_short	Uma abordagem baseada em dados para triagem de transtorno do espectro autista
title_full	Uma abordagem baseada em dados para triagem de transtorno do espectro autista
title_fullStr	Uma abordagem baseada em dados para triagem de transtorno do espectro autista
title_full_unstemmed	Uma abordagem baseada em dados para triagem de transtorno do espectro autista
title_sort	Uma abordagem baseada em dados para triagem de transtorno do espectro autista
author	Gomes, Maísa Fernandes
author_facet	Gomes, Maísa Fernandes
author_role	author
dc.contributor.none.fl_str_mv	Parpinelli, Rafael Stubs
dc.contributor.author.fl_str_mv	Gomes, Maísa Fernandes
dc.subject.por.fl_str_mv	Inteligência Artificial Aprendizado de Máquina Transtorno do Espectro Autista (TEA) Auxílio ao Diagnostico Modelos Interpretáveis
topic	Inteligência Artificial Aprendizado de Máquina Transtorno do Espectro Autista (TEA) Auxílio ao Diagnostico Modelos Interpretáveis
description	A evolução da Inteligência Artificial (IA) e do Aprendizado de Máquina (ML) tem impulsionado avanços significativos no setor da saúde, permitindo a automação de tarefas complexas e aprimorando diagnósticos médicos. Diversos estudos na literatura exploram o uso de modelos de ML para auxiliar no diagnóstico precoce, acelerando o processo de tratamento. Um exemplo relevante é o Transtorno do Espectro Autista (TEA), uma condição atípica sem cura, mas cujo tratamento com Terapias Especiais, especialmente em idades iniciais, traz benefícios significativos ao desenvolvimento de pessoas autistas. Atualmente, o diagnóstico formal de TEA é desafiador, pois não existe uma causa única identificada. O processo envolve uma equipe multidisciplinar que realiza testes psicológicos, exames de imagem, genéticos e de sangue para auxiliar na identificação do transtorno. Embora trabalhos existentes na literatura utilizem modelos de ML para apoiar o diagnóstico, muitos dependem de dados extraídos de exames médicos, o que nem sempre reflete a realidade de hospitais e provedores de saúde interessados no rastreamento do TEA. Esses provedores, muitas vezes, não dispõem de dados de diagnóstico for mal, tornando essencial o desenvolvimento de uma base de dados alternativa que possa viabilizar análises preditivas em contextos reais. A adoção de metodologias estruturadas, como o CRISP-DM, é fundamental no desenvolvimento de modelos de ML, pois contribui para maior assertividade, eficiência e organização ao longo de todo o processo. Neste estudo, foi aplicada a metodologia CRISP-ML para o desenvolvimento de um banco de dados voltado à identificação de beneficiários com risco de TEA, sem a necessidade de dados de diagnóstico. Foram identificadas 68 variáveis relevantes a partir de registros de uso de serviços médicos e realizada uma análise exploratória para compreender melhor o perfil dos beneficiários que solicitaram Terapias Especiais. Para o treinamento dos modelos de ML, foram selecionadas 25 variáveis, e a classificação foi abordada de duas formas: classificação binária e classificação de uma classe. Os modelos de classificação binária Random Forest, XGBoost e CatBoost foram empregados para distinguir beneficiários que solicitaram Terapia Especial entre TEA e Não TEA. Já os modelos de classificação de uma classe, Isolation Forest e One-Class SVM, buscaram identificar beneficiários com indicação de solicitação futura de Terapia Especial. Todos os modelos foram comparados em termos de desempenho, utilizando técnicas de tuning de hiperparâmetros e seleção de variáveis. Os modelos de classificação binária XGBoost e Random Forest, com ajuste de hiper parâmetros e seleção de variáveis, apresentaram os melhores resultados, alcançando 8 respectivamente 73.49% e 73.61% de acurácia. Entre os modelos de uma classe, Iso lation Forest obteve 85,90% de acurácia, enquanto One-Class SVM atingiu 83,07%. Os modelos Random Forest e Isolation Forest, que demonstraram melhor desempenho, foram submetidos a um processo de interpretabilidade por meio do SHAP, em conjunto com especialistas da área. A análise revelou que as variáveis mais relevantes para os modelos estavam associadas a consultas com psicólogos, fonoaudiólogos e terapeutas ocupacionais, serviços frequentemente buscados no processo de diagnóstico do TEA. Os resultados demonstram que a aplicação de modelos interpretáveis, combinada com técnicas de seleção de características e ajuste de hiperparâmetros, pode contribuir significativamente para a identificação precoce de beneficiários com risco de TEA. Ademais, a colaboração entre especialistas técnicos e profissionais de saúde reforça a validade e a aplicação dessas abordagens no contexto de operadoras de saúde. Essa validade foi assegurada por meio da participação ativa dos especialistas na revisão das variáveis e na análise dos resultados gerados pelos modelos, garantindo coerência com a prática clínica.
publishDate	2025
dc.date.none.fl_str_mv	2025-05-12T16:54:44Z 2025
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	GOMES, Maísa Fernandes. <b>Uma abordagem baseada em dados para triagem de transtorno do espectro autista</b>. 2025. Dissertação (Pós-Graduação em Computação Aplicada) - Udesc, Joinville, 2025. Disponível em: https://repositorio.udesc.br/handle/UDESC/20963. Acesso em: insira aqui a data de acesso ao material. Ex: 18 fev. 2025. https://repositorio.udesc.br/handle/UDESC/20963
dc.identifier.dark.fl_str_mv	ark:/33523/001300000vh5n
identifier_str_mv	GOMES, Maísa Fernandes. <b>Uma abordagem baseada em dados para triagem de transtorno do espectro autista</b>. 2025. Dissertação (Pós-Graduação em Computação Aplicada) - Udesc, Joinville, 2025. Disponível em: https://repositorio.udesc.br/handle/UDESC/20963. Acesso em: insira aqui a data de acesso ao material. Ex: 18 fev. 2025. ark:/33523/001300000vh5n
url	https://repositorio.udesc.br/handle/UDESC/20963
dc.language.iso.fl_str_mv	eng
language	eng
dc.rights.driver.fl_str_mv	Attribution-NonCommercial-ShareAlike 4.0 Brazil http://creativecommons.org/licenses/by-nc-sa/4.0/br/ info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Attribution-NonCommercial-ShareAlike 4.0 Brazil http://creativecommons.org/licenses/by-nc-sa/4.0/br/
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	114 f. application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UDESC instname:Universidade do Estado de Santa Catarina (UDESC) instacron:UDESC
instname_str	Universidade do Estado de Santa Catarina (UDESC)
instacron_str	UDESC
institution	UDESC
reponame_str	Repositório Institucional da UDESC
collection	Repositório Institucional da UDESC
repository.name.fl_str_mv	Repositório Institucional da UDESC - Universidade do Estado de Santa Catarina (UDESC)
repository.mail.fl_str_mv	ri@udesc.br
_version_	1860697702847741952

Uma abordagem baseada em dados para triagem de transtorno do espectro autista

Registros relacionados