Uma abordagem baseada em dados para triagem de transtorno do espectro autista
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| dARK ID: | ark:/33523/001300000vh5n |
| Idioma: | eng |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.udesc.br/handle/UDESC/20963 |
Resumo: | A evolução da Inteligência Artificial (IA) e do Aprendizado de Máquina (ML) tem impulsionado avanços significativos no setor da saúde, permitindo a automação de tarefas complexas e aprimorando diagnósticos médicos. Diversos estudos na literatura exploram o uso de modelos de ML para auxiliar no diagnóstico precoce, acelerando o processo de tratamento. Um exemplo relevante é o Transtorno do Espectro Autista (TEA), uma condição atípica sem cura, mas cujo tratamento com Terapias Especiais, especialmente em idades iniciais, traz benefícios significativos ao desenvolvimento de pessoas autistas. Atualmente, o diagnóstico formal de TEA é desafiador, pois não existe uma causa única identificada. O processo envolve uma equipe multidisciplinar que realiza testes psicológicos, exames de imagem, genéticos e de sangue para auxiliar na identificação do transtorno. Embora trabalhos existentes na literatura utilizem modelos de ML para apoiar o diagnóstico, muitos dependem de dados extraídos de exames médicos, o que nem sempre reflete a realidade de hospitais e provedores de saúde interessados no rastreamento do TEA. Esses provedores, muitas vezes, não dispõem de dados de diagnóstico for mal, tornando essencial o desenvolvimento de uma base de dados alternativa que possa viabilizar análises preditivas em contextos reais. A adoção de metodologias estruturadas, como o CRISP-DM, é fundamental no desenvolvimento de modelos de ML, pois contribui para maior assertividade, eficiência e organização ao longo de todo o processo. Neste estudo, foi aplicada a metodologia CRISP-ML para o desenvolvimento de um banco de dados voltado à identificação de beneficiários com risco de TEA, sem a necessidade de dados de diagnóstico. Foram identificadas 68 variáveis relevantes a partir de registros de uso de serviços médicos e realizada uma análise exploratória para compreender melhor o perfil dos beneficiários que solicitaram Terapias Especiais. Para o treinamento dos modelos de ML, foram selecionadas 25 variáveis, e a classificação foi abordada de duas formas: classificação binária e classificação de uma classe. Os modelos de classificação binária Random Forest, XGBoost e CatBoost foram empregados para distinguir beneficiários que solicitaram Terapia Especial entre TEA e Não TEA. Já os modelos de classificação de uma classe, Isolation Forest e One-Class SVM, buscaram identificar beneficiários com indicação de solicitação futura de Terapia Especial. Todos os modelos foram comparados em termos de desempenho, utilizando técnicas de tuning de hiperparâmetros e seleção de variáveis. Os modelos de classificação binária XGBoost e Random Forest, com ajuste de hiper parâmetros e seleção de variáveis, apresentaram os melhores resultados, alcançando 8 respectivamente 73.49% e 73.61% de acurácia. Entre os modelos de uma classe, Iso lation Forest obteve 85,90% de acurácia, enquanto One-Class SVM atingiu 83,07%. Os modelos Random Forest e Isolation Forest, que demonstraram melhor desempenho, foram submetidos a um processo de interpretabilidade por meio do SHAP, em conjunto com especialistas da área. A análise revelou que as variáveis mais relevantes para os modelos estavam associadas a consultas com psicólogos, fonoaudiólogos e terapeutas ocupacionais, serviços frequentemente buscados no processo de diagnóstico do TEA. Os resultados demonstram que a aplicação de modelos interpretáveis, combinada com técnicas de seleção de características e ajuste de hiperparâmetros, pode contribuir significativamente para a identificação precoce de beneficiários com risco de TEA. Ademais, a colaboração entre especialistas técnicos e profissionais de saúde reforça a validade e a aplicação dessas abordagens no contexto de operadoras de saúde. Essa validade foi assegurada por meio da participação ativa dos especialistas na revisão das variáveis e na análise dos resultados gerados pelos modelos, garantindo coerência com a prática clínica. |
| id |
UDESC-2_a0abc11bf35d520dc0a2a37732028471 |
|---|---|
| oai_identifier_str |
oai:repositorio.udesc.br:UDESC/20963 |
| network_acronym_str |
UDESC-2 |
| network_name_str |
Repositório Institucional da UDESC |
| repository_id_str |
|
| spelling |
Uma abordagem baseada em dados para triagem de transtorno do espectro autistaAdata-driven approach for autism spectrumdisorder screeningInteligência ArtificialAprendizado de MáquinaTranstorno do Espectro Autista (TEA)Auxílio ao DiagnosticoModelos InterpretáveisA evolução da Inteligência Artificial (IA) e do Aprendizado de Máquina (ML) tem impulsionado avanços significativos no setor da saúde, permitindo a automação de tarefas complexas e aprimorando diagnósticos médicos. Diversos estudos na literatura exploram o uso de modelos de ML para auxiliar no diagnóstico precoce, acelerando o processo de tratamento. Um exemplo relevante é o Transtorno do Espectro Autista (TEA), uma condição atípica sem cura, mas cujo tratamento com Terapias Especiais, especialmente em idades iniciais, traz benefícios significativos ao desenvolvimento de pessoas autistas. Atualmente, o diagnóstico formal de TEA é desafiador, pois não existe uma causa única identificada. O processo envolve uma equipe multidisciplinar que realiza testes psicológicos, exames de imagem, genéticos e de sangue para auxiliar na identificação do transtorno. Embora trabalhos existentes na literatura utilizem modelos de ML para apoiar o diagnóstico, muitos dependem de dados extraídos de exames médicos, o que nem sempre reflete a realidade de hospitais e provedores de saúde interessados no rastreamento do TEA. Esses provedores, muitas vezes, não dispõem de dados de diagnóstico for mal, tornando essencial o desenvolvimento de uma base de dados alternativa que possa viabilizar análises preditivas em contextos reais. A adoção de metodologias estruturadas, como o CRISP-DM, é fundamental no desenvolvimento de modelos de ML, pois contribui para maior assertividade, eficiência e organização ao longo de todo o processo. Neste estudo, foi aplicada a metodologia CRISP-ML para o desenvolvimento de um banco de dados voltado à identificação de beneficiários com risco de TEA, sem a necessidade de dados de diagnóstico. Foram identificadas 68 variáveis relevantes a partir de registros de uso de serviços médicos e realizada uma análise exploratória para compreender melhor o perfil dos beneficiários que solicitaram Terapias Especiais. Para o treinamento dos modelos de ML, foram selecionadas 25 variáveis, e a classificação foi abordada de duas formas: classificação binária e classificação de uma classe. Os modelos de classificação binária Random Forest, XGBoost e CatBoost foram empregados para distinguir beneficiários que solicitaram Terapia Especial entre TEA e Não TEA. Já os modelos de classificação de uma classe, Isolation Forest e One-Class SVM, buscaram identificar beneficiários com indicação de solicitação futura de Terapia Especial. Todos os modelos foram comparados em termos de desempenho, utilizando técnicas de tuning de hiperparâmetros e seleção de variáveis. Os modelos de classificação binária XGBoost e Random Forest, com ajuste de hiper parâmetros e seleção de variáveis, apresentaram os melhores resultados, alcançando 8 respectivamente 73.49% e 73.61% de acurácia. Entre os modelos de uma classe, Iso lation Forest obteve 85,90% de acurácia, enquanto One-Class SVM atingiu 83,07%. Os modelos Random Forest e Isolation Forest, que demonstraram melhor desempenho, foram submetidos a um processo de interpretabilidade por meio do SHAP, em conjunto com especialistas da área. A análise revelou que as variáveis mais relevantes para os modelos estavam associadas a consultas com psicólogos, fonoaudiólogos e terapeutas ocupacionais, serviços frequentemente buscados no processo de diagnóstico do TEA. Os resultados demonstram que a aplicação de modelos interpretáveis, combinada com técnicas de seleção de características e ajuste de hiperparâmetros, pode contribuir significativamente para a identificação precoce de beneficiários com risco de TEA. Ademais, a colaboração entre especialistas técnicos e profissionais de saúde reforça a validade e a aplicação dessas abordagens no contexto de operadoras de saúde. Essa validade foi assegurada por meio da participação ativa dos especialistas na revisão das variáveis e na análise dos resultados gerados pelos modelos, garantindo coerência com a prática clínica.Parpinelli, Rafael StubsGomes, Maísa Fernandes2025-05-12T16:54:44Z2025info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis114 f.application/pdfGOMES, Maísa Fernandes. <b>Uma abordagem baseada em dados para triagem de transtorno do espectro autista</b>. 2025. Dissertação (Pós-Graduação em Computação Aplicada) - Udesc, Joinville, 2025. Disponível em: https://repositorio.udesc.br/handle/UDESC/20963. Acesso em: insira aqui a data de acesso ao material. Ex: 18 fev. 2025.https://repositorio.udesc.br/handle/UDESC/20963ark:/33523/001300000vh5nAttribution-NonCommercial-ShareAlike 4.0 Brazilhttp://creativecommons.org/licenses/by-nc-sa/4.0/br/info:eu-repo/semantics/openAccessengreponame:Repositório Institucional da UDESCinstname:Universidade do Estado de Santa Catarina (UDESC)instacron:UDESC2026-03-13T20:18:36Zoai:repositorio.udesc.br:UDESC/20963Biblioteca Digital de Teses e Dissertaçõeshttps://pergamumweb.udesc.br/biblioteca/index.phpPRIhttps://repositorio-api.udesc.br/server/oai/requestri@udesc.bropendoar:63912026-03-13T20:18:36Repositório Institucional da UDESC - Universidade do Estado de Santa Catarina (UDESC)false |
| dc.title.none.fl_str_mv |
Uma abordagem baseada em dados para triagem de transtorno do espectro autista Adata-driven approach for autism spectrumdisorder screening |
| title |
Uma abordagem baseada em dados para triagem de transtorno do espectro autista |
| spellingShingle |
Uma abordagem baseada em dados para triagem de transtorno do espectro autista Gomes, Maísa Fernandes Inteligência Artificial Aprendizado de Máquina Transtorno do Espectro Autista (TEA) Auxílio ao Diagnostico Modelos Interpretáveis |
| title_short |
Uma abordagem baseada em dados para triagem de transtorno do espectro autista |
| title_full |
Uma abordagem baseada em dados para triagem de transtorno do espectro autista |
| title_fullStr |
Uma abordagem baseada em dados para triagem de transtorno do espectro autista |
| title_full_unstemmed |
Uma abordagem baseada em dados para triagem de transtorno do espectro autista |
| title_sort |
Uma abordagem baseada em dados para triagem de transtorno do espectro autista |
| author |
Gomes, Maísa Fernandes |
| author_facet |
Gomes, Maísa Fernandes |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Parpinelli, Rafael Stubs |
| dc.contributor.author.fl_str_mv |
Gomes, Maísa Fernandes |
| dc.subject.por.fl_str_mv |
Inteligência Artificial Aprendizado de Máquina Transtorno do Espectro Autista (TEA) Auxílio ao Diagnostico Modelos Interpretáveis |
| topic |
Inteligência Artificial Aprendizado de Máquina Transtorno do Espectro Autista (TEA) Auxílio ao Diagnostico Modelos Interpretáveis |
| description |
A evolução da Inteligência Artificial (IA) e do Aprendizado de Máquina (ML) tem impulsionado avanços significativos no setor da saúde, permitindo a automação de tarefas complexas e aprimorando diagnósticos médicos. Diversos estudos na literatura exploram o uso de modelos de ML para auxiliar no diagnóstico precoce, acelerando o processo de tratamento. Um exemplo relevante é o Transtorno do Espectro Autista (TEA), uma condição atípica sem cura, mas cujo tratamento com Terapias Especiais, especialmente em idades iniciais, traz benefícios significativos ao desenvolvimento de pessoas autistas. Atualmente, o diagnóstico formal de TEA é desafiador, pois não existe uma causa única identificada. O processo envolve uma equipe multidisciplinar que realiza testes psicológicos, exames de imagem, genéticos e de sangue para auxiliar na identificação do transtorno. Embora trabalhos existentes na literatura utilizem modelos de ML para apoiar o diagnóstico, muitos dependem de dados extraídos de exames médicos, o que nem sempre reflete a realidade de hospitais e provedores de saúde interessados no rastreamento do TEA. Esses provedores, muitas vezes, não dispõem de dados de diagnóstico for mal, tornando essencial o desenvolvimento de uma base de dados alternativa que possa viabilizar análises preditivas em contextos reais. A adoção de metodologias estruturadas, como o CRISP-DM, é fundamental no desenvolvimento de modelos de ML, pois contribui para maior assertividade, eficiência e organização ao longo de todo o processo. Neste estudo, foi aplicada a metodologia CRISP-ML para o desenvolvimento de um banco de dados voltado à identificação de beneficiários com risco de TEA, sem a necessidade de dados de diagnóstico. Foram identificadas 68 variáveis relevantes a partir de registros de uso de serviços médicos e realizada uma análise exploratória para compreender melhor o perfil dos beneficiários que solicitaram Terapias Especiais. Para o treinamento dos modelos de ML, foram selecionadas 25 variáveis, e a classificação foi abordada de duas formas: classificação binária e classificação de uma classe. Os modelos de classificação binária Random Forest, XGBoost e CatBoost foram empregados para distinguir beneficiários que solicitaram Terapia Especial entre TEA e Não TEA. Já os modelos de classificação de uma classe, Isolation Forest e One-Class SVM, buscaram identificar beneficiários com indicação de solicitação futura de Terapia Especial. Todos os modelos foram comparados em termos de desempenho, utilizando técnicas de tuning de hiperparâmetros e seleção de variáveis. Os modelos de classificação binária XGBoost e Random Forest, com ajuste de hiper parâmetros e seleção de variáveis, apresentaram os melhores resultados, alcançando 8 respectivamente 73.49% e 73.61% de acurácia. Entre os modelos de uma classe, Iso lation Forest obteve 85,90% de acurácia, enquanto One-Class SVM atingiu 83,07%. Os modelos Random Forest e Isolation Forest, que demonstraram melhor desempenho, foram submetidos a um processo de interpretabilidade por meio do SHAP, em conjunto com especialistas da área. A análise revelou que as variáveis mais relevantes para os modelos estavam associadas a consultas com psicólogos, fonoaudiólogos e terapeutas ocupacionais, serviços frequentemente buscados no processo de diagnóstico do TEA. Os resultados demonstram que a aplicação de modelos interpretáveis, combinada com técnicas de seleção de características e ajuste de hiperparâmetros, pode contribuir significativamente para a identificação precoce de beneficiários com risco de TEA. Ademais, a colaboração entre especialistas técnicos e profissionais de saúde reforça a validade e a aplicação dessas abordagens no contexto de operadoras de saúde. Essa validade foi assegurada por meio da participação ativa dos especialistas na revisão das variáveis e na análise dos resultados gerados pelos modelos, garantindo coerência com a prática clínica. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-05-12T16:54:44Z 2025 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
GOMES, Maísa Fernandes. <b>Uma abordagem baseada em dados para triagem de transtorno do espectro autista</b>. 2025. Dissertação (Pós-Graduação em Computação Aplicada) - Udesc, Joinville, 2025. Disponível em: https://repositorio.udesc.br/handle/UDESC/20963. Acesso em: insira aqui a data de acesso ao material. Ex: 18 fev. 2025. https://repositorio.udesc.br/handle/UDESC/20963 |
| dc.identifier.dark.fl_str_mv |
ark:/33523/001300000vh5n |
| identifier_str_mv |
GOMES, Maísa Fernandes. <b>Uma abordagem baseada em dados para triagem de transtorno do espectro autista</b>. 2025. Dissertação (Pós-Graduação em Computação Aplicada) - Udesc, Joinville, 2025. Disponível em: https://repositorio.udesc.br/handle/UDESC/20963. Acesso em: insira aqui a data de acesso ao material. Ex: 18 fev. 2025. ark:/33523/001300000vh5n |
| url |
https://repositorio.udesc.br/handle/UDESC/20963 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-ShareAlike 4.0 Brazil http://creativecommons.org/licenses/by-nc-sa/4.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-ShareAlike 4.0 Brazil http://creativecommons.org/licenses/by-nc-sa/4.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
114 f. application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UDESC instname:Universidade do Estado de Santa Catarina (UDESC) instacron:UDESC |
| instname_str |
Universidade do Estado de Santa Catarina (UDESC) |
| instacron_str |
UDESC |
| institution |
UDESC |
| reponame_str |
Repositório Institucional da UDESC |
| collection |
Repositório Institucional da UDESC |
| repository.name.fl_str_mv |
Repositório Institucional da UDESC - Universidade do Estado de Santa Catarina (UDESC) |
| repository.mail.fl_str_mv |
ri@udesc.br |
| _version_ |
1860697702847741952 |