Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Silva Junior, Antonio Carlos Da [UNIFESP]
Orientador(a): Mancini, Felipe [UNIFESP]
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
dARK ID: ark:/48912/001300002hbqn
Idioma: por
Instituição de defesa: Universidade Federal de São Paulo (UNIFESP)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=9178921
https://repositorio.unifesp.br/handle/11600/59992
Resumo: INTRODUÇÃO: Dislexia do desenvolvimento é uma disfunção neurológica que afeta a habilidade de leitura, que se não tratado pode levar a problemas de aprendizado e impactando negativamente o aumento de vocabulário. O diagnóstico da dislexia é complexo e feito por exclusão. Alguns estudos avaliaram dados de movimento ocular em conjunto com técnicas de aprendizado de máquina (AM) para classificar a dislexia. Outro estudo levanta a hipótese de padrões de funções visuais de leitura (FVL) para compreensão da dislexia. Entretanto, o estudo de FVL em conjunto de técnicas de AM ainda não foi explorado. OBJETIVO GERAL: Aplicar técnicas de aprendizado de máquina (AM) para explorar e auxiliar o diagnóstico de disléxicos a partir das funções visuais de leitura (FVL). OBJETIVOS ESPECÍFICOS: Explorar os dados de FVL de disléxicos e não-disléxicos, a partir de extração de características e classificá-los utilizando AM. MATERIAL E MÉTODOS: Esta dissertação foi executada em duas etapas: uma quantitativa e exploratória e uma quantitativa e correlacional. A primeira etapa explorou os dados de FVL de disléxicos de duas bases, uma de leituras de textos em 1 linha (1L) e outra de 3 linhas (3L). Foi aplicado o algoritmo de mapas auto-organizáveis em cada base para separá-los em clusters que foram então enviados para uma Árvore de Decisão para extrair as regras que regem cada um dos grupos. A segunda etapa utilizou dados de leituras de 3L e foi realizada uma seleção de outliers. Com os dados restantes foi aplicado geração sintética de dados com o algoritmo SMOTE. Então foi aplicado uma técnica de seleção de características tendo a melhor área sob a curva ROC (AUC) como alvo para cada um dos cinco algoritmos selecionados. Eles foram comparados pela AUC e acurácia. Todos também foram comparados pela sua curva de calibração. RESULTADOS: Na primeira etapa, a avaliação da base de 1L, resultou em uma aglomeração de 1 cluster de controles e 3 de disléxicos. Somente disléxicos obtiverem MVL<140,72 ppm, já na avaliação de 3L foram obtidos 3 clusters de disléxicos e 1 de controle. Neste somente disléxicos tiveram uma Velocidade de Leitura no Tamanho Crítico de Letra (VTCL) inferior a 112,71 ppm. Na segunda etapa foram gerados dados sintéticos para cada grupo ter 100 registros. Na seleção de característica a Acuidade de Leitura (AL) foi selecionada em 4 dos 5 algoritmos. A Regressão Logística obteve a melhor AUC (0,999) e acurácia (99%) além de ter obtido a melhor curva de calibração CONCLUSÃO: Na primeira etapa o fato de a MVL ter sido tão determinante na separação dos clusters com 1L e o VTCL no de 3L pode indicar que o efeito de crownding teve algum impacto no teste de 3L. O fato de AL ter sido selecionado em 4 das 5 seleções de características, a torna uma variável importante para o diagnóstico e estudo da dislexia. O algoritmo de Regressão Logística obteve os melhores resultados sendo indicado para classificação de disléxicos com base em FVL.
id UFSP_ba97dd901457fe5bfeed6ae4e2e3e0c1
oai_identifier_str oai:repositorio.unifesp.br:11600/59992
network_acronym_str UFSP
network_name_str Repositório Institucional da UNIFESP
repository_id_str
spelling Mestradohttp://lattes.cnpq.br/3542867700396961http://lattes.cnpq.br/8425496220946395http://lattes.cnpq.br/4433119488921195Silva Junior, Antonio Carlos Da [UNIFESP]http://lattes.cnpq.br/1464083566861583Universidade Federal de São Paulo (UNIFESP)Mancini, Felipe [UNIFESP]Schor, Paulo [UNIFESP]Gonçalves, Emanuela Cristina Ramos [UNIFESP]São Paulo2021-01-19T16:37:33Z2021-01-19T16:37:33Z2019-12-16INTRODUÇÃO: Dislexia do desenvolvimento é uma disfunção neurológica que afeta a habilidade de leitura, que se não tratado pode levar a problemas de aprendizado e impactando negativamente o aumento de vocabulário. O diagnóstico da dislexia é complexo e feito por exclusão. Alguns estudos avaliaram dados de movimento ocular em conjunto com técnicas de aprendizado de máquina (AM) para classificar a dislexia. Outro estudo levanta a hipótese de padrões de funções visuais de leitura (FVL) para compreensão da dislexia. Entretanto, o estudo de FVL em conjunto de técnicas de AM ainda não foi explorado. OBJETIVO GERAL: Aplicar técnicas de aprendizado de máquina (AM) para explorar e auxiliar o diagnóstico de disléxicos a partir das funções visuais de leitura (FVL). OBJETIVOS ESPECÍFICOS: Explorar os dados de FVL de disléxicos e não-disléxicos, a partir de extração de características e classificá-los utilizando AM. MATERIAL E MÉTODOS: Esta dissertação foi executada em duas etapas: uma quantitativa e exploratória e uma quantitativa e correlacional. A primeira etapa explorou os dados de FVL de disléxicos de duas bases, uma de leituras de textos em 1 linha (1L) e outra de 3 linhas (3L). Foi aplicado o algoritmo de mapas auto-organizáveis em cada base para separá-los em clusters que foram então enviados para uma Árvore de Decisão para extrair as regras que regem cada um dos grupos. A segunda etapa utilizou dados de leituras de 3L e foi realizada uma seleção de outliers. Com os dados restantes foi aplicado geração sintética de dados com o algoritmo SMOTE. Então foi aplicado uma técnica de seleção de características tendo a melhor área sob a curva ROC (AUC) como alvo para cada um dos cinco algoritmos selecionados. Eles foram comparados pela AUC e acurácia. Todos também foram comparados pela sua curva de calibração. RESULTADOS: Na primeira etapa, a avaliação da base de 1L, resultou em uma aglomeração de 1 cluster de controles e 3 de disléxicos. Somente disléxicos obtiverem MVL<140,72 ppm, já na avaliação de 3L foram obtidos 3 clusters de disléxicos e 1 de controle. Neste somente disléxicos tiveram uma Velocidade de Leitura no Tamanho Crítico de Letra (VTCL) inferior a 112,71 ppm. Na segunda etapa foram gerados dados sintéticos para cada grupo ter 100 registros. Na seleção de característica a Acuidade de Leitura (AL) foi selecionada em 4 dos 5 algoritmos. A Regressão Logística obteve a melhor AUC (0,999) e acurácia (99%) além de ter obtido a melhor curva de calibração CONCLUSÃO: Na primeira etapa o fato de a MVL ter sido tão determinante na separação dos clusters com 1L e o VTCL no de 3L pode indicar que o efeito de crownding teve algum impacto no teste de 3L. O fato de AL ter sido selecionado em 4 das 5 seleções de características, a torna uma variável importante para o diagnóstico e estudo da dislexia. O algoritmo de Regressão Logística obteve os melhores resultados sendo indicado para classificação de disléxicos com base em FVL.INTRODUCTION: Developmental dyslexia is a neurological disorder that affects reading ability, that when left untreated can lead to learning problems and negatively affecting vocabulary increase. The diagnosis of dyslexia is complex and made by exclusion. Some studies evaluated eye movement data in conjunction with machine learning (ML) techniques to classify dyslexia. Another study raises the hypothesis of visual reading function patterns (VRF) for dyslexic differentiation. The study of VRF in combination of ML techniques has not been explored. GENERAL OBJECTIVE: To apply ML techniques to explore and assist the diagnosis of dyslexics from VRF. SPECIFIC OBJECTIVES: To explore dyslexic and non-dyslexic VRF data with feature extraction and to classify dyslexic and non-dyslexic using ML. MATERIAL AND METHODS: This dissertation has two steps: a quantitative and exploratory and a quantitative and correlational. The first step explored two dyslexic VRF datasets, one of 1-line (1L) text readings and the other of 3-line (3L) text readings. The self-organizing map algorithm was applied to each base to separate them into clusters that were then sent to a decision tree to extract the rules characterize each of the groups. The second step used data from 3L readings. The outliers was selected by a specialist. With the remaining data, the SMOTE algorithm was applied. Then a feature selection technique was applied having the best area under the ROC curve (AUC) as target for each of the five selected algorithms. They were compared by AUC and accuracy. All were also compared by their calibration curve. RESULTS: In the first step, the 1L base evaluation resulted in a clustering of 1 cluster of controls and 3 of dyslexics. Only dyslexics obtained Maximum reading speed MRS <140.72 ppm, while in the 3L evaluation, 3 dyslexic clusters and 1 control were obtained. In this only dyslexics had reading speed at critical read size (RSCPS) of less than 112.71 ppm. In the second step, synthetic data were generated for each group to have 100 records. In feature selection, the reading acuity (RA) was selected in 4 of the 5 algorithms. Logistic regression obtained the best AUC (0.999) and accuracy (99%) and obtained the best calibration curve. CONCLUSION: In the first step, the fact that MRS was so determinant in the separation of the 1L clusters and the RSCPS in the first one. It may indicate that the crownding effect had some impact on the 3L test. The fact that RA has been selected in 4 of the 5 feature selections may be an important variable for the diagnosis and study of dyslexia. The logistic regression algorithm obtained the best results and was indicated for VRF-based dyslexic classification.Dados abertos - Sucupira - Teses e dissertações (2019)https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=9178921SILVA JR., Antonio Carlos. Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais de leitura e aprendizado de máquina. 2019. 44f. Dissertação (Mestrado em Gestão e Informática em Saúde) – Escola Paulista de Medicina, Universidade Federal de São Paulo. São Paulo, 2019.Antonio Carlos da Silva Junior-A.pdfhttps://repositorio.unifesp.br/handle/11600/59992ark:/48912/001300002hbqnporUniversidade Federal de São Paulo (UNIFESP)info:eu-repo/semantics/openAccessExtração De CaracterísticasGeração Sintética De DadosClassificaçãoAprendizado De MáquinaDislexiaFeature ExtractionSynthetic Data GenerationClassificationMachine LearningDyslexiaReconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquinaAutomatic recognition of dyslexic patterns: an approach based on visual reading functions and machine learninginfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESPSão Paulo, Escola Paulista de MedicinaGestão e Informática em SaúdeGestão E Informática Em SaúdeGestão E Informática Em SaúdeORIGINALAntonio Carlos da Silva Junior-A.pdfapplication/pdf1275995https://repositorio.unifesp.br/bitstreams/3e0fb6d2-8fc8-4285-889b-8f6effc2d34e/downloaddda66e925bcd48d80d5c46b4332b7008MD51TEXTAntonio Carlos da Silva Junior-A.pdf.txtAntonio Carlos da Silva Junior-A.pdf.txtExtracted texttext/plain101589https://repositorio.unifesp.br/bitstreams/a31eafea-96af-4cc2-80fb-df4f20aad40c/download96bed801c5e87e1dd34b5f2c93372acaMD52THUMBNAILAntonio Carlos da Silva Junior-A.pdf.jpgAntonio Carlos da Silva Junior-A.pdf.jpgGenerated Thumbnailimage/jpeg3090https://repositorio.unifesp.br/bitstreams/d34b1c26-252a-4213-8e8e-a19b650cbd22/download8b693ecc95218f328161bccfdd370826MD5311600/599922024-08-08 04:05:05.569oai:repositorio.unifesp.br:11600/59992https://repositorio.unifesp.brRepositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestbiblioteca.csp@unifesp.bropendoar:34652024-08-08T04:05:05Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)false
dc.title.pt_BR.fl_str_mv Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina
dc.title.alternative.en.fl_str_mv Automatic recognition of dyslexic patterns: an approach based on visual reading functions and machine learning
title Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina
spellingShingle Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina
Silva Junior, Antonio Carlos Da [UNIFESP]
Extração De Características
Geração Sintética De Dados
Classificação
Aprendizado De Máquina
Dislexia
Feature Extraction
Synthetic Data Generation
Classification
Machine Learning
Dyslexia
title_short Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina
title_full Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina
title_fullStr Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina
title_full_unstemmed Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina
title_sort Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina
author Silva Junior, Antonio Carlos Da [UNIFESP]
author_facet Silva Junior, Antonio Carlos Da [UNIFESP]
author_role author
dc.contributor.advisor-coLattes.none.fl_str_mv http://lattes.cnpq.br/3542867700396961
http://lattes.cnpq.br/8425496220946395
dc.contributor.advisorLattes.none.fl_str_mv http://lattes.cnpq.br/4433119488921195
dc.contributor.authorLattes.none.fl_str_mv http://lattes.cnpq.br/1464083566861583
dc.contributor.institution.pt_BR.fl_str_mv Universidade Federal de São Paulo (UNIFESP)
dc.contributor.author.fl_str_mv Silva Junior, Antonio Carlos Da [UNIFESP]
dc.contributor.advisor1.fl_str_mv Mancini, Felipe [UNIFESP]
dc.contributor.advisor-co1.fl_str_mv Schor, Paulo [UNIFESP]
Gonçalves, Emanuela Cristina Ramos [UNIFESP]
contributor_str_mv Mancini, Felipe [UNIFESP]
Schor, Paulo [UNIFESP]
Gonçalves, Emanuela Cristina Ramos [UNIFESP]
dc.subject.por.fl_str_mv Extração De Características
Geração Sintética De Dados
Classificação
Aprendizado De Máquina
Dislexia
topic Extração De Características
Geração Sintética De Dados
Classificação
Aprendizado De Máquina
Dislexia
Feature Extraction
Synthetic Data Generation
Classification
Machine Learning
Dyslexia
dc.subject.eng.fl_str_mv Feature Extraction
Synthetic Data Generation
Classification
Machine Learning
Dyslexia
description INTRODUÇÃO: Dislexia do desenvolvimento é uma disfunção neurológica que afeta a habilidade de leitura, que se não tratado pode levar a problemas de aprendizado e impactando negativamente o aumento de vocabulário. O diagnóstico da dislexia é complexo e feito por exclusão. Alguns estudos avaliaram dados de movimento ocular em conjunto com técnicas de aprendizado de máquina (AM) para classificar a dislexia. Outro estudo levanta a hipótese de padrões de funções visuais de leitura (FVL) para compreensão da dislexia. Entretanto, o estudo de FVL em conjunto de técnicas de AM ainda não foi explorado. OBJETIVO GERAL: Aplicar técnicas de aprendizado de máquina (AM) para explorar e auxiliar o diagnóstico de disléxicos a partir das funções visuais de leitura (FVL). OBJETIVOS ESPECÍFICOS: Explorar os dados de FVL de disléxicos e não-disléxicos, a partir de extração de características e classificá-los utilizando AM. MATERIAL E MÉTODOS: Esta dissertação foi executada em duas etapas: uma quantitativa e exploratória e uma quantitativa e correlacional. A primeira etapa explorou os dados de FVL de disléxicos de duas bases, uma de leituras de textos em 1 linha (1L) e outra de 3 linhas (3L). Foi aplicado o algoritmo de mapas auto-organizáveis em cada base para separá-los em clusters que foram então enviados para uma Árvore de Decisão para extrair as regras que regem cada um dos grupos. A segunda etapa utilizou dados de leituras de 3L e foi realizada uma seleção de outliers. Com os dados restantes foi aplicado geração sintética de dados com o algoritmo SMOTE. Então foi aplicado uma técnica de seleção de características tendo a melhor área sob a curva ROC (AUC) como alvo para cada um dos cinco algoritmos selecionados. Eles foram comparados pela AUC e acurácia. Todos também foram comparados pela sua curva de calibração. RESULTADOS: Na primeira etapa, a avaliação da base de 1L, resultou em uma aglomeração de 1 cluster de controles e 3 de disléxicos. Somente disléxicos obtiverem MVL<140,72 ppm, já na avaliação de 3L foram obtidos 3 clusters de disléxicos e 1 de controle. Neste somente disléxicos tiveram uma Velocidade de Leitura no Tamanho Crítico de Letra (VTCL) inferior a 112,71 ppm. Na segunda etapa foram gerados dados sintéticos para cada grupo ter 100 registros. Na seleção de característica a Acuidade de Leitura (AL) foi selecionada em 4 dos 5 algoritmos. A Regressão Logística obteve a melhor AUC (0,999) e acurácia (99%) além de ter obtido a melhor curva de calibração CONCLUSÃO: Na primeira etapa o fato de a MVL ter sido tão determinante na separação dos clusters com 1L e o VTCL no de 3L pode indicar que o efeito de crownding teve algum impacto no teste de 3L. O fato de AL ter sido selecionado em 4 das 5 seleções de características, a torna uma variável importante para o diagnóstico e estudo da dislexia. O algoritmo de Regressão Logística obteve os melhores resultados sendo indicado para classificação de disléxicos com base em FVL.
publishDate 2019
dc.date.issued.fl_str_mv 2019-12-16
dc.date.accessioned.fl_str_mv 2021-01-19T16:37:33Z
dc.date.available.fl_str_mv 2021-01-19T16:37:33Z
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format masterThesis
status_str publishedVersion
dc.identifier.pt_BR.fl_str_mv https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=9178921
dc.identifier.citation.fl_str_mv SILVA JR., Antonio Carlos. Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais de leitura e aprendizado de máquina. 2019. 44f. Dissertação (Mestrado em Gestão e Informática em Saúde) – Escola Paulista de Medicina, Universidade Federal de São Paulo. São Paulo, 2019.
dc.identifier.uri.fl_str_mv https://repositorio.unifesp.br/handle/11600/59992
dc.identifier.dark.fl_str_mv ark:/48912/001300002hbqn
dc.identifier.file.none.fl_str_mv Antonio Carlos da Silva Junior-A.pdf
url https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=9178921
https://repositorio.unifesp.br/handle/11600/59992
identifier_str_mv SILVA JR., Antonio Carlos. Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais de leitura e aprendizado de máquina. 2019. 44f. Dissertação (Mestrado em Gestão e Informática em Saúde) – Escola Paulista de Medicina, Universidade Federal de São Paulo. São Paulo, 2019.
Antonio Carlos da Silva Junior-A.pdf
ark:/48912/001300002hbqn
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.coverage.spatial.none.fl_str_mv São Paulo
dc.publisher.none.fl_str_mv Universidade Federal de São Paulo (UNIFESP)
publisher.none.fl_str_mv Universidade Federal de São Paulo (UNIFESP)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNIFESP
instname:Universidade Federal de São Paulo (UNIFESP)
instacron:UNIFESP
instname_str Universidade Federal de São Paulo (UNIFESP)
instacron_str UNIFESP
institution UNIFESP
reponame_str Repositório Institucional da UNIFESP
collection Repositório Institucional da UNIFESP
bitstream.url.fl_str_mv https://repositorio.unifesp.br/bitstreams/3e0fb6d2-8fc8-4285-889b-8f6effc2d34e/download
https://repositorio.unifesp.br/bitstreams/a31eafea-96af-4cc2-80fb-df4f20aad40c/download
https://repositorio.unifesp.br/bitstreams/d34b1c26-252a-4213-8e8e-a19b650cbd22/download
bitstream.checksum.fl_str_mv dda66e925bcd48d80d5c46b4332b7008
96bed801c5e87e1dd34b5f2c93372aca
8b693ecc95218f328161bccfdd370826
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)
repository.mail.fl_str_mv biblioteca.csp@unifesp.br
_version_ 1863846353935794176