Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina
| Ano de defesa: | 2019 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| dARK ID: | ark:/48912/001300002hbqn |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Paulo (UNIFESP)
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Link de acesso: | https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=9178921 https://repositorio.unifesp.br/handle/11600/59992 |
Resumo: | INTRODUÇÃO: Dislexia do desenvolvimento é uma disfunção neurológica que afeta a habilidade de leitura, que se não tratado pode levar a problemas de aprendizado e impactando negativamente o aumento de vocabulário. O diagnóstico da dislexia é complexo e feito por exclusão. Alguns estudos avaliaram dados de movimento ocular em conjunto com técnicas de aprendizado de máquina (AM) para classificar a dislexia. Outro estudo levanta a hipótese de padrões de funções visuais de leitura (FVL) para compreensão da dislexia. Entretanto, o estudo de FVL em conjunto de técnicas de AM ainda não foi explorado. OBJETIVO GERAL: Aplicar técnicas de aprendizado de máquina (AM) para explorar e auxiliar o diagnóstico de disléxicos a partir das funções visuais de leitura (FVL). OBJETIVOS ESPECÍFICOS: Explorar os dados de FVL de disléxicos e não-disléxicos, a partir de extração de características e classificá-los utilizando AM. MATERIAL E MÉTODOS: Esta dissertação foi executada em duas etapas: uma quantitativa e exploratória e uma quantitativa e correlacional. A primeira etapa explorou os dados de FVL de disléxicos de duas bases, uma de leituras de textos em 1 linha (1L) e outra de 3 linhas (3L). Foi aplicado o algoritmo de mapas auto-organizáveis em cada base para separá-los em clusters que foram então enviados para uma Árvore de Decisão para extrair as regras que regem cada um dos grupos. A segunda etapa utilizou dados de leituras de 3L e foi realizada uma seleção de outliers. Com os dados restantes foi aplicado geração sintética de dados com o algoritmo SMOTE. Então foi aplicado uma técnica de seleção de características tendo a melhor área sob a curva ROC (AUC) como alvo para cada um dos cinco algoritmos selecionados. Eles foram comparados pela AUC e acurácia. Todos também foram comparados pela sua curva de calibração. RESULTADOS: Na primeira etapa, a avaliação da base de 1L, resultou em uma aglomeração de 1 cluster de controles e 3 de disléxicos. Somente disléxicos obtiverem MVL<140,72 ppm, já na avaliação de 3L foram obtidos 3 clusters de disléxicos e 1 de controle. Neste somente disléxicos tiveram uma Velocidade de Leitura no Tamanho Crítico de Letra (VTCL) inferior a 112,71 ppm. Na segunda etapa foram gerados dados sintéticos para cada grupo ter 100 registros. Na seleção de característica a Acuidade de Leitura (AL) foi selecionada em 4 dos 5 algoritmos. A Regressão Logística obteve a melhor AUC (0,999) e acurácia (99%) além de ter obtido a melhor curva de calibração CONCLUSÃO: Na primeira etapa o fato de a MVL ter sido tão determinante na separação dos clusters com 1L e o VTCL no de 3L pode indicar que o efeito de crownding teve algum impacto no teste de 3L. O fato de AL ter sido selecionado em 4 das 5 seleções de características, a torna uma variável importante para o diagnóstico e estudo da dislexia. O algoritmo de Regressão Logística obteve os melhores resultados sendo indicado para classificação de disléxicos com base em FVL. |
| id |
UFSP_ba97dd901457fe5bfeed6ae4e2e3e0c1 |
|---|---|
| oai_identifier_str |
oai:repositorio.unifesp.br:11600/59992 |
| network_acronym_str |
UFSP |
| network_name_str |
Repositório Institucional da UNIFESP |
| repository_id_str |
|
| spelling |
Mestradohttp://lattes.cnpq.br/3542867700396961http://lattes.cnpq.br/8425496220946395http://lattes.cnpq.br/4433119488921195Silva Junior, Antonio Carlos Da [UNIFESP]http://lattes.cnpq.br/1464083566861583Universidade Federal de São Paulo (UNIFESP)Mancini, Felipe [UNIFESP]Schor, Paulo [UNIFESP]Gonçalves, Emanuela Cristina Ramos [UNIFESP]São Paulo2021-01-19T16:37:33Z2021-01-19T16:37:33Z2019-12-16INTRODUÇÃO: Dislexia do desenvolvimento é uma disfunção neurológica que afeta a habilidade de leitura, que se não tratado pode levar a problemas de aprendizado e impactando negativamente o aumento de vocabulário. O diagnóstico da dislexia é complexo e feito por exclusão. Alguns estudos avaliaram dados de movimento ocular em conjunto com técnicas de aprendizado de máquina (AM) para classificar a dislexia. Outro estudo levanta a hipótese de padrões de funções visuais de leitura (FVL) para compreensão da dislexia. Entretanto, o estudo de FVL em conjunto de técnicas de AM ainda não foi explorado. OBJETIVO GERAL: Aplicar técnicas de aprendizado de máquina (AM) para explorar e auxiliar o diagnóstico de disléxicos a partir das funções visuais de leitura (FVL). OBJETIVOS ESPECÍFICOS: Explorar os dados de FVL de disléxicos e não-disléxicos, a partir de extração de características e classificá-los utilizando AM. MATERIAL E MÉTODOS: Esta dissertação foi executada em duas etapas: uma quantitativa e exploratória e uma quantitativa e correlacional. A primeira etapa explorou os dados de FVL de disléxicos de duas bases, uma de leituras de textos em 1 linha (1L) e outra de 3 linhas (3L). Foi aplicado o algoritmo de mapas auto-organizáveis em cada base para separá-los em clusters que foram então enviados para uma Árvore de Decisão para extrair as regras que regem cada um dos grupos. A segunda etapa utilizou dados de leituras de 3L e foi realizada uma seleção de outliers. Com os dados restantes foi aplicado geração sintética de dados com o algoritmo SMOTE. Então foi aplicado uma técnica de seleção de características tendo a melhor área sob a curva ROC (AUC) como alvo para cada um dos cinco algoritmos selecionados. Eles foram comparados pela AUC e acurácia. Todos também foram comparados pela sua curva de calibração. RESULTADOS: Na primeira etapa, a avaliação da base de 1L, resultou em uma aglomeração de 1 cluster de controles e 3 de disléxicos. Somente disléxicos obtiverem MVL<140,72 ppm, já na avaliação de 3L foram obtidos 3 clusters de disléxicos e 1 de controle. Neste somente disléxicos tiveram uma Velocidade de Leitura no Tamanho Crítico de Letra (VTCL) inferior a 112,71 ppm. Na segunda etapa foram gerados dados sintéticos para cada grupo ter 100 registros. Na seleção de característica a Acuidade de Leitura (AL) foi selecionada em 4 dos 5 algoritmos. A Regressão Logística obteve a melhor AUC (0,999) e acurácia (99%) além de ter obtido a melhor curva de calibração CONCLUSÃO: Na primeira etapa o fato de a MVL ter sido tão determinante na separação dos clusters com 1L e o VTCL no de 3L pode indicar que o efeito de crownding teve algum impacto no teste de 3L. O fato de AL ter sido selecionado em 4 das 5 seleções de características, a torna uma variável importante para o diagnóstico e estudo da dislexia. O algoritmo de Regressão Logística obteve os melhores resultados sendo indicado para classificação de disléxicos com base em FVL.INTRODUCTION: Developmental dyslexia is a neurological disorder that affects reading ability, that when left untreated can lead to learning problems and negatively affecting vocabulary increase. The diagnosis of dyslexia is complex and made by exclusion. Some studies evaluated eye movement data in conjunction with machine learning (ML) techniques to classify dyslexia. Another study raises the hypothesis of visual reading function patterns (VRF) for dyslexic differentiation. The study of VRF in combination of ML techniques has not been explored. GENERAL OBJECTIVE: To apply ML techniques to explore and assist the diagnosis of dyslexics from VRF. SPECIFIC OBJECTIVES: To explore dyslexic and non-dyslexic VRF data with feature extraction and to classify dyslexic and non-dyslexic using ML. MATERIAL AND METHODS: This dissertation has two steps: a quantitative and exploratory and a quantitative and correlational. The first step explored two dyslexic VRF datasets, one of 1-line (1L) text readings and the other of 3-line (3L) text readings. The self-organizing map algorithm was applied to each base to separate them into clusters that were then sent to a decision tree to extract the rules characterize each of the groups. The second step used data from 3L readings. The outliers was selected by a specialist. With the remaining data, the SMOTE algorithm was applied. Then a feature selection technique was applied having the best area under the ROC curve (AUC) as target for each of the five selected algorithms. They were compared by AUC and accuracy. All were also compared by their calibration curve. RESULTS: In the first step, the 1L base evaluation resulted in a clustering of 1 cluster of controls and 3 of dyslexics. Only dyslexics obtained Maximum reading speed MRS <140.72 ppm, while in the 3L evaluation, 3 dyslexic clusters and 1 control were obtained. In this only dyslexics had reading speed at critical read size (RSCPS) of less than 112.71 ppm. In the second step, synthetic data were generated for each group to have 100 records. In feature selection, the reading acuity (RA) was selected in 4 of the 5 algorithms. Logistic regression obtained the best AUC (0.999) and accuracy (99%) and obtained the best calibration curve. CONCLUSION: In the first step, the fact that MRS was so determinant in the separation of the 1L clusters and the RSCPS in the first one. It may indicate that the crownding effect had some impact on the 3L test. The fact that RA has been selected in 4 of the 5 feature selections may be an important variable for the diagnosis and study of dyslexia. The logistic regression algorithm obtained the best results and was indicated for VRF-based dyslexic classification.Dados abertos - Sucupira - Teses e dissertações (2019)https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=9178921SILVA JR., Antonio Carlos. Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais de leitura e aprendizado de máquina. 2019. 44f. Dissertação (Mestrado em Gestão e Informática em Saúde) – Escola Paulista de Medicina, Universidade Federal de São Paulo. São Paulo, 2019.Antonio Carlos da Silva Junior-A.pdfhttps://repositorio.unifesp.br/handle/11600/59992ark:/48912/001300002hbqnporUniversidade Federal de São Paulo (UNIFESP)info:eu-repo/semantics/openAccessExtração De CaracterísticasGeração Sintética De DadosClassificaçãoAprendizado De MáquinaDislexiaFeature ExtractionSynthetic Data GenerationClassificationMachine LearningDyslexiaReconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquinaAutomatic recognition of dyslexic patterns: an approach based on visual reading functions and machine learninginfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESPSão Paulo, Escola Paulista de MedicinaGestão e Informática em SaúdeGestão E Informática Em SaúdeGestão E Informática Em SaúdeORIGINALAntonio Carlos da Silva Junior-A.pdfapplication/pdf1275995https://repositorio.unifesp.br/bitstreams/3e0fb6d2-8fc8-4285-889b-8f6effc2d34e/downloaddda66e925bcd48d80d5c46b4332b7008MD51TEXTAntonio Carlos da Silva Junior-A.pdf.txtAntonio Carlos da Silva Junior-A.pdf.txtExtracted texttext/plain101589https://repositorio.unifesp.br/bitstreams/a31eafea-96af-4cc2-80fb-df4f20aad40c/download96bed801c5e87e1dd34b5f2c93372acaMD52THUMBNAILAntonio Carlos da Silva Junior-A.pdf.jpgAntonio Carlos da Silva Junior-A.pdf.jpgGenerated Thumbnailimage/jpeg3090https://repositorio.unifesp.br/bitstreams/d34b1c26-252a-4213-8e8e-a19b650cbd22/download8b693ecc95218f328161bccfdd370826MD5311600/599922024-08-08 04:05:05.569oai:repositorio.unifesp.br:11600/59992https://repositorio.unifesp.brRepositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestbiblioteca.csp@unifesp.bropendoar:34652024-08-08T04:05:05Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)false |
| dc.title.pt_BR.fl_str_mv |
Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina |
| dc.title.alternative.en.fl_str_mv |
Automatic recognition of dyslexic patterns: an approach based on visual reading functions and machine learning |
| title |
Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina |
| spellingShingle |
Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina Silva Junior, Antonio Carlos Da [UNIFESP] Extração De Características Geração Sintética De Dados Classificação Aprendizado De Máquina Dislexia Feature Extraction Synthetic Data Generation Classification Machine Learning Dyslexia |
| title_short |
Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina |
| title_full |
Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina |
| title_fullStr |
Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina |
| title_full_unstemmed |
Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina |
| title_sort |
Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais da leitura e aprendizado de máquina |
| author |
Silva Junior, Antonio Carlos Da [UNIFESP] |
| author_facet |
Silva Junior, Antonio Carlos Da [UNIFESP] |
| author_role |
author |
| dc.contributor.advisor-coLattes.none.fl_str_mv |
http://lattes.cnpq.br/3542867700396961 http://lattes.cnpq.br/8425496220946395 |
| dc.contributor.advisorLattes.none.fl_str_mv |
http://lattes.cnpq.br/4433119488921195 |
| dc.contributor.authorLattes.none.fl_str_mv |
http://lattes.cnpq.br/1464083566861583 |
| dc.contributor.institution.pt_BR.fl_str_mv |
Universidade Federal de São Paulo (UNIFESP) |
| dc.contributor.author.fl_str_mv |
Silva Junior, Antonio Carlos Da [UNIFESP] |
| dc.contributor.advisor1.fl_str_mv |
Mancini, Felipe [UNIFESP] |
| dc.contributor.advisor-co1.fl_str_mv |
Schor, Paulo [UNIFESP] Gonçalves, Emanuela Cristina Ramos [UNIFESP] |
| contributor_str_mv |
Mancini, Felipe [UNIFESP] Schor, Paulo [UNIFESP] Gonçalves, Emanuela Cristina Ramos [UNIFESP] |
| dc.subject.por.fl_str_mv |
Extração De Características Geração Sintética De Dados Classificação Aprendizado De Máquina Dislexia |
| topic |
Extração De Características Geração Sintética De Dados Classificação Aprendizado De Máquina Dislexia Feature Extraction Synthetic Data Generation Classification Machine Learning Dyslexia |
| dc.subject.eng.fl_str_mv |
Feature Extraction Synthetic Data Generation Classification Machine Learning Dyslexia |
| description |
INTRODUÇÃO: Dislexia do desenvolvimento é uma disfunção neurológica que afeta a habilidade de leitura, que se não tratado pode levar a problemas de aprendizado e impactando negativamente o aumento de vocabulário. O diagnóstico da dislexia é complexo e feito por exclusão. Alguns estudos avaliaram dados de movimento ocular em conjunto com técnicas de aprendizado de máquina (AM) para classificar a dislexia. Outro estudo levanta a hipótese de padrões de funções visuais de leitura (FVL) para compreensão da dislexia. Entretanto, o estudo de FVL em conjunto de técnicas de AM ainda não foi explorado. OBJETIVO GERAL: Aplicar técnicas de aprendizado de máquina (AM) para explorar e auxiliar o diagnóstico de disléxicos a partir das funções visuais de leitura (FVL). OBJETIVOS ESPECÍFICOS: Explorar os dados de FVL de disléxicos e não-disléxicos, a partir de extração de características e classificá-los utilizando AM. MATERIAL E MÉTODOS: Esta dissertação foi executada em duas etapas: uma quantitativa e exploratória e uma quantitativa e correlacional. A primeira etapa explorou os dados de FVL de disléxicos de duas bases, uma de leituras de textos em 1 linha (1L) e outra de 3 linhas (3L). Foi aplicado o algoritmo de mapas auto-organizáveis em cada base para separá-los em clusters que foram então enviados para uma Árvore de Decisão para extrair as regras que regem cada um dos grupos. A segunda etapa utilizou dados de leituras de 3L e foi realizada uma seleção de outliers. Com os dados restantes foi aplicado geração sintética de dados com o algoritmo SMOTE. Então foi aplicado uma técnica de seleção de características tendo a melhor área sob a curva ROC (AUC) como alvo para cada um dos cinco algoritmos selecionados. Eles foram comparados pela AUC e acurácia. Todos também foram comparados pela sua curva de calibração. RESULTADOS: Na primeira etapa, a avaliação da base de 1L, resultou em uma aglomeração de 1 cluster de controles e 3 de disléxicos. Somente disléxicos obtiverem MVL<140,72 ppm, já na avaliação de 3L foram obtidos 3 clusters de disléxicos e 1 de controle. Neste somente disléxicos tiveram uma Velocidade de Leitura no Tamanho Crítico de Letra (VTCL) inferior a 112,71 ppm. Na segunda etapa foram gerados dados sintéticos para cada grupo ter 100 registros. Na seleção de característica a Acuidade de Leitura (AL) foi selecionada em 4 dos 5 algoritmos. A Regressão Logística obteve a melhor AUC (0,999) e acurácia (99%) além de ter obtido a melhor curva de calibração CONCLUSÃO: Na primeira etapa o fato de a MVL ter sido tão determinante na separação dos clusters com 1L e o VTCL no de 3L pode indicar que o efeito de crownding teve algum impacto no teste de 3L. O fato de AL ter sido selecionado em 4 das 5 seleções de características, a torna uma variável importante para o diagnóstico e estudo da dislexia. O algoritmo de Regressão Logística obteve os melhores resultados sendo indicado para classificação de disléxicos com base em FVL. |
| publishDate |
2019 |
| dc.date.issued.fl_str_mv |
2019-12-16 |
| dc.date.accessioned.fl_str_mv |
2021-01-19T16:37:33Z |
| dc.date.available.fl_str_mv |
2021-01-19T16:37:33Z |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.pt_BR.fl_str_mv |
https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=9178921 |
| dc.identifier.citation.fl_str_mv |
SILVA JR., Antonio Carlos. Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais de leitura e aprendizado de máquina. 2019. 44f. Dissertação (Mestrado em Gestão e Informática em Saúde) – Escola Paulista de Medicina, Universidade Federal de São Paulo. São Paulo, 2019. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.unifesp.br/handle/11600/59992 |
| dc.identifier.dark.fl_str_mv |
ark:/48912/001300002hbqn |
| dc.identifier.file.none.fl_str_mv |
Antonio Carlos da Silva Junior-A.pdf |
| url |
https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=9178921 https://repositorio.unifesp.br/handle/11600/59992 |
| identifier_str_mv |
SILVA JR., Antonio Carlos. Reconhecimento automático de padrões em dislexia: uma abordagem baseada em funções visuais de leitura e aprendizado de máquina. 2019. 44f. Dissertação (Mestrado em Gestão e Informática em Saúde) – Escola Paulista de Medicina, Universidade Federal de São Paulo. São Paulo, 2019. Antonio Carlos da Silva Junior-A.pdf ark:/48912/001300002hbqn |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.coverage.spatial.none.fl_str_mv |
São Paulo |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Paulo (UNIFESP) |
| publisher.none.fl_str_mv |
Universidade Federal de São Paulo (UNIFESP) |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNIFESP instname:Universidade Federal de São Paulo (UNIFESP) instacron:UNIFESP |
| instname_str |
Universidade Federal de São Paulo (UNIFESP) |
| instacron_str |
UNIFESP |
| institution |
UNIFESP |
| reponame_str |
Repositório Institucional da UNIFESP |
| collection |
Repositório Institucional da UNIFESP |
| bitstream.url.fl_str_mv |
https://repositorio.unifesp.br/bitstreams/3e0fb6d2-8fc8-4285-889b-8f6effc2d34e/download https://repositorio.unifesp.br/bitstreams/a31eafea-96af-4cc2-80fb-df4f20aad40c/download https://repositorio.unifesp.br/bitstreams/d34b1c26-252a-4213-8e8e-a19b650cbd22/download |
| bitstream.checksum.fl_str_mv |
dda66e925bcd48d80d5c46b4332b7008 96bed801c5e87e1dd34b5f2c93372aca 8b693ecc95218f328161bccfdd370826 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP) |
| repository.mail.fl_str_mv |
biblioteca.csp@unifesp.br |
| _version_ |
1863846353935794176 |