Classificação do estágio de glaucoma usando dados multimodais

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: FERREIRA, Marcos Melo lattes
Orientador(a): BRAZ JUNIOR, Geraldo lattes
Banca de defesa: BRAZ JUNIOR, Geraldo lattes, CUNHA, António Manuel Trigueiros da Silva lattes, RENNA, Francesco lattes, NETTO SANTOS, Paulo Ivson, VERAS, Rodrigo de Melo Souza
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Maranhão
Programa de Pós-Graduação: PROGRAMA DE PÓS-GRADUAÇÃO DOUTORADO EM CIÊNCIA DA COMPUTAÇÃO
Departamento: COORDENAÇÃO DO CURSO DE CIÊNCIAS DA COMPUTAÇÃO/CCET
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://tedebc.ufma.br/jspui/handle/tede/6579
Resumo: Glaucoma is the leading cause of irreversible blindness worldwide. Its early diagnosis is challenging due to the absence of symptoms in the initial stages, the need for multiple exams to be analysed by specialised professionals, and the general lack of awareness about the disease among the population. Although the visual loss caused by glaucoma is irreversible, its progression can be slowed if the disease is detected in its early stages. In this context, deep learning methods have demonstrated promising results in medical image processing tasks, including classification and segmentation, offering potential support for clinical diagnosis. In this work, we developed a method for glaucoma stage classification that combines fundus photographs and OCT volumes. The method employs a multimodal convolutional architecture and explores various fusion strategies, both at the feature map and prediction levels, aiming to integrate multimodal information effectively. Additionally, specific regions of interest were investigated — the optic nerve in fundus photographs and the retinal layers in OCT volumes — to improve data representation and enhance classification accuracy. The experiments demonstrated that multimodal models outperformed unimodal approaches, achieving a Kappa score of 0.88, which indicates a high level of agreement of the proposed method with specialist assessments. Moreover, the results showed that fundus photography has a greater influence than OCT volumes in the classification process. At the same time, the targeted capture of retinal layers proved to be a promising strategy for further improving accuracy. Overall, the proposed method demonstrated significant potential as a clinical decision support tool, contributing to the advancement of automated diagnostic systems and enabling earlier and more accurate glaucoma detection.
id UFMA_d99cfc34e0ff5fa30851731b799b51b8
oai_identifier_str oai:tede2:tede/6579
network_acronym_str UFMA
network_name_str Biblioteca Digital de Teses e Dissertações da UFMA
repository_id_str
spelling BRAZ JUNIOR, Geraldohttp://lattes.cnpq.br/8287861610873629CUNHA, António Manuel Trigueiros da Silva0000-0002-3458-7693BRAZ JUNIOR, Geraldohttp://lattes.cnpq.br/8287861610873629CUNHA, António Manuel Trigueiros da SilvaRENNA, FrancescoNETTO SANTOS, Paulo Ivsonhttp://lattes.cnpq.br/3762142722427704VERAS, Rodrigo de Melo Souzahttp://lattes.cnpq.br/2634254790193199https://lattes.cnpq.br/6573361384439101FERREIRA, Marcos Melo2025-11-04T12:48:07Z2025-09-19FERREIRA, Marcos Melo. Classificação do estágio de glaucoma usando dados multimodais. 2025. 96 f. Tese( Programa de Pós-graduação Doutorado em Ciência da Computação) - Universidade Federal do Maranhão, São Luís, 2025.https://tedebc.ufma.br/jspui/handle/tede/6579Glaucoma is the leading cause of irreversible blindness worldwide. Its early diagnosis is challenging due to the absence of symptoms in the initial stages, the need for multiple exams to be analysed by specialised professionals, and the general lack of awareness about the disease among the population. Although the visual loss caused by glaucoma is irreversible, its progression can be slowed if the disease is detected in its early stages. In this context, deep learning methods have demonstrated promising results in medical image processing tasks, including classification and segmentation, offering potential support for clinical diagnosis. In this work, we developed a method for glaucoma stage classification that combines fundus photographs and OCT volumes. The method employs a multimodal convolutional architecture and explores various fusion strategies, both at the feature map and prediction levels, aiming to integrate multimodal information effectively. Additionally, specific regions of interest were investigated — the optic nerve in fundus photographs and the retinal layers in OCT volumes — to improve data representation and enhance classification accuracy. The experiments demonstrated that multimodal models outperformed unimodal approaches, achieving a Kappa score of 0.88, which indicates a high level of agreement of the proposed method with specialist assessments. Moreover, the results showed that fundus photography has a greater influence than OCT volumes in the classification process. At the same time, the targeted capture of retinal layers proved to be a promising strategy for further improving accuracy. Overall, the proposed method demonstrated significant potential as a clinical decision support tool, contributing to the advancement of automated diagnostic systems and enabling earlier and more accurate glaucoma detection.O glaucoma é a principal causa de cegueira irreversível no mundo. Seu diagnóstico precoce é desafiador devido à ausência de sintomas nos estágios iniciais, à necessidade de análise de múltiplos exames por profissionais especializados e ao baixo conhecimento da população sobre a doença. Embora a perda visual causada pelo glaucoma seja irreversível, sua progressão pode ser retardada quando identificada precocemente. Nesse contexto, métodos baseados em deep learning têm se mostrado promissores em tarefas de processamento de imagens médicas, como classificação e segmentação, oferecendo suporte potencial ao diagnóstico clínico. Neste trabalho, foi desenvolvido um método para classificação dos estágios do glaucoma a partir da utilização de retinografias e volumes de OCT. O método emprega uma arquitetura multimodal baseada em redes convolucionais e explora diferentes estratégias de fusão, tanto de mapas de características quanto de predições, com o objetivo de integrar de forma eficaz as modalidades. Além disso, foram investigadas regiões específicas de interesse — o nervo óptico, nas retinografias, e as camadas retinianas, nos volumes de OCT — como forma de aprimorar a representação dos dados e melhorar a acurácia da classificação. Os experimentos realizados demonstraram que os modelos multimodais alcançaram desempenhos superiores em relação aos unimodais, atingindo como melhor resultado um valor de Kappa de 0,88, o que indica um alto nível de concordância do método proposto em relação às avaliações de especialistas. Adicionalmente, os resultados evidenciaram que a retinografia exerce maior influência do que os volumes de OCT no processo de classificação, enquanto a captura direcionada das camadas da retina mostrou-se uma abordagem promissora para aumentar a precisão do modelo. De forma geral, o método proposto demonstrou potencial significativo como ferramenta de apoio à decisão clínica, contribuindo para o avanço de sistemas automatizados de diagnóstico e para a detecção precoce e precisa do glaucoma.Submitted by Maria Aparecida (cidazen@gmail.com) on 2025-11-04T12:48:07Z No. of bitstreams: 1 1_DCCMAPI_Tese_Marcos__1___Revisada_assinado_assinado.pdf: 1757930 bytes, checksum: 046ae2c461584dba2e2558570d394d27 (MD5)Made available in DSpace on 2025-11-04T12:48:07Z (GMT). No. of bitstreams: 1 1_DCCMAPI_Tese_Marcos__1___Revisada_assinado_assinado.pdf: 1757930 bytes, checksum: 046ae2c461584dba2e2558570d394d27 (MD5) Previous issue date: 2025-09-19application/pdfporUniversidade Federal do MaranhãoPROGRAMA DE PÓS-GRADUAÇÃO DOUTORADO EM CIÊNCIA DA COMPUTAÇÃOUFMABrasilCOORDENAÇÃO DO CURSO DE CIÊNCIAS DA COMPUTAÇÃO/CCETClassificação de estágios de glaucoma;Retinografia;Tomografia de coerência óptica;Deep learning;Redes neurais convolucionais;Modelos multimodaisGlaucoma grading stages;Retinography;Optical coherence tomography;Deep learning;Convolutional neural networks;Multimodal modelsSistemas de InformaçãoClassificação do estágio de glaucoma usando dados multimodaisGlaucoma stage classification using multimodal datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFMAinstname:Universidade Federal do Maranhão (UFMA)instacron:UFMAORIGINAL1_DCCMAPI_Tese_Marcos__1___Revisada_assinado_assinado.pdf1_DCCMAPI_Tese_Marcos__1___Revisada_assinado_assinado.pdfapplication/pdf1757930http://tedebc.ufma.br:8080/bitstream/tede/6579/2/1_DCCMAPI_Tese_Marcos__1___Revisada_assinado_assinado.pdf046ae2c461584dba2e2558570d394d27MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82255http://tedebc.ufma.br:8080/bitstream/tede/6579/1/license.txt97eeade1fce43278e63fe063657f8083MD51tede/65792025-11-04 09:48:07.051oai:tede2:tede/6579IExJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpDb20gYSBhcHJlc2VudGHDp8OjbyBkZXN0YSBsaWNlbsOnYSxvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBjb25jZWRlIMOgIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRvIE1hcmFuaMOjbyAoVUZNQSkgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IGRpc3RyaWJ1aXIgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBjb25jb3JkYSBxdWUgYSBVRk1BIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGTUEgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVUZNQSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRk1BLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCkEgVUZNQSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgoKRGVjbGFyYSB0YW1iw6ltIHF1ZSB0b2RhcyBhcyBhZmlsaWHDp8O1ZXMgY29ycG9yYXRpdmFzIG91IGluc3RpdHVjaW9uYWlzIGUgdG9kYXMgYXMgZm9udGVzIGRlIGFwb2lvIGZpbmFuY2Vpcm8gYW8gdHJhYmFsaG8gZXN0w6NvIGRldmlkYW1lbnRlIGNpdGFkYXMgb3UgbWVuY2lvbmFkYXMgZSBjZXJ0aWZpY2EgcXVlIG7Do28gaMOhIG5lbmh1bSBpbnRlcmVzc2UgY29tZXJjaWFsIG91IGFzc29jaWF0aXZvIHF1ZSByZXByZXNlbnRlIGNvbmZsaXRvIGRlIGludGVyZXNzZSBlbSBjb25leMOjbyBjb20gbyB0cmFiYWxobyBzdWJtZXRpZG8uCgoKCgoKCgo=Biblioteca Digital de Teses e Dissertaçõeshttps://tedebc.ufma.br/jspui/PUBhttp://tedebc.ufma.br:8080/oai/requestrepositorio@ufma.br||repositorio@ufma.bropendoar:21312025-11-04T12:48:07Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA)false
dc.title.por.fl_str_mv Classificação do estágio de glaucoma usando dados multimodais
dc.title.alternative.eng.fl_str_mv Glaucoma stage classification using multimodal data
title Classificação do estágio de glaucoma usando dados multimodais
spellingShingle Classificação do estágio de glaucoma usando dados multimodais
FERREIRA, Marcos Melo
Classificação de estágios de glaucoma;
Retinografia;
Tomografia de coerência óptica;
Deep learning;
Redes neurais convolucionais;
Modelos multimodais
Glaucoma grading stages;
Retinography;
Optical coherence tomography;
Deep learning;
Convolutional neural networks;
Multimodal models
Sistemas de Informação
title_short Classificação do estágio de glaucoma usando dados multimodais
title_full Classificação do estágio de glaucoma usando dados multimodais
title_fullStr Classificação do estágio de glaucoma usando dados multimodais
title_full_unstemmed Classificação do estágio de glaucoma usando dados multimodais
title_sort Classificação do estágio de glaucoma usando dados multimodais
author FERREIRA, Marcos Melo
author_facet FERREIRA, Marcos Melo
author_role author
dc.contributor.advisor1.fl_str_mv BRAZ JUNIOR, Geraldo
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8287861610873629
dc.contributor.advisor-co1.fl_str_mv CUNHA, António Manuel Trigueiros da Silva
dc.contributor.advisor-co1Lattes.fl_str_mv 0000-0002-3458-7693
dc.contributor.referee1.fl_str_mv BRAZ JUNIOR, Geraldo
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/8287861610873629
dc.contributor.referee2.fl_str_mv CUNHA, António Manuel Trigueiros da Silva
dc.contributor.referee3.fl_str_mv RENNA, Francesco
dc.contributor.referee4.fl_str_mv NETTO SANTOS, Paulo Ivson
dc.contributor.referee4Lattes.fl_str_mv http://lattes.cnpq.br/3762142722427704
dc.contributor.referee5.fl_str_mv VERAS, Rodrigo de Melo Souza
dc.contributor.referee5Lattes.fl_str_mv http://lattes.cnpq.br/2634254790193199
dc.contributor.authorLattes.fl_str_mv https://lattes.cnpq.br/6573361384439101
dc.contributor.author.fl_str_mv FERREIRA, Marcos Melo
contributor_str_mv BRAZ JUNIOR, Geraldo
CUNHA, António Manuel Trigueiros da Silva
BRAZ JUNIOR, Geraldo
CUNHA, António Manuel Trigueiros da Silva
RENNA, Francesco
NETTO SANTOS, Paulo Ivson
VERAS, Rodrigo de Melo Souza
dc.subject.por.fl_str_mv Classificação de estágios de glaucoma;
Retinografia;
Tomografia de coerência óptica;
Deep learning;
Redes neurais convolucionais;
Modelos multimodais
topic Classificação de estágios de glaucoma;
Retinografia;
Tomografia de coerência óptica;
Deep learning;
Redes neurais convolucionais;
Modelos multimodais
Glaucoma grading stages;
Retinography;
Optical coherence tomography;
Deep learning;
Convolutional neural networks;
Multimodal models
Sistemas de Informação
dc.subject.eng.fl_str_mv Glaucoma grading stages;
Retinography;
Optical coherence tomography;
Deep learning;
Convolutional neural networks;
Multimodal models
dc.subject.cnpq.fl_str_mv Sistemas de Informação
description Glaucoma is the leading cause of irreversible blindness worldwide. Its early diagnosis is challenging due to the absence of symptoms in the initial stages, the need for multiple exams to be analysed by specialised professionals, and the general lack of awareness about the disease among the population. Although the visual loss caused by glaucoma is irreversible, its progression can be slowed if the disease is detected in its early stages. In this context, deep learning methods have demonstrated promising results in medical image processing tasks, including classification and segmentation, offering potential support for clinical diagnosis. In this work, we developed a method for glaucoma stage classification that combines fundus photographs and OCT volumes. The method employs a multimodal convolutional architecture and explores various fusion strategies, both at the feature map and prediction levels, aiming to integrate multimodal information effectively. Additionally, specific regions of interest were investigated — the optic nerve in fundus photographs and the retinal layers in OCT volumes — to improve data representation and enhance classification accuracy. The experiments demonstrated that multimodal models outperformed unimodal approaches, achieving a Kappa score of 0.88, which indicates a high level of agreement of the proposed method with specialist assessments. Moreover, the results showed that fundus photography has a greater influence than OCT volumes in the classification process. At the same time, the targeted capture of retinal layers proved to be a promising strategy for further improving accuracy. Overall, the proposed method demonstrated significant potential as a clinical decision support tool, contributing to the advancement of automated diagnostic systems and enabling earlier and more accurate glaucoma detection.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-11-04T12:48:07Z
dc.date.issued.fl_str_mv 2025-09-19
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv FERREIRA, Marcos Melo. Classificação do estágio de glaucoma usando dados multimodais. 2025. 96 f. Tese( Programa de Pós-graduação Doutorado em Ciência da Computação) - Universidade Federal do Maranhão, São Luís, 2025.
dc.identifier.uri.fl_str_mv https://tedebc.ufma.br/jspui/handle/tede/6579
identifier_str_mv FERREIRA, Marcos Melo. Classificação do estágio de glaucoma usando dados multimodais. 2025. 96 f. Tese( Programa de Pós-graduação Doutorado em Ciência da Computação) - Universidade Federal do Maranhão, São Luís, 2025.
url https://tedebc.ufma.br/jspui/handle/tede/6579
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Maranhão
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO DOUTORADO EM CIÊNCIA DA COMPUTAÇÃO
dc.publisher.initials.fl_str_mv UFMA
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv COORDENAÇÃO DO CURSO DE CIÊNCIAS DA COMPUTAÇÃO/CCET
publisher.none.fl_str_mv Universidade Federal do Maranhão
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFMA
instname:Universidade Federal do Maranhão (UFMA)
instacron:UFMA
instname_str Universidade Federal do Maranhão (UFMA)
instacron_str UFMA
institution UFMA
reponame_str Biblioteca Digital de Teses e Dissertações da UFMA
collection Biblioteca Digital de Teses e Dissertações da UFMA
bitstream.url.fl_str_mv http://tedebc.ufma.br:8080/bitstream/tede/6579/2/1_DCCMAPI_Tese_Marcos__1___Revisada_assinado_assinado.pdf
http://tedebc.ufma.br:8080/bitstream/tede/6579/1/license.txt
bitstream.checksum.fl_str_mv 046ae2c461584dba2e2558570d394d27
97eeade1fce43278e63fe063657f8083
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA)
repository.mail.fl_str_mv repositorio@ufma.br||repositorio@ufma.br
_version_ 1853508052635877376