Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Ribeiro, David Augusto lattes
Orientador(a): Zegarra Rodríguez, Demóstenes
Banca de defesa: Zegarra Rodríguez, Demóstenes, Rosa, Renata Lopes, Begazo, Dante Coaquira
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Lavras
Programa de Pós-Graduação: Programa de Pós-Graduação em Engenharia de Sistemas e Automação
Departamento: Departamento de Engenharia
País: brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufla.br/handle/1/49119
Resumo: O desenvolvimento tecnológico possibilitou ao homem nas últimas décadas dar um grande salto em técnicas de processamento computacional voltado às Redes Neurais Artificiais (RNA). A biometria facial é uma área que está em crescimento no mundo, e suas aplicações são interessantes, tanto para empresas privadas, quanto públicas. Sua capacidade crescente de autenticação em sistemas de segurança e entretenimento a torna um dos melhores meios para validação de identidade e/ou monitoramento de fluxo de pessoas. No entanto, ainda nos deparamos com sistemas que apresentam certa lentidão no reconhecimento e que demandam alto poder de processamento. Objetiva-se então, suprir essa demanda com uma arquitetura de reconhecimento leve e robusta, e que ao mesmo tempo apresente índices de desempenho otimizados, como precisão média (mAP - Mean Average Precision), inferência, baixo tempo de resposta e interseção sobre união (IoU - Intersection Over Union). O presente trabalho apresenta um processo de aprendizagem supervisionado, no qual faz-se uso de uma arquitetura emergente que vem apresentando destaque no cenário de sistemas de reconhecimento de padrões em processamento de imagens. Programa-se nas linguagens Python e C, com uso de frameworks OpenCV e Darknet em arquitetura YOLOv4 (versão 4). Trabalha-se a RNA em máquina virtual em nuvem com GPU NVIDIA Tesla T4 em ambiente Colab, treinando-a em 3 bases de dados distintas: OIDv4, Personal e Wider Face. Nosso sistema também pode operar localmente em sistemas Linux, como o Ubuntu Minimal, que por sua vez requer ajustes básicos de configuração em IDE Jupyter. Os resultados mostram a capacidade de classificação/detecção otimizada na arquitetura YOLO, bem como obtenção de índices aprimorados no trabalho. O dataset OID obteve um mAP de 69,23% para classe de objetos, com inferência média de 82.2%, tempo de detecção de 16 segundos e alcançou um IoU de 52.63%. O segundo dataset Personal obteve os incríveis mAP de 99,11% em biometria facial de reconhecimento individual, com inferência média de 98%, tempo de detecção de 3 segundos e alcançou um IoU de 82.56%. E por fim, o terceiro dataset Wider Face, obteve um mAP de 86,04% em biometria facial multivariada, com inferência média de 91%, tempo de detecção de 5 segundos e alcançou um IoU de 61.32%. Os resultados, portanto, demonstram a qualidade da rede neural desenvolvida em virtude dos objetivos inicialmente propostos, nos quais mostram-se promissores em relação à comparativos com outros modelos da literatura no estado da arte dos últimos anos.
id UFLA_322f9071dce264847d5a9ea38ba50bf0
oai_identifier_str oai:repositorio.ufla.br:1/49119
network_acronym_str UFLA
network_name_str Repositório Institucional da UFLA
repository_id_str
spelling 2022-02-01T19:05:48Z2022-02-01T19:05:48Z2022-02-012021-12-15RIBEIRO, D. A. Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO. 2021. 105 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação) – Universidade Federal de Lavras, Lavras, 2022.https://repositorio.ufla.br/handle/1/49119O desenvolvimento tecnológico possibilitou ao homem nas últimas décadas dar um grande salto em técnicas de processamento computacional voltado às Redes Neurais Artificiais (RNA). A biometria facial é uma área que está em crescimento no mundo, e suas aplicações são interessantes, tanto para empresas privadas, quanto públicas. Sua capacidade crescente de autenticação em sistemas de segurança e entretenimento a torna um dos melhores meios para validação de identidade e/ou monitoramento de fluxo de pessoas. No entanto, ainda nos deparamos com sistemas que apresentam certa lentidão no reconhecimento e que demandam alto poder de processamento. Objetiva-se então, suprir essa demanda com uma arquitetura de reconhecimento leve e robusta, e que ao mesmo tempo apresente índices de desempenho otimizados, como precisão média (mAP - Mean Average Precision), inferência, baixo tempo de resposta e interseção sobre união (IoU - Intersection Over Union). O presente trabalho apresenta um processo de aprendizagem supervisionado, no qual faz-se uso de uma arquitetura emergente que vem apresentando destaque no cenário de sistemas de reconhecimento de padrões em processamento de imagens. Programa-se nas linguagens Python e C, com uso de frameworks OpenCV e Darknet em arquitetura YOLOv4 (versão 4). Trabalha-se a RNA em máquina virtual em nuvem com GPU NVIDIA Tesla T4 em ambiente Colab, treinando-a em 3 bases de dados distintas: OIDv4, Personal e Wider Face. Nosso sistema também pode operar localmente em sistemas Linux, como o Ubuntu Minimal, que por sua vez requer ajustes básicos de configuração em IDE Jupyter. Os resultados mostram a capacidade de classificação/detecção otimizada na arquitetura YOLO, bem como obtenção de índices aprimorados no trabalho. O dataset OID obteve um mAP de 69,23% para classe de objetos, com inferência média de 82.2%, tempo de detecção de 16 segundos e alcançou um IoU de 52.63%. O segundo dataset Personal obteve os incríveis mAP de 99,11% em biometria facial de reconhecimento individual, com inferência média de 98%, tempo de detecção de 3 segundos e alcançou um IoU de 82.56%. E por fim, o terceiro dataset Wider Face, obteve um mAP de 86,04% em biometria facial multivariada, com inferência média de 91%, tempo de detecção de 5 segundos e alcançou um IoU de 61.32%. Os resultados, portanto, demonstram a qualidade da rede neural desenvolvida em virtude dos objetivos inicialmente propostos, nos quais mostram-se promissores em relação à comparativos com outros modelos da literatura no estado da arte dos últimos anos.Technological development has made it possible for man in recent decades to make a great leap in computational processing techniques aimed at Artificial Neural Networks (ANN). Facial biometrics is a growing area in the world, and its applications are interesting for both private and public companies. Its growing ability to authenticate in security and entertainment systems makes it one of the best means of identity validation and/or people flow monitoring. However, we still come across systems that have a certain slowness in recognition and that demand high processing power. The objective is, then, to supply this demand with a light and robust recognition architecture, and that at the same time presents optimized performance indexes, such as average precision (mAP - Mean Average Precision), inference, low response time and intersection over union (IoU - Intersection Over Union). The present work presents a supervised learning process, in which an emerging architecture is used that has been highlighted in the scenario of pattern recognition systems in image processing. It is programmed in Python and C languages, using OpenCV and Darknet frameworks in YOLOv4 architecture (version 4). The ANN is worked on in a cloud virtual machine with NVIDIA Tesla T4 GPU in Colab environment, training it in 3 different databases: OIDv4, Personal and Wider Face. Our system can also operate locally on Linux systems such as Ubuntu Minimal, which in turn requires basic configuration adjustments in the Jupyter IDE. The results show the optimized sorting/detection capability in the YOLO architecture, as well as achieving improved indices on the job. The dataset OID obtained a mAP of 69.23% for object class, with an average inference of 82.2%, detection time of 16 seconds and reached an IoU of 52.63%. The second dataset Personal achieved an incredible 99.11% mAP in individual recognition facial biometrics, with an average inference of 98%, detection time of 3 seconds and achieved an IoU of 82.56%. And finally, the third dataset Wider Face, obtained a mAP of 86.04% in multivariate facial biometrics, with an average inference of 91%, detection time of 5 seconds and reached an IoU of 61.32% . The results, therefore, demonstrate the quality of the neural network developed in virtue of the objectives initially proposed, in which they are promising in relation to comparisons with other models in the literature in the state of the art in recent years.Universidade Federal de LavrasPrograma de Pós-Graduação em Engenharia de Sistemas e AutomaçãoUFLAbrasilDepartamento de EngenhariaEngenharia de SoftwareReconhecimento facialBiometriaRedes neurais artificiaisReconhecimento de padrõesYOLOFacial recognitionBiometryArtificial neural networksPattern recognitionReconhecimento facial baseado no algoritmo de aprendizado profundo YOLOFace recognition based on the YOLO deep learning algorithminfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisZegarra Rodríguez, DemóstenesZegarra Rodríguez, DemóstenesRosa, Renata LopesBegazo, Dante Coaquirahttp://lattes.cnpq.br/1475421976593124Ribeiro, David Augustoinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLALICENSElicense.txtlicense.txttext/plain; charset=utf-8953https://repositorio.ufla.br/bitstreams/77d354bf-3c9d-4a8e-8759-189f13ecbc43/download760884c1e72224de569e74f79eb87ce3MD52falseAnonymousREADORIGINALDISSERTAÇÃO_Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO.pdfDISSERTAÇÃO_Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO.pdfapplication/pdf16824286https://repositorio.ufla.br/bitstreams/0ed8ee4f-270e-4440-a1f2-1593d36ac073/download586c99cae39ee52b3a8a0e804ad169eeMD51trueAnonymousREADTEXTDISSERTAÇÃO_Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO.pdf.txtDISSERTAÇÃO_Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO.pdf.txtExtracted texttext/plain102885https://repositorio.ufla.br/bitstreams/6f774217-e3af-4eba-86ee-8407eb0d7498/download610f20d5fa648ccea4e25135e783d7a9MD53falseAnonymousREADTHUMBNAILDISSERTAÇÃO_Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO.pdf.jpgDISSERTAÇÃO_Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO.pdf.jpgGenerated Thumbnailimage/jpeg3055https://repositorio.ufla.br/bitstreams/45841c1b-dd28-491f-bbc8-d5695ce74ba1/download15a1348baf843655dea02846cbef0139MD54falseAnonymousREAD1/491192025-08-19 09:44:21.377open.accessoai:repositorio.ufla.br:1/49119https://repositorio.ufla.brRepositório InstitucionalPUBhttps://repositorio.ufla.br/server/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2025-08-19T12:44:21Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)falseREVDTEFSQcOHw4NPIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCk8gcmVmZXJpZG8gYXV0b3I6CmEpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4KRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50bwpsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UKZW50aWRhZGUuCmIpIFNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCBuw6NvIGRldMOpbSBvcwpkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGF1dG9yaXphw6fDo28gZG8gZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgTGF2cmFzIG9zCmRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgY3Vqb3MKZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbwpubyB0ZXh0byBvdSBjb250ZcO6ZG8gZG8gZG9jdW1lbnRvIGVudHJlZ3VlLiBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqQpiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbyBwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUKbsOjbyBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIExhdnJhcywgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIKb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgo=
dc.title.pt_BR.fl_str_mv Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO
dc.title.alternative.pt_BR.fl_str_mv Face recognition based on the YOLO deep learning algorithm
title Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO
spellingShingle Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO
Ribeiro, David Augusto
Engenharia de Software
Reconhecimento facial
Biometria
Redes neurais artificiais
Reconhecimento de padrões
YOLO
Facial recognition
Biometry
Artificial neural networks
Pattern recognition
title_short Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO
title_full Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO
title_fullStr Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO
title_full_unstemmed Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO
title_sort Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO
author Ribeiro, David Augusto
author_facet Ribeiro, David Augusto
author_role author
dc.contributor.advisor1.fl_str_mv Zegarra Rodríguez, Demóstenes
dc.contributor.referee1.fl_str_mv Zegarra Rodríguez, Demóstenes
dc.contributor.referee2.fl_str_mv Rosa, Renata Lopes
dc.contributor.referee3.fl_str_mv Begazo, Dante Coaquira
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/1475421976593124
dc.contributor.author.fl_str_mv Ribeiro, David Augusto
contributor_str_mv Zegarra Rodríguez, Demóstenes
Zegarra Rodríguez, Demóstenes
Rosa, Renata Lopes
Begazo, Dante Coaquira
dc.subject.cnpq.fl_str_mv Engenharia de Software
topic Engenharia de Software
Reconhecimento facial
Biometria
Redes neurais artificiais
Reconhecimento de padrões
YOLO
Facial recognition
Biometry
Artificial neural networks
Pattern recognition
dc.subject.por.fl_str_mv Reconhecimento facial
Biometria
Redes neurais artificiais
Reconhecimento de padrões
YOLO
Facial recognition
Biometry
Artificial neural networks
Pattern recognition
description O desenvolvimento tecnológico possibilitou ao homem nas últimas décadas dar um grande salto em técnicas de processamento computacional voltado às Redes Neurais Artificiais (RNA). A biometria facial é uma área que está em crescimento no mundo, e suas aplicações são interessantes, tanto para empresas privadas, quanto públicas. Sua capacidade crescente de autenticação em sistemas de segurança e entretenimento a torna um dos melhores meios para validação de identidade e/ou monitoramento de fluxo de pessoas. No entanto, ainda nos deparamos com sistemas que apresentam certa lentidão no reconhecimento e que demandam alto poder de processamento. Objetiva-se então, suprir essa demanda com uma arquitetura de reconhecimento leve e robusta, e que ao mesmo tempo apresente índices de desempenho otimizados, como precisão média (mAP - Mean Average Precision), inferência, baixo tempo de resposta e interseção sobre união (IoU - Intersection Over Union). O presente trabalho apresenta um processo de aprendizagem supervisionado, no qual faz-se uso de uma arquitetura emergente que vem apresentando destaque no cenário de sistemas de reconhecimento de padrões em processamento de imagens. Programa-se nas linguagens Python e C, com uso de frameworks OpenCV e Darknet em arquitetura YOLOv4 (versão 4). Trabalha-se a RNA em máquina virtual em nuvem com GPU NVIDIA Tesla T4 em ambiente Colab, treinando-a em 3 bases de dados distintas: OIDv4, Personal e Wider Face. Nosso sistema também pode operar localmente em sistemas Linux, como o Ubuntu Minimal, que por sua vez requer ajustes básicos de configuração em IDE Jupyter. Os resultados mostram a capacidade de classificação/detecção otimizada na arquitetura YOLO, bem como obtenção de índices aprimorados no trabalho. O dataset OID obteve um mAP de 69,23% para classe de objetos, com inferência média de 82.2%, tempo de detecção de 16 segundos e alcançou um IoU de 52.63%. O segundo dataset Personal obteve os incríveis mAP de 99,11% em biometria facial de reconhecimento individual, com inferência média de 98%, tempo de detecção de 3 segundos e alcançou um IoU de 82.56%. E por fim, o terceiro dataset Wider Face, obteve um mAP de 86,04% em biometria facial multivariada, com inferência média de 91%, tempo de detecção de 5 segundos e alcançou um IoU de 61.32%. Os resultados, portanto, demonstram a qualidade da rede neural desenvolvida em virtude dos objetivos inicialmente propostos, nos quais mostram-se promissores em relação à comparativos com outros modelos da literatura no estado da arte dos últimos anos.
publishDate 2021
dc.date.submitted.none.fl_str_mv 2021-12-15
dc.date.accessioned.fl_str_mv 2022-02-01T19:05:48Z
dc.date.available.fl_str_mv 2022-02-01T19:05:48Z
dc.date.issued.fl_str_mv 2022-02-01
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv RIBEIRO, D. A. Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO. 2021. 105 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação) – Universidade Federal de Lavras, Lavras, 2022.
dc.identifier.uri.fl_str_mv https://repositorio.ufla.br/handle/1/49119
identifier_str_mv RIBEIRO, D. A. Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO. 2021. 105 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação) – Universidade Federal de Lavras, Lavras, 2022.
url https://repositorio.ufla.br/handle/1/49119
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Lavras
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia de Sistemas e Automação
dc.publisher.initials.fl_str_mv UFLA
dc.publisher.country.fl_str_mv brasil
dc.publisher.department.fl_str_mv Departamento de Engenharia
publisher.none.fl_str_mv Universidade Federal de Lavras
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFLA
instname:Universidade Federal de Lavras (UFLA)
instacron:UFLA
instname_str Universidade Federal de Lavras (UFLA)
instacron_str UFLA
institution UFLA
reponame_str Repositório Institucional da UFLA
collection Repositório Institucional da UFLA
bitstream.url.fl_str_mv https://repositorio.ufla.br/bitstreams/77d354bf-3c9d-4a8e-8759-189f13ecbc43/download
https://repositorio.ufla.br/bitstreams/0ed8ee4f-270e-4440-a1f2-1593d36ac073/download
https://repositorio.ufla.br/bitstreams/6f774217-e3af-4eba-86ee-8407eb0d7498/download
https://repositorio.ufla.br/bitstreams/45841c1b-dd28-491f-bbc8-d5695ce74ba1/download
bitstream.checksum.fl_str_mv 760884c1e72224de569e74f79eb87ce3
586c99cae39ee52b3a8a0e804ad169ee
610f20d5fa648ccea4e25135e783d7a9
15a1348baf843655dea02846cbef0139
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)
repository.mail.fl_str_mv nivaldo@ufla.br || repositorio.biblioteca@ufla.br
_version_ 1854947760017506304