Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO
| Ano de defesa: | 2021 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | , , |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Lavras
|
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Engenharia de Sistemas e Automação
|
| Departamento: |
Departamento de Engenharia
|
| País: |
brasil
|
| Palavras-chave em Português: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.ufla.br/handle/1/49119 |
Resumo: | O desenvolvimento tecnológico possibilitou ao homem nas últimas décadas dar um grande salto em técnicas de processamento computacional voltado às Redes Neurais Artificiais (RNA). A biometria facial é uma área que está em crescimento no mundo, e suas aplicações são interessantes, tanto para empresas privadas, quanto públicas. Sua capacidade crescente de autenticação em sistemas de segurança e entretenimento a torna um dos melhores meios para validação de identidade e/ou monitoramento de fluxo de pessoas. No entanto, ainda nos deparamos com sistemas que apresentam certa lentidão no reconhecimento e que demandam alto poder de processamento. Objetiva-se então, suprir essa demanda com uma arquitetura de reconhecimento leve e robusta, e que ao mesmo tempo apresente índices de desempenho otimizados, como precisão média (mAP - Mean Average Precision), inferência, baixo tempo de resposta e interseção sobre união (IoU - Intersection Over Union). O presente trabalho apresenta um processo de aprendizagem supervisionado, no qual faz-se uso de uma arquitetura emergente que vem apresentando destaque no cenário de sistemas de reconhecimento de padrões em processamento de imagens. Programa-se nas linguagens Python e C, com uso de frameworks OpenCV e Darknet em arquitetura YOLOv4 (versão 4). Trabalha-se a RNA em máquina virtual em nuvem com GPU NVIDIA Tesla T4 em ambiente Colab, treinando-a em 3 bases de dados distintas: OIDv4, Personal e Wider Face. Nosso sistema também pode operar localmente em sistemas Linux, como o Ubuntu Minimal, que por sua vez requer ajustes básicos de configuração em IDE Jupyter. Os resultados mostram a capacidade de classificação/detecção otimizada na arquitetura YOLO, bem como obtenção de índices aprimorados no trabalho. O dataset OID obteve um mAP de 69,23% para classe de objetos, com inferência média de 82.2%, tempo de detecção de 16 segundos e alcançou um IoU de 52.63%. O segundo dataset Personal obteve os incríveis mAP de 99,11% em biometria facial de reconhecimento individual, com inferência média de 98%, tempo de detecção de 3 segundos e alcançou um IoU de 82.56%. E por fim, o terceiro dataset Wider Face, obteve um mAP de 86,04% em biometria facial multivariada, com inferência média de 91%, tempo de detecção de 5 segundos e alcançou um IoU de 61.32%. Os resultados, portanto, demonstram a qualidade da rede neural desenvolvida em virtude dos objetivos inicialmente propostos, nos quais mostram-se promissores em relação à comparativos com outros modelos da literatura no estado da arte dos últimos anos. |
| id |
UFLA_322f9071dce264847d5a9ea38ba50bf0 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufla.br:1/49119 |
| network_acronym_str |
UFLA |
| network_name_str |
Repositório Institucional da UFLA |
| repository_id_str |
|
| spelling |
2022-02-01T19:05:48Z2022-02-01T19:05:48Z2022-02-012021-12-15RIBEIRO, D. A. Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO. 2021. 105 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação) – Universidade Federal de Lavras, Lavras, 2022.https://repositorio.ufla.br/handle/1/49119O desenvolvimento tecnológico possibilitou ao homem nas últimas décadas dar um grande salto em técnicas de processamento computacional voltado às Redes Neurais Artificiais (RNA). A biometria facial é uma área que está em crescimento no mundo, e suas aplicações são interessantes, tanto para empresas privadas, quanto públicas. Sua capacidade crescente de autenticação em sistemas de segurança e entretenimento a torna um dos melhores meios para validação de identidade e/ou monitoramento de fluxo de pessoas. No entanto, ainda nos deparamos com sistemas que apresentam certa lentidão no reconhecimento e que demandam alto poder de processamento. Objetiva-se então, suprir essa demanda com uma arquitetura de reconhecimento leve e robusta, e que ao mesmo tempo apresente índices de desempenho otimizados, como precisão média (mAP - Mean Average Precision), inferência, baixo tempo de resposta e interseção sobre união (IoU - Intersection Over Union). O presente trabalho apresenta um processo de aprendizagem supervisionado, no qual faz-se uso de uma arquitetura emergente que vem apresentando destaque no cenário de sistemas de reconhecimento de padrões em processamento de imagens. Programa-se nas linguagens Python e C, com uso de frameworks OpenCV e Darknet em arquitetura YOLOv4 (versão 4). Trabalha-se a RNA em máquina virtual em nuvem com GPU NVIDIA Tesla T4 em ambiente Colab, treinando-a em 3 bases de dados distintas: OIDv4, Personal e Wider Face. Nosso sistema também pode operar localmente em sistemas Linux, como o Ubuntu Minimal, que por sua vez requer ajustes básicos de configuração em IDE Jupyter. Os resultados mostram a capacidade de classificação/detecção otimizada na arquitetura YOLO, bem como obtenção de índices aprimorados no trabalho. O dataset OID obteve um mAP de 69,23% para classe de objetos, com inferência média de 82.2%, tempo de detecção de 16 segundos e alcançou um IoU de 52.63%. O segundo dataset Personal obteve os incríveis mAP de 99,11% em biometria facial de reconhecimento individual, com inferência média de 98%, tempo de detecção de 3 segundos e alcançou um IoU de 82.56%. E por fim, o terceiro dataset Wider Face, obteve um mAP de 86,04% em biometria facial multivariada, com inferência média de 91%, tempo de detecção de 5 segundos e alcançou um IoU de 61.32%. Os resultados, portanto, demonstram a qualidade da rede neural desenvolvida em virtude dos objetivos inicialmente propostos, nos quais mostram-se promissores em relação à comparativos com outros modelos da literatura no estado da arte dos últimos anos.Technological development has made it possible for man in recent decades to make a great leap in computational processing techniques aimed at Artificial Neural Networks (ANN). Facial biometrics is a growing area in the world, and its applications are interesting for both private and public companies. Its growing ability to authenticate in security and entertainment systems makes it one of the best means of identity validation and/or people flow monitoring. However, we still come across systems that have a certain slowness in recognition and that demand high processing power. The objective is, then, to supply this demand with a light and robust recognition architecture, and that at the same time presents optimized performance indexes, such as average precision (mAP - Mean Average Precision), inference, low response time and intersection over union (IoU - Intersection Over Union). The present work presents a supervised learning process, in which an emerging architecture is used that has been highlighted in the scenario of pattern recognition systems in image processing. It is programmed in Python and C languages, using OpenCV and Darknet frameworks in YOLOv4 architecture (version 4). The ANN is worked on in a cloud virtual machine with NVIDIA Tesla T4 GPU in Colab environment, training it in 3 different databases: OIDv4, Personal and Wider Face. Our system can also operate locally on Linux systems such as Ubuntu Minimal, which in turn requires basic configuration adjustments in the Jupyter IDE. The results show the optimized sorting/detection capability in the YOLO architecture, as well as achieving improved indices on the job. The dataset OID obtained a mAP of 69.23% for object class, with an average inference of 82.2%, detection time of 16 seconds and reached an IoU of 52.63%. The second dataset Personal achieved an incredible 99.11% mAP in individual recognition facial biometrics, with an average inference of 98%, detection time of 3 seconds and achieved an IoU of 82.56%. And finally, the third dataset Wider Face, obtained a mAP of 86.04% in multivariate facial biometrics, with an average inference of 91%, detection time of 5 seconds and reached an IoU of 61.32% . The results, therefore, demonstrate the quality of the neural network developed in virtue of the objectives initially proposed, in which they are promising in relation to comparisons with other models in the literature in the state of the art in recent years.Universidade Federal de LavrasPrograma de Pós-Graduação em Engenharia de Sistemas e AutomaçãoUFLAbrasilDepartamento de EngenhariaEngenharia de SoftwareReconhecimento facialBiometriaRedes neurais artificiaisReconhecimento de padrõesYOLOFacial recognitionBiometryArtificial neural networksPattern recognitionReconhecimento facial baseado no algoritmo de aprendizado profundo YOLOFace recognition based on the YOLO deep learning algorithminfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisZegarra Rodríguez, DemóstenesZegarra Rodríguez, DemóstenesRosa, Renata LopesBegazo, Dante Coaquirahttp://lattes.cnpq.br/1475421976593124Ribeiro, David Augustoinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLALICENSElicense.txtlicense.txttext/plain; charset=utf-8953https://repositorio.ufla.br/bitstreams/77d354bf-3c9d-4a8e-8759-189f13ecbc43/download760884c1e72224de569e74f79eb87ce3MD52falseAnonymousREADORIGINALDISSERTAÇÃO_Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO.pdfDISSERTAÇÃO_Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO.pdfapplication/pdf16824286https://repositorio.ufla.br/bitstreams/0ed8ee4f-270e-4440-a1f2-1593d36ac073/download586c99cae39ee52b3a8a0e804ad169eeMD51trueAnonymousREADTEXTDISSERTAÇÃO_Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO.pdf.txtDISSERTAÇÃO_Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO.pdf.txtExtracted texttext/plain102885https://repositorio.ufla.br/bitstreams/6f774217-e3af-4eba-86ee-8407eb0d7498/download610f20d5fa648ccea4e25135e783d7a9MD53falseAnonymousREADTHUMBNAILDISSERTAÇÃO_Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO.pdf.jpgDISSERTAÇÃO_Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO.pdf.jpgGenerated Thumbnailimage/jpeg3055https://repositorio.ufla.br/bitstreams/45841c1b-dd28-491f-bbc8-d5695ce74ba1/download15a1348baf843655dea02846cbef0139MD54falseAnonymousREAD1/491192025-08-19 09:44:21.377open.accessoai:repositorio.ufla.br:1/49119https://repositorio.ufla.brRepositório InstitucionalPUBhttps://repositorio.ufla.br/server/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2025-08-19T12:44:21Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)falseREVDTEFSQcOHw4NPIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCk8gcmVmZXJpZG8gYXV0b3I6CmEpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4KRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50bwpsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UKZW50aWRhZGUuCmIpIFNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCBuw6NvIGRldMOpbSBvcwpkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGF1dG9yaXphw6fDo28gZG8gZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgTGF2cmFzIG9zCmRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgY3Vqb3MKZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbwpubyB0ZXh0byBvdSBjb250ZcO6ZG8gZG8gZG9jdW1lbnRvIGVudHJlZ3VlLiBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqQpiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbyBwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUKbsOjbyBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIExhdnJhcywgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIKb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgo= |
| dc.title.pt_BR.fl_str_mv |
Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO |
| dc.title.alternative.pt_BR.fl_str_mv |
Face recognition based on the YOLO deep learning algorithm |
| title |
Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO |
| spellingShingle |
Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO Ribeiro, David Augusto Engenharia de Software Reconhecimento facial Biometria Redes neurais artificiais Reconhecimento de padrões YOLO Facial recognition Biometry Artificial neural networks Pattern recognition |
| title_short |
Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO |
| title_full |
Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO |
| title_fullStr |
Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO |
| title_full_unstemmed |
Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO |
| title_sort |
Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO |
| author |
Ribeiro, David Augusto |
| author_facet |
Ribeiro, David Augusto |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
Zegarra Rodríguez, Demóstenes |
| dc.contributor.referee1.fl_str_mv |
Zegarra Rodríguez, Demóstenes |
| dc.contributor.referee2.fl_str_mv |
Rosa, Renata Lopes |
| dc.contributor.referee3.fl_str_mv |
Begazo, Dante Coaquira |
| dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/1475421976593124 |
| dc.contributor.author.fl_str_mv |
Ribeiro, David Augusto |
| contributor_str_mv |
Zegarra Rodríguez, Demóstenes Zegarra Rodríguez, Demóstenes Rosa, Renata Lopes Begazo, Dante Coaquira |
| dc.subject.cnpq.fl_str_mv |
Engenharia de Software |
| topic |
Engenharia de Software Reconhecimento facial Biometria Redes neurais artificiais Reconhecimento de padrões YOLO Facial recognition Biometry Artificial neural networks Pattern recognition |
| dc.subject.por.fl_str_mv |
Reconhecimento facial Biometria Redes neurais artificiais Reconhecimento de padrões YOLO Facial recognition Biometry Artificial neural networks Pattern recognition |
| description |
O desenvolvimento tecnológico possibilitou ao homem nas últimas décadas dar um grande salto em técnicas de processamento computacional voltado às Redes Neurais Artificiais (RNA). A biometria facial é uma área que está em crescimento no mundo, e suas aplicações são interessantes, tanto para empresas privadas, quanto públicas. Sua capacidade crescente de autenticação em sistemas de segurança e entretenimento a torna um dos melhores meios para validação de identidade e/ou monitoramento de fluxo de pessoas. No entanto, ainda nos deparamos com sistemas que apresentam certa lentidão no reconhecimento e que demandam alto poder de processamento. Objetiva-se então, suprir essa demanda com uma arquitetura de reconhecimento leve e robusta, e que ao mesmo tempo apresente índices de desempenho otimizados, como precisão média (mAP - Mean Average Precision), inferência, baixo tempo de resposta e interseção sobre união (IoU - Intersection Over Union). O presente trabalho apresenta um processo de aprendizagem supervisionado, no qual faz-se uso de uma arquitetura emergente que vem apresentando destaque no cenário de sistemas de reconhecimento de padrões em processamento de imagens. Programa-se nas linguagens Python e C, com uso de frameworks OpenCV e Darknet em arquitetura YOLOv4 (versão 4). Trabalha-se a RNA em máquina virtual em nuvem com GPU NVIDIA Tesla T4 em ambiente Colab, treinando-a em 3 bases de dados distintas: OIDv4, Personal e Wider Face. Nosso sistema também pode operar localmente em sistemas Linux, como o Ubuntu Minimal, que por sua vez requer ajustes básicos de configuração em IDE Jupyter. Os resultados mostram a capacidade de classificação/detecção otimizada na arquitetura YOLO, bem como obtenção de índices aprimorados no trabalho. O dataset OID obteve um mAP de 69,23% para classe de objetos, com inferência média de 82.2%, tempo de detecção de 16 segundos e alcançou um IoU de 52.63%. O segundo dataset Personal obteve os incríveis mAP de 99,11% em biometria facial de reconhecimento individual, com inferência média de 98%, tempo de detecção de 3 segundos e alcançou um IoU de 82.56%. E por fim, o terceiro dataset Wider Face, obteve um mAP de 86,04% em biometria facial multivariada, com inferência média de 91%, tempo de detecção de 5 segundos e alcançou um IoU de 61.32%. Os resultados, portanto, demonstram a qualidade da rede neural desenvolvida em virtude dos objetivos inicialmente propostos, nos quais mostram-se promissores em relação à comparativos com outros modelos da literatura no estado da arte dos últimos anos. |
| publishDate |
2021 |
| dc.date.submitted.none.fl_str_mv |
2021-12-15 |
| dc.date.accessioned.fl_str_mv |
2022-02-01T19:05:48Z |
| dc.date.available.fl_str_mv |
2022-02-01T19:05:48Z |
| dc.date.issued.fl_str_mv |
2022-02-01 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
RIBEIRO, D. A. Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO. 2021. 105 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação) – Universidade Federal de Lavras, Lavras, 2022. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufla.br/handle/1/49119 |
| identifier_str_mv |
RIBEIRO, D. A. Reconhecimento facial baseado no algoritmo de aprendizado profundo YOLO. 2021. 105 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação) – Universidade Federal de Lavras, Lavras, 2022. |
| url |
https://repositorio.ufla.br/handle/1/49119 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Lavras |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Engenharia de Sistemas e Automação |
| dc.publisher.initials.fl_str_mv |
UFLA |
| dc.publisher.country.fl_str_mv |
brasil |
| dc.publisher.department.fl_str_mv |
Departamento de Engenharia |
| publisher.none.fl_str_mv |
Universidade Federal de Lavras |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFLA instname:Universidade Federal de Lavras (UFLA) instacron:UFLA |
| instname_str |
Universidade Federal de Lavras (UFLA) |
| instacron_str |
UFLA |
| institution |
UFLA |
| reponame_str |
Repositório Institucional da UFLA |
| collection |
Repositório Institucional da UFLA |
| bitstream.url.fl_str_mv |
https://repositorio.ufla.br/bitstreams/77d354bf-3c9d-4a8e-8759-189f13ecbc43/download https://repositorio.ufla.br/bitstreams/0ed8ee4f-270e-4440-a1f2-1593d36ac073/download https://repositorio.ufla.br/bitstreams/6f774217-e3af-4eba-86ee-8407eb0d7498/download https://repositorio.ufla.br/bitstreams/45841c1b-dd28-491f-bbc8-d5695ce74ba1/download |
| bitstream.checksum.fl_str_mv |
760884c1e72224de569e74f79eb87ce3 586c99cae39ee52b3a8a0e804ad169ee 610f20d5fa648ccea4e25135e783d7a9 15a1348baf843655dea02846cbef0139 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA) |
| repository.mail.fl_str_mv |
nivaldo@ufla.br || repositorio.biblioteca@ufla.br |
| _version_ |
1854947760017506304 |