Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Leite, Guilherme Vieira, 1991-
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: [s.n.]
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/20.500.12733/1638739
Resumo: Orientador: Hélio Pedrini
id UNICAMP-30_7d9b67a71e502e244601eeebcb2159fc
oai_identifier_str oai::1128689
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canaisHuman fall detection on videos using convolutional neural networks with multiple channelsAprendizado de máquinaReconhecimento de padrõesRedes neurais convolucionaisMachine learningPattern recognitionConvolutional neural networksOrientador: Hélio PedriniDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Baixas taxas de mortalidade infantil, avanços na medicina e mudanças culturais aumentaram a expectativa de vida nos países desenvolvidos para mais de 60 anos. Alguns países esperam que, até 2030, 20% da sua população tenham mais de 65 anos. A qualidade de vida nessa idade avançada é altamente determinada pela saúde do indivíduo, que ditará se o idoso pode se engajar em atividades importantes para o seu bem estar, independência e satisfação pessoal. O envelhecimento é acompanhado por problemas de saúde causados por limitações biológicas e fraqueza muscular. Esse enfraquecimento facilita a ocorrência de quedas, responsáveis pela morte de aproximadamente 646.000 pessoas em todo o mundo e, mesmo quando uma pequena queda ocorre, ela ainda pode fraturar ossos ou danificar tecidos moles, que não cicatrizam completamente. Lesões e danos dessa natureza, por sua vez, podem afetar a autoconfiança do indivíduo, diminuindo sua independência. Neste trabalho, propomos um método capaz de detectar quedas humanas em sequências de vídeo usando redes neurais convolucionais (CNNs) multicanais. Nós desenvolvemos dois métodos para detecção de quedas, o primeiro utilizando uma CNN 2D e o segundo utilizando uma CNN 3D. Nossos métodos utilizam características extraídas previamente de cada quadro do vídeo e as classificam. Após a etapa de classificação, uma máquina de vetores de suporte (SVM) é aplicada para ponderar os canais de entrada e indicar se houve ou não uma queda. Experimentamos quatro tipos de características, a saber: (i) fluxo óptico, (ii) ritmo visual, (iii) estimativa de pose e (iv) mapa de saliência. As bases de dados utilizadas (URFD e FDD) estão disponíveis publicamente e nossos resultados são comparados com os da literatura. As métricas selecionadas para avaliação são acurácia balanceada, acurácia, sensibilidade e especificidade. Nossos métodos apresentaram resultados competitivos com os obtidos pelo estado da arte na base de dados URFD e superam os obtidos na base de dados FDD. Ao conhecimento dos autores, nós somos os primeiros a realizar testes cruzados entre os conjuntos de dados em questão, e a reportar resultados de acurácia balanceada. Os métodos propostos são capazes de detectar quedas nas bases selecionadas. A detecção de quedas, bem como a classificação de atividades em vídeos, está fortemente relacionada à capacidade da rede de interpretar informações temporais e, como esperado, o fluxo óptico é a característica mais relevante para a detecção de quedasAbstract: Lower child mortality rates, advances in medicine, and cultural changes have increased life expectancy in developed countries over 60 years old. Some countries expect that, by 2030, 20% of their population will be over 65 years old. The quality of life at this advanced age is highly dictated by the individual's health, which will determine whether the elderly can engage in important activities to their well-being, independence, and personal satisfaction. Old age is accompanied by health problems caused by biological limitations and muscle weakness. This weakening facilitates the occurrence of falls, which are responsible for the deaths of approximately 646,000 people worldwide and, even when a minor fall occurs, it can still cause fractures, break bones or damage soft tissues, which will not heal completely. Injuries and damages of this nature, in turn, will consume the self-confidence of the individual, diminishing their independence. In this work, we propose a method capable of detecting human falls in video sequences using multichannel convolutional neural networks (CNN). We developed two methods for fall detection, the first using a 2D CNN and the second using a 3D CNN. Our method uses features previously extracted from each frame and classifies them with a CNN. After the classification step, a support vector machine (SVM) is applied to weight the input channels and indicate whether or not there was a fall. We experiment with four types of features, namely: (i) optical flow, (ii) visual rhythm, (iii) pose estimation, and (iv) saliency map. The benchmarks used (URFD and FDD) are publicly available and our results are compared to those in the literature. The metrics selected for evaluation are balanced accuracy, accuracy, sensitivity, and specificity. Our results are competitive with those obtained by the state of the art on the URFD data set and surpass those on the FDD data set. To the authors' knowledge, we are the first to perform cross-tests between the datasets in question and to report results for the balanced accuracy metric. The proposed method is able to detect falls in the selected benchmarks. Fall detection, as well as activity classification in videos, is strongly related to the network's ability to interpret temporal information and, as expected, optical flow is the most relevant feature for detecting fallsMestradoCiência da ComputaçãoMestre em Ciência da Computação[s.n.]Pedrini, Hélio, 1963-Dias, Gabriel MartinsColombini, Esther LunaUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASLeite, Guilherme Vieira, 1991-20202020-02-14T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online (52 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/1638739LEITE, Guilherme Vieira. Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais. 2020. 1 recurso online (52 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1638739. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1128689Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2020-05-20T17:05:33Zoai::1128689Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2020-05-20T17:05:33Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais
Human fall detection on videos using convolutional neural networks with multiple channels
title Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais
spellingShingle Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais
Leite, Guilherme Vieira, 1991-
Aprendizado de máquina
Reconhecimento de padrões
Redes neurais convolucionais
Machine learning
Pattern recognition
Convolutional neural networks
title_short Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais
title_full Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais
title_fullStr Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais
title_full_unstemmed Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais
title_sort Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais
author Leite, Guilherme Vieira, 1991-
author_facet Leite, Guilherme Vieira, 1991-
author_role author
dc.contributor.none.fl_str_mv Pedrini, Hélio, 1963-
Dias, Gabriel Martins
Colombini, Esther Luna
Universidade Estadual de Campinas (UNICAMP). Instituto de Computação
Programa de Pós-Graduação em Ciência da Computação
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Leite, Guilherme Vieira, 1991-
dc.subject.por.fl_str_mv Aprendizado de máquina
Reconhecimento de padrões
Redes neurais convolucionais
Machine learning
Pattern recognition
Convolutional neural networks
topic Aprendizado de máquina
Reconhecimento de padrões
Redes neurais convolucionais
Machine learning
Pattern recognition
Convolutional neural networks
description Orientador: Hélio Pedrini
publishDate 2020
dc.date.none.fl_str_mv 2020
2020-02-14T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1638739
LEITE, Guilherme Vieira. Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais. 2020. 1 recurso online (52 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1638739. Acesso em: 3 set. 2024.
url https://hdl.handle.net/20.500.12733/1638739
identifier_str_mv LEITE, Guilherme Vieira. Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais. 2020. 1 recurso online (52 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1638739. Acesso em: 3 set. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/1128689
Requisitos do sistema: Software para leitura de arquivo em PDF
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
1 recurso online (52 p.) : il., digital, arquivo PDF.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809189914553614336