Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais
Ano de defesa: | 2020 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
[s.n.]
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://hdl.handle.net/20.500.12733/1638739 |
Resumo: | Orientador: Hélio Pedrini |
id |
UNICAMP-30_7d9b67a71e502e244601eeebcb2159fc |
---|---|
oai_identifier_str |
oai::1128689 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canaisHuman fall detection on videos using convolutional neural networks with multiple channelsAprendizado de máquinaReconhecimento de padrõesRedes neurais convolucionaisMachine learningPattern recognitionConvolutional neural networksOrientador: Hélio PedriniDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Baixas taxas de mortalidade infantil, avanços na medicina e mudanças culturais aumentaram a expectativa de vida nos países desenvolvidos para mais de 60 anos. Alguns países esperam que, até 2030, 20% da sua população tenham mais de 65 anos. A qualidade de vida nessa idade avançada é altamente determinada pela saúde do indivíduo, que ditará se o idoso pode se engajar em atividades importantes para o seu bem estar, independência e satisfação pessoal. O envelhecimento é acompanhado por problemas de saúde causados por limitações biológicas e fraqueza muscular. Esse enfraquecimento facilita a ocorrência de quedas, responsáveis pela morte de aproximadamente 646.000 pessoas em todo o mundo e, mesmo quando uma pequena queda ocorre, ela ainda pode fraturar ossos ou danificar tecidos moles, que não cicatrizam completamente. Lesões e danos dessa natureza, por sua vez, podem afetar a autoconfiança do indivíduo, diminuindo sua independência. Neste trabalho, propomos um método capaz de detectar quedas humanas em sequências de vídeo usando redes neurais convolucionais (CNNs) multicanais. Nós desenvolvemos dois métodos para detecção de quedas, o primeiro utilizando uma CNN 2D e o segundo utilizando uma CNN 3D. Nossos métodos utilizam características extraídas previamente de cada quadro do vídeo e as classificam. Após a etapa de classificação, uma máquina de vetores de suporte (SVM) é aplicada para ponderar os canais de entrada e indicar se houve ou não uma queda. Experimentamos quatro tipos de características, a saber: (i) fluxo óptico, (ii) ritmo visual, (iii) estimativa de pose e (iv) mapa de saliência. As bases de dados utilizadas (URFD e FDD) estão disponíveis publicamente e nossos resultados são comparados com os da literatura. As métricas selecionadas para avaliação são acurácia balanceada, acurácia, sensibilidade e especificidade. Nossos métodos apresentaram resultados competitivos com os obtidos pelo estado da arte na base de dados URFD e superam os obtidos na base de dados FDD. Ao conhecimento dos autores, nós somos os primeiros a realizar testes cruzados entre os conjuntos de dados em questão, e a reportar resultados de acurácia balanceada. Os métodos propostos são capazes de detectar quedas nas bases selecionadas. A detecção de quedas, bem como a classificação de atividades em vídeos, está fortemente relacionada à capacidade da rede de interpretar informações temporais e, como esperado, o fluxo óptico é a característica mais relevante para a detecção de quedasAbstract: Lower child mortality rates, advances in medicine, and cultural changes have increased life expectancy in developed countries over 60 years old. Some countries expect that, by 2030, 20% of their population will be over 65 years old. The quality of life at this advanced age is highly dictated by the individual's health, which will determine whether the elderly can engage in important activities to their well-being, independence, and personal satisfaction. Old age is accompanied by health problems caused by biological limitations and muscle weakness. This weakening facilitates the occurrence of falls, which are responsible for the deaths of approximately 646,000 people worldwide and, even when a minor fall occurs, it can still cause fractures, break bones or damage soft tissues, which will not heal completely. Injuries and damages of this nature, in turn, will consume the self-confidence of the individual, diminishing their independence. In this work, we propose a method capable of detecting human falls in video sequences using multichannel convolutional neural networks (CNN). We developed two methods for fall detection, the first using a 2D CNN and the second using a 3D CNN. Our method uses features previously extracted from each frame and classifies them with a CNN. After the classification step, a support vector machine (SVM) is applied to weight the input channels and indicate whether or not there was a fall. We experiment with four types of features, namely: (i) optical flow, (ii) visual rhythm, (iii) pose estimation, and (iv) saliency map. The benchmarks used (URFD and FDD) are publicly available and our results are compared to those in the literature. The metrics selected for evaluation are balanced accuracy, accuracy, sensitivity, and specificity. Our results are competitive with those obtained by the state of the art on the URFD data set and surpass those on the FDD data set. To the authors' knowledge, we are the first to perform cross-tests between the datasets in question and to report results for the balanced accuracy metric. The proposed method is able to detect falls in the selected benchmarks. Fall detection, as well as activity classification in videos, is strongly related to the network's ability to interpret temporal information and, as expected, optical flow is the most relevant feature for detecting fallsMestradoCiência da ComputaçãoMestre em Ciência da Computação[s.n.]Pedrini, Hélio, 1963-Dias, Gabriel MartinsColombini, Esther LunaUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASLeite, Guilherme Vieira, 1991-20202020-02-14T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online (52 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/1638739LEITE, Guilherme Vieira. Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais. 2020. 1 recurso online (52 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1638739. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1128689Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2020-05-20T17:05:33Zoai::1128689Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2020-05-20T17:05:33Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais Human fall detection on videos using convolutional neural networks with multiple channels |
title |
Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais |
spellingShingle |
Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais Leite, Guilherme Vieira, 1991- Aprendizado de máquina Reconhecimento de padrões Redes neurais convolucionais Machine learning Pattern recognition Convolutional neural networks |
title_short |
Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais |
title_full |
Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais |
title_fullStr |
Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais |
title_full_unstemmed |
Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais |
title_sort |
Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais |
author |
Leite, Guilherme Vieira, 1991- |
author_facet |
Leite, Guilherme Vieira, 1991- |
author_role |
author |
dc.contributor.none.fl_str_mv |
Pedrini, Hélio, 1963- Dias, Gabriel Martins Colombini, Esther Luna Universidade Estadual de Campinas (UNICAMP). Instituto de Computação Programa de Pós-Graduação em Ciência da Computação UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Leite, Guilherme Vieira, 1991- |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Reconhecimento de padrões Redes neurais convolucionais Machine learning Pattern recognition Convolutional neural networks |
topic |
Aprendizado de máquina Reconhecimento de padrões Redes neurais convolucionais Machine learning Pattern recognition Convolutional neural networks |
description |
Orientador: Hélio Pedrini |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020 2020-02-14T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/1638739 LEITE, Guilherme Vieira. Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais. 2020. 1 recurso online (52 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1638739. Acesso em: 3 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/1638739 |
identifier_str_mv |
LEITE, Guilherme Vieira. Detecção de quedas de pessoas em vídeos utilizando redes neurais convolucionais com múltiplos canais. 2020. 1 recurso online (52 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1638739. Acesso em: 3 set. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/1128689 Requisitos do sistema: Software para leitura de arquivo em PDF |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 1 recurso online (52 p.) : il., digital, arquivo PDF. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809189914553614336 |