Aprendizado de máquina em representações tridimensionais

Detalhes bibliográficos
Ano de defesa: 2013
Autor(a) principal: Costa, Anderson Bessa da
Orientador(a): Matsubara, Edson Takashi
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufms.br/handle/123456789/1749
Resumo: Aprendizado consiste em adquirir novos, ou modificar os existentes, conhecimentos, comportamentos, habilidades, valores ou preferências e pode envolver a síntese de diferentes tipos de informação. O aprendizado está fortemente relacionado à representação do conhecimento. Uma representação de conhecimento está ligada a capacidade de se inferir, ou seja, aprender. Uma representação de dados bastante presente nos últimos tempos se refere à representação tridimensional, associada fortemente a imagens 3D. Neste trabalho apresenta-se um estudo sobre aprendizado 3D com base em dois estudos de caso, imagens 3D adquiridas a partir do Kinect e movimentos adquirido a partir dos dados do wiimote. A visão humana sempre despertou um grande fascínio por ser considerada um dos sensores humanos mais ricos em informação. Sempre existiu um grande interesse em simular a capacidade de visão do ser humano. Com o surgimento e popularização de sistemas RGB-D (RedGreenBlue - Depth), é possível obter informação de profundidade de cada pixel de maneira rápida e confiável. Isto permitiu a aproximação da tecnologia atual com a visão humana, que com dois olhos são capazes de estimar a profundidade aproximada de um objeto. Uma imagem capturada de um sistema RGB-D é muito mais rica em informação do que uma imagem capturada de uma câmera comum. Estudar como este ganho de informação pode ser utilizado para melhorar a capacidade de representação e reconhecimento de objetos em Inteligência Artificial é um dos objetivos deste projeto. Por meio de uma proposta de um pipeline de aprendizado 3D, desde captura dos dados até algoritmos de reconhecimento, será provido um estudo sobre aprendizado em sistemas RGB-D. Assim como o Kinect, o nintendo Wii também revolucionou a indústria de games graças ao seu controle capaz de reconhecer os movimentos do jogador. Neste trabalho apresenta-se um estudo sobre reconhecimento de padrões em estruturas tridimensionais com o objetivo de explicitar que com a utilização da técnica de aprendizado de máquina juntamente com a representação adequada do problema é possível atingir altas taxas de acerto com um baixo tempo de processamento, o que foi realizado com sucesso.
id UFMS_ddeef5fbb83f72e6d93989cd9ee4ef4d
oai_identifier_str oai:repositorio.ufms.br:123456789/1749
network_acronym_str UFMS
network_name_str Repositório Institucional da UFMS
repository_id_str
spelling 2013-08-05T18:41:53Z2021-09-30T19:55:25Z2013https://repositorio.ufms.br/handle/123456789/1749Aprendizado consiste em adquirir novos, ou modificar os existentes, conhecimentos, comportamentos, habilidades, valores ou preferências e pode envolver a síntese de diferentes tipos de informação. O aprendizado está fortemente relacionado à representação do conhecimento. Uma representação de conhecimento está ligada a capacidade de se inferir, ou seja, aprender. Uma representação de dados bastante presente nos últimos tempos se refere à representação tridimensional, associada fortemente a imagens 3D. Neste trabalho apresenta-se um estudo sobre aprendizado 3D com base em dois estudos de caso, imagens 3D adquiridas a partir do Kinect e movimentos adquirido a partir dos dados do wiimote. A visão humana sempre despertou um grande fascínio por ser considerada um dos sensores humanos mais ricos em informação. Sempre existiu um grande interesse em simular a capacidade de visão do ser humano. Com o surgimento e popularização de sistemas RGB-D (RedGreenBlue - Depth), é possível obter informação de profundidade de cada pixel de maneira rápida e confiável. Isto permitiu a aproximação da tecnologia atual com a visão humana, que com dois olhos são capazes de estimar a profundidade aproximada de um objeto. Uma imagem capturada de um sistema RGB-D é muito mais rica em informação do que uma imagem capturada de uma câmera comum. Estudar como este ganho de informação pode ser utilizado para melhorar a capacidade de representação e reconhecimento de objetos em Inteligência Artificial é um dos objetivos deste projeto. Por meio de uma proposta de um pipeline de aprendizado 3D, desde captura dos dados até algoritmos de reconhecimento, será provido um estudo sobre aprendizado em sistemas RGB-D. Assim como o Kinect, o nintendo Wii também revolucionou a indústria de games graças ao seu controle capaz de reconhecer os movimentos do jogador. Neste trabalho apresenta-se um estudo sobre reconhecimento de padrões em estruturas tridimensionais com o objetivo de explicitar que com a utilização da técnica de aprendizado de máquina juntamente com a representação adequada do problema é possível atingir altas taxas de acerto com um baixo tempo de processamento, o que foi realizado com sucesso.ABSTRACT - Learning is acquiring new or modifying existing knowledge, behaviors, skills, values, or preferences and may involve synthesizing different types of information. Learning is strongly related to knowledge representation. A knowledge representation is linked to the ability to infer, or learn. A data representation very seen nowdays is tridimensional representation, which is strongly associated with 3D images. This work presents a study on 3D learning based on two case studies, 3D images acquired from the Kinect and motion data acquired from the wiimote. Human vision has always aroused a great fascination for being considered one of the richest human sensors. There has always been a great interest in the ability to simulate human vision. With the emergence and popularization of systems RGB-D (RedGreenBlue - Depth), it is possible to obtain depth information of each pixel quickly and reliably. This allowed the approach of current technology with human vision, with two eyes that are able to estimate the approximate depth of an object. A captured image of a system RGB-D is much richer in information than a captured image of an ordinary camera. Study how this information gain can be used to improve the ability of representation and recognition of objects in Artificial Intelligence is one of the goals of this project. Through a proposal of a 3D pipeline learning, from data capture to recognition algorithms, will be provided a study on learning systems RGB-D. Just as the Kinect, the Nintendo Wii also revolutionized the gaming industry thanks to its control able to recognize the player’s movements. This paper presents a study on recognition of patterns in three-dimensional structures with the purpose of clarifying that the use of the technique of machine learning along with adequate representation of the problem is possible to achieve high hit rates with a low processing time, which was successful.porRealidade VirtualAlgoritmos para ImagensImagem DigitalVisão ComputacionalTerceira Dimensão (Modelos)Digital ImageAlgorithms for ImagesVirtual RealityComputer VisionThird Dimension (Models)Aprendizado de máquina em representações tridimensionaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisMatsubara, Edson TakashiCosta, Anderson Bessa dainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMSinstname:Universidade Federal de Mato Grosso do Sul (UFMS)instacron:UFMSTHUMBNAILAnderson.pdf.jpgAnderson.pdf.jpgGenerated Thumbnailimage/jpeg1172https://repositorio.ufms.br/bitstream/123456789/1749/4/Anderson.pdf.jpg4afa6b8955da0c095c2d0f0eb3eb7c9aMD54ORIGINALAnderson.pdfAnderson.pdfapplication/pdf6385230https://repositorio.ufms.br/bitstream/123456789/1749/1/Anderson.pdfe0dcb0dc6fdd85bf96a32781c0dfb177MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufms.br/bitstream/123456789/1749/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTAnderson.pdf.txtAnderson.pdf.txtExtracted texttext/plain0https://repositorio.ufms.br/bitstream/123456789/1749/3/Anderson.pdf.txtd41d8cd98f00b204e9800998ecf8427eMD53123456789/17492021-09-30 15:55:25.433oai:repositorio.ufms.br:123456789/1749Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufms.br/oai/requestri.prograd@ufms.bropendoar:21242021-09-30T19:55:25Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)false
dc.title.pt_BR.fl_str_mv Aprendizado de máquina em representações tridimensionais
title Aprendizado de máquina em representações tridimensionais
spellingShingle Aprendizado de máquina em representações tridimensionais
Costa, Anderson Bessa da
Realidade Virtual
Algoritmos para Imagens
Imagem Digital
Visão Computacional
Terceira Dimensão (Modelos)
Digital Image
Algorithms for Images
Virtual Reality
Computer Vision
Third Dimension (Models)
title_short Aprendizado de máquina em representações tridimensionais
title_full Aprendizado de máquina em representações tridimensionais
title_fullStr Aprendizado de máquina em representações tridimensionais
title_full_unstemmed Aprendizado de máquina em representações tridimensionais
title_sort Aprendizado de máquina em representações tridimensionais
author Costa, Anderson Bessa da
author_facet Costa, Anderson Bessa da
author_role author
dc.contributor.advisor1.fl_str_mv Matsubara, Edson Takashi
dc.contributor.author.fl_str_mv Costa, Anderson Bessa da
contributor_str_mv Matsubara, Edson Takashi
dc.subject.por.fl_str_mv Realidade Virtual
Algoritmos para Imagens
Imagem Digital
Visão Computacional
Terceira Dimensão (Modelos)
Digital Image
Algorithms for Images
Virtual Reality
Computer Vision
Third Dimension (Models)
topic Realidade Virtual
Algoritmos para Imagens
Imagem Digital
Visão Computacional
Terceira Dimensão (Modelos)
Digital Image
Algorithms for Images
Virtual Reality
Computer Vision
Third Dimension (Models)
description Aprendizado consiste em adquirir novos, ou modificar os existentes, conhecimentos, comportamentos, habilidades, valores ou preferências e pode envolver a síntese de diferentes tipos de informação. O aprendizado está fortemente relacionado à representação do conhecimento. Uma representação de conhecimento está ligada a capacidade de se inferir, ou seja, aprender. Uma representação de dados bastante presente nos últimos tempos se refere à representação tridimensional, associada fortemente a imagens 3D. Neste trabalho apresenta-se um estudo sobre aprendizado 3D com base em dois estudos de caso, imagens 3D adquiridas a partir do Kinect e movimentos adquirido a partir dos dados do wiimote. A visão humana sempre despertou um grande fascínio por ser considerada um dos sensores humanos mais ricos em informação. Sempre existiu um grande interesse em simular a capacidade de visão do ser humano. Com o surgimento e popularização de sistemas RGB-D (RedGreenBlue - Depth), é possível obter informação de profundidade de cada pixel de maneira rápida e confiável. Isto permitiu a aproximação da tecnologia atual com a visão humana, que com dois olhos são capazes de estimar a profundidade aproximada de um objeto. Uma imagem capturada de um sistema RGB-D é muito mais rica em informação do que uma imagem capturada de uma câmera comum. Estudar como este ganho de informação pode ser utilizado para melhorar a capacidade de representação e reconhecimento de objetos em Inteligência Artificial é um dos objetivos deste projeto. Por meio de uma proposta de um pipeline de aprendizado 3D, desde captura dos dados até algoritmos de reconhecimento, será provido um estudo sobre aprendizado em sistemas RGB-D. Assim como o Kinect, o nintendo Wii também revolucionou a indústria de games graças ao seu controle capaz de reconhecer os movimentos do jogador. Neste trabalho apresenta-se um estudo sobre reconhecimento de padrões em estruturas tridimensionais com o objetivo de explicitar que com a utilização da técnica de aprendizado de máquina juntamente com a representação adequada do problema é possível atingir altas taxas de acerto com um baixo tempo de processamento, o que foi realizado com sucesso.
publishDate 2013
dc.date.accessioned.fl_str_mv 2013-08-05T18:41:53Z
dc.date.issued.fl_str_mv 2013
dc.date.available.fl_str_mv 2021-09-30T19:55:25Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufms.br/handle/123456789/1749
url https://repositorio.ufms.br/handle/123456789/1749
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMS
instname:Universidade Federal de Mato Grosso do Sul (UFMS)
instacron:UFMS
instname_str Universidade Federal de Mato Grosso do Sul (UFMS)
instacron_str UFMS
institution UFMS
reponame_str Repositório Institucional da UFMS
collection Repositório Institucional da UFMS
bitstream.url.fl_str_mv https://repositorio.ufms.br/bitstream/123456789/1749/4/Anderson.pdf.jpg
https://repositorio.ufms.br/bitstream/123456789/1749/1/Anderson.pdf
https://repositorio.ufms.br/bitstream/123456789/1749/2/license.txt
https://repositorio.ufms.br/bitstream/123456789/1749/3/Anderson.pdf.txt
bitstream.checksum.fl_str_mv 4afa6b8955da0c095c2d0f0eb3eb7c9a
e0dcb0dc6fdd85bf96a32781c0dfb177
8a4605be74aa9ea9d79846c1fba20a33
d41d8cd98f00b204e9800998ecf8427e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMS - Universidade Federal de Mato Grosso do Sul (UFMS)
repository.mail.fl_str_mv ri.prograd@ufms.br
_version_ 1833922111342641152