Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados.
| Ano de defesa: | 2016 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://www.repositorio.ufop.br/handle/123456789/7360 |
Resumo: | Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. |
| id |
UFOP_9d7cb90da291c84eff64c0f5c4564d4f |
|---|---|
| oai_identifier_str |
oai:repositorio.ufop.br:123456789/7360 |
| network_acronym_str |
UFOP |
| network_name_str |
Repositório Institucional da UFOP |
| repository_id_str |
|
| spelling |
Stiilpen Júnior, MiltonMerschmann, Luiz Henrique de CamposFerreira, Anderson AlmeidaSouza, Fabrício Benevenuto deMerschmann, Luiz Henrique de Campos2017-03-13T12:24:38Z2017-03-13T12:24:38Z2016STIILPEN JÚNIOR, Milton. Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados. 2016. 41 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2016.http://www.repositorio.ufop.br/handle/123456789/7360Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.Redes Sociais online (RSO) surgiram no início do século XXI e dão indícios de que terão vida longa. Cerca de 64% dos usuários de mídias sociais dizem acessar ao menos uma rede social todos os dias. Desse modo, é imensa a quantidade de dados gerados por esses canais de comunicação. O Processamento de Linguagem Natural em textos de redes sociais é um tema de pesquisa recente que vem atraindo um número cada vez maior de pesquisadores. Portanto, neste trabalho, é proposta um arcabouço capaz de lidar com a diversidade do português brasileiro, com o informalismo, com a natureza de tempo real e com a falta de contextualização de textos publicados em redes sociais. O arcabouço proposto foi avaliado em duas tarefas (Categorização de Texto e Mineração de Opinião) e os resultados experimentais mostraram que os mecanismos de pré-processamento existentes no arcabouço foram importantes para obtenção de bons resultados.Social Networks emerged at the beginning of 21st century and give us evidence that they are going to have a long life. Almost two-thirds of overall social media users affirm an everyday usage of a social media website and, therefore, the data volume across this platforms is huge. Natural language processing of social media texts is an attractive topic among researchers of this area. While there are many studies about natural language processing of social media texts for some languages (e.g., English), the researches for Brazilian Portuguese language are still limited. Then, in this work, a framework is proposed to deal with peculiarities of the Brazilian Portuguese language in informal, short and noisy texts, where the lack of context poses obstacles in text mining. The proposed framework has been evaluated in two tasks (Text Categorization and Opinion Mining) and experiments showed that the preprocessing mechanisms included in this framework were important to achieve better results.Autorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 09/03/2017 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação.info:eu-repo/semantics/openAccessMineração de dados - computaçãoRedes sociais on-lineProcessamento da linguagem natural - computaçãoUm arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFOPinstname:Universidade Federal de Ouro Preto (UFOP)instacron:UFOPLICENSElicense.txtlicense.txttext/plain; charset=utf-8924https://www.repositorio.ufop.br/bitstreams/958a3dd7-1820-41f8-8e86-12108e893d2b/download62604f8d955274beb56c80ce1ee5dcaeMD52falseAnonymousREADORIGINALDISSERTAÇÃO_ArcabouçoProcessamentoTextos.pdfDISSERTAÇÃO_ArcabouçoProcessamentoTextos.pdfapplication/pdf3459366https://www.repositorio.ufop.br/bitstreams/820e7617-3980-4c33-a404-3d083e68d857/download2768a90dc68fe45829391e3a483a2373MD51trueAnonymousREADTEXTDISSERTAÇÃO_ArcabouçoProcessamentoTextos.pdf.txtDISSERTAÇÃO_ArcabouçoProcessamentoTextos.pdf.txtExtracted texttext/plain71475https://www.repositorio.ufop.br/bitstreams/2817606e-79a2-4ce7-8bb2-28a385354afb/download6d6def7b328f141b9bafdf36eb47e293MD53falseAnonymousREADTHUMBNAILDISSERTAÇÃO_ArcabouçoProcessamentoTextos.pdf.jpgDISSERTAÇÃO_ArcabouçoProcessamentoTextos.pdf.jpgGenerated Thumbnailimage/jpeg2683https://www.repositorio.ufop.br/bitstreams/914d975c-f797-4baa-8410-99d8004b5ffa/download158bd12987d56c324e7418be40b26704MD54falseAnonymousREAD123456789/73602024-11-10 11:10:27.943open.accessoai:repositorio.ufop.br:123456789/7360https://www.repositorio.ufop.brRepositório InstitucionalPUBhttp://www.repositorio.ufop.br/oai/requestrepositorio@ufop.edu.bropendoar:32332024-11-10T14:10:27Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)falseRGVjbGFyYcOnw6NvIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhCgpPIHJlZmVyaWRvIGF1dG9yOgoKYSlEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBwZXNzb2Egb3UgZW50aWRhZGUuCgpiKVNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCBuw6NvIGRldMOpbSBvcyBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGF1dG9yaXphw6fDo28gZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgT3VybyBQcmV0by9VRk9QIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EgZSBxdWUgZXNzZSBtYXRlcmlhbCwgY3Vqb3MgZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MsIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpjKVNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIGJhc2VhZG8gZW0gdHJhYmFsaG8gZmluYW5jaWFkbyBvdSBhcG9pYWRvIHBvciBvdXRyYSBpbnN0aXR1acOnw6NvIHF1ZSBuw6NvIGEgVUZPUCwgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gY29udHJhdG8gb3UgYWNvcmRvLgoK |
| dc.title.pt_BR.fl_str_mv |
Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados. |
| title |
Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados. |
| spellingShingle |
Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados. Stiilpen Júnior, Milton Mineração de dados - computação Redes sociais on-line Processamento da linguagem natural - computação |
| title_short |
Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados. |
| title_full |
Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados. |
| title_fullStr |
Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados. |
| title_full_unstemmed |
Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados. |
| title_sort |
Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados. |
| author |
Stiilpen Júnior, Milton |
| author_facet |
Stiilpen Júnior, Milton |
| author_role |
author |
| dc.contributor.referee.pt_BR.fl_str_mv |
Merschmann, Luiz Henrique de Campos Ferreira, Anderson Almeida Souza, Fabrício Benevenuto de |
| dc.contributor.author.fl_str_mv |
Stiilpen Júnior, Milton |
| dc.contributor.advisor1.fl_str_mv |
Merschmann, Luiz Henrique de Campos |
| contributor_str_mv |
Merschmann, Luiz Henrique de Campos |
| dc.subject.por.fl_str_mv |
Mineração de dados - computação Redes sociais on-line Processamento da linguagem natural - computação |
| topic |
Mineração de dados - computação Redes sociais on-line Processamento da linguagem natural - computação |
| description |
Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. |
| publishDate |
2016 |
| dc.date.issued.fl_str_mv |
2016 |
| dc.date.accessioned.fl_str_mv |
2017-03-13T12:24:38Z |
| dc.date.available.fl_str_mv |
2017-03-13T12:24:38Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
STIILPEN JÚNIOR, Milton. Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados. 2016. 41 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2016. |
| dc.identifier.uri.fl_str_mv |
http://www.repositorio.ufop.br/handle/123456789/7360 |
| identifier_str_mv |
STIILPEN JÚNIOR, Milton. Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados. 2016. 41 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2016. |
| url |
http://www.repositorio.ufop.br/handle/123456789/7360 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFOP instname:Universidade Federal de Ouro Preto (UFOP) instacron:UFOP |
| instname_str |
Universidade Federal de Ouro Preto (UFOP) |
| instacron_str |
UFOP |
| institution |
UFOP |
| reponame_str |
Repositório Institucional da UFOP |
| collection |
Repositório Institucional da UFOP |
| bitstream.url.fl_str_mv |
https://www.repositorio.ufop.br/bitstreams/958a3dd7-1820-41f8-8e86-12108e893d2b/download https://www.repositorio.ufop.br/bitstreams/820e7617-3980-4c33-a404-3d083e68d857/download https://www.repositorio.ufop.br/bitstreams/2817606e-79a2-4ce7-8bb2-28a385354afb/download https://www.repositorio.ufop.br/bitstreams/914d975c-f797-4baa-8410-99d8004b5ffa/download |
| bitstream.checksum.fl_str_mv |
62604f8d955274beb56c80ce1ee5dcae 2768a90dc68fe45829391e3a483a2373 6d6def7b328f141b9bafdf36eb47e293 158bd12987d56c324e7418be40b26704 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP) |
| repository.mail.fl_str_mv |
repositorio@ufop.edu.br |
| _version_ |
1862724380917760000 |