Relevância da tradução de textos de português para inglês no processo de classificação binária de sentimento de postagens rápidas em redes sociais on-line.

Detalhes bibliográficos
Ano de defesa: 2016
Autor(a) principal: FARIAS, Evelyn de Souza. lattes
Orientador(a): GOMES, Reinaldo. lattes, COSTA, Anderson. lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Campina Grande
Programa de Pós-Graduação: PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
Departamento: Centro de Engenharia Elétrica e Informática - CEEI
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/674
Resumo: A análise e mineração de opinião em dados de texto extraídos de redes sociais online tem ganhado bastante força nos últimos anos, tornando-se uma área muito pesquisada e difundida em todo o mundo. Entretanto, esses processos são dependentes do idioma dos dados escritos, sendo o inglês o mais estudado e, consequentemente, o idioma que abrange uma maior quantidade de técnicas e soluções. Nesse contexto, a obtenção de resultados globais nessas áreas de pesquisa torna-se bastante custosa em tempo, sendo assim, com o avanço dos tradutores automáticos de texto e a tradução de dados para o inglês ser utilizada por alguns autores, julgamos necessário analisar o impacto dessas traduções no processo de classificação de sentimento. Os experimentos realizados em nosso trabalho mostraram resultados satisfatórios em métricas de avaliação e comparados aos resultados obtidos em trabalhos de outros autores em experimentos semelhantes de tradução de dados de texto e classificação de polaridade de sentimento. Os sistemas de tradução automática utilizados em nosso trabalho apresentaram uma tendência de traduções equiparadamente eficientes, mostrando que esses sistemas evoluíram bastante nos últimos anos. Quanto à classificação de dados de texto traduzidos automaticamente podemos dizer que, a partir dos resultados obtidos, a tradução automática de texto pode apresentar bons resultados para alguns casos. Porém, há a necessidade de experimentação com volumes de dados de treino mais abrangentes nas duas línguas estudadas neste documento.
id UFCG_27bbf812383c27ff8bdd64f154e2cadc
oai_identifier_str oai:localhost:riufcg/674
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str
spelling GOMES, Reinaldo.GOMES, R.http://lattes.cnpq.br/8132074356628564COSTA, Anderson.COSTA, A. F. B. F.http://lattes.cnpq.br/3275705963015582FARIAS, E. S.http://lattes.cnpq.br/4362443431160649FARIAS, Evelyn de Souza.A análise e mineração de opinião em dados de texto extraídos de redes sociais online tem ganhado bastante força nos últimos anos, tornando-se uma área muito pesquisada e difundida em todo o mundo. Entretanto, esses processos são dependentes do idioma dos dados escritos, sendo o inglês o mais estudado e, consequentemente, o idioma que abrange uma maior quantidade de técnicas e soluções. Nesse contexto, a obtenção de resultados globais nessas áreas de pesquisa torna-se bastante custosa em tempo, sendo assim, com o avanço dos tradutores automáticos de texto e a tradução de dados para o inglês ser utilizada por alguns autores, julgamos necessário analisar o impacto dessas traduções no processo de classificação de sentimento. Os experimentos realizados em nosso trabalho mostraram resultados satisfatórios em métricas de avaliação e comparados aos resultados obtidos em trabalhos de outros autores em experimentos semelhantes de tradução de dados de texto e classificação de polaridade de sentimento. Os sistemas de tradução automática utilizados em nosso trabalho apresentaram uma tendência de traduções equiparadamente eficientes, mostrando que esses sistemas evoluíram bastante nos últimos anos. Quanto à classificação de dados de texto traduzidos automaticamente podemos dizer que, a partir dos resultados obtidos, a tradução automática de texto pode apresentar bons resultados para alguns casos. Porém, há a necessidade de experimentação com volumes de dados de treino mais abrangentes nas duas línguas estudadas neste documento.The sentiment analysis and opinion mining in text data extracted from online social media services has gained enough strength in recent years, making it an area very researched and disseminated worldwide. However, these processes are language dependent and the english language is the most studied one, covering a larger amount of techniques and solutions in the field. In this context, obtaining overall results in these research areas becomes quite time consuming, so with the advancement of automatic text translators and that data automatic translated to english is used by some authors, it is necessary to analyze the impact these automatic translations cost in a text classification process. The experiments performed in our study showed satisfactory results in evaluation metrics and compared to the results obtained in works by other authors in similar experiments using automatic translations of text data and sentiment polarity classification. The machine translation systems used in our study showed a trend of equally efficient translations, showing that these systems have evolved considerably in recent years. As for the automatically translated text data classification we can say that from the results obtained, automatic text translation can present good results in some scenarios and case studies. However, there is a need for experimentation with more comprehensive training data volumes in the two languages studied in this document.Submitted by Kilvya Braga (kilvyabraga@hotmail.com) on 2018-05-15T12:03:49Z No. of bitstreams: 1 EVELYN DE SOUZA FARIAS - DISSERTAÇÃO (PPGCC) 2016.pdf: 2171903 bytes, checksum: c6d0f3ccb5ecf6ba4f906222cd163982 (MD5)Made available in DSpace on 2018-05-15T12:03:49Z (GMT). No. of bitstreams: 1 EVELYN DE SOUZA FARIAS - DISSERTAÇÃO (PPGCC) 2016.pdf: 2171903 bytes, checksum: c6d0f3ccb5ecf6ba4f906222cd163982 (MD5) Previous issue date: 2016CNPqUniversidade Federal de Campina GrandePÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGBrasilCentro de Engenharia Elétrica e Informática - CEEICiênciasCiência da ComputaçãoAnálise de DadosMineração de OpiniãoTradução Automática de TextosClassificação de SentimentoRelevância da tradução de textos de português para inglês no processo de classificação binária de sentimento de postagens rápidas em redes sociais on-line.20162018-05-15T12:03:49Z2018-05-152018-05-15T12:03:49Zhttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/674FARIAS, E. de S. Relevância da tradução de textos de português para inglês no processo de classificação binária de sentimento de postagens rápidas em redes sociais on-line. 2016. 98 f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2016. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/674info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCGORIGINALEVELYN DE SOUZA FARIAS - DISSERTAÇÃO (PPGCC) 2016.pdfEVELYN DE SOUZA FARIAS - DISSERTAÇÃO (PPGCC) 2016.pdfapplication/pdf1551384http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/674/3/EVELYN+DE+SOUZA+FARIAS+-+DISSERTA%C3%87%C3%83O+%28PPGCC%29+2016.pdf9f4868943e4d129feee2d329eb72486bMD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/674/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52riufcg/6742022-06-02 19:52:48.713oai:localhost:riufcg/674Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512022-06-02T22:52:48Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.pt_BR.fl_str_mv Relevância da tradução de textos de português para inglês no processo de classificação binária de sentimento de postagens rápidas em redes sociais on-line.
title Relevância da tradução de textos de português para inglês no processo de classificação binária de sentimento de postagens rápidas em redes sociais on-line.
spellingShingle Relevância da tradução de textos de português para inglês no processo de classificação binária de sentimento de postagens rápidas em redes sociais on-line.
FARIAS, Evelyn de Souza.
Ciências
Ciência da Computação
Análise de Dados
Mineração de Opinião
Tradução Automática de Textos
Classificação de Sentimento
title_short Relevância da tradução de textos de português para inglês no processo de classificação binária de sentimento de postagens rápidas em redes sociais on-line.
title_full Relevância da tradução de textos de português para inglês no processo de classificação binária de sentimento de postagens rápidas em redes sociais on-line.
title_fullStr Relevância da tradução de textos de português para inglês no processo de classificação binária de sentimento de postagens rápidas em redes sociais on-line.
title_full_unstemmed Relevância da tradução de textos de português para inglês no processo de classificação binária de sentimento de postagens rápidas em redes sociais on-line.
title_sort Relevância da tradução de textos de português para inglês no processo de classificação binária de sentimento de postagens rápidas em redes sociais on-line.
author FARIAS, Evelyn de Souza.
author_facet FARIAS, Evelyn de Souza.
author_role author
dc.contributor.advisor2ID.pt_BR.fl_str_mv COSTA, A. F. B. F.
dc.contributor.advisor1.fl_str_mv GOMES, Reinaldo.
dc.contributor.advisor1ID.fl_str_mv GOMES, R.
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8132074356628564
dc.contributor.advisor2.fl_str_mv COSTA, Anderson.
dc.contributor.advisor2Lattes.fl_str_mv http://lattes.cnpq.br/3275705963015582
dc.contributor.authorID.fl_str_mv FARIAS, E. S.
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/4362443431160649
dc.contributor.author.fl_str_mv FARIAS, Evelyn de Souza.
contributor_str_mv GOMES, Reinaldo.
COSTA, Anderson.
dc.subject.cnpq.fl_str_mv Ciências
Ciência da Computação
topic Ciências
Ciência da Computação
Análise de Dados
Mineração de Opinião
Tradução Automática de Textos
Classificação de Sentimento
dc.subject.por.fl_str_mv Análise de Dados
Mineração de Opinião
Tradução Automática de Textos
Classificação de Sentimento
description A análise e mineração de opinião em dados de texto extraídos de redes sociais online tem ganhado bastante força nos últimos anos, tornando-se uma área muito pesquisada e difundida em todo o mundo. Entretanto, esses processos são dependentes do idioma dos dados escritos, sendo o inglês o mais estudado e, consequentemente, o idioma que abrange uma maior quantidade de técnicas e soluções. Nesse contexto, a obtenção de resultados globais nessas áreas de pesquisa torna-se bastante custosa em tempo, sendo assim, com o avanço dos tradutores automáticos de texto e a tradução de dados para o inglês ser utilizada por alguns autores, julgamos necessário analisar o impacto dessas traduções no processo de classificação de sentimento. Os experimentos realizados em nosso trabalho mostraram resultados satisfatórios em métricas de avaliação e comparados aos resultados obtidos em trabalhos de outros autores em experimentos semelhantes de tradução de dados de texto e classificação de polaridade de sentimento. Os sistemas de tradução automática utilizados em nosso trabalho apresentaram uma tendência de traduções equiparadamente eficientes, mostrando que esses sistemas evoluíram bastante nos últimos anos. Quanto à classificação de dados de texto traduzidos automaticamente podemos dizer que, a partir dos resultados obtidos, a tradução automática de texto pode apresentar bons resultados para alguns casos. Porém, há a necessidade de experimentação com volumes de dados de treino mais abrangentes nas duas línguas estudadas neste documento.
publishDate 2016
dc.date.issued.fl_str_mv 2016
dc.date.accessioned.fl_str_mv 2018-05-15T12:03:49Z
dc.date.available.fl_str_mv 2018-05-15
2018-05-15T12:03:49Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/674
dc.identifier.citation.fl_str_mv FARIAS, E. de S. Relevância da tradução de textos de português para inglês no processo de classificação binária de sentimento de postagens rápidas em redes sociais on-line. 2016. 98 f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2016. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/674
url http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/674
identifier_str_mv FARIAS, E. de S. Relevância da tradução de textos de português para inglês no processo de classificação binária de sentimento de postagens rápidas em redes sociais on-line. 2016. 98 f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2016. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/674
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
dc.publisher.program.fl_str_mv PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
dc.publisher.initials.fl_str_mv UFCG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Centro de Engenharia Elétrica e Informática - CEEI
publisher.none.fl_str_mv Universidade Federal de Campina Grande
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
bitstream.url.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/674/3/EVELYN+DE+SOUZA+FARIAS+-+DISSERTA%C3%87%C3%83O+%28PPGCC%29+2016.pdf
http://dspace.sti.ufcg.edu.br:8080/xmlui/bitstream/riufcg/674/2/license.txt
bitstream.checksum.fl_str_mv 9f4868943e4d129feee2d329eb72486b
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1797044596203585536