Ambiente de análise de sentimentos baseado em domínio

Detalhes bibliográficos
Ano de defesa: 2010
Autor(a) principal: Koblitz, Leonardo Falcão
Outros Autores: Instituto de Engenharia Nuclear
Orientador(a): Ebecken, Nelson Francisco Favilla
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Instituto de Engenharia Nuclear
Programa de Pós-Graduação: Programa de Pós-Graduação em Engenharia Civil
Departamento: Universidade Federal do Rio de Janeiro
País: Brasil
Palavras-chave em Português:
Link de acesso: http://carpedien.ien.gov.br:8080/handle/ien/1963
Resumo: Cada vez mais as pessoas colocam suas opiniões e sentimentos em diversos tipos de serviços disponíveis na Web. Sites de microblogging como o twitter, redes sociais ou fóruns têm se tornado o meio comum para elas se expressarem. Elas colocam de forma espontânea, gratuita e em tempo real, opiniões sobre os mais diferentes assuntos. A análise destes dados constitui uma fonte importante e rica para se entender e se antecipar às expectativas e frustrações das pessoas a respeito de um produto, um serviço ou mesmo sobre pessoas ou fatos. Entretanto, cada domínio ou serviço de Internet tem suas peculiaridades. Jargões específicos de um domínio, gírias ou mesmo características próprias dos serviços para as pessoas colocarem as suas opiniões diferem de maneira significativa, o que compromete a utilização de sistemas de aprendizado de máquina desenvolvidos anteriormente para outros domínios. Com isto em mente, foi proposta uma estratégia para permitir a análise de sentimentos baseada em domínio, a qual estabelece os passos para se montar rapidamente um ambiente de análise de sentimentos e conteúdo de acordo com o domínio sendo examinado. Esta estratégia contempla desde o processo de anotação do corpus, os passos necessários para a criação de anotações de acordo com o domínio, criação de léxicos semânticos e o desenvolvimento e validação dos classificadores. Para testar esta estratégia foi desenvolvido o sistema JULGAR, cujo núcleo está baseado no ambiente computacional GATE utilizado para o processamento de linguagem natural.
id IEN_cc0099039659e837bb8d089886532844
oai_identifier_str oai:carpedien.ien.gov.br:ien/1963
network_acronym_str IEN
network_name_str Repositório Institucional do IEN
spelling Koblitz, Leonardo FalcãoInstituto de Engenharia NuclearEbecken, Nelson Francisco FavillaEvsukoff, Alexandre GonçalvesGuimarães, Antônio Cesar FerreiraLima, Beatriz de Souza Leite PiesMattoso, Marta Lima de QueirósEbecken, Nelson Francisco Favilla2017-10-10T17:05:05Z2017-10-10T17:05:05Z2010-12http://carpedien.ien.gov.br:8080/handle/ien/1963Cada vez mais as pessoas colocam suas opiniões e sentimentos em diversos tipos de serviços disponíveis na Web. Sites de microblogging como o twitter, redes sociais ou fóruns têm se tornado o meio comum para elas se expressarem. Elas colocam de forma espontânea, gratuita e em tempo real, opiniões sobre os mais diferentes assuntos. A análise destes dados constitui uma fonte importante e rica para se entender e se antecipar às expectativas e frustrações das pessoas a respeito de um produto, um serviço ou mesmo sobre pessoas ou fatos. Entretanto, cada domínio ou serviço de Internet tem suas peculiaridades. Jargões específicos de um domínio, gírias ou mesmo características próprias dos serviços para as pessoas colocarem as suas opiniões diferem de maneira significativa, o que compromete a utilização de sistemas de aprendizado de máquina desenvolvidos anteriormente para outros domínios. Com isto em mente, foi proposta uma estratégia para permitir a análise de sentimentos baseada em domínio, a qual estabelece os passos para se montar rapidamente um ambiente de análise de sentimentos e conteúdo de acordo com o domínio sendo examinado. Esta estratégia contempla desde o processo de anotação do corpus, os passos necessários para a criação de anotações de acordo com o domínio, criação de léxicos semânticos e o desenvolvimento e validação dos classificadores. Para testar esta estratégia foi desenvolvido o sistema JULGAR, cujo núcleo está baseado no ambiente computacional GATE utilizado para o processamento de linguagem natural.More and more people show their opinion and feelings at several available Web services. Microblogging sites, such as the twitter, social networks or forums have become the ordinary media for these people to express themselves. In real time, they say spontaneously and at no cost what they think about different matters. These data analysis is an important resource to understand and to know in advance people's expectations and frustrations about a product, a service and even people or facts. However, each Internet site or service has its own characteristics. Sites' specific jargons, slangs or even specific characteristics of services where persons express their opinions don't have a pattern, making difficult the use of learning systems previously developed for other sites. For this purpose a strategy was proposed a strategy that allows the analysis of feelings based on site and that establishes steps to quickly create an environment for the analysis of feelings according to the site being examined.This strategy comprises making notes on the corpus, the necessary steps for creating annotations according to the site, lexical semantic creation and the development and validation of the classifiers. In order to test this strategy, it was developed the JULGAR system, whose core is based on the computational environment GATE, which is employed for the processing of natural language.Submitted by Marcele Costal de Castro (costalcastro@gmail.com) on 2017-10-10T17:05:05Z No. of bitstreams: 1 LEONARDO FALCAO KOBLITZ _D.pdf: 998698 bytes, checksum: a51748c3ce87730fc510c7a4f4daba34 (MD5)Made available in DSpace on 2017-10-10T17:05:05Z (GMT). No. of bitstreams: 1 LEONARDO FALCAO KOBLITZ _D.pdf: 998698 bytes, checksum: a51748c3ce87730fc510c7a4f4daba34 (MD5) Previous issue date: 2010-12porInstituto de Engenharia NuclearPrograma de Pós-Graduação em Engenharia CivilIENBrasilUniversidade Federal do Rio de JaneiroAnálise de sentimentosMineração de textosAdaptação de domínioAmbiente de análise de sentimentos baseado em domínioinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional do IENinstname:Instituto de Engenharia Nuclearinstacron:IENLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://carpedien.ien.gov.br:8080/xmlui/bitstream/ien/1963/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALLEONARDO FALCAO KOBLITZ _D.pdfLEONARDO FALCAO KOBLITZ _D.pdfapplication/pdf998698http://carpedien.ien.gov.br:8080/xmlui/bitstream/ien/1963/1/LEONARDO+FALCAO+KOBLITZ+_D.pdfa51748c3ce87730fc510c7a4f4daba34MD51ien/1963oai:carpedien.ien.gov.br:ien/19632017-10-10 14:05:05.706Dspace IENlsales@ien.gov.brTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
dc.title.pt_BR.fl_str_mv Ambiente de análise de sentimentos baseado em domínio
title Ambiente de análise de sentimentos baseado em domínio
spellingShingle Ambiente de análise de sentimentos baseado em domínio
Koblitz, Leonardo Falcão
Análise de sentimentos
Mineração de textos
Adaptação de domínio
title_short Ambiente de análise de sentimentos baseado em domínio
title_full Ambiente de análise de sentimentos baseado em domínio
title_fullStr Ambiente de análise de sentimentos baseado em domínio
title_full_unstemmed Ambiente de análise de sentimentos baseado em domínio
title_sort Ambiente de análise de sentimentos baseado em domínio
author Koblitz, Leonardo Falcão
author_facet Koblitz, Leonardo Falcão
Instituto de Engenharia Nuclear
author_role author
author2 Instituto de Engenharia Nuclear
author2_role author
dc.contributor.referees1.none.fl_str_mv Ebecken, Nelson Francisco Favilla
dc.contributor.referees2.none.fl_str_mv Evsukoff, Alexandre Gonçalves
dc.contributor.referees3.none.fl_str_mv Guimarães, Antônio Cesar Ferreira
dc.contributor.referees4.none.fl_str_mv Lima, Beatriz de Souza Leite Pies
dc.contributor.referees5.none.fl_str_mv Mattoso, Marta Lima de Queirós
dc.contributor.author.fl_str_mv Koblitz, Leonardo Falcão
Instituto de Engenharia Nuclear
dc.contributor.advisor1.fl_str_mv Ebecken, Nelson Francisco Favilla
contributor_str_mv Ebecken, Nelson Francisco Favilla
dc.subject.por.fl_str_mv Análise de sentimentos
Mineração de textos
Adaptação de domínio
topic Análise de sentimentos
Mineração de textos
Adaptação de domínio
dc.description.abstract.por.fl_txt_mv Cada vez mais as pessoas colocam suas opiniões e sentimentos em diversos tipos de serviços disponíveis na Web. Sites de microblogging como o twitter, redes sociais ou fóruns têm se tornado o meio comum para elas se expressarem. Elas colocam de forma espontânea, gratuita e em tempo real, opiniões sobre os mais diferentes assuntos. A análise destes dados constitui uma fonte importante e rica para se entender e se antecipar às expectativas e frustrações das pessoas a respeito de um produto, um serviço ou mesmo sobre pessoas ou fatos. Entretanto, cada domínio ou serviço de Internet tem suas peculiaridades. Jargões específicos de um domínio, gírias ou mesmo características próprias dos serviços para as pessoas colocarem as suas opiniões diferem de maneira significativa, o que compromete a utilização de sistemas de aprendizado de máquina desenvolvidos anteriormente para outros domínios. Com isto em mente, foi proposta uma estratégia para permitir a análise de sentimentos baseada em domínio, a qual estabelece os passos para se montar rapidamente um ambiente de análise de sentimentos e conteúdo de acordo com o domínio sendo examinado. Esta estratégia contempla desde o processo de anotação do corpus, os passos necessários para a criação de anotações de acordo com o domínio, criação de léxicos semânticos e o desenvolvimento e validação dos classificadores. Para testar esta estratégia foi desenvolvido o sistema JULGAR, cujo núcleo está baseado no ambiente computacional GATE utilizado para o processamento de linguagem natural.
More and more people show their opinion and feelings at several available Web services. Microblogging sites, such as the twitter, social networks or forums have become the ordinary media for these people to express themselves. In real time, they say spontaneously and at no cost what they think about different matters. These data analysis is an important resource to understand and to know in advance people's expectations and frustrations about a product, a service and even people or facts. However, each Internet site or service has its own characteristics. Sites' specific jargons, slangs or even specific characteristics of services where persons express their opinions don't have a pattern, making difficult the use of learning systems previously developed for other sites. For this purpose a strategy was proposed a strategy that allows the analysis of feelings based on site and that establishes steps to quickly create an environment for the analysis of feelings according to the site being examined.This strategy comprises making notes on the corpus, the necessary steps for creating annotations according to the site, lexical semantic creation and the development and validation of the classifiers. In order to test this strategy, it was developed the JULGAR system, whose core is based on the computational environment GATE, which is employed for the processing of natural language.
description Cada vez mais as pessoas colocam suas opiniões e sentimentos em diversos tipos de serviços disponíveis na Web. Sites de microblogging como o twitter, redes sociais ou fóruns têm se tornado o meio comum para elas se expressarem. Elas colocam de forma espontânea, gratuita e em tempo real, opiniões sobre os mais diferentes assuntos. A análise destes dados constitui uma fonte importante e rica para se entender e se antecipar às expectativas e frustrações das pessoas a respeito de um produto, um serviço ou mesmo sobre pessoas ou fatos. Entretanto, cada domínio ou serviço de Internet tem suas peculiaridades. Jargões específicos de um domínio, gírias ou mesmo características próprias dos serviços para as pessoas colocarem as suas opiniões diferem de maneira significativa, o que compromete a utilização de sistemas de aprendizado de máquina desenvolvidos anteriormente para outros domínios. Com isto em mente, foi proposta uma estratégia para permitir a análise de sentimentos baseada em domínio, a qual estabelece os passos para se montar rapidamente um ambiente de análise de sentimentos e conteúdo de acordo com o domínio sendo examinado. Esta estratégia contempla desde o processo de anotação do corpus, os passos necessários para a criação de anotações de acordo com o domínio, criação de léxicos semânticos e o desenvolvimento e validação dos classificadores. Para testar esta estratégia foi desenvolvido o sistema JULGAR, cujo núcleo está baseado no ambiente computacional GATE utilizado para o processamento de linguagem natural.
publishDate 2010
dc.date.issued.fl_str_mv 2010-12
dc.date.accessioned.fl_str_mv 2017-10-10T17:05:05Z
dc.date.available.fl_str_mv 2017-10-10T17:05:05Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
status_str publishedVersion
format doctoralThesis
dc.identifier.uri.fl_str_mv http://carpedien.ien.gov.br:8080/handle/ien/1963
url http://carpedien.ien.gov.br:8080/handle/ien/1963
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Instituto de Engenharia Nuclear
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia Civil
dc.publisher.initials.fl_str_mv IEN
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Universidade Federal do Rio de Janeiro
publisher.none.fl_str_mv Instituto de Engenharia Nuclear
dc.source.none.fl_str_mv reponame:Repositório Institucional do IEN
instname:Instituto de Engenharia Nuclear
instacron:IEN
reponame_str Repositório Institucional do IEN
collection Repositório Institucional do IEN
instname_str Instituto de Engenharia Nuclear
instacron_str IEN
institution IEN
bitstream.url.fl_str_mv http://carpedien.ien.gov.br:8080/xmlui/bitstream/ien/1963/2/license.txt
http://carpedien.ien.gov.br:8080/xmlui/bitstream/ien/1963/1/LEONARDO+FALCAO+KOBLITZ+_D.pdf
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
a51748c3ce87730fc510c7a4f4daba34
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Dspace IEN
repository.mail.fl_str_mv lsales@ien.gov.br
_version_ 1623394161142005760