Ambiente de análise de sentimentos baseado em domínio
Ano de defesa: | 2010 |
---|---|
Autor(a) principal: | |
Outros Autores: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Instituto de Engenharia Nuclear
|
Programa de Pós-Graduação: |
Programa de Pós-Graduação em Engenharia Civil
|
Departamento: |
Universidade Federal do Rio de Janeiro
|
País: |
Brasil
|
Palavras-chave em Português: | |
Link de acesso: | http://carpedien.ien.gov.br:8080/handle/ien/1963 |
Resumo: | Cada vez mais as pessoas colocam suas opiniões e sentimentos em diversos tipos de serviços disponíveis na Web. Sites de microblogging como o twitter, redes sociais ou fóruns têm se tornado o meio comum para elas se expressarem. Elas colocam de forma espontânea, gratuita e em tempo real, opiniões sobre os mais diferentes assuntos. A análise destes dados constitui uma fonte importante e rica para se entender e se antecipar às expectativas e frustrações das pessoas a respeito de um produto, um serviço ou mesmo sobre pessoas ou fatos. Entretanto, cada domínio ou serviço de Internet tem suas peculiaridades. Jargões específicos de um domínio, gírias ou mesmo características próprias dos serviços para as pessoas colocarem as suas opiniões diferem de maneira significativa, o que compromete a utilização de sistemas de aprendizado de máquina desenvolvidos anteriormente para outros domínios. Com isto em mente, foi proposta uma estratégia para permitir a análise de sentimentos baseada em domínio, a qual estabelece os passos para se montar rapidamente um ambiente de análise de sentimentos e conteúdo de acordo com o domínio sendo examinado. Esta estratégia contempla desde o processo de anotação do corpus, os passos necessários para a criação de anotações de acordo com o domínio, criação de léxicos semânticos e o desenvolvimento e validação dos classificadores. Para testar esta estratégia foi desenvolvido o sistema JULGAR, cujo núcleo está baseado no ambiente computacional GATE utilizado para o processamento de linguagem natural. |
id |
IEN_cc0099039659e837bb8d089886532844 |
---|---|
oai_identifier_str |
oai:carpedien.ien.gov.br:ien/1963 |
network_acronym_str |
IEN |
network_name_str |
Repositório Institucional do IEN |
spelling |
Koblitz, Leonardo FalcãoInstituto de Engenharia NuclearEbecken, Nelson Francisco FavillaEvsukoff, Alexandre GonçalvesGuimarães, Antônio Cesar FerreiraLima, Beatriz de Souza Leite PiesMattoso, Marta Lima de QueirósEbecken, Nelson Francisco Favilla2017-10-10T17:05:05Z2017-10-10T17:05:05Z2010-12http://carpedien.ien.gov.br:8080/handle/ien/1963Cada vez mais as pessoas colocam suas opiniões e sentimentos em diversos tipos de serviços disponíveis na Web. Sites de microblogging como o twitter, redes sociais ou fóruns têm se tornado o meio comum para elas se expressarem. Elas colocam de forma espontânea, gratuita e em tempo real, opiniões sobre os mais diferentes assuntos. A análise destes dados constitui uma fonte importante e rica para se entender e se antecipar às expectativas e frustrações das pessoas a respeito de um produto, um serviço ou mesmo sobre pessoas ou fatos. Entretanto, cada domínio ou serviço de Internet tem suas peculiaridades. Jargões específicos de um domínio, gírias ou mesmo características próprias dos serviços para as pessoas colocarem as suas opiniões diferem de maneira significativa, o que compromete a utilização de sistemas de aprendizado de máquina desenvolvidos anteriormente para outros domínios. Com isto em mente, foi proposta uma estratégia para permitir a análise de sentimentos baseada em domínio, a qual estabelece os passos para se montar rapidamente um ambiente de análise de sentimentos e conteúdo de acordo com o domínio sendo examinado. Esta estratégia contempla desde o processo de anotação do corpus, os passos necessários para a criação de anotações de acordo com o domínio, criação de léxicos semânticos e o desenvolvimento e validação dos classificadores. Para testar esta estratégia foi desenvolvido o sistema JULGAR, cujo núcleo está baseado no ambiente computacional GATE utilizado para o processamento de linguagem natural.More and more people show their opinion and feelings at several available Web services. Microblogging sites, such as the twitter, social networks or forums have become the ordinary media for these people to express themselves. In real time, they say spontaneously and at no cost what they think about different matters. These data analysis is an important resource to understand and to know in advance people's expectations and frustrations about a product, a service and even people or facts. However, each Internet site or service has its own characteristics. Sites' specific jargons, slangs or even specific characteristics of services where persons express their opinions don't have a pattern, making difficult the use of learning systems previously developed for other sites. For this purpose a strategy was proposed a strategy that allows the analysis of feelings based on site and that establishes steps to quickly create an environment for the analysis of feelings according to the site being examined.This strategy comprises making notes on the corpus, the necessary steps for creating annotations according to the site, lexical semantic creation and the development and validation of the classifiers. In order to test this strategy, it was developed the JULGAR system, whose core is based on the computational environment GATE, which is employed for the processing of natural language.Submitted by Marcele Costal de Castro (costalcastro@gmail.com) on 2017-10-10T17:05:05Z No. of bitstreams: 1 LEONARDO FALCAO KOBLITZ _D.pdf: 998698 bytes, checksum: a51748c3ce87730fc510c7a4f4daba34 (MD5)Made available in DSpace on 2017-10-10T17:05:05Z (GMT). No. of bitstreams: 1 LEONARDO FALCAO KOBLITZ _D.pdf: 998698 bytes, checksum: a51748c3ce87730fc510c7a4f4daba34 (MD5) Previous issue date: 2010-12porInstituto de Engenharia NuclearPrograma de Pós-Graduação em Engenharia CivilIENBrasilUniversidade Federal do Rio de JaneiroAnálise de sentimentosMineração de textosAdaptação de domínioAmbiente de análise de sentimentos baseado em domínioinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional do IENinstname:Instituto de Engenharia Nuclearinstacron:IENLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://carpedien.ien.gov.br:8080/xmlui/bitstream/ien/1963/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALLEONARDO FALCAO KOBLITZ _D.pdfLEONARDO FALCAO KOBLITZ _D.pdfapplication/pdf998698http://carpedien.ien.gov.br:8080/xmlui/bitstream/ien/1963/1/LEONARDO+FALCAO+KOBLITZ+_D.pdfa51748c3ce87730fc510c7a4f4daba34MD51ien/1963oai:carpedien.ien.gov.br:ien/19632017-10-10 14:05:05.706Dspace IENlsales@ien.gov.brTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
dc.title.pt_BR.fl_str_mv |
Ambiente de análise de sentimentos baseado em domínio |
title |
Ambiente de análise de sentimentos baseado em domínio |
spellingShingle |
Ambiente de análise de sentimentos baseado em domínio Koblitz, Leonardo Falcão Análise de sentimentos Mineração de textos Adaptação de domínio |
title_short |
Ambiente de análise de sentimentos baseado em domínio |
title_full |
Ambiente de análise de sentimentos baseado em domínio |
title_fullStr |
Ambiente de análise de sentimentos baseado em domínio |
title_full_unstemmed |
Ambiente de análise de sentimentos baseado em domínio |
title_sort |
Ambiente de análise de sentimentos baseado em domínio |
author |
Koblitz, Leonardo Falcão |
author_facet |
Koblitz, Leonardo Falcão Instituto de Engenharia Nuclear |
author_role |
author |
author2 |
Instituto de Engenharia Nuclear |
author2_role |
author |
dc.contributor.referees1.none.fl_str_mv |
Ebecken, Nelson Francisco Favilla |
dc.contributor.referees2.none.fl_str_mv |
Evsukoff, Alexandre Gonçalves |
dc.contributor.referees3.none.fl_str_mv |
Guimarães, Antônio Cesar Ferreira |
dc.contributor.referees4.none.fl_str_mv |
Lima, Beatriz de Souza Leite Pies |
dc.contributor.referees5.none.fl_str_mv |
Mattoso, Marta Lima de Queirós |
dc.contributor.author.fl_str_mv |
Koblitz, Leonardo Falcão Instituto de Engenharia Nuclear |
dc.contributor.advisor1.fl_str_mv |
Ebecken, Nelson Francisco Favilla |
contributor_str_mv |
Ebecken, Nelson Francisco Favilla |
dc.subject.por.fl_str_mv |
Análise de sentimentos Mineração de textos Adaptação de domínio |
topic |
Análise de sentimentos Mineração de textos Adaptação de domínio |
dc.description.abstract.por.fl_txt_mv |
Cada vez mais as pessoas colocam suas opiniões e sentimentos em diversos tipos de serviços disponíveis na Web. Sites de microblogging como o twitter, redes sociais ou fóruns têm se tornado o meio comum para elas se expressarem. Elas colocam de forma espontânea, gratuita e em tempo real, opiniões sobre os mais diferentes assuntos. A análise destes dados constitui uma fonte importante e rica para se entender e se antecipar às expectativas e frustrações das pessoas a respeito de um produto, um serviço ou mesmo sobre pessoas ou fatos. Entretanto, cada domínio ou serviço de Internet tem suas peculiaridades. Jargões específicos de um domínio, gírias ou mesmo características próprias dos serviços para as pessoas colocarem as suas opiniões diferem de maneira significativa, o que compromete a utilização de sistemas de aprendizado de máquina desenvolvidos anteriormente para outros domínios. Com isto em mente, foi proposta uma estratégia para permitir a análise de sentimentos baseada em domínio, a qual estabelece os passos para se montar rapidamente um ambiente de análise de sentimentos e conteúdo de acordo com o domínio sendo examinado. Esta estratégia contempla desde o processo de anotação do corpus, os passos necessários para a criação de anotações de acordo com o domínio, criação de léxicos semânticos e o desenvolvimento e validação dos classificadores. Para testar esta estratégia foi desenvolvido o sistema JULGAR, cujo núcleo está baseado no ambiente computacional GATE utilizado para o processamento de linguagem natural. More and more people show their opinion and feelings at several available Web services. Microblogging sites, such as the twitter, social networks or forums have become the ordinary media for these people to express themselves. In real time, they say spontaneously and at no cost what they think about different matters. These data analysis is an important resource to understand and to know in advance people's expectations and frustrations about a product, a service and even people or facts. However, each Internet site or service has its own characteristics. Sites' specific jargons, slangs or even specific characteristics of services where persons express their opinions don't have a pattern, making difficult the use of learning systems previously developed for other sites. For this purpose a strategy was proposed a strategy that allows the analysis of feelings based on site and that establishes steps to quickly create an environment for the analysis of feelings according to the site being examined.This strategy comprises making notes on the corpus, the necessary steps for creating annotations according to the site, lexical semantic creation and the development and validation of the classifiers. In order to test this strategy, it was developed the JULGAR system, whose core is based on the computational environment GATE, which is employed for the processing of natural language. |
description |
Cada vez mais as pessoas colocam suas opiniões e sentimentos em diversos tipos de serviços disponíveis na Web. Sites de microblogging como o twitter, redes sociais ou fóruns têm se tornado o meio comum para elas se expressarem. Elas colocam de forma espontânea, gratuita e em tempo real, opiniões sobre os mais diferentes assuntos. A análise destes dados constitui uma fonte importante e rica para se entender e se antecipar às expectativas e frustrações das pessoas a respeito de um produto, um serviço ou mesmo sobre pessoas ou fatos. Entretanto, cada domínio ou serviço de Internet tem suas peculiaridades. Jargões específicos de um domínio, gírias ou mesmo características próprias dos serviços para as pessoas colocarem as suas opiniões diferem de maneira significativa, o que compromete a utilização de sistemas de aprendizado de máquina desenvolvidos anteriormente para outros domínios. Com isto em mente, foi proposta uma estratégia para permitir a análise de sentimentos baseada em domínio, a qual estabelece os passos para se montar rapidamente um ambiente de análise de sentimentos e conteúdo de acordo com o domínio sendo examinado. Esta estratégia contempla desde o processo de anotação do corpus, os passos necessários para a criação de anotações de acordo com o domínio, criação de léxicos semânticos e o desenvolvimento e validação dos classificadores. Para testar esta estratégia foi desenvolvido o sistema JULGAR, cujo núcleo está baseado no ambiente computacional GATE utilizado para o processamento de linguagem natural. |
publishDate |
2010 |
dc.date.issued.fl_str_mv |
2010-12 |
dc.date.accessioned.fl_str_mv |
2017-10-10T17:05:05Z |
dc.date.available.fl_str_mv |
2017-10-10T17:05:05Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
status_str |
publishedVersion |
format |
doctoralThesis |
dc.identifier.uri.fl_str_mv |
http://carpedien.ien.gov.br:8080/handle/ien/1963 |
url |
http://carpedien.ien.gov.br:8080/handle/ien/1963 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Instituto de Engenharia Nuclear |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Engenharia Civil |
dc.publisher.initials.fl_str_mv |
IEN |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Universidade Federal do Rio de Janeiro |
publisher.none.fl_str_mv |
Instituto de Engenharia Nuclear |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional do IEN instname:Instituto de Engenharia Nuclear instacron:IEN |
reponame_str |
Repositório Institucional do IEN |
collection |
Repositório Institucional do IEN |
instname_str |
Instituto de Engenharia Nuclear |
instacron_str |
IEN |
institution |
IEN |
bitstream.url.fl_str_mv |
http://carpedien.ien.gov.br:8080/xmlui/bitstream/ien/1963/2/license.txt http://carpedien.ien.gov.br:8080/xmlui/bitstream/ien/1963/1/LEONARDO+FALCAO+KOBLITZ+_D.pdf |
bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 a51748c3ce87730fc510c7a4f4daba34 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Dspace IEN |
repository.mail.fl_str_mv |
lsales@ien.gov.br |
_version_ |
1623394161142005760 |