Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades.

Detalhes bibliográficos
Ano de defesa: 2015
Autor(a) principal: Silva, Josiane Rodrigues da
Outros Autores: http://lattes.cnpq.br/1788997377079235
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://tede.ufam.edu.br/handle/tede/4071
Resumo: Análise de polaridade consiste em classificar a opinião do autor em positiva, negativa e neutra. No entanto, dado o grande volume de informações disponíveis na Web, esta análise manual torna-se inviável. Em particular, no domínio financeiro este tipo de análise é útil para empresas na tomada de decisões relacionadas ao mercado financeiro que parece ser particularmente propenso a mudanças de acordo com opiniões. Os trabalhos disponíveis na literatura propõem abordagens globais para esta tarefa, ou seja, consideram que o texto tem apenas uma polaridade. No entanto, verifica-se que os documentos, em sua grande maioria, citam várias entidades e as polaridades para estas entidades, em geral, são diferentes. Isto sugere que a classificação de polaridade deve ser feita em nível de entidade. Contudo, a maioria das abordagens tradicionais não concentram-se na tarefa de classificar polaridade por entidade. Além disso, observamos que muitos dos documentos no domínio financeiro nem sempre emitem opinião. Assim, uma primeira tarefa de interesse nesse domínio é identificar os documentos em que opiniões são expressas, isto é, documentos subjetivos. Portanto, neste trabalho propomos um método supervisionado para classificação de polaridade baseado em múltiplos modelos com o intuito de classificar documentos financeiros com múltiplas entidades. Em particular, estudamos estratégias de segmentação em texto que usam heurísticas de casamento de string e resolução de anáfora e propomos um método de classificação hierárquica baseada em detecção de subjetividade. Nossos resultados mostraram que uma abordagem baseada em múltiplos modelos é capaz de obter ganhos significativos sobre uma abordagem baseada em modelo global na tarefa de classificação de polaridade com múltiplas entidades. A segmentação do documento em sentenças que mencionam as entidades e a adoção de uma estratégia hierárquica também obtiveram ganhos, embora modestos.
id UFAM_0577cbfb544556b4028ba1a7c763cdce
oai_identifier_str oai:https://tede.ufam.edu.br/handle/:tede/4071
network_acronym_str UFAM
network_name_str Biblioteca Digital de Teses e Dissertações da UFAM
repository_id_str
spelling Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades.Análise de PolaridadeDetecção de SubjetividadeAprendizagem de MáquinaResolução de Anáfora.Polarity AnalysisDetection of SubjectivityMachine LearningAnaphora ResolutionCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃOAnálise de polaridade consiste em classificar a opinião do autor em positiva, negativa e neutra. No entanto, dado o grande volume de informações disponíveis na Web, esta análise manual torna-se inviável. Em particular, no domínio financeiro este tipo de análise é útil para empresas na tomada de decisões relacionadas ao mercado financeiro que parece ser particularmente propenso a mudanças de acordo com opiniões. Os trabalhos disponíveis na literatura propõem abordagens globais para esta tarefa, ou seja, consideram que o texto tem apenas uma polaridade. No entanto, verifica-se que os documentos, em sua grande maioria, citam várias entidades e as polaridades para estas entidades, em geral, são diferentes. Isto sugere que a classificação de polaridade deve ser feita em nível de entidade. Contudo, a maioria das abordagens tradicionais não concentram-se na tarefa de classificar polaridade por entidade. Além disso, observamos que muitos dos documentos no domínio financeiro nem sempre emitem opinião. Assim, uma primeira tarefa de interesse nesse domínio é identificar os documentos em que opiniões são expressas, isto é, documentos subjetivos. Portanto, neste trabalho propomos um método supervisionado para classificação de polaridade baseado em múltiplos modelos com o intuito de classificar documentos financeiros com múltiplas entidades. Em particular, estudamos estratégias de segmentação em texto que usam heurísticas de casamento de string e resolução de anáfora e propomos um método de classificação hierárquica baseada em detecção de subjetividade. Nossos resultados mostraram que uma abordagem baseada em múltiplos modelos é capaz de obter ganhos significativos sobre uma abordagem baseada em modelo global na tarefa de classificação de polaridade com múltiplas entidades. A segmentação do documento em sentenças que mencionam as entidades e a adoção de uma estratégia hierárquica também obtiveram ganhos, embora modestos.Polarity analysis aims at classifying the author’s opinion into positive, negative, or neutral. However, given the sheer volume of information available on the web, manually carrying out such task is unfeasible. In particular, in the financial domain this type of analysis is useful for companies in making decisions related to the financial market which is particularly prone to changes according to shifting of opinions. Most studies in literature deal with this problem by considering that documents have a global polarity. However, in general, documents cite several entities with possibly different polarities. This suggests that the classification should be performed in an entity level. Besides this problem, we also noted that many financial documents do not always emit opinion. Thus, a first task of interest in this research field is to identify documents on which opinions are expressed, that is, the subjective ones. Therefore, in this paper we propose a supervised polarity classification method based on multiple models to deal with financial documents with multiple entities. In particular, we study text segmentation strategies that use heuristics such as string matching and anaphora resolution and we propose a hierarchical classification method based on subjectivity detection. Our results showed that the multiple-models approach significantly outperformed the global-model baseline. The segmentation of the documents restricted to sentences that mention entities and the adoption of a hierarchical strategy also achieved gains, although modest.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorUniversidade Federal do AmazonasInstituto de ComputaçãoBrasilUFAMPrograma de Pós-graduação em InformáticaCristo, Marco Antônio Pinheiro dehttp://lattes.cnpq.br/6261175351521953Cristo, Marco Antônio Pinheiro deOliveira, David Braga Fernandes deRosa, Thierson CoutoSilva, Josiane Rodrigues dahttp://lattes.cnpq.br/17889973770792352015-06-15T18:06:18Z2015-03-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSILVA, Josiane Rodrigues. Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades. 2015. 62 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2015.http://tede.ufam.edu.br/handle/tede/4071porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2016-05-11T14:31:31Zoai:https://tede.ufam.edu.br/handle/:tede/4071Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br||ddbc@ufam.edu.bropendoar:65922016-05-11T14:31:31Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false
dc.title.none.fl_str_mv Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades.
title Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades.
spellingShingle Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades.
Silva, Josiane Rodrigues da
Análise de Polaridade
Detecção de Subjetividade
Aprendizagem de Máquina
Resolução de Anáfora.
Polarity Analysis
Detection of Subjectivity
Machine Learning
Anaphora Resolution
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
title_short Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades.
title_full Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades.
title_fullStr Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades.
title_full_unstemmed Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades.
title_sort Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades.
author Silva, Josiane Rodrigues da
author_facet Silva, Josiane Rodrigues da
http://lattes.cnpq.br/1788997377079235
author_role author
author2 http://lattes.cnpq.br/1788997377079235
author2_role author
dc.contributor.none.fl_str_mv Cristo, Marco Antônio Pinheiro de
http://lattes.cnpq.br/6261175351521953
Cristo, Marco Antônio Pinheiro de
Oliveira, David Braga Fernandes de
Rosa, Thierson Couto
dc.contributor.author.fl_str_mv Silva, Josiane Rodrigues da
http://lattes.cnpq.br/1788997377079235
dc.subject.por.fl_str_mv Análise de Polaridade
Detecção de Subjetividade
Aprendizagem de Máquina
Resolução de Anáfora.
Polarity Analysis
Detection of Subjectivity
Machine Learning
Anaphora Resolution
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
topic Análise de Polaridade
Detecção de Subjetividade
Aprendizagem de Máquina
Resolução de Anáfora.
Polarity Analysis
Detection of Subjectivity
Machine Learning
Anaphora Resolution
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
description Análise de polaridade consiste em classificar a opinião do autor em positiva, negativa e neutra. No entanto, dado o grande volume de informações disponíveis na Web, esta análise manual torna-se inviável. Em particular, no domínio financeiro este tipo de análise é útil para empresas na tomada de decisões relacionadas ao mercado financeiro que parece ser particularmente propenso a mudanças de acordo com opiniões. Os trabalhos disponíveis na literatura propõem abordagens globais para esta tarefa, ou seja, consideram que o texto tem apenas uma polaridade. No entanto, verifica-se que os documentos, em sua grande maioria, citam várias entidades e as polaridades para estas entidades, em geral, são diferentes. Isto sugere que a classificação de polaridade deve ser feita em nível de entidade. Contudo, a maioria das abordagens tradicionais não concentram-se na tarefa de classificar polaridade por entidade. Além disso, observamos que muitos dos documentos no domínio financeiro nem sempre emitem opinião. Assim, uma primeira tarefa de interesse nesse domínio é identificar os documentos em que opiniões são expressas, isto é, documentos subjetivos. Portanto, neste trabalho propomos um método supervisionado para classificação de polaridade baseado em múltiplos modelos com o intuito de classificar documentos financeiros com múltiplas entidades. Em particular, estudamos estratégias de segmentação em texto que usam heurísticas de casamento de string e resolução de anáfora e propomos um método de classificação hierárquica baseada em detecção de subjetividade. Nossos resultados mostraram que uma abordagem baseada em múltiplos modelos é capaz de obter ganhos significativos sobre uma abordagem baseada em modelo global na tarefa de classificação de polaridade com múltiplas entidades. A segmentação do documento em sentenças que mencionam as entidades e a adoção de uma estratégia hierárquica também obtiveram ganhos, embora modestos.
publishDate 2015
dc.date.none.fl_str_mv 2015-06-15T18:06:18Z
2015-03-05
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SILVA, Josiane Rodrigues. Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades. 2015. 62 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2015.
http://tede.ufam.edu.br/handle/tede/4071
identifier_str_mv SILVA, Josiane Rodrigues. Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades. 2015. 62 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2015.
url http://tede.ufam.edu.br/handle/tede/4071
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFAM
instname:Universidade Federal do Amazonas (UFAM)
instacron:UFAM
instname_str Universidade Federal do Amazonas (UFAM)
instacron_str UFAM
institution UFAM
reponame_str Biblioteca Digital de Teses e Dissertações da UFAM
collection Biblioteca Digital de Teses e Dissertações da UFAM
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)
repository.mail.fl_str_mv ddbc@ufam.edu.br||ddbc@ufam.edu.br
_version_ 1797040480405422080