5-Ions: um método para estimar o desempenho de entidades a partir de menções a entidades relacionadas em textos na web
| Ano de defesa: | 2019 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Link de acesso: | https://repositorio.ufsc.br/handle/123456789/214719 |
Resumo: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019. |
| id |
UFSC_e637f2cfadd00c1fe5f3b71f2b2014bf |
|---|---|
| oai_identifier_str |
oai:repositorio.ufsc.br:123456789/214719 |
| network_acronym_str |
UFSC |
| network_name_str |
Repositório Institucional da UFSC |
| repository_id_str |
|
| spelling |
Universidade Federal de Santa CatarinaSampaio, Vanderson Santana de Oliveira LeiteFileto, RenatoMacedo, Douglas Dyllon Jeronimo de2020-10-21T21:09:01Z2020-10-21T21:09:01Z2019369650https://repositorio.ufsc.br/handle/123456789/214719Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.Publicações na Web (e.g. notícias) podem influenciar a opinião pública acerca de certas entidades (e.g., políticos, instituições). Vários indicadores podem ser automaticamente extraídos dos textos dessas publicações e usados para estimar o comportamento do desempenho das entidades (e.g., popularidade, intenção de votos) ao longo do tempo. Este trabalho propõe um método automático que utiliza ferramentas do estado da arte em processamento de linguagem natural para identificar menções a entidades em textos e os sentimentos a elas associados. A partir dessas informações o método proposto calcula métricas que são usadas para construir modelos de regressão e de classificação para estimar tendências de desempenho das entidades mencionadas ou de entidades semanticamente relacionadas a elas. Nosso método calcula métricas de desempenho a partir de indicadores consolidados para entidades semanticamente relacionadas, avalia as correlações dessas métricas consolidadas com o desempenho real das entidades e usa essas métricas consolidadas para estimar o comportamento do desempenho de cada entidade. Um algoritmo genético, alguns métodos de classificação e técnicas de regressão foram usados para compor tais métricas consolidadas e efetuar predições de maneiras adequadas. Resultados experimentais em estudos de caso envolvendo política e economia mostram que métricas consolidadas para várias entidades inter-relacionadas são melhor correlacionadas com medidas reais de desempenho observadas para algumas entidades-alvo e levam a melhores previsões, em comparação com métricas para apenas uma entidade.Abstract: Publications on the Web (e.g. news) may influence public opinion about certain entities (e.g., politicians, institutions). Various indicators can be automatically extracted from the texts of these publications and used to estimate entity performance (e.g., popularity, vote intention) over time. This paper proposes an automatic method that uses state-ofthe-art tools for natural language processing to identify references to entities in texts and the associated sentiment. The extracted information is used to calculate metrics that are used to build regression and classification models to estimate the performance trends of the mentioned entities or entities semantically related to them. Our method calculates performance metrics from consolidated indicators for semantically related entities, assesses the correlations of these consolidated metrics with actual entity performance, and uses the consolidated metrics to estimate the performance of each entity. A genetic algorithm, some classification methods, and regression techniques were used to compose such consolidated metrics and make predictions in appropriate ways. Experimental results in case studies involving politics and economics show that consolidated metrics for several interrelated entities are better correlated with actual performance measures observed for some target entities and lead to better prediction than metrics for just one entity.86 p.| il.porComputaçãoLinguagem de programação (Computadores)Sites da WebComputação semânticaProcessamento eletrônico de dados5-Ions: um método para estimar o desempenho de entidades a partir de menções a entidades relacionadas em textos na webinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccessORIGINALPGCC1168-D.pdfPGCC1168-D.pdfapplication/pdf6494021https://repositorio.ufsc.br/bitstream/123456789/214719/-1/PGCC1168-D.pdfe60724dec9b0f38958a8ca59a1b719dfMD5-1123456789/2147192020-10-21 18:09:01.527oai:repositorio.ufsc.br:123456789/214719Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestsandra.sobrera@ufsc.bropendoar:23732020-10-21T21:09:01Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
| dc.title.none.fl_str_mv |
5-Ions: um método para estimar o desempenho de entidades a partir de menções a entidades relacionadas em textos na web |
| title |
5-Ions: um método para estimar o desempenho de entidades a partir de menções a entidades relacionadas em textos na web |
| spellingShingle |
5-Ions: um método para estimar o desempenho de entidades a partir de menções a entidades relacionadas em textos na web Sampaio, Vanderson Santana de Oliveira Leite Computação Linguagem de programação (Computadores) Sites da Web Computação semântica Processamento eletrônico de dados |
| title_short |
5-Ions: um método para estimar o desempenho de entidades a partir de menções a entidades relacionadas em textos na web |
| title_full |
5-Ions: um método para estimar o desempenho de entidades a partir de menções a entidades relacionadas em textos na web |
| title_fullStr |
5-Ions: um método para estimar o desempenho de entidades a partir de menções a entidades relacionadas em textos na web |
| title_full_unstemmed |
5-Ions: um método para estimar o desempenho de entidades a partir de menções a entidades relacionadas em textos na web |
| title_sort |
5-Ions: um método para estimar o desempenho de entidades a partir de menções a entidades relacionadas em textos na web |
| author |
Sampaio, Vanderson Santana de Oliveira Leite |
| author_facet |
Sampaio, Vanderson Santana de Oliveira Leite |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Universidade Federal de Santa Catarina |
| dc.contributor.author.fl_str_mv |
Sampaio, Vanderson Santana de Oliveira Leite |
| dc.contributor.advisor1.fl_str_mv |
Fileto, Renato |
| dc.contributor.advisor-co1.fl_str_mv |
Macedo, Douglas Dyllon Jeronimo de |
| contributor_str_mv |
Fileto, Renato Macedo, Douglas Dyllon Jeronimo de |
| dc.subject.classification.none.fl_str_mv |
Computação Linguagem de programação (Computadores) Sites da Web Computação semântica Processamento eletrônico de dados |
| topic |
Computação Linguagem de programação (Computadores) Sites da Web Computação semântica Processamento eletrônico de dados |
| description |
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019. |
| publishDate |
2019 |
| dc.date.issued.fl_str_mv |
2019 |
| dc.date.accessioned.fl_str_mv |
2020-10-21T21:09:01Z |
| dc.date.available.fl_str_mv |
2020-10-21T21:09:01Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufsc.br/handle/123456789/214719 |
| dc.identifier.other.none.fl_str_mv |
369650 |
| identifier_str_mv |
369650 |
| url |
https://repositorio.ufsc.br/handle/123456789/214719 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
86 p.| il. |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
| instname_str |
Universidade Federal de Santa Catarina (UFSC) |
| instacron_str |
UFSC |
| institution |
UFSC |
| reponame_str |
Repositório Institucional da UFSC |
| collection |
Repositório Institucional da UFSC |
| bitstream.url.fl_str_mv |
https://repositorio.ufsc.br/bitstream/123456789/214719/-1/PGCC1168-D.pdf |
| bitstream.checksum.fl_str_mv |
e60724dec9b0f38958a8ca59a1b719df |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
| repository.mail.fl_str_mv |
sandra.sobrera@ufsc.br |
| _version_ |
1851758986758455296 |