Unsupervised learning strategies for automatic generation of personalized summaries

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Woloszyn, Vinicius
Orientador(a): Wives, Leandro Krug
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/200036
Resumo: É relativamente difícil para leitores lidarem objetivamente com grandes documentos para absorver a ideia-chave sobre um determinado assunto. Nesse sentido, técnicas automáticas para sumarização de texto desempenham um papel importante ao digerir sistematicamente um grande número de documentos para produzir resumos detalhados. Apesar dos resumos gerados por máquina terem mais de cinquenta anos, uma das falhas é que geralmente seus métodos não consideram o interesse dos leitores durante o processo de criação, culminando em resumos de propósito geral. Em relação às técnicas, normalmente a sumarização automática de textos baseia-se em algoritmos de Aprendizado de Máquina supervisionados, como classificação e regressão. No entanto, a qualidade dos resultados depende da existência de um grande conjunto de dados de treinamento dependente de domínio. Por outro lado, as estratégias de aprendizado não supervisionadas são uma alternativa atraente para evitar a tarefa intensa de trabalho e propensa a erros de anotação manual de conjuntos de dados de treinamento. Este trabalho realiza uma análise abrangente de algoritmos de Aprendizado de Máquina não supervisionados para gerar, automaticamente, um Resumo Personalizado.
id URGS_be0ab69084e7ea99419bde8e938fe48b
oai_identifier_str oai:www.lume.ufrgs.br:10183/200036
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Woloszyn, ViniciusWives, Leandro Krug2019-10-03T03:46:05Z2019http://hdl.handle.net/10183/200036001102767É relativamente difícil para leitores lidarem objetivamente com grandes documentos para absorver a ideia-chave sobre um determinado assunto. Nesse sentido, técnicas automáticas para sumarização de texto desempenham um papel importante ao digerir sistematicamente um grande número de documentos para produzir resumos detalhados. Apesar dos resumos gerados por máquina terem mais de cinquenta anos, uma das falhas é que geralmente seus métodos não consideram o interesse dos leitores durante o processo de criação, culminando em resumos de propósito geral. Em relação às técnicas, normalmente a sumarização automática de textos baseia-se em algoritmos de Aprendizado de Máquina supervisionados, como classificação e regressão. No entanto, a qualidade dos resultados depende da existência de um grande conjunto de dados de treinamento dependente de domínio. Por outro lado, as estratégias de aprendizado não supervisionadas são uma alternativa atraente para evitar a tarefa intensa de trabalho e propensa a erros de anotação manual de conjuntos de dados de treinamento. Este trabalho realiza uma análise abrangente de algoritmos de Aprendizado de Máquina não supervisionados para gerar, automaticamente, um Resumo Personalizado.It is relatively hard for readers to deal objectively with large documents in order to absorb the key idea about a particular subject. In this sense, automatic text summarization plays an important role by systematically digest a large number of documents to produce indepth abstracts. Despite fifty years of studies in automatic summarization of texts, one of the still persistent shortcomings is that the individual interests of the readers are still not considered. Regarding the automatic techniques for generation of summaries, it mostly relies on supervised Machine Learning algorithms such as classification and regression, however, the quality of results is dependent on the existence of a large, domain-dependent training data set. On the other hand, unsupervised learning strategies are an attractive alternative to avoid the labor-intense and error-prone task of manual annotation of training data sets. To accomplish such objective, this work puts forward a novel unsupervised and semi-supervised algorithms to automatically generate tailored summaries. Our experiments showed that we can effectively identify a significant number of interesting passages for the readers with less data for the training step.application/pdfengBanco de dadosAprendizadoUnsupervised learningText SummarizationPersonalizationBiasUnsupervised learning strategies for automatic generation of personalized summariesMétodos não-supervisionados para a geração automática de sumários personalizados info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2019doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001102767.pdf.txt001102767.pdf.txtExtracted Texttext/plain148005http://www.lume.ufrgs.br/bitstream/10183/200036/2/001102767.pdf.txta2c782dd292e83788f5489c2031ab039MD52ORIGINAL001102767.pdfTexto completo (inglês)application/pdf662908http://www.lume.ufrgs.br/bitstream/10183/200036/1/001102767.pdf004215c2371747504a1763998ca79dadMD5110183/2000362021-05-26 04:47:21.121691oai:www.lume.ufrgs.br:10183/200036Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532021-05-26T07:47:21Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Unsupervised learning strategies for automatic generation of personalized summaries
dc.title.alternative.pt.fl_str_mv Métodos não-supervisionados para a geração automática de sumários personalizados
title Unsupervised learning strategies for automatic generation of personalized summaries
spellingShingle Unsupervised learning strategies for automatic generation of personalized summaries
Woloszyn, Vinicius
Banco de dados
Aprendizado
Unsupervised learning
Text Summarization
Personalization
Bias
title_short Unsupervised learning strategies for automatic generation of personalized summaries
title_full Unsupervised learning strategies for automatic generation of personalized summaries
title_fullStr Unsupervised learning strategies for automatic generation of personalized summaries
title_full_unstemmed Unsupervised learning strategies for automatic generation of personalized summaries
title_sort Unsupervised learning strategies for automatic generation of personalized summaries
author Woloszyn, Vinicius
author_facet Woloszyn, Vinicius
author_role author
dc.contributor.author.fl_str_mv Woloszyn, Vinicius
dc.contributor.advisor1.fl_str_mv Wives, Leandro Krug
contributor_str_mv Wives, Leandro Krug
dc.subject.por.fl_str_mv Banco de dados
Aprendizado
topic Banco de dados
Aprendizado
Unsupervised learning
Text Summarization
Personalization
Bias
dc.subject.eng.fl_str_mv Unsupervised learning
Text Summarization
Personalization
Bias
description É relativamente difícil para leitores lidarem objetivamente com grandes documentos para absorver a ideia-chave sobre um determinado assunto. Nesse sentido, técnicas automáticas para sumarização de texto desempenham um papel importante ao digerir sistematicamente um grande número de documentos para produzir resumos detalhados. Apesar dos resumos gerados por máquina terem mais de cinquenta anos, uma das falhas é que geralmente seus métodos não consideram o interesse dos leitores durante o processo de criação, culminando em resumos de propósito geral. Em relação às técnicas, normalmente a sumarização automática de textos baseia-se em algoritmos de Aprendizado de Máquina supervisionados, como classificação e regressão. No entanto, a qualidade dos resultados depende da existência de um grande conjunto de dados de treinamento dependente de domínio. Por outro lado, as estratégias de aprendizado não supervisionadas são uma alternativa atraente para evitar a tarefa intensa de trabalho e propensa a erros de anotação manual de conjuntos de dados de treinamento. Este trabalho realiza uma análise abrangente de algoritmos de Aprendizado de Máquina não supervisionados para gerar, automaticamente, um Resumo Personalizado.
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-10-03T03:46:05Z
dc.date.issued.fl_str_mv 2019
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/200036
dc.identifier.nrb.pt_BR.fl_str_mv 001102767
url http://hdl.handle.net/10183/200036
identifier_str_mv 001102767
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/200036/2/001102767.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/200036/1/001102767.pdf
bitstream.checksum.fl_str_mv a2c782dd292e83788f5489c2031ab039
004215c2371747504a1763998ca79dad
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1831316080024354816