Unsupervised learning strategies for automatic generation of personalized summaries
| Ano de defesa: | 2019 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Link de acesso: | http://hdl.handle.net/10183/200036 |
Resumo: | É relativamente difícil para leitores lidarem objetivamente com grandes documentos para absorver a ideia-chave sobre um determinado assunto. Nesse sentido, técnicas automáticas para sumarização de texto desempenham um papel importante ao digerir sistematicamente um grande número de documentos para produzir resumos detalhados. Apesar dos resumos gerados por máquina terem mais de cinquenta anos, uma das falhas é que geralmente seus métodos não consideram o interesse dos leitores durante o processo de criação, culminando em resumos de propósito geral. Em relação às técnicas, normalmente a sumarização automática de textos baseia-se em algoritmos de Aprendizado de Máquina supervisionados, como classificação e regressão. No entanto, a qualidade dos resultados depende da existência de um grande conjunto de dados de treinamento dependente de domínio. Por outro lado, as estratégias de aprendizado não supervisionadas são uma alternativa atraente para evitar a tarefa intensa de trabalho e propensa a erros de anotação manual de conjuntos de dados de treinamento. Este trabalho realiza uma análise abrangente de algoritmos de Aprendizado de Máquina não supervisionados para gerar, automaticamente, um Resumo Personalizado. |
| id |
URGS_be0ab69084e7ea99419bde8e938fe48b |
|---|---|
| oai_identifier_str |
oai:www.lume.ufrgs.br:10183/200036 |
| network_acronym_str |
URGS |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| repository_id_str |
|
| spelling |
Woloszyn, ViniciusWives, Leandro Krug2019-10-03T03:46:05Z2019http://hdl.handle.net/10183/200036001102767É relativamente difícil para leitores lidarem objetivamente com grandes documentos para absorver a ideia-chave sobre um determinado assunto. Nesse sentido, técnicas automáticas para sumarização de texto desempenham um papel importante ao digerir sistematicamente um grande número de documentos para produzir resumos detalhados. Apesar dos resumos gerados por máquina terem mais de cinquenta anos, uma das falhas é que geralmente seus métodos não consideram o interesse dos leitores durante o processo de criação, culminando em resumos de propósito geral. Em relação às técnicas, normalmente a sumarização automática de textos baseia-se em algoritmos de Aprendizado de Máquina supervisionados, como classificação e regressão. No entanto, a qualidade dos resultados depende da existência de um grande conjunto de dados de treinamento dependente de domínio. Por outro lado, as estratégias de aprendizado não supervisionadas são uma alternativa atraente para evitar a tarefa intensa de trabalho e propensa a erros de anotação manual de conjuntos de dados de treinamento. Este trabalho realiza uma análise abrangente de algoritmos de Aprendizado de Máquina não supervisionados para gerar, automaticamente, um Resumo Personalizado.It is relatively hard for readers to deal objectively with large documents in order to absorb the key idea about a particular subject. In this sense, automatic text summarization plays an important role by systematically digest a large number of documents to produce indepth abstracts. Despite fifty years of studies in automatic summarization of texts, one of the still persistent shortcomings is that the individual interests of the readers are still not considered. Regarding the automatic techniques for generation of summaries, it mostly relies on supervised Machine Learning algorithms such as classification and regression, however, the quality of results is dependent on the existence of a large, domain-dependent training data set. On the other hand, unsupervised learning strategies are an attractive alternative to avoid the labor-intense and error-prone task of manual annotation of training data sets. To accomplish such objective, this work puts forward a novel unsupervised and semi-supervised algorithms to automatically generate tailored summaries. Our experiments showed that we can effectively identify a significant number of interesting passages for the readers with less data for the training step.application/pdfengBanco de dadosAprendizadoUnsupervised learningText SummarizationPersonalizationBiasUnsupervised learning strategies for automatic generation of personalized summariesMétodos não-supervisionados para a geração automática de sumários personalizados info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2019doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001102767.pdf.txt001102767.pdf.txtExtracted Texttext/plain148005http://www.lume.ufrgs.br/bitstream/10183/200036/2/001102767.pdf.txta2c782dd292e83788f5489c2031ab039MD52ORIGINAL001102767.pdfTexto completo (inglês)application/pdf662908http://www.lume.ufrgs.br/bitstream/10183/200036/1/001102767.pdf004215c2371747504a1763998ca79dadMD5110183/2000362021-05-26 04:47:21.121691oai:www.lume.ufrgs.br:10183/200036Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532021-05-26T07:47:21Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
| dc.title.pt_BR.fl_str_mv |
Unsupervised learning strategies for automatic generation of personalized summaries |
| dc.title.alternative.pt.fl_str_mv |
Métodos não-supervisionados para a geração automática de sumários personalizados |
| title |
Unsupervised learning strategies for automatic generation of personalized summaries |
| spellingShingle |
Unsupervised learning strategies for automatic generation of personalized summaries Woloszyn, Vinicius Banco de dados Aprendizado Unsupervised learning Text Summarization Personalization Bias |
| title_short |
Unsupervised learning strategies for automatic generation of personalized summaries |
| title_full |
Unsupervised learning strategies for automatic generation of personalized summaries |
| title_fullStr |
Unsupervised learning strategies for automatic generation of personalized summaries |
| title_full_unstemmed |
Unsupervised learning strategies for automatic generation of personalized summaries |
| title_sort |
Unsupervised learning strategies for automatic generation of personalized summaries |
| author |
Woloszyn, Vinicius |
| author_facet |
Woloszyn, Vinicius |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Woloszyn, Vinicius |
| dc.contributor.advisor1.fl_str_mv |
Wives, Leandro Krug |
| contributor_str_mv |
Wives, Leandro Krug |
| dc.subject.por.fl_str_mv |
Banco de dados Aprendizado |
| topic |
Banco de dados Aprendizado Unsupervised learning Text Summarization Personalization Bias |
| dc.subject.eng.fl_str_mv |
Unsupervised learning Text Summarization Personalization Bias |
| description |
É relativamente difícil para leitores lidarem objetivamente com grandes documentos para absorver a ideia-chave sobre um determinado assunto. Nesse sentido, técnicas automáticas para sumarização de texto desempenham um papel importante ao digerir sistematicamente um grande número de documentos para produzir resumos detalhados. Apesar dos resumos gerados por máquina terem mais de cinquenta anos, uma das falhas é que geralmente seus métodos não consideram o interesse dos leitores durante o processo de criação, culminando em resumos de propósito geral. Em relação às técnicas, normalmente a sumarização automática de textos baseia-se em algoritmos de Aprendizado de Máquina supervisionados, como classificação e regressão. No entanto, a qualidade dos resultados depende da existência de um grande conjunto de dados de treinamento dependente de domínio. Por outro lado, as estratégias de aprendizado não supervisionadas são uma alternativa atraente para evitar a tarefa intensa de trabalho e propensa a erros de anotação manual de conjuntos de dados de treinamento. Este trabalho realiza uma análise abrangente de algoritmos de Aprendizado de Máquina não supervisionados para gerar, automaticamente, um Resumo Personalizado. |
| publishDate |
2019 |
| dc.date.accessioned.fl_str_mv |
2019-10-03T03:46:05Z |
| dc.date.issued.fl_str_mv |
2019 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/200036 |
| dc.identifier.nrb.pt_BR.fl_str_mv |
001102767 |
| url |
http://hdl.handle.net/10183/200036 |
| identifier_str_mv |
001102767 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
| instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
| instacron_str |
UFRGS |
| institution |
UFRGS |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/200036/2/001102767.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/200036/1/001102767.pdf |
| bitstream.checksum.fl_str_mv |
a2c782dd292e83788f5489c2031ab039 004215c2371747504a1763998ca79dad |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
| repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
| _version_ |
1831316080024354816 |