Leitura, tradução e medidas de complexidade textual em contos da literatura para leitores com letramento básico

Pasqualini, Bianca Franco

Leitura, tradução e medidas de complexidade textual em contos da literatura para leitores com letramento básico

Detalhes bibliográficos
Ano de defesa:	2012
Autor(a) principal:	Pasqualini, Bianca Franco
Orientador(a):	Finatto, Maria José Bocorny
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Não Informado pela instituição
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Leitura Aquisição da linguagem Tradutologia Lingüística de corpus Língua inglesa Linguística computacional Estudos da linguagem
Palavras-chave em Inglês:	Text readability Reading Natural language processing
Link de acesso:	http://hdl.handle.net/10183/61188
Resumo:	Este trabalho trata dos temas da complexidade textual e de padrões de legibilidade a partir de um enfoque computacional, situando o tema em meio à descrição de textos originais e traduzidos, aproveitando postulados teóricos da Tradutologia, da Linguística de Corpus e do Processamento de Línguas Naturais. Investigou-se a suposição de que há traduções de literatura em língua inglesa produzidas no Brasil que tendem a gerar textos mais complexos do que seus originais, tendo como parâmetro o leitor brasileiro médio, cuja proficiência de leitura situa-se em nível básico. Para testar essa hipótese, processamos, usando as ferramentas Coh-Metrix e Coh-Metrix-Port, um conjunto de contos literários de vários autores em língua inglesa e suas traduções para o português brasileiro, e, como contraste, um conjunto de contos de autores brasileiros publicados na mesma época e suas traduções para o inglês. As ferramentas Coh-Metrix e Coh-Metrix-Port calculam parâmetros de coesão, coerência e inteligibilidade textual em diferentes níveis linguísticos, e as métricas estudadas foram as linguística e gramaticalmente equivalentes entre as duas línguas. Foi realizado também um teste estatístico (t-Student), para cada métrica e entre as traduções, para avaliar a diferença entre as médias significativas dentre resultados obtidos. Por fim, são introduzidas tecnologias tipicamente usadas em Linguística Computacional, como a Aprendizagem de Máquina (AM), para o aprofundamento da análise. Os resultados indicam que as traduções para o português produziram textos mais complexos do que seus textos-fonte em algumas das medidas analisadas, e que tais traduções não são adequadas para leitores com nível de letramento básico. Além disso, o índice Flesch de legibilidade mostrou-se como a medida mais discriminante entre textos traduzidos do inglês para o português brasileiro e textos escritos originalmente em português. Conclui-se que é importante: a) revisar equivalências de medidas de complexidade entre o sistema Coh-Metrix para o inglês e para o português; b) propor medidas específicas das línguas estudadas; e c) ampliar os critérios de adequação para além do nível lexical.

Metadados do item

id	UFRGS-2_e13237d5b7acc370bcb199334aec3cb5
oai_identifier_str	oai:www.lume.ufrgs.br:10183/61188
network_acronym_str	UFRGS-2
network_name_str	Repositório Institucional da UFRGS
repository_id_str
spelling	Pasqualini, Bianca FrancoFinatto, Maria José Bocorny2012-11-21T01:50:53Z2012http://hdl.handle.net/10183/61188000862924Este trabalho trata dos temas da complexidade textual e de padrões de legibilidade a partir de um enfoque computacional, situando o tema em meio à descrição de textos originais e traduzidos, aproveitando postulados teóricos da Tradutologia, da Linguística de Corpus e do Processamento de Línguas Naturais. Investigou-se a suposição de que há traduções de literatura em língua inglesa produzidas no Brasil que tendem a gerar textos mais complexos do que seus originais, tendo como parâmetro o leitor brasileiro médio, cuja proficiência de leitura situa-se em nível básico. Para testar essa hipótese, processamos, usando as ferramentas Coh-Metrix e Coh-Metrix-Port, um conjunto de contos literários de vários autores em língua inglesa e suas traduções para o português brasileiro, e, como contraste, um conjunto de contos de autores brasileiros publicados na mesma época e suas traduções para o inglês. As ferramentas Coh-Metrix e Coh-Metrix-Port calculam parâmetros de coesão, coerência e inteligibilidade textual em diferentes níveis linguísticos, e as métricas estudadas foram as linguística e gramaticalmente equivalentes entre as duas línguas. Foi realizado também um teste estatístico (t-Student), para cada métrica e entre as traduções, para avaliar a diferença entre as médias significativas dentre resultados obtidos. Por fim, são introduzidas tecnologias tipicamente usadas em Linguística Computacional, como a Aprendizagem de Máquina (AM), para o aprofundamento da análise. Os resultados indicam que as traduções para o português produziram textos mais complexos do que seus textos-fonte em algumas das medidas analisadas, e que tais traduções não são adequadas para leitores com nível de letramento básico. Além disso, o índice Flesch de legibilidade mostrou-se como a medida mais discriminante entre textos traduzidos do inglês para o português brasileiro e textos escritos originalmente em português. Conclui-se que é importante: a) revisar equivalências de medidas de complexidade entre o sistema Coh-Metrix para o inglês e para o português; b) propor medidas específicas das línguas estudadas; e c) ampliar os critérios de adequação para além do nível lexical.This work analyzes textual complexity and readability patterns from a computational perspective, situating the problem through the description of original and translated texts, based on Translation Studies, Corpus Linguistics and Natural Language Processing theoretical postulates. We investigated the hypothesis that there are English literature translations made in Brazil that tend to generate more complex texts than their originals, considering – as parameter – the typical Brazilian reader, whose reading skills are at a basic level according to official data. To test this hypothesis, we processed –using the Coh-Metrix and Coh-Metrix-Port tools – a set of literary short stories by various authors in English and their translations into Brazilian Portuguese, and – as contrast – a set of short stories by Brazilian literature authors from the same period and their translations into English. The Coh-Metrix and Coh-Metrix-Port tools calculate cohesion, coherence and textual intelligibility parameters at different linguistic levels, and the metrics studied were the linguistic and grammatical equivalents between the two languages. We also carried out a statistical test (t-test) for each metric, and between translations, to assess whether the difference between the mean results are significant. Finally, we introduced Computational Linguistics methods such as Machine Learning, to improve the results obtained with the mentioned tools. The results indicate that translations into Portuguese are more complex than their source texts in some of the measures analyzed and they are not suitable for readers with basic reading skills. We conclude that it is important to: a) review complexity metrics of equivalence between Coh-Metrix system for English and Portuguese; b) propose specific metrics for the languages studied, and c) expand the criteria of adaptation beyond the lexical level.application/pdfporLeituraAquisição da linguagemTradutologiaLingüística de corpusLíngua inglesaLinguística computacionalEstudos da linguagemText readabilityReadingNatural language processingLeitura, tradução e medidas de complexidade textual em contos da literatura para leitores com letramento básicoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de LetrasPrograma de Pós-Graduação em LetrasPorto Alegre, BR-RS2012mestradoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000862924.pdf000862924.pdfTexto completoapplication/pdf2743401http://www.lume.ufrgs.br/bitstream/10183/61188/1/000862924.pdf879a4de154b1355a4ee4fbf4d5515dbfMD51TEXT000862924.pdf.txt000862924.pdf.txtExtracted Texttext/plain357615http://www.lume.ufrgs.br/bitstream/10183/61188/2/000862924.pdf.txt879fd2732ee04f3b48d9c73902935a5aMD52THUMBNAIL000862924.pdf.jpg000862924.pdf.jpgGenerated Thumbnailimage/jpeg976http://www.lume.ufrgs.br/bitstream/10183/61188/3/000862924.pdf.jpg81a183229d9cab848065f494250ad4bfMD5310183/611882018-10-15 09:35:59.055oai:www.lume.ufrgs.br:10183/61188Repositório InstitucionalPUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.bropendoar:2018-10-15T12:35:59Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv	Leitura, tradução e medidas de complexidade textual em contos da literatura para leitores com letramento básico
title	Leitura, tradução e medidas de complexidade textual em contos da literatura para leitores com letramento básico
spellingShingle	Leitura, tradução e medidas de complexidade textual em contos da literatura para leitores com letramento básico Pasqualini, Bianca Franco Leitura Aquisição da linguagem Tradutologia Lingüística de corpus Língua inglesa Linguística computacional Estudos da linguagem Text readability Reading Natural language processing
title_short	Leitura, tradução e medidas de complexidade textual em contos da literatura para leitores com letramento básico
title_full	Leitura, tradução e medidas de complexidade textual em contos da literatura para leitores com letramento básico
title_fullStr	Leitura, tradução e medidas de complexidade textual em contos da literatura para leitores com letramento básico
title_full_unstemmed	Leitura, tradução e medidas de complexidade textual em contos da literatura para leitores com letramento básico
title_sort	Leitura, tradução e medidas de complexidade textual em contos da literatura para leitores com letramento básico
author	Pasqualini, Bianca Franco
author_facet	Pasqualini, Bianca Franco
author_role	author
dc.contributor.author.fl_str_mv	Pasqualini, Bianca Franco
dc.contributor.advisor1.fl_str_mv	Finatto, Maria José Bocorny
contributor_str_mv	Finatto, Maria José Bocorny
dc.subject.por.fl_str_mv	Leitura Aquisição da linguagem Tradutologia Lingüística de corpus Língua inglesa Linguística computacional Estudos da linguagem
topic	Leitura Aquisição da linguagem Tradutologia Lingüística de corpus Língua inglesa Linguística computacional Estudos da linguagem Text readability Reading Natural language processing
dc.subject.eng.fl_str_mv	Text readability Reading Natural language processing
description	Este trabalho trata dos temas da complexidade textual e de padrões de legibilidade a partir de um enfoque computacional, situando o tema em meio à descrição de textos originais e traduzidos, aproveitando postulados teóricos da Tradutologia, da Linguística de Corpus e do Processamento de Línguas Naturais. Investigou-se a suposição de que há traduções de literatura em língua inglesa produzidas no Brasil que tendem a gerar textos mais complexos do que seus originais, tendo como parâmetro o leitor brasileiro médio, cuja proficiência de leitura situa-se em nível básico. Para testar essa hipótese, processamos, usando as ferramentas Coh-Metrix e Coh-Metrix-Port, um conjunto de contos literários de vários autores em língua inglesa e suas traduções para o português brasileiro, e, como contraste, um conjunto de contos de autores brasileiros publicados na mesma época e suas traduções para o inglês. As ferramentas Coh-Metrix e Coh-Metrix-Port calculam parâmetros de coesão, coerência e inteligibilidade textual em diferentes níveis linguísticos, e as métricas estudadas foram as linguística e gramaticalmente equivalentes entre as duas línguas. Foi realizado também um teste estatístico (t-Student), para cada métrica e entre as traduções, para avaliar a diferença entre as médias significativas dentre resultados obtidos. Por fim, são introduzidas tecnologias tipicamente usadas em Linguística Computacional, como a Aprendizagem de Máquina (AM), para o aprofundamento da análise. Os resultados indicam que as traduções para o português produziram textos mais complexos do que seus textos-fonte em algumas das medidas analisadas, e que tais traduções não são adequadas para leitores com nível de letramento básico. Além disso, o índice Flesch de legibilidade mostrou-se como a medida mais discriminante entre textos traduzidos do inglês para o português brasileiro e textos escritos originalmente em português. Conclui-se que é importante: a) revisar equivalências de medidas de complexidade entre o sistema Coh-Metrix para o inglês e para o português; b) propor medidas específicas das línguas estudadas; e c) ampliar os critérios de adequação para além do nível lexical.
publishDate	2012
dc.date.accessioned.fl_str_mv	2012-11-21T01:50:53Z
dc.date.issued.fl_str_mv	2012
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10183/61188
dc.identifier.nrb.pt_BR.fl_str_mv	000862924
url	http://hdl.handle.net/10183/61188
identifier_str_mv	000862924
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS
instname_str	Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str	UFRGS
institution	UFRGS
reponame_str	Repositório Institucional da UFRGS
collection	Repositório Institucional da UFRGS
bitstream.url.fl_str_mv	http://www.lume.ufrgs.br/bitstream/10183/61188/1/000862924.pdf http://www.lume.ufrgs.br/bitstream/10183/61188/2/000862924.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/61188/3/000862924.pdf.jpg
bitstream.checksum.fl_str_mv	879a4de154b1355a4ee4fbf4d5515dbf 879fd2732ee04f3b48d9c73902935a5a 81a183229d9cab848065f494250ad4bf
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv	lume@ufrgs.br
_version_	1864542167221927936

Leitura, tradução e medidas de complexidade textual em contos da literatura para leitores com letramento básico

Registros relacionados