Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Silva, Jorge Sassaki Resende lattes
Orientador(a): Freire, André Pimenta
Banca de defesa: Pardo, Thiago Alexandre Salgueiro, Valentim, Natasha Malveira Costa
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal de Lavras
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação
Departamento: Departamento de Ciência da Computação
País: brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufla.br/handle/1/49017
Resumo: A evolução da Internet ampliou a disponibilidade de informação e de conteúdos didáticos na Web ampliando o acesso ao conhecimento. Mesmo assim, as pessoas com deficiência enfrentam problemas de acessibilidade. Neste trabalho, focamos em pessoas com deficiência visual e seus problemas na leitura de documentos longos. Mesmo com leitores de tela, buscar informações na Web pode ser uma tarefa exaustiva. Faltam opções para leitura rápida de grandes quantidades de texto, uma vez que leitores de tela lêem o texto de forma sequencial. Os comandos disponíveis por meio de atalhos ajudam os usuários a criar estratégias na busca de informações, como aumento da velocidade de leitura e uso de marcação de página da web para navegar. Mas muitas vezes eles têm um impacto na carga cognitiva por causa da atenção necessária para entender e lembrar informações em alta velocidade. Navegar dentro de textos também é um problema, estudos mostram que um problema comum é ter que mapear mentalmente as informações do texto. Pensando nisso, realizamos um mapeamento sistemático para reunir trabalhos anteriores que visavam ajudar os usuários de leitores de tela no uso da Web, e os categorizamos com base em suas estratégias. Os métodos encontrados foram Filtragem de Conteúdo, Redução de Texto, Navegação, Fala Simultânea, Visão Geral Auditiva e Sistemas de Recomendação. Observamos uma falta de trabalhos com topicalização e seus efeitos na navegação de cegos. Assim, o objetivo deste trabalho foi propor um algoritmo para gerar cabeçalhos automaticamente para auxiliar usuários na busca de informação. O algoritmo foi dividido em duas tarefas: segmentar um documento por tópicos e rotular estes segmentos. Adaptamos o algoritmo de segmentação C99 para usar o BERT e observamos melhora nas taxas de erro para textos longos. Em seguida, foi implementado um algoritmo de rotulagem baseado em palavras-chave, os rótulos são feitos das palavras mais repetidas no documento. Para testar o algoritmo, conduzimos um estudo de usuário com 8 participants e um protótipo composto de 4 textos pré-processados de 720-1131 palavras. Os usuários tinham que responder a conjuntos de perguntas com base nas informações desses textos, para comparação em dois cenários: um com cabeçalhos gerados automaticamente e outro sem. Medimos o tempo gasto em cada texto e a carga cognitiva que os participantes sentiram ao realizar as tarefas. Uma entrevista pós-teste também foi conduzida para coletar feedback. Nossa análise não pôde confirmar nossa hipótese com alta significância devido à pequena amostra de voluntários, mas as entrevistas indicaram que os usuários se beneficiaram com a ferramenta proposta. Seja ajudando a navegar dentro do texto ou reencontrando informações, os participantes concordaram que gostariam de ter essa ferramenta em seus leitores de tela. Com este trabalho, fornecemos implicações de design e alternativas para implementar um plugin para leitor de tela.
id UFLA_2ff14438f3b89a33f08bf090efdcd906
oai_identifier_str oai:repositorio.ufla.br:1/49017
network_acronym_str UFLA
network_name_str Repositório Institucional da UFLA
repository_id_str
spelling 2022-01-25T17:46:10Z2022-01-25T17:46:10Z2022-01-252021-11-23SILVA, J. S. R. Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts. 2021. 90 p. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Lavras, Lavras, 2022.https://repositorio.ufla.br/handle/1/49017A evolução da Internet ampliou a disponibilidade de informação e de conteúdos didáticos na Web ampliando o acesso ao conhecimento. Mesmo assim, as pessoas com deficiência enfrentam problemas de acessibilidade. Neste trabalho, focamos em pessoas com deficiência visual e seus problemas na leitura de documentos longos. Mesmo com leitores de tela, buscar informações na Web pode ser uma tarefa exaustiva. Faltam opções para leitura rápida de grandes quantidades de texto, uma vez que leitores de tela lêem o texto de forma sequencial. Os comandos disponíveis por meio de atalhos ajudam os usuários a criar estratégias na busca de informações, como aumento da velocidade de leitura e uso de marcação de página da web para navegar. Mas muitas vezes eles têm um impacto na carga cognitiva por causa da atenção necessária para entender e lembrar informações em alta velocidade. Navegar dentro de textos também é um problema, estudos mostram que um problema comum é ter que mapear mentalmente as informações do texto. Pensando nisso, realizamos um mapeamento sistemático para reunir trabalhos anteriores que visavam ajudar os usuários de leitores de tela no uso da Web, e os categorizamos com base em suas estratégias. Os métodos encontrados foram Filtragem de Conteúdo, Redução de Texto, Navegação, Fala Simultânea, Visão Geral Auditiva e Sistemas de Recomendação. Observamos uma falta de trabalhos com topicalização e seus efeitos na navegação de cegos. Assim, o objetivo deste trabalho foi propor um algoritmo para gerar cabeçalhos automaticamente para auxiliar usuários na busca de informação. O algoritmo foi dividido em duas tarefas: segmentar um documento por tópicos e rotular estes segmentos. Adaptamos o algoritmo de segmentação C99 para usar o BERT e observamos melhora nas taxas de erro para textos longos. Em seguida, foi implementado um algoritmo de rotulagem baseado em palavras-chave, os rótulos são feitos das palavras mais repetidas no documento. Para testar o algoritmo, conduzimos um estudo de usuário com 8 participants e um protótipo composto de 4 textos pré-processados de 720-1131 palavras. Os usuários tinham que responder a conjuntos de perguntas com base nas informações desses textos, para comparação em dois cenários: um com cabeçalhos gerados automaticamente e outro sem. Medimos o tempo gasto em cada texto e a carga cognitiva que os participantes sentiram ao realizar as tarefas. Uma entrevista pós-teste também foi conduzida para coletar feedback. Nossa análise não pôde confirmar nossa hipótese com alta significância devido à pequena amostra de voluntários, mas as entrevistas indicaram que os usuários se beneficiaram com a ferramenta proposta. Seja ajudando a navegar dentro do texto ou reencontrando informações, os participantes concordaram que gostariam de ter essa ferramenta em seus leitores de tela. Com este trabalho, fornecemos implicações de design e alternativas para implementar um plugin para leitor de tela.The evolution in information access caused by the Internet has expanded access to information for everyone. Consequently, the availability of information sources and teaching content on the Web has broadened access to knowledge. Still, people with disabilities face accessibility barriers. In this work, we focus on people with visual impairment and their problems when reading long documents. Even with assistive technologies such as screen readers, consulting the Web when seeking information can be exhausting for this group. They lack options for speed reading or skimming large amounts of text since these tools read texts aloud in sequence. The commands available in screen readers through shortcuts helped users create strategies when searching for information, such as increased reading speed and using webpage markup to navigate (e.g. headers or paragraphs). However, they often come at the cost of the cognitive load caused by the attention needed to understand and remember the information at high speeds. Navigating inside texts also proved to be a problem. Studies have shown that a common complaint of visually impaired people is having to create a text map to re-find information mentally. To counter these problems, we have conducted a systematic mapping to gather previous work that aimed to help screen reader users when using the Web and categorize them based on their proposed approach. The methods encountered were Content Filtering, Text Reduction, Navigation, Concurrent Speech, Auditory Overview and Recommendation Systems. Based on this analysis, we observed a lack of topicalization techniques and their effects on navigation for blind people. Thus, the goal of this work was to propose an algorithm to generate headers aiming to help users in information-seeking tasks automatically. The algorithm was divided into two tasks: segmenting a document into topic segments and labelling a text segment. We adapted the C99 segmenting algorithm to use BERT and improved error rates for long texts. Then, the study followed with the implementation of a labelling algorithm based on keywords, and labels are made of words from the text segment that were ranked according to repetition. We conducted a user study with 8 participants and a prototype composed of preprocessed texts 720-1131 words long to test the algorithm. Users had to answer questions based on the information in these texts for comparison in two scenarios: one with automatically generated headers and the other without. We measured the time taken in each text and the cognitive load participants perceived while completing it. A post-test interview was also conducted to gather feedback. Our analysis could not confirm our hypothesis significantly due to a small volunteer sample, but interviews indicated users benefited from the proposed tool. Either by helping navigate inside the text, or re-finding information, participants agreed they would like to have this tool in their screen readers. With this work, we provide design implications and alternatives to implement a plugin for the screen reader.Universidade Federal de LavrasPrograma de Pós-Graduação em Ciência da ComputaçãoUFLAbrasilDepartamento de Ciência da ComputaçãoCiência da ComputaçãoAcessibilidade digitalDeficiência visualProcessamento de linguagem naturalLeitores de telaDigital accessibilityBlind peopleNatural language processingScreen readerAutomatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based textsCabeçalhos automaticamente gerados como mecanismo de leitura rápida para usuários cegos usando softwares leitores de tela em textos não-marcados na webinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisFreire, André PimentaCardoso, Paula Christina FigueiraPardo, Thiago Alexandre SalgueiroValentim, Natasha Malveira Costahttp://lattes.cnpq.br/0716009691147326Silva, Jorge Sassaki Resendeinfo:eu-repo/semantics/openAccessengreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLAORIGINALDISSERTAÇÃO_Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts.pdfDISSERTAÇÃO_Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts.pdfapplication/pdf1134863https://repositorio.ufla.br/bitstreams/239e6422-beb3-464d-abae-2b7977343b74/downloadcbda1449e76c0d4d1cb995c011e583c0MD51trueAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-8953https://repositorio.ufla.br/bitstreams/19b33670-9613-48a2-964e-bd73a43209da/download760884c1e72224de569e74f79eb87ce3MD52falseAnonymousREADTEXTDISSERTAÇÃO_Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts.pdf.txtDISSERTAÇÃO_Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts.pdf.txtExtracted texttext/plain100436https://repositorio.ufla.br/bitstreams/c96df1a0-4179-4ab0-95be-65dd7a2a9ad4/downloade1fe5be45ac8cdcf24653ecffa440400MD53falseAnonymousREADTHUMBNAILDISSERTAÇÃO_Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts.pdf.jpgDISSERTAÇÃO_Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts.pdf.jpgGenerated Thumbnailimage/jpeg3478https://repositorio.ufla.br/bitstreams/914629f3-56ee-4cdc-a0b6-4e19c26e0c87/download04a29625821c529fb40736d9c6d61e2eMD54falseAnonymousREAD1/490172025-08-11 17:31:24.562open.accessoai:repositorio.ufla.br:1/49017https://repositorio.ufla.brRepositório InstitucionalPUBhttps://repositorio.ufla.br/server/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2025-08-11T20:31:24Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)falseREVDTEFSQcOHw4NPIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCk8gcmVmZXJpZG8gYXV0b3I6CmEpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4KRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50bwpsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UKZW50aWRhZGUuCmIpIFNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCBuw6NvIGRldMOpbSBvcwpkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGF1dG9yaXphw6fDo28gZG8gZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgTGF2cmFzIG9zCmRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgY3Vqb3MKZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbwpubyB0ZXh0byBvdSBjb250ZcO6ZG8gZG8gZG9jdW1lbnRvIGVudHJlZ3VlLiBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqQpiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbyBwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUKbsOjbyBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIExhdnJhcywgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIKb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgo=
dc.title.pt_BR.fl_str_mv Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts
dc.title.alternative.pt_BR.fl_str_mv Cabeçalhos automaticamente gerados como mecanismo de leitura rápida para usuários cegos usando softwares leitores de tela em textos não-marcados na web
title Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts
spellingShingle Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts
Silva, Jorge Sassaki Resende
Ciência da Computação
Acessibilidade digital
Deficiência visual
Processamento de linguagem natural
Leitores de tela
Digital accessibility
Blind people
Natural language processing
Screen reader
title_short Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts
title_full Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts
title_fullStr Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts
title_full_unstemmed Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts
title_sort Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts
author Silva, Jorge Sassaki Resende
author_facet Silva, Jorge Sassaki Resende
author_role author
dc.contributor.advisor1.fl_str_mv Freire, André Pimenta
dc.contributor.advisor-co1.fl_str_mv Cardoso, Paula Christina Figueira
dc.contributor.referee1.fl_str_mv Pardo, Thiago Alexandre Salgueiro
dc.contributor.referee2.fl_str_mv Valentim, Natasha Malveira Costa
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/0716009691147326
dc.contributor.author.fl_str_mv Silva, Jorge Sassaki Resende
contributor_str_mv Freire, André Pimenta
Cardoso, Paula Christina Figueira
Pardo, Thiago Alexandre Salgueiro
Valentim, Natasha Malveira Costa
dc.subject.cnpq.fl_str_mv Ciência da Computação
topic Ciência da Computação
Acessibilidade digital
Deficiência visual
Processamento de linguagem natural
Leitores de tela
Digital accessibility
Blind people
Natural language processing
Screen reader
dc.subject.por.fl_str_mv Acessibilidade digital
Deficiência visual
Processamento de linguagem natural
Leitores de tela
Digital accessibility
Blind people
Natural language processing
Screen reader
description A evolução da Internet ampliou a disponibilidade de informação e de conteúdos didáticos na Web ampliando o acesso ao conhecimento. Mesmo assim, as pessoas com deficiência enfrentam problemas de acessibilidade. Neste trabalho, focamos em pessoas com deficiência visual e seus problemas na leitura de documentos longos. Mesmo com leitores de tela, buscar informações na Web pode ser uma tarefa exaustiva. Faltam opções para leitura rápida de grandes quantidades de texto, uma vez que leitores de tela lêem o texto de forma sequencial. Os comandos disponíveis por meio de atalhos ajudam os usuários a criar estratégias na busca de informações, como aumento da velocidade de leitura e uso de marcação de página da web para navegar. Mas muitas vezes eles têm um impacto na carga cognitiva por causa da atenção necessária para entender e lembrar informações em alta velocidade. Navegar dentro de textos também é um problema, estudos mostram que um problema comum é ter que mapear mentalmente as informações do texto. Pensando nisso, realizamos um mapeamento sistemático para reunir trabalhos anteriores que visavam ajudar os usuários de leitores de tela no uso da Web, e os categorizamos com base em suas estratégias. Os métodos encontrados foram Filtragem de Conteúdo, Redução de Texto, Navegação, Fala Simultânea, Visão Geral Auditiva e Sistemas de Recomendação. Observamos uma falta de trabalhos com topicalização e seus efeitos na navegação de cegos. Assim, o objetivo deste trabalho foi propor um algoritmo para gerar cabeçalhos automaticamente para auxiliar usuários na busca de informação. O algoritmo foi dividido em duas tarefas: segmentar um documento por tópicos e rotular estes segmentos. Adaptamos o algoritmo de segmentação C99 para usar o BERT e observamos melhora nas taxas de erro para textos longos. Em seguida, foi implementado um algoritmo de rotulagem baseado em palavras-chave, os rótulos são feitos das palavras mais repetidas no documento. Para testar o algoritmo, conduzimos um estudo de usuário com 8 participants e um protótipo composto de 4 textos pré-processados de 720-1131 palavras. Os usuários tinham que responder a conjuntos de perguntas com base nas informações desses textos, para comparação em dois cenários: um com cabeçalhos gerados automaticamente e outro sem. Medimos o tempo gasto em cada texto e a carga cognitiva que os participantes sentiram ao realizar as tarefas. Uma entrevista pós-teste também foi conduzida para coletar feedback. Nossa análise não pôde confirmar nossa hipótese com alta significância devido à pequena amostra de voluntários, mas as entrevistas indicaram que os usuários se beneficiaram com a ferramenta proposta. Seja ajudando a navegar dentro do texto ou reencontrando informações, os participantes concordaram que gostariam de ter essa ferramenta em seus leitores de tela. Com este trabalho, fornecemos implicações de design e alternativas para implementar um plugin para leitor de tela.
publishDate 2021
dc.date.submitted.none.fl_str_mv 2021-11-23
dc.date.accessioned.fl_str_mv 2022-01-25T17:46:10Z
dc.date.available.fl_str_mv 2022-01-25T17:46:10Z
dc.date.issued.fl_str_mv 2022-01-25
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, J. S. R. Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts. 2021. 90 p. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Lavras, Lavras, 2022.
dc.identifier.uri.fl_str_mv https://repositorio.ufla.br/handle/1/49017
identifier_str_mv SILVA, J. S. R. Automatically generated headers as text-skimming mechanisms for blind users using screen reading software in unmarked web-based texts. 2021. 90 p. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Lavras, Lavras, 2022.
url https://repositorio.ufla.br/handle/1/49017
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Lavras
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv UFLA
dc.publisher.country.fl_str_mv brasil
dc.publisher.department.fl_str_mv Departamento de Ciência da Computação
publisher.none.fl_str_mv Universidade Federal de Lavras
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFLA
instname:Universidade Federal de Lavras (UFLA)
instacron:UFLA
instname_str Universidade Federal de Lavras (UFLA)
instacron_str UFLA
institution UFLA
reponame_str Repositório Institucional da UFLA
collection Repositório Institucional da UFLA
bitstream.url.fl_str_mv https://repositorio.ufla.br/bitstreams/239e6422-beb3-464d-abae-2b7977343b74/download
https://repositorio.ufla.br/bitstreams/19b33670-9613-48a2-964e-bd73a43209da/download
https://repositorio.ufla.br/bitstreams/c96df1a0-4179-4ab0-95be-65dd7a2a9ad4/download
https://repositorio.ufla.br/bitstreams/914629f3-56ee-4cdc-a0b6-4e19c26e0c87/download
bitstream.checksum.fl_str_mv cbda1449e76c0d4d1cb995c011e583c0
760884c1e72224de569e74f79eb87ce3
e1fe5be45ac8cdcf24653ecffa440400
04a29625821c529fb40736d9c6d61e2e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)
repository.mail.fl_str_mv nivaldo@ufla.br || repositorio.biblioteca@ufla.br
_version_ 1854947800182161408