Avaliação automática de redação em língua portuguesa empregando redes neurais profundas

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Bittencourt Júnior, José Adenaldo Santos lattes
Orientador(a): Soares, Anderson da Silva lattes
Banca de defesa: Soares, Anderson da Silva, Rosa, Thierson Couto, Nogueira, Rodrigo Frassetto
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Goiás
Programa de Pós-Graduação: Programa de Pós-graduação em Ciência da Computação (INF)
Departamento: Instituto de Informática - INF (RG)
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://repositorio.bc.ufg.br/tede/handle/tede/10411
Resumo: Writing is one of the most relevant and valued human skills. One of the most traditional way of evaluating writing is with an essay. Nowadays, the essay evaluation and student guidance are done manually, which makes the process costly and time consuming, therefore it is not very scalable. Automatic Essay Scoring (AES) is the main alternative to the conventional manual method. Its main characteristic is that the essay scoring is done without human interference. AES systems are widely used in english exams, however, they are seldom used in portuguese exams. With the recent advances in deep learning and the skills of such systems to surpass other models that represent the state of the art in similar areas, this work proposes the development of deep neural networks for Automatic Essay Scoring (AES) in portuguese. The first contribution of this work was the investigation and parameterization of architectures for portuguese texts. The second contribution was the proposition of a new multi prompt architecture, based on the hypothesis that the features learned by a neural network to evaluate essays of a given prompt could help to improve performance to evaluate essays of other prompts. The proposed architecture surpassed two models considered state of the art for AES in english when applied to portuguese by a margin greater than 15 \% according to the QWK metric, obtaining a QWK close to 0.5 when evaluated for essays of 18 different prompts, which shows that the predicted grades have a reasonable correlation with the grades given by human evaluators.
id UFG-2_b6b74582a55ffb38aa88a4302ea7e853
oai_identifier_str oai:repositorio.bc.ufg.br:tede/10411
network_acronym_str UFG-2
network_name_str Repositório Institucional da UFG
repository_id_str
spelling Soares, Anderson da Silvahttp://lattes.cnpq.br/1096941114079527Soares, Anderson da SilvaRosa, Thierson CoutoNogueira, Rodrigo Frassettohttp://lattes.cnpq.br/6472068612037512Bittencourt Júnior, José Adenaldo Santos2020-03-16T12:15:52Z2020-02-28BITTENCOURT JÚNIOR, José Adenaldo Santos. Avaliação automática de redação em língua portuguesa empregando redes neurais profundas. 2020. 100 f. Dissertação ( Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2020.http://repositorio.bc.ufg.br/tede/handle/tede/10411Writing is one of the most relevant and valued human skills. One of the most traditional way of evaluating writing is with an essay. Nowadays, the essay evaluation and student guidance are done manually, which makes the process costly and time consuming, therefore it is not very scalable. Automatic Essay Scoring (AES) is the main alternative to the conventional manual method. Its main characteristic is that the essay scoring is done without human interference. AES systems are widely used in english exams, however, they are seldom used in portuguese exams. With the recent advances in deep learning and the skills of such systems to surpass other models that represent the state of the art in similar areas, this work proposes the development of deep neural networks for Automatic Essay Scoring (AES) in portuguese. The first contribution of this work was the investigation and parameterization of architectures for portuguese texts. The second contribution was the proposition of a new multi prompt architecture, based on the hypothesis that the features learned by a neural network to evaluate essays of a given prompt could help to improve performance to evaluate essays of other prompts. The proposed architecture surpassed two models considered state of the art for AES in english when applied to portuguese by a margin greater than 15 \% according to the QWK metric, obtaining a QWK close to 0.5 when evaluated for essays of 18 different prompts, which shows that the predicted grades have a reasonable correlation with the grades given by human evaluators.A capacidade de escrita é uma das habilidades humanas de maior relevância e valorização. Uma das formas mais tradicionais de se avaliar a capacidade de escrita é por meio do teste de redação. Atualmente, o processo de correção de redação e orientação dos alunos é feito de forma manual, o que torna o processo oneroso e demorado, que por consequência é pouco escalável. A Avaliação Automática de Redações (AAR) é a principal alternativa ao método manual convencional. Sua característica é a correção de redações sem interferência humana. Os sistemas de AAR são amplamente utilizados em exames de Língua Inglesa, porém, pouco utilizados na Língua Portuguesa. Com os recentes avanços em aprendizagem profunda e as habilidades de tais sistemas de superar outros modelos que representam o estado da arte em áreas similares, este trabalho propõe o desenvolvimento de redes neurais profundas para avaliação automática de redações (AAR) em Língua Portuguesa. A primeira contribuição foi a investigação e parametrização de arquiteturas para o contexto da Língua Portuguesa. A segunda contribuição foi a proposição de uma nova arquitetura Multi-tema, com base na hipótese de que as características aprendidas pela rede para a correção de determinado tema poderiam ajudar a aprimorar o desempenho de outros temas. A arquitetura proposta superou dois modelos considerados estado da arte para AAR em Língua Inglesa quando aplicados para a Língua Portuguesa por uma margem superior a 15\% na métrica QWK, obtendo um QWK próximo a 0,5 quando avaliada para redações de 18 temas diferentes, o que mostra que as notas previstas possuem uma correlação competitiva com as notas dadas por corretores humanos.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESapplication/pdfporUniversidade Federal de GoiásPrograma de Pós-graduação em Ciência da Computação (INF)UFGBrasilInstituto de Informática - INF (RG)http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessAprendizagem profundaRedes neurais profundasProcessamento de linguagem naturalEducaçãoAvaliação automática de redaçõesPortuguêsPortugueseDeep learningDeep neural networksNatural language processingEducationAutomatic essay scoringCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAvaliação automática de redação em língua portuguesa empregando redes neurais profundasAutomatic essay scoring of portuguese texts with deep learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-3303550325223384799600600600600-771226673463364476836717112058112045092075167498588264571reponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGLICENSElicense.txtlicense.txttext/plain; charset=utf-82165http://repositorio.bc.ufg.br/tede/bitstreams/7aa8e34d-d1cd-48d4-bd1d-44eadadf02c9/downloadbd3efa91386c1718a7f26a329fdcb468MD51CC-LICENSElicense_urllicense_urltext/plain; charset=utf-849http://repositorio.bc.ufg.br/tede/bitstreams/ba829e3b-babd-4ffb-8432-12876e91f79b/download4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_texttext/html; charset=utf-80http://repositorio.bc.ufg.br/tede/bitstreams/2bc31187-f3aa-4405-9fc6-cdfc0ad0142e/downloadd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-80http://repositorio.bc.ufg.br/tede/bitstreams/fa317503-c005-4144-bc0e-8c56cafa90e8/downloadd41d8cd98f00b204e9800998ecf8427eMD54ORIGINALDissertação - José Adenaldo Santos Bittencourt Júnior - 2020.pdfDissertação - José Adenaldo Santos Bittencourt Júnior - 2020.pdfapplication/pdf8334450http://repositorio.bc.ufg.br/tede/bitstreams/65f13d39-0612-4909-b2ae-22081cd8bc5c/downloadb27c0c4e954c4197b92da0b0c184ceafMD55tede/104112020-03-16 09:15:52.999http://creativecommons.org/licenses/by-nc-nd/4.0/Acesso Abertoopen.accessoai:repositorio.bc.ufg.br:tede/10411http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttps://repositorio.bc.ufg.br/tedeserver/oai/requestgrt.bc@ufg.bropendoar:oai:repositorio.bc.ufg.br:tede/12342020-03-16T12:15:52Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSw5NQUklBIExJQ0VOw4dBCkVzdGEgbGljZW7Dp2EgZGUgZXhlbXBsbyDDqSBmb3JuZWNpZGEgYXBlbmFzIHBhcmEgZmlucyBpbmZvcm1hdGl2b3MuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgClhYWCAoU2lnbGEgZGEgVW5pdmVyc2lkYWRlKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyAKVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=
dc.title.eng.fl_str_mv Avaliação automática de redação em língua portuguesa empregando redes neurais profundas
dc.title.alternative.eng.fl_str_mv Automatic essay scoring of portuguese texts with deep learning
title Avaliação automática de redação em língua portuguesa empregando redes neurais profundas
spellingShingle Avaliação automática de redação em língua portuguesa empregando redes neurais profundas
Bittencourt Júnior, José Adenaldo Santos
Aprendizagem profunda
Redes neurais profundas
Processamento de linguagem natural
Educação
Avaliação automática de redações
Português
Portuguese
Deep learning
Deep neural networks
Natural language processing
Education
Automatic essay scoring
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Avaliação automática de redação em língua portuguesa empregando redes neurais profundas
title_full Avaliação automática de redação em língua portuguesa empregando redes neurais profundas
title_fullStr Avaliação automática de redação em língua portuguesa empregando redes neurais profundas
title_full_unstemmed Avaliação automática de redação em língua portuguesa empregando redes neurais profundas
title_sort Avaliação automática de redação em língua portuguesa empregando redes neurais profundas
author Bittencourt Júnior, José Adenaldo Santos
author_facet Bittencourt Júnior, José Adenaldo Santos
author_role author
dc.contributor.advisor1.fl_str_mv Soares, Anderson da Silva
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/1096941114079527
dc.contributor.referee1.fl_str_mv Soares, Anderson da Silva
dc.contributor.referee2.fl_str_mv Rosa, Thierson Couto
dc.contributor.referee3.fl_str_mv Nogueira, Rodrigo Frassetto
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/6472068612037512
dc.contributor.author.fl_str_mv Bittencourt Júnior, José Adenaldo Santos
contributor_str_mv Soares, Anderson da Silva
Soares, Anderson da Silva
Rosa, Thierson Couto
Nogueira, Rodrigo Frassetto
dc.subject.por.fl_str_mv Aprendizagem profunda
Redes neurais profundas
Processamento de linguagem natural
Educação
Avaliação automática de redações
Português
Portuguese
topic Aprendizagem profunda
Redes neurais profundas
Processamento de linguagem natural
Educação
Avaliação automática de redações
Português
Portuguese
Deep learning
Deep neural networks
Natural language processing
Education
Automatic essay scoring
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Deep learning
Deep neural networks
Natural language processing
Education
Automatic essay scoring
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Writing is one of the most relevant and valued human skills. One of the most traditional way of evaluating writing is with an essay. Nowadays, the essay evaluation and student guidance are done manually, which makes the process costly and time consuming, therefore it is not very scalable. Automatic Essay Scoring (AES) is the main alternative to the conventional manual method. Its main characteristic is that the essay scoring is done without human interference. AES systems are widely used in english exams, however, they are seldom used in portuguese exams. With the recent advances in deep learning and the skills of such systems to surpass other models that represent the state of the art in similar areas, this work proposes the development of deep neural networks for Automatic Essay Scoring (AES) in portuguese. The first contribution of this work was the investigation and parameterization of architectures for portuguese texts. The second contribution was the proposition of a new multi prompt architecture, based on the hypothesis that the features learned by a neural network to evaluate essays of a given prompt could help to improve performance to evaluate essays of other prompts. The proposed architecture surpassed two models considered state of the art for AES in english when applied to portuguese by a margin greater than 15 \% according to the QWK metric, obtaining a QWK close to 0.5 when evaluated for essays of 18 different prompts, which shows that the predicted grades have a reasonable correlation with the grades given by human evaluators.
publishDate 2020
dc.date.accessioned.fl_str_mv 2020-03-16T12:15:52Z
dc.date.issued.fl_str_mv 2020-02-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv BITTENCOURT JÚNIOR, José Adenaldo Santos. Avaliação automática de redação em língua portuguesa empregando redes neurais profundas. 2020. 100 f. Dissertação ( Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2020.
dc.identifier.uri.fl_str_mv http://repositorio.bc.ufg.br/tede/handle/tede/10411
identifier_str_mv BITTENCOURT JÚNIOR, José Adenaldo Santos. Avaliação automática de redação em língua portuguesa empregando redes neurais profundas. 2020. 100 f. Dissertação ( Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2020.
url http://repositorio.bc.ufg.br/tede/handle/tede/10411
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv -3303550325223384799
dc.relation.confidence.fl_str_mv 600
600
600
600
dc.relation.department.fl_str_mv -7712266734633644768
dc.relation.cnpq.fl_str_mv 3671711205811204509
dc.relation.sponsorship.fl_str_mv 2075167498588264571
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Goiás
dc.publisher.program.fl_str_mv Programa de Pós-graduação em Ciência da Computação (INF)
dc.publisher.initials.fl_str_mv UFG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Informática - INF (RG)
publisher.none.fl_str_mv Universidade Federal de Goiás
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFG
instname:Universidade Federal de Goiás (UFG)
instacron:UFG
instname_str Universidade Federal de Goiás (UFG)
instacron_str UFG
institution UFG
reponame_str Repositório Institucional da UFG
collection Repositório Institucional da UFG
bitstream.url.fl_str_mv http://repositorio.bc.ufg.br/tede/bitstreams/7aa8e34d-d1cd-48d4-bd1d-44eadadf02c9/download
http://repositorio.bc.ufg.br/tede/bitstreams/ba829e3b-babd-4ffb-8432-12876e91f79b/download
http://repositorio.bc.ufg.br/tede/bitstreams/2bc31187-f3aa-4405-9fc6-cdfc0ad0142e/download
http://repositorio.bc.ufg.br/tede/bitstreams/fa317503-c005-4144-bc0e-8c56cafa90e8/download
http://repositorio.bc.ufg.br/tede/bitstreams/65f13d39-0612-4909-b2ae-22081cd8bc5c/download
bitstream.checksum.fl_str_mv bd3efa91386c1718a7f26a329fdcb468
4afdbb8c545fd630ea7db775da747b2f
d41d8cd98f00b204e9800998ecf8427e
d41d8cd98f00b204e9800998ecf8427e
b27c0c4e954c4197b92da0b0c184ceaf
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)
repository.mail.fl_str_mv grt.bc@ufg.br
_version_ 1861293889289191424