Avaliação automática de redação em língua portuguesa empregando redes neurais profundas
| Ano de defesa: | 2020 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | , , |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Goiás
|
| Programa de Pós-Graduação: |
Programa de Pós-graduação em Ciência da Computação (INF)
|
| Departamento: |
Instituto de Informática - INF (RG)
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | http://repositorio.bc.ufg.br/tede/handle/tede/10411 |
Resumo: | Writing is one of the most relevant and valued human skills. One of the most traditional way of evaluating writing is with an essay. Nowadays, the essay evaluation and student guidance are done manually, which makes the process costly and time consuming, therefore it is not very scalable. Automatic Essay Scoring (AES) is the main alternative to the conventional manual method. Its main characteristic is that the essay scoring is done without human interference. AES systems are widely used in english exams, however, they are seldom used in portuguese exams. With the recent advances in deep learning and the skills of such systems to surpass other models that represent the state of the art in similar areas, this work proposes the development of deep neural networks for Automatic Essay Scoring (AES) in portuguese. The first contribution of this work was the investigation and parameterization of architectures for portuguese texts. The second contribution was the proposition of a new multi prompt architecture, based on the hypothesis that the features learned by a neural network to evaluate essays of a given prompt could help to improve performance to evaluate essays of other prompts. The proposed architecture surpassed two models considered state of the art for AES in english when applied to portuguese by a margin greater than 15 \% according to the QWK metric, obtaining a QWK close to 0.5 when evaluated for essays of 18 different prompts, which shows that the predicted grades have a reasonable correlation with the grades given by human evaluators. |
| id |
UFG-2_b6b74582a55ffb38aa88a4302ea7e853 |
|---|---|
| oai_identifier_str |
oai:repositorio.bc.ufg.br:tede/10411 |
| network_acronym_str |
UFG-2 |
| network_name_str |
Repositório Institucional da UFG |
| repository_id_str |
|
| spelling |
Soares, Anderson da Silvahttp://lattes.cnpq.br/1096941114079527Soares, Anderson da SilvaRosa, Thierson CoutoNogueira, Rodrigo Frassettohttp://lattes.cnpq.br/6472068612037512Bittencourt Júnior, José Adenaldo Santos2020-03-16T12:15:52Z2020-02-28BITTENCOURT JÚNIOR, José Adenaldo Santos. Avaliação automática de redação em língua portuguesa empregando redes neurais profundas. 2020. 100 f. Dissertação ( Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2020.http://repositorio.bc.ufg.br/tede/handle/tede/10411Writing is one of the most relevant and valued human skills. One of the most traditional way of evaluating writing is with an essay. Nowadays, the essay evaluation and student guidance are done manually, which makes the process costly and time consuming, therefore it is not very scalable. Automatic Essay Scoring (AES) is the main alternative to the conventional manual method. Its main characteristic is that the essay scoring is done without human interference. AES systems are widely used in english exams, however, they are seldom used in portuguese exams. With the recent advances in deep learning and the skills of such systems to surpass other models that represent the state of the art in similar areas, this work proposes the development of deep neural networks for Automatic Essay Scoring (AES) in portuguese. The first contribution of this work was the investigation and parameterization of architectures for portuguese texts. The second contribution was the proposition of a new multi prompt architecture, based on the hypothesis that the features learned by a neural network to evaluate essays of a given prompt could help to improve performance to evaluate essays of other prompts. The proposed architecture surpassed two models considered state of the art for AES in english when applied to portuguese by a margin greater than 15 \% according to the QWK metric, obtaining a QWK close to 0.5 when evaluated for essays of 18 different prompts, which shows that the predicted grades have a reasonable correlation with the grades given by human evaluators.A capacidade de escrita é uma das habilidades humanas de maior relevância e valorização. Uma das formas mais tradicionais de se avaliar a capacidade de escrita é por meio do teste de redação. Atualmente, o processo de correção de redação e orientação dos alunos é feito de forma manual, o que torna o processo oneroso e demorado, que por consequência é pouco escalável. A Avaliação Automática de Redações (AAR) é a principal alternativa ao método manual convencional. Sua característica é a correção de redações sem interferência humana. Os sistemas de AAR são amplamente utilizados em exames de Língua Inglesa, porém, pouco utilizados na Língua Portuguesa. Com os recentes avanços em aprendizagem profunda e as habilidades de tais sistemas de superar outros modelos que representam o estado da arte em áreas similares, este trabalho propõe o desenvolvimento de redes neurais profundas para avaliação automática de redações (AAR) em Língua Portuguesa. A primeira contribuição foi a investigação e parametrização de arquiteturas para o contexto da Língua Portuguesa. A segunda contribuição foi a proposição de uma nova arquitetura Multi-tema, com base na hipótese de que as características aprendidas pela rede para a correção de determinado tema poderiam ajudar a aprimorar o desempenho de outros temas. A arquitetura proposta superou dois modelos considerados estado da arte para AAR em Língua Inglesa quando aplicados para a Língua Portuguesa por uma margem superior a 15\% na métrica QWK, obtendo um QWK próximo a 0,5 quando avaliada para redações de 18 temas diferentes, o que mostra que as notas previstas possuem uma correlação competitiva com as notas dadas por corretores humanos.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESapplication/pdfporUniversidade Federal de GoiásPrograma de Pós-graduação em Ciência da Computação (INF)UFGBrasilInstituto de Informática - INF (RG)http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessAprendizagem profundaRedes neurais profundasProcessamento de linguagem naturalEducaçãoAvaliação automática de redaçõesPortuguêsPortugueseDeep learningDeep neural networksNatural language processingEducationAutomatic essay scoringCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAvaliação automática de redação em língua portuguesa empregando redes neurais profundasAutomatic essay scoring of portuguese texts with deep learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-3303550325223384799600600600600-771226673463364476836717112058112045092075167498588264571reponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGLICENSElicense.txtlicense.txttext/plain; charset=utf-82165http://repositorio.bc.ufg.br/tede/bitstreams/7aa8e34d-d1cd-48d4-bd1d-44eadadf02c9/downloadbd3efa91386c1718a7f26a329fdcb468MD51CC-LICENSElicense_urllicense_urltext/plain; charset=utf-849http://repositorio.bc.ufg.br/tede/bitstreams/ba829e3b-babd-4ffb-8432-12876e91f79b/download4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_texttext/html; charset=utf-80http://repositorio.bc.ufg.br/tede/bitstreams/2bc31187-f3aa-4405-9fc6-cdfc0ad0142e/downloadd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-80http://repositorio.bc.ufg.br/tede/bitstreams/fa317503-c005-4144-bc0e-8c56cafa90e8/downloadd41d8cd98f00b204e9800998ecf8427eMD54ORIGINALDissertação - José Adenaldo Santos Bittencourt Júnior - 2020.pdfDissertação - José Adenaldo Santos Bittencourt Júnior - 2020.pdfapplication/pdf8334450http://repositorio.bc.ufg.br/tede/bitstreams/65f13d39-0612-4909-b2ae-22081cd8bc5c/downloadb27c0c4e954c4197b92da0b0c184ceafMD55tede/104112020-03-16 09:15:52.999http://creativecommons.org/licenses/by-nc-nd/4.0/Acesso Abertoopen.accessoai:repositorio.bc.ufg.br:tede/10411http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttps://repositorio.bc.ufg.br/tedeserver/oai/requestgrt.bc@ufg.bropendoar:oai:repositorio.bc.ufg.br:tede/12342020-03-16T12:15:52Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSw5NQUklBIExJQ0VOw4dBCkVzdGEgbGljZW7Dp2EgZGUgZXhlbXBsbyDDqSBmb3JuZWNpZGEgYXBlbmFzIHBhcmEgZmlucyBpbmZvcm1hdGl2b3MuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgClhYWCAoU2lnbGEgZGEgVW5pdmVyc2lkYWRlKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyAKVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo= |
| dc.title.eng.fl_str_mv |
Avaliação automática de redação em língua portuguesa empregando redes neurais profundas |
| dc.title.alternative.eng.fl_str_mv |
Automatic essay scoring of portuguese texts with deep learning |
| title |
Avaliação automática de redação em língua portuguesa empregando redes neurais profundas |
| spellingShingle |
Avaliação automática de redação em língua portuguesa empregando redes neurais profundas Bittencourt Júnior, José Adenaldo Santos Aprendizagem profunda Redes neurais profundas Processamento de linguagem natural Educação Avaliação automática de redações Português Portuguese Deep learning Deep neural networks Natural language processing Education Automatic essay scoring CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| title_short |
Avaliação automática de redação em língua portuguesa empregando redes neurais profundas |
| title_full |
Avaliação automática de redação em língua portuguesa empregando redes neurais profundas |
| title_fullStr |
Avaliação automática de redação em língua portuguesa empregando redes neurais profundas |
| title_full_unstemmed |
Avaliação automática de redação em língua portuguesa empregando redes neurais profundas |
| title_sort |
Avaliação automática de redação em língua portuguesa empregando redes neurais profundas |
| author |
Bittencourt Júnior, José Adenaldo Santos |
| author_facet |
Bittencourt Júnior, José Adenaldo Santos |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
Soares, Anderson da Silva |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/1096941114079527 |
| dc.contributor.referee1.fl_str_mv |
Soares, Anderson da Silva |
| dc.contributor.referee2.fl_str_mv |
Rosa, Thierson Couto |
| dc.contributor.referee3.fl_str_mv |
Nogueira, Rodrigo Frassetto |
| dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/6472068612037512 |
| dc.contributor.author.fl_str_mv |
Bittencourt Júnior, José Adenaldo Santos |
| contributor_str_mv |
Soares, Anderson da Silva Soares, Anderson da Silva Rosa, Thierson Couto Nogueira, Rodrigo Frassetto |
| dc.subject.por.fl_str_mv |
Aprendizagem profunda Redes neurais profundas Processamento de linguagem natural Educação Avaliação automática de redações Português Portuguese |
| topic |
Aprendizagem profunda Redes neurais profundas Processamento de linguagem natural Educação Avaliação automática de redações Português Portuguese Deep learning Deep neural networks Natural language processing Education Automatic essay scoring CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| dc.subject.eng.fl_str_mv |
Deep learning Deep neural networks Natural language processing Education Automatic essay scoring |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| description |
Writing is one of the most relevant and valued human skills. One of the most traditional way of evaluating writing is with an essay. Nowadays, the essay evaluation and student guidance are done manually, which makes the process costly and time consuming, therefore it is not very scalable. Automatic Essay Scoring (AES) is the main alternative to the conventional manual method. Its main characteristic is that the essay scoring is done without human interference. AES systems are widely used in english exams, however, they are seldom used in portuguese exams. With the recent advances in deep learning and the skills of such systems to surpass other models that represent the state of the art in similar areas, this work proposes the development of deep neural networks for Automatic Essay Scoring (AES) in portuguese. The first contribution of this work was the investigation and parameterization of architectures for portuguese texts. The second contribution was the proposition of a new multi prompt architecture, based on the hypothesis that the features learned by a neural network to evaluate essays of a given prompt could help to improve performance to evaluate essays of other prompts. The proposed architecture surpassed two models considered state of the art for AES in english when applied to portuguese by a margin greater than 15 \% according to the QWK metric, obtaining a QWK close to 0.5 when evaluated for essays of 18 different prompts, which shows that the predicted grades have a reasonable correlation with the grades given by human evaluators. |
| publishDate |
2020 |
| dc.date.accessioned.fl_str_mv |
2020-03-16T12:15:52Z |
| dc.date.issued.fl_str_mv |
2020-02-28 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
BITTENCOURT JÚNIOR, José Adenaldo Santos. Avaliação automática de redação em língua portuguesa empregando redes neurais profundas. 2020. 100 f. Dissertação ( Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2020. |
| dc.identifier.uri.fl_str_mv |
http://repositorio.bc.ufg.br/tede/handle/tede/10411 |
| identifier_str_mv |
BITTENCOURT JÚNIOR, José Adenaldo Santos. Avaliação automática de redação em língua portuguesa empregando redes neurais profundas. 2020. 100 f. Dissertação ( Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2020. |
| url |
http://repositorio.bc.ufg.br/tede/handle/tede/10411 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.program.fl_str_mv |
-3303550325223384799 |
| dc.relation.confidence.fl_str_mv |
600 600 600 600 |
| dc.relation.department.fl_str_mv |
-7712266734633644768 |
| dc.relation.cnpq.fl_str_mv |
3671711205811204509 |
| dc.relation.sponsorship.fl_str_mv |
2075167498588264571 |
| dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Goiás |
| dc.publisher.program.fl_str_mv |
Programa de Pós-graduação em Ciência da Computação (INF) |
| dc.publisher.initials.fl_str_mv |
UFG |
| dc.publisher.country.fl_str_mv |
Brasil |
| dc.publisher.department.fl_str_mv |
Instituto de Informática - INF (RG) |
| publisher.none.fl_str_mv |
Universidade Federal de Goiás |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFG instname:Universidade Federal de Goiás (UFG) instacron:UFG |
| instname_str |
Universidade Federal de Goiás (UFG) |
| instacron_str |
UFG |
| institution |
UFG |
| reponame_str |
Repositório Institucional da UFG |
| collection |
Repositório Institucional da UFG |
| bitstream.url.fl_str_mv |
http://repositorio.bc.ufg.br/tede/bitstreams/7aa8e34d-d1cd-48d4-bd1d-44eadadf02c9/download http://repositorio.bc.ufg.br/tede/bitstreams/ba829e3b-babd-4ffb-8432-12876e91f79b/download http://repositorio.bc.ufg.br/tede/bitstreams/2bc31187-f3aa-4405-9fc6-cdfc0ad0142e/download http://repositorio.bc.ufg.br/tede/bitstreams/fa317503-c005-4144-bc0e-8c56cafa90e8/download http://repositorio.bc.ufg.br/tede/bitstreams/65f13d39-0612-4909-b2ae-22081cd8bc5c/download |
| bitstream.checksum.fl_str_mv |
bd3efa91386c1718a7f26a329fdcb468 4afdbb8c545fd630ea7db775da747b2f d41d8cd98f00b204e9800998ecf8427e d41d8cd98f00b204e9800998ecf8427e b27c0c4e954c4197b92da0b0c184ceaf |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFG - Universidade Federal de Goiás (UFG) |
| repository.mail.fl_str_mv |
grt.bc@ufg.br |
| _version_ |
1861293889289191424 |