Mineração de Texto: a clusterização aplicada em artigos científicos de Química, por meio do modelo Cassiopeia
| Ano de defesa: | 2023 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
UFVJM
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Link de acesso: | https://acervo.ufvjm.edu.br//handle/123456789/3469 |
Resumo: | A Química é uma ciência básica da natureza. Ao se dedicar à compreensão da natureza submicroscópica da matéria e suas transformações, desenvolve uma linguagem própria e produz um conhecimento fundamental sobre a natureza. Sua natureza como conhecimento básico a levou, junto com outras ciências da natureza, a compor o conhecimento de qualquer cidadão, quer seja para ler e compreender o mundo natural ou transformado pela mão do homem, quer seja para se continuar os estudos em nível superior ou técnico em outras áreas ou profissões. No entanto, assimilar e lidar com o grande volume de informação disponível, localizando-as de forma rápida e precisa, tornou-se um grande desafio, dentro da diversa gama documental existente. Com isso, Técnicas de Mineração de Texto podem auxiliar nesse processo, por meio da extração de dados textuais. Dessa forma, o objetivo dessa pesquisa é relacionar conceitos de Química encontrando palavras similares em artigos científicos de área, que possam demonstrar uma ligação entre alguns conceitos abordados no Ensino Médio. Por meio da técnica de clusterização com a utilização do modelo Cassiopeia, em um corpus de textos acadêmicos relacionados a Química. A pesquisa foi desenvolvida segundo as seguintes ações: levantamento bibliográfico; construção do corpus; coleta do corpus; análise estatística do corpus; mineração de texto; a clusterização; e, por fim, a análise dos dados a partir dos clusters gerados. Os resultados obtidos mostraram que a clusterização, efetuada no corpus, por meio do modelo Cassiopeia proporcionou a relação entre conceitos químicos, encontrando palavras similares nos artigos científicos que compõem o corpus desenvolvido nessa pesquisa. Destaca-se como contribuição desta pesquisa a criação de um corpus relacionado ao conteúdo de Química, que pode ser utilizado por pesquisadores em trabalhos futuros. Além disso, destaca-se a relação existente entre palavras em diversos artigos do corpus, que demonstram a ligação de conteúdos de Química abordados no EM. |
| id |
UFVJM-2_1c4658bdea255bd647c11b8d52b03458 |
|---|---|
| oai_identifier_str |
oai:localhost:123456789/3469 |
| network_acronym_str |
UFVJM-2 |
| network_name_str |
Repositório Institucional da UFVJM |
| repository_id_str |
|
| spelling |
Amariz, Diego SampaioGuelpeli, Marcus Vinicius CarvalhoAssis, Weslley Luiz da SilvaMesquita, João Paulo deUniversidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)Guelpeli, Marcus Vinicius Carvalho2024-11-18T19:37:26Z20232023-12-19AMARIZ, Diego Sampaio. Mineração de Texto: a clusterização aplicada em artigos científicos de Química, por meio do modelo Cassiopeia. 2023. 75 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2023.https://acervo.ufvjm.edu.br//handle/123456789/3469A Química é uma ciência básica da natureza. Ao se dedicar à compreensão da natureza submicroscópica da matéria e suas transformações, desenvolve uma linguagem própria e produz um conhecimento fundamental sobre a natureza. Sua natureza como conhecimento básico a levou, junto com outras ciências da natureza, a compor o conhecimento de qualquer cidadão, quer seja para ler e compreender o mundo natural ou transformado pela mão do homem, quer seja para se continuar os estudos em nível superior ou técnico em outras áreas ou profissões. No entanto, assimilar e lidar com o grande volume de informação disponível, localizando-as de forma rápida e precisa, tornou-se um grande desafio, dentro da diversa gama documental existente. Com isso, Técnicas de Mineração de Texto podem auxiliar nesse processo, por meio da extração de dados textuais. Dessa forma, o objetivo dessa pesquisa é relacionar conceitos de Química encontrando palavras similares em artigos científicos de área, que possam demonstrar uma ligação entre alguns conceitos abordados no Ensino Médio. Por meio da técnica de clusterização com a utilização do modelo Cassiopeia, em um corpus de textos acadêmicos relacionados a Química. A pesquisa foi desenvolvida segundo as seguintes ações: levantamento bibliográfico; construção do corpus; coleta do corpus; análise estatística do corpus; mineração de texto; a clusterização; e, por fim, a análise dos dados a partir dos clusters gerados. Os resultados obtidos mostraram que a clusterização, efetuada no corpus, por meio do modelo Cassiopeia proporcionou a relação entre conceitos químicos, encontrando palavras similares nos artigos científicos que compõem o corpus desenvolvido nessa pesquisa. Destaca-se como contribuição desta pesquisa a criação de um corpus relacionado ao conteúdo de Química, que pode ser utilizado por pesquisadores em trabalhos futuros. Além disso, destaca-se a relação existente entre palavras em diversos artigos do corpus, que demonstram a ligação de conteúdos de Química abordados no EM. Dissertação (Mestrado Profissional) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, 2023.Chemistry is a basic natural science. By dedicating himself to understanding the submicroscopic nature of matter and its transformations, he develops his own language and produces fundamental knowledge about nature. Its nature as basic knowledge led it, together with other natural sciences, to form the basic knowledge of any citizen, whether to read and understand the natural world or transformed by human hands, or to continue studies at a higher level. or technician in other areas or professions. However, assimilating and dealing with the large volume of information available, locating it quickly and accurately, has become a major challenge, within the diverse range of existing documents. Therefore, Text Mining Techniques can assist in this process, through the extraction of textual data. Therefore, the objective of this research is to relate Chemistry concepts by finding similar words in scientific articles in the area, which can demonstrate a connection between some concepts covered in High School. Through the clustering technique using the Cassiopeia model, in a corpus of academic texts related to Chemistry. The research was developed according to the following actions: bibliographical survey; corpus construction; corpus collection; statistical analysis of the corpus; text mining; clustering; and, finally, data analysis based on the clusters generated. The results obtained showed that clustering, carried out on the corpus, using the Cassiopeia model provided the relationship between chemical concepts, finding similar words in the scientific articles that make up the corpus developed in this research. The contribution of this research stands out as the creation of a corpus related to Chemistry content, which can be used by researchers in future work. Furthermore, the relationship between words in several articles in the corpus stands out, which demonstrates the connection between Chemistry content covered in EM.porUFVJMAttribution-NonCommercial-NoDerivs 4.0 Brazilhttps://creativecommons.org/licenses/by-nc-nd/4.0/deed.ptA concessão da licença deste item refere-se ao à termo de autorização impresso assinado pelo autor, assim como na licença Creative Commons, com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade Federal dos Vales do Jequitinhonha e Mucuri e o IBICT a disponibilizar por meio de seus repositórios, sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, e preservação, a partir desta data.info:eu-repo/semantics/openAccessMineração de textoQuímicaClusterizaçãoModelo CassiopeiaCorpusText miningChemicalClusteringModel Cassiopeia.Mineração de Texto: a clusterização aplicada em artigos científicos de Química, por meio do modelo Cassiopeiainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFVJMinstname:Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)instacron:UFVJMLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://acervo.ufvjm.edu.br//bitstreams/961bb340-cb57-461e-9863-e66c94ef9072/downloadbb9bdc0b3349e4284e09149f943790b4MD51falseAnonymousREADORIGINALdiego_sampaio_amariz.pdfdiego_sampaio_amariz.pdfapplication/pdf1032234https://acervo.ufvjm.edu.br//bitstreams/04b629cd-e660-4636-a79f-2e97f6e5606a/downloadf1038705b9fdd93c787d6364917241e5MD52trueAnonymousREADTEXTdiego_sampaio_amariz.pdf.txtdiego_sampaio_amariz.pdf.txtExtracted texttext/plain92531https://acervo.ufvjm.edu.br//bitstreams/a56da9c8-9320-4db9-91e9-44edf973036e/downloadd27fe7d2d68284b8701707e37187deaaMD53falseAnonymousREADTHUMBNAILdiego_sampaio_amariz.pdf.jpgdiego_sampaio_amariz.pdf.jpgGenerated Thumbnailimage/jpeg2528https://acervo.ufvjm.edu.br//bitstreams/06a327c2-0f51-4a82-9e95-498a2db29713/downloadecc84e059408aafef74684ec7c704735MD54falseAnonymousREAD123456789/34692024-11-19 06:01:53.412https://creativecommons.org/licenses/by-nc-nd/4.0/deed.ptOpen Accessopen.accessoai:localhost:123456789/3469https://acervo.ufvjm.edu.br/Repositório InstitucionalPUBhttps://repositorio.ufvjm.edu.brrepositorio@ufvjm.edu.bropendoar:21452024-11-19T06:01:53Repositório Institucional da UFVJM - Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)falseTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| dc.title.pt_BR.fl_str_mv |
Mineração de Texto: a clusterização aplicada em artigos científicos de Química, por meio do modelo Cassiopeia |
| title |
Mineração de Texto: a clusterização aplicada em artigos científicos de Química, por meio do modelo Cassiopeia |
| spellingShingle |
Mineração de Texto: a clusterização aplicada em artigos científicos de Química, por meio do modelo Cassiopeia Amariz, Diego Sampaio Mineração de texto Química Clusterização Modelo Cassiopeia Corpus Text mining Chemical Clustering Model Cassiopeia. |
| title_short |
Mineração de Texto: a clusterização aplicada em artigos científicos de Química, por meio do modelo Cassiopeia |
| title_full |
Mineração de Texto: a clusterização aplicada em artigos científicos de Química, por meio do modelo Cassiopeia |
| title_fullStr |
Mineração de Texto: a clusterização aplicada em artigos científicos de Química, por meio do modelo Cassiopeia |
| title_full_unstemmed |
Mineração de Texto: a clusterização aplicada em artigos científicos de Química, por meio do modelo Cassiopeia |
| title_sort |
Mineração de Texto: a clusterização aplicada em artigos científicos de Química, por meio do modelo Cassiopeia |
| author |
Amariz, Diego Sampaio |
| author_facet |
Amariz, Diego Sampaio |
| author_role |
author |
| dc.contributor.referee.none.fl_str_mv |
Guelpeli, Marcus Vinicius Carvalho Assis, Weslley Luiz da Silva Mesquita, João Paulo de |
| dc.contributor.institution.pt_BR.fl_str_mv |
Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM) |
| dc.contributor.author.fl_str_mv |
Amariz, Diego Sampaio |
| dc.contributor.advisor1.fl_str_mv |
Guelpeli, Marcus Vinicius Carvalho |
| contributor_str_mv |
Guelpeli, Marcus Vinicius Carvalho |
| dc.subject.por.fl_str_mv |
Mineração de texto Química Clusterização Modelo Cassiopeia |
| topic |
Mineração de texto Química Clusterização Modelo Cassiopeia Corpus Text mining Chemical Clustering Model Cassiopeia. |
| dc.subject.eng.fl_str_mv |
Corpus Text mining Chemical Clustering Model Cassiopeia. |
| description |
A Química é uma ciência básica da natureza. Ao se dedicar à compreensão da natureza submicroscópica da matéria e suas transformações, desenvolve uma linguagem própria e produz um conhecimento fundamental sobre a natureza. Sua natureza como conhecimento básico a levou, junto com outras ciências da natureza, a compor o conhecimento de qualquer cidadão, quer seja para ler e compreender o mundo natural ou transformado pela mão do homem, quer seja para se continuar os estudos em nível superior ou técnico em outras áreas ou profissões. No entanto, assimilar e lidar com o grande volume de informação disponível, localizando-as de forma rápida e precisa, tornou-se um grande desafio, dentro da diversa gama documental existente. Com isso, Técnicas de Mineração de Texto podem auxiliar nesse processo, por meio da extração de dados textuais. Dessa forma, o objetivo dessa pesquisa é relacionar conceitos de Química encontrando palavras similares em artigos científicos de área, que possam demonstrar uma ligação entre alguns conceitos abordados no Ensino Médio. Por meio da técnica de clusterização com a utilização do modelo Cassiopeia, em um corpus de textos acadêmicos relacionados a Química. A pesquisa foi desenvolvida segundo as seguintes ações: levantamento bibliográfico; construção do corpus; coleta do corpus; análise estatística do corpus; mineração de texto; a clusterização; e, por fim, a análise dos dados a partir dos clusters gerados. Os resultados obtidos mostraram que a clusterização, efetuada no corpus, por meio do modelo Cassiopeia proporcionou a relação entre conceitos químicos, encontrando palavras similares nos artigos científicos que compõem o corpus desenvolvido nessa pesquisa. Destaca-se como contribuição desta pesquisa a criação de um corpus relacionado ao conteúdo de Química, que pode ser utilizado por pesquisadores em trabalhos futuros. Além disso, destaca-se a relação existente entre palavras em diversos artigos do corpus, que demonstram a ligação de conteúdos de Química abordados no EM. |
| publishDate |
2023 |
| dc.date.submitted.none.fl_str_mv |
2023-12-19 |
| dc.date.issued.fl_str_mv |
2023 |
| dc.date.accessioned.fl_str_mv |
2024-11-18T19:37:26Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
AMARIZ, Diego Sampaio. Mineração de Texto: a clusterização aplicada em artigos científicos de Química, por meio do modelo Cassiopeia. 2023. 75 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2023. |
| dc.identifier.uri.fl_str_mv |
https://acervo.ufvjm.edu.br//handle/123456789/3469 |
| identifier_str_mv |
AMARIZ, Diego Sampaio. Mineração de Texto: a clusterização aplicada em artigos científicos de Química, por meio do modelo Cassiopeia. 2023. 75 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2023. |
| url |
https://acervo.ufvjm.edu.br//handle/123456789/3469 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 4.0 Brazil https://creativecommons.org/licenses/by-nc-nd/4.0/deed.pt info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 4.0 Brazil https://creativecommons.org/licenses/by-nc-nd/4.0/deed.pt |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
UFVJM |
| publisher.none.fl_str_mv |
UFVJM |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFVJM instname:Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM) instacron:UFVJM |
| instname_str |
Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM) |
| instacron_str |
UFVJM |
| institution |
UFVJM |
| reponame_str |
Repositório Institucional da UFVJM |
| collection |
Repositório Institucional da UFVJM |
| bitstream.url.fl_str_mv |
https://acervo.ufvjm.edu.br//bitstreams/961bb340-cb57-461e-9863-e66c94ef9072/download https://acervo.ufvjm.edu.br//bitstreams/04b629cd-e660-4636-a79f-2e97f6e5606a/download https://acervo.ufvjm.edu.br//bitstreams/a56da9c8-9320-4db9-91e9-44edf973036e/download https://acervo.ufvjm.edu.br//bitstreams/06a327c2-0f51-4a82-9e95-498a2db29713/download |
| bitstream.checksum.fl_str_mv |
bb9bdc0b3349e4284e09149f943790b4 f1038705b9fdd93c787d6364917241e5 d27fe7d2d68284b8701707e37187deaa ecc84e059408aafef74684ec7c704735 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFVJM - Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM) |
| repository.mail.fl_str_mv |
repositorio@ufvjm.edu.br |
| _version_ |
1833927347605078016 |