Combinação de modelos por método físico inspirado para a classificação científica de patentes

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Resende, Lucas Lopes
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/100/100132/tde-16012024-085102/
Resumo: Este presente trabalho propõe um modelo físico inspirado para a composição de modelos de aprendizado de máquina. O objetivo é aplicar o modelo para o estudo bibliométrico da relação entre ciência e tecnologia nos países latino-americanos por meio de citações a não patentes. Na metodologia, as citações a não patentes foram utilizadas como recurso de supervisão para os classificadores Naive Bayes, BERT e SVM OneClass. Em seguida, os classificadores são combinados por meio de comitê de superposição para a classificação científica das patentes. Foi avaliado o alinhamento com as citações a não patentes, a distorção da representatividade e a significância estatística dos resultados produzidos. Verificou-se que o modelo de superposição é 5,18% mais alinhado com as citações a não patentes e distorce 18,96% menos a proporção esperada das classes que o método de base Naive Bayes. Respectivamente, os resultados são significativos para o teste-z e para teste qui-quadrado de aderência com significância para &alpha; < 0,05. Durante a aplicação do classificador de comitê, foi criada uma interpretação inspirada pelas leis da termodinâmica para explicar a superioridade dos métodos de comitê sobre os preditores fracos. É apontado que a entropia é conceito essencial para explicar a melhoria da acurácia nos métodos de comitê. Por fim, as predições do classificador de comitê são utilizadas para criação de rede que representa a intensidade da interação entre as áreas científicas e as áreas tecnológicas, como também para regressão que compara o peso da produção científica de um país com relação à proporção esperada da produção de patentes. Concluímos que o classificador de superposição é capaz de fornecer um resultado mais verossímil para o problema da classificação científica de patentes.
id USP_fda3d8a1794a49ea7b2b423d8061e067
oai_identifier_str oai:teses.usp.br:tde-16012024-085102
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Combinação de modelos por método físico inspirado para a classificação científica de patentesCombination of models by inspired physical method for the scientific classification of patentsBERTBERTCitações a não PatentesComitê de ClassificadoresEnsemble LearningNon-Patent ReferencesPatentesPatentsEste presente trabalho propõe um modelo físico inspirado para a composição de modelos de aprendizado de máquina. O objetivo é aplicar o modelo para o estudo bibliométrico da relação entre ciência e tecnologia nos países latino-americanos por meio de citações a não patentes. Na metodologia, as citações a não patentes foram utilizadas como recurso de supervisão para os classificadores Naive Bayes, BERT e SVM OneClass. Em seguida, os classificadores são combinados por meio de comitê de superposição para a classificação científica das patentes. Foi avaliado o alinhamento com as citações a não patentes, a distorção da representatividade e a significância estatística dos resultados produzidos. Verificou-se que o modelo de superposição é 5,18% mais alinhado com as citações a não patentes e distorce 18,96% menos a proporção esperada das classes que o método de base Naive Bayes. Respectivamente, os resultados são significativos para o teste-z e para teste qui-quadrado de aderência com significância para &alpha; < 0,05. Durante a aplicação do classificador de comitê, foi criada uma interpretação inspirada pelas leis da termodinâmica para explicar a superioridade dos métodos de comitê sobre os preditores fracos. É apontado que a entropia é conceito essencial para explicar a melhoria da acurácia nos métodos de comitê. Por fim, as predições do classificador de comitê são utilizadas para criação de rede que representa a intensidade da interação entre as áreas científicas e as áreas tecnológicas, como também para regressão que compara o peso da produção científica de um país com relação à proporção esperada da produção de patentes. Concluímos que o classificador de superposição é capaz de fornecer um resultado mais verossímil para o problema da classificação científica de patentes.This present work proposes an inspired physical model for the composition of machine learning models. The objective is to apply the model for the bibliometric study of the relationship between science and technology in Latin American countries through non-patent references. In the methodology, non-patent references were used as a supervisory resource for the Naive Bayes, BERT and OneClass SVM classifiers. Then, the classifiers are combined by means of a superposition ensemble for the scientific classification of the patents. Alignment with non-patent references, representativeness distortion and statistical significance of the results produced were evaluated. It was found that the superposition model is 5.18% more aligned with non-patent references and distorts 18.96% less the expected proportion of classes. Respectively, the results are significant for the z-test and for the chi-square test of adherence with significance for &alpha; < 0.05. During the application of the ensemble classifier, an interpretation inspired by the laws of thermodynamics was created to explain the superiority of ensemble methods over simplified predictors. It is pointed out that entropy is an essential concept to explain the improvement of accuracy in competition methods. Finally, the predictions of the eating classifier are used to create a network that represents the intensity of interaction between scientific and technological areas, as well as for regression that compares the weight of a country\'s scientific production in relation to the expected production. of patents. We conclude that the superposition classifier is able to provide a more plausible result for the problem of scientific classification of patents.Biblioteca Digitais de Teses e Dissertações da USPFernandez Tuesta, Esteban Resende, Lucas Lopes2023-08-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/100/100132/tde-16012024-085102/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-08-25T13:53:02Zoai:teses.usp.br:tde-16012024-085102Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-08-25T13:53:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Combinação de modelos por método físico inspirado para a classificação científica de patentes
Combination of models by inspired physical method for the scientific classification of patents
title Combinação de modelos por método físico inspirado para a classificação científica de patentes
spellingShingle Combinação de modelos por método físico inspirado para a classificação científica de patentes
Resende, Lucas Lopes
BERT
BERT
Citações a não Patentes
Comitê de Classificadores
Ensemble Learning
Non-Patent References
Patentes
Patents
title_short Combinação de modelos por método físico inspirado para a classificação científica de patentes
title_full Combinação de modelos por método físico inspirado para a classificação científica de patentes
title_fullStr Combinação de modelos por método físico inspirado para a classificação científica de patentes
title_full_unstemmed Combinação de modelos por método físico inspirado para a classificação científica de patentes
title_sort Combinação de modelos por método físico inspirado para a classificação científica de patentes
author Resende, Lucas Lopes
author_facet Resende, Lucas Lopes
author_role author
dc.contributor.none.fl_str_mv Fernandez Tuesta, Esteban
dc.contributor.author.fl_str_mv Resende, Lucas Lopes
dc.subject.por.fl_str_mv BERT
BERT
Citações a não Patentes
Comitê de Classificadores
Ensemble Learning
Non-Patent References
Patentes
Patents
topic BERT
BERT
Citações a não Patentes
Comitê de Classificadores
Ensemble Learning
Non-Patent References
Patentes
Patents
description Este presente trabalho propõe um modelo físico inspirado para a composição de modelos de aprendizado de máquina. O objetivo é aplicar o modelo para o estudo bibliométrico da relação entre ciência e tecnologia nos países latino-americanos por meio de citações a não patentes. Na metodologia, as citações a não patentes foram utilizadas como recurso de supervisão para os classificadores Naive Bayes, BERT e SVM OneClass. Em seguida, os classificadores são combinados por meio de comitê de superposição para a classificação científica das patentes. Foi avaliado o alinhamento com as citações a não patentes, a distorção da representatividade e a significância estatística dos resultados produzidos. Verificou-se que o modelo de superposição é 5,18% mais alinhado com as citações a não patentes e distorce 18,96% menos a proporção esperada das classes que o método de base Naive Bayes. Respectivamente, os resultados são significativos para o teste-z e para teste qui-quadrado de aderência com significância para &alpha; < 0,05. Durante a aplicação do classificador de comitê, foi criada uma interpretação inspirada pelas leis da termodinâmica para explicar a superioridade dos métodos de comitê sobre os preditores fracos. É apontado que a entropia é conceito essencial para explicar a melhoria da acurácia nos métodos de comitê. Por fim, as predições do classificador de comitê são utilizadas para criação de rede que representa a intensidade da interação entre as áreas científicas e as áreas tecnológicas, como também para regressão que compara o peso da produção científica de um país com relação à proporção esperada da produção de patentes. Concluímos que o classificador de superposição é capaz de fornecer um resultado mais verossímil para o problema da classificação científica de patentes.
publishDate 2023
dc.date.none.fl_str_mv 2023-08-14
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/100/100132/tde-16012024-085102/
url https://www.teses.usp.br/teses/disponiveis/100/100132/tde-16012024-085102/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1848370485436350464