Web scraping na extração e combinação sistemática de conteúdos : ferramenta auxiliar em processos de pesquisa, desenvolvimento e inovação (PD&I)

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Oliveira, Jessica Sousa
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.unb.br/handle/10482/49967
Resumo: Dissertação (mestrado) — Universidade de Brasília, Faculdade UnB Gama, Programa de Pós-Graduação em Engenharia Biomédica, 2023.
id UNB_b9005292f5c2b367e9c1415ef34a00f9
oai_identifier_str oai:repositorio.unb.br:10482/49967
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Web scraping na extração e combinação sistemática de conteúdos : ferramenta auxiliar em processos de pesquisa, desenvolvimento e inovação (PD&I)Lei de inovação tecnológicaExploração de dadosWeb scrapingPesquisa científicaDissertação (mestrado) — Universidade de Brasília, Faculdade UnB Gama, Programa de Pós-Graduação em Engenharia Biomédica, 2023.Introdução: O Marco Legal da Ciência, Tecnologia e Inovação tem como propósito a contribuição para com o desenvolvimento sustentável do Brasil, coordenando e alocando recursos com vistas a garantir produtos ou estudos científicos, tecnológicos, industriais e comerciais no país. Para que as instituições públicas de ensino superior possam usufruir dos direitos garantidos por este marco, é necessário que evidenciem e tornem públicas suas contribuições para a sociedade incluindo a translação do desenvolvimento científico para usufruto social. Nesse viés, evidencia-se a demanda por uma busca sistemática que enfatize as iniciativas científicas e tecnológicas desenvolvidas por estas instituições que, posteriormente, culminaram em produtos técnicos e tecnológicos para além daspublicações, mas principalmente patentes e/ou transferência tecnológicas. Objetivos: Surge então, como uma solução tecnológica viável, o desenvolvimento de uma aplicação que automatize esse processo. Este trabalho visa entregar uma ferramenta de mineração de dados, baseada em Web Scraping, que realize uma coleta capaz de extrair e combinar conteúdo da web de maneira sistemática e prática, buscando autores de projetos desenvolvidos na Universidade de Brasília que, posteriormente, translacionaram seus resultados para patentes e/ou transferências tecnológicas. Metodologia: Para tanto, utilizou-se uma abordagem aplicada, visando solucionar um problema específico que envolve interesses locais. Com base em revisões bibliográficas e em produtos de pesquisas semelhantes, espera-se que o scraper facilite a extração de informações acerca de projetos de pesquisa depositados em determinado repositório online e que, ao combinar os dados obtidos com os que foram minerados de uma base de patentes e/ou transferências tecnológicas, comprove o retorno de estudos, produções e pesquisas para o desenvolvimento econômico e social do país. Resultados: Como resultado da execução da ferramenta no repositório do Instituto Nacional da Propriedade Industrial, obteve-se 783 nomes de inventores de patentes; e a aplicação no repositório da Universidade de Brasília retornou 53.704 autores de projetos desenvolvidos na universidade. Após a comparação das tabelas geradas, considera-se 3.244 registros referentes aos autores que depositaram alguma patente, o que auxilia na análise das pesquisas que se tornaram inovações. Conclusão: O desfecho aponta que a ferramenta desenvolvida é funcional ao que se destina, considerando-se também que o cruzamento de informações é totalmente viável, podendo ser incorporado em análises e/ou aperfeiçoamento de processos que maximizem os indicadores de inovação gerados pelas universidades mitigando o Marco Legal da Ciência, Tecnologia e Inovação.Introduction: The Legal Framework for Science, Technology, and Innovation aims to contribute to the sustainable development of Brazil by coordinating and allocating resources to ensure scientific, technological, industrial, and commercial products or studies in the country. For public institutions of higher education to benefit from the rights guaranteed by this framework, it is necessary for them to demonstrate and make public their contributions to society, including the translation of scientific development for social benefit. In this regard, there is a demand for a systematic search that emphasizes the scientific and technological initiatives developed by these institutions, which subsequently result in technical and technological products beyond publications, but mainly patents and/or technology transfer. Objectives: Therefore, the development of an application that automates this process emerges as a viable technological solution. This work aims to deliver a data mining tool based on web scraping that performs systematic and practical data collection by extracting and combining web content, seeking authors of projects developed at the University of Brasília who have subsequently translated their results into patents and/or technology transfers. Methodology: To this end, an applied approach was used, aiming to solve a specific problem involving local interests. Based on literature reviews and similar research products, it is expected that the scraper will facilitate the extraction of information about research projects deposited in a specific online repository and, by combining the obtained data with those mined from a database of patents and/or technology transfers, demonstrate the return of studies, productions, and research to the country's economic and social development. Results: As a result of running the tool on the repository of the National Institute of Industrial Property, we obtained 783 patent inventors' names. The application on the repository of the University of Brasília returned 53,704 authors of projects developed at the university. After comparing the generated tables, we identified 3,244 records corresponding to authors who filed patents, which assists in the analysis of research that led to innovations. Conclusion: The outcome indicates that the developed tool is functional for its intended purpose, considering that the cross referencing of information is entirely feasible and can be incorporated into analyses and/or process improvements that maximize the innovation indicators generated by universities, mitigating the Legal Framework for Science, Technology, and Innovation.Faculdade de Ciências e Tecnologias em Engenharia (FCTE) – Campus UnB GamaPrograma de Pós-Graduação em Engenharia BiomédicaRosa, Mário Fabrício Fleuryeijessicasousa@gmail.comOliveira, Jessica Sousa2024-08-16T22:06:37Z2024-08-16T22:06:37Z2024-08-162023info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfOLIVEIRA, Jessica Sousa. Web scraping na extração e combinação sistemática de conteúdos: ferramenta auxiliar em processos de pesquisa, desenvolvimento e inovação (PD&I). 2023. 83 f., il. Dissertação (Mestrado em Engenharia Biomédica) — Brasília, 2023.http://repositorio.unb.br/handle/10482/49967porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2025-02-27T18:24:09Zoai:repositorio.unb.br:10482/49967Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2025-02-27T18:24:09Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Web scraping na extração e combinação sistemática de conteúdos : ferramenta auxiliar em processos de pesquisa, desenvolvimento e inovação (PD&I)
title Web scraping na extração e combinação sistemática de conteúdos : ferramenta auxiliar em processos de pesquisa, desenvolvimento e inovação (PD&I)
spellingShingle Web scraping na extração e combinação sistemática de conteúdos : ferramenta auxiliar em processos de pesquisa, desenvolvimento e inovação (PD&I)
Oliveira, Jessica Sousa
Lei de inovação tecnológica
Exploração de dados
Web scraping
Pesquisa científica
title_short Web scraping na extração e combinação sistemática de conteúdos : ferramenta auxiliar em processos de pesquisa, desenvolvimento e inovação (PD&I)
title_full Web scraping na extração e combinação sistemática de conteúdos : ferramenta auxiliar em processos de pesquisa, desenvolvimento e inovação (PD&I)
title_fullStr Web scraping na extração e combinação sistemática de conteúdos : ferramenta auxiliar em processos de pesquisa, desenvolvimento e inovação (PD&I)
title_full_unstemmed Web scraping na extração e combinação sistemática de conteúdos : ferramenta auxiliar em processos de pesquisa, desenvolvimento e inovação (PD&I)
title_sort Web scraping na extração e combinação sistemática de conteúdos : ferramenta auxiliar em processos de pesquisa, desenvolvimento e inovação (PD&I)
author Oliveira, Jessica Sousa
author_facet Oliveira, Jessica Sousa
author_role author
dc.contributor.none.fl_str_mv Rosa, Mário Fabrício Fleury
eijessicasousa@gmail.com
dc.contributor.author.fl_str_mv Oliveira, Jessica Sousa
dc.subject.por.fl_str_mv Lei de inovação tecnológica
Exploração de dados
Web scraping
Pesquisa científica
topic Lei de inovação tecnológica
Exploração de dados
Web scraping
Pesquisa científica
description Dissertação (mestrado) — Universidade de Brasília, Faculdade UnB Gama, Programa de Pós-Graduação em Engenharia Biomédica, 2023.
publishDate 2023
dc.date.none.fl_str_mv 2023
2024-08-16T22:06:37Z
2024-08-16T22:06:37Z
2024-08-16
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv OLIVEIRA, Jessica Sousa. Web scraping na extração e combinação sistemática de conteúdos: ferramenta auxiliar em processos de pesquisa, desenvolvimento e inovação (PD&I). 2023. 83 f., il. Dissertação (Mestrado em Engenharia Biomédica) — Brasília, 2023.
http://repositorio.unb.br/handle/10482/49967
identifier_str_mv OLIVEIRA, Jessica Sousa. Web scraping na extração e combinação sistemática de conteúdos: ferramenta auxiliar em processos de pesquisa, desenvolvimento e inovação (PD&I). 2023. 83 f., il. Dissertação (Mestrado em Engenharia Biomédica) — Brasília, 2023.
url http://repositorio.unb.br/handle/10482/49967
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1839083986785140736