Otimização em algoritmos de extração de bibliométricas de redes de colaboração científica

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Freitas, José Carlos de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/11449/193347
Resumo: Com o processo natural de evolução da ciência, a produção de informações nesta área passou a ganhar dimensões importantes, como é o caso quanto as produções científicas e as respectivas colaborações dos pesquisadores. Isso deu origem a grandes redes de colaboração científica, as quais podem ser extraídas de plataformas de armazenamento de informações acadêmicas. Nesse contexto, tem-se a bibliometria com o objetivo de extrair conhecimento quantitativo dessas redes de colaboração científica por meio de métricas, denominadas bibliométricas. Entretanto, os algoritmos de extração de bibliométricas não são escaláveis e, portanto, não suportam grandes redes de colaboração. Neste sentido, faz-se necessário o desenvolvimento de algoritmos otimizados por meio de distribuição de dados, que utilizam os recursos de forma mais eficiente. Assim, a contribuição científica desse trabalho é a proposição de algoritmos de extração de bibliométricas com desempenho superior aos semelhantes encontrados na literatura para grandes redes de colaboração. Verificou-se por meio dos testes que o algoritmo de extração da bibliométrica de transitividade desenvolvido tem crescimento de tempo de processamento 12,76 vezes menor que o tempo de processamento do algoritmo paralelo proposto na literatura, quando o número de pesquisadores tende ao infinito. Como subproduto, foi desenvolvida uma Ferramenta de Extração de Indicadores Bibliométricos com o objetivo de facilitar o uso dos algoritmos desenvolvidos para extração de conhecimento de redes de colaboração científica.
id UNSP_5d47977807b0b01f793926e808a4a473
oai_identifier_str oai:repositorio.unesp.br:11449/193347
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str
spelling Otimização em algoritmos de extração de bibliométricas de redes de colaboração científicaSpark-based transitivity algorithm for co-authorship network analysisBibliometriaParalelização e distribuição de algoritmosRede de colaboração científicaBibliometricBig dataData miningNoSQLAlgorithm parallelization and distributionCo-authorship networkCom o processo natural de evolução da ciência, a produção de informações nesta área passou a ganhar dimensões importantes, como é o caso quanto as produções científicas e as respectivas colaborações dos pesquisadores. Isso deu origem a grandes redes de colaboração científica, as quais podem ser extraídas de plataformas de armazenamento de informações acadêmicas. Nesse contexto, tem-se a bibliometria com o objetivo de extrair conhecimento quantitativo dessas redes de colaboração científica por meio de métricas, denominadas bibliométricas. Entretanto, os algoritmos de extração de bibliométricas não são escaláveis e, portanto, não suportam grandes redes de colaboração. Neste sentido, faz-se necessário o desenvolvimento de algoritmos otimizados por meio de distribuição de dados, que utilizam os recursos de forma mais eficiente. Assim, a contribuição científica desse trabalho é a proposição de algoritmos de extração de bibliométricas com desempenho superior aos semelhantes encontrados na literatura para grandes redes de colaboração. Verificou-se por meio dos testes que o algoritmo de extração da bibliométrica de transitividade desenvolvido tem crescimento de tempo de processamento 12,76 vezes menor que o tempo de processamento do algoritmo paralelo proposto na literatura, quando o número de pesquisadores tende ao infinito. Como subproduto, foi desenvolvida uma Ferramenta de Extração de Indicadores Bibliométricos com o objetivo de facilitar o uso dos algoritmos desenvolvidos para extração de conhecimento de redes de colaboração científica.Due to the natural process of science evolution, information production in this area has been reaching important dimensions, such as scientific productions and their respective collaborations of researchers. As a result, large scientific collaboration networks have arisen, which can be extracted from academic information storage platforms. In this context, Bibliometry aims at extracting quantitative knowledge from these scientific collaboration networks through metrics, called bibliometrics. However, the extraction algorithms of bibliometrics are not scalable and, consequently, do not support large collaboration networks. Considering this, the development of an optimized algorithm becomes necessary through data distribution that uses resources more efficiently. Therefore, the scientific contribution of this work is to implement the transitivity algorithm for extracting bibliometrics developed through the Apache Spark framework with superior performance to those found in the literature for large collaboration networks. Tests have revealed that the developed algorithm has a processing time growth 12.76 times smaller than the processing time of the parallel algorithm proposed in the literature, where the number of researchers tends to infinity. As a by-product, a Tool for Extracting Bibliometric Indicators was designed to enable the use of algorithms developed to extract knowledge from scientific collaboration networks.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)CAPES: 001Universidade Estadual Paulista (Unesp)Valêncio, Carlos Roberto [UNESP]Universidade Estadual Paulista (Unesp)Freitas, José Carlos de2020-08-31T21:16:21Z2020-08-31T21:16:21Z2020-08-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/11449/19334733004153073P2porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2024-11-05T13:26:01Zoai:repositorio.unesp.br:11449/193347Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestrepositoriounesp@unesp.bropendoar:29462024-11-05T13:26:01Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Otimização em algoritmos de extração de bibliométricas de redes de colaboração científica
Spark-based transitivity algorithm for co-authorship network analysis
title Otimização em algoritmos de extração de bibliométricas de redes de colaboração científica
spellingShingle Otimização em algoritmos de extração de bibliométricas de redes de colaboração científica
Freitas, José Carlos de
Bibliometria
Paralelização e distribuição de algoritmos
Rede de colaboração científica
Bibliometric
Big data
Data mining
NoSQL
Algorithm parallelization and distribution
Co-authorship network
title_short Otimização em algoritmos de extração de bibliométricas de redes de colaboração científica
title_full Otimização em algoritmos de extração de bibliométricas de redes de colaboração científica
title_fullStr Otimização em algoritmos de extração de bibliométricas de redes de colaboração científica
title_full_unstemmed Otimização em algoritmos de extração de bibliométricas de redes de colaboração científica
title_sort Otimização em algoritmos de extração de bibliométricas de redes de colaboração científica
author Freitas, José Carlos de
author_facet Freitas, José Carlos de
author_role author
dc.contributor.none.fl_str_mv Valêncio, Carlos Roberto [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Freitas, José Carlos de
dc.subject.por.fl_str_mv Bibliometria
Paralelização e distribuição de algoritmos
Rede de colaboração científica
Bibliometric
Big data
Data mining
NoSQL
Algorithm parallelization and distribution
Co-authorship network
topic Bibliometria
Paralelização e distribuição de algoritmos
Rede de colaboração científica
Bibliometric
Big data
Data mining
NoSQL
Algorithm parallelization and distribution
Co-authorship network
description Com o processo natural de evolução da ciência, a produção de informações nesta área passou a ganhar dimensões importantes, como é o caso quanto as produções científicas e as respectivas colaborações dos pesquisadores. Isso deu origem a grandes redes de colaboração científica, as quais podem ser extraídas de plataformas de armazenamento de informações acadêmicas. Nesse contexto, tem-se a bibliometria com o objetivo de extrair conhecimento quantitativo dessas redes de colaboração científica por meio de métricas, denominadas bibliométricas. Entretanto, os algoritmos de extração de bibliométricas não são escaláveis e, portanto, não suportam grandes redes de colaboração. Neste sentido, faz-se necessário o desenvolvimento de algoritmos otimizados por meio de distribuição de dados, que utilizam os recursos de forma mais eficiente. Assim, a contribuição científica desse trabalho é a proposição de algoritmos de extração de bibliométricas com desempenho superior aos semelhantes encontrados na literatura para grandes redes de colaboração. Verificou-se por meio dos testes que o algoritmo de extração da bibliométrica de transitividade desenvolvido tem crescimento de tempo de processamento 12,76 vezes menor que o tempo de processamento do algoritmo paralelo proposto na literatura, quando o número de pesquisadores tende ao infinito. Como subproduto, foi desenvolvida uma Ferramenta de Extração de Indicadores Bibliométricos com o objetivo de facilitar o uso dos algoritmos desenvolvidos para extração de conhecimento de redes de colaboração científica.
publishDate 2020
dc.date.none.fl_str_mv 2020-08-31T21:16:21Z
2020-08-31T21:16:21Z
2020-08-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/193347
33004153073P2
url http://hdl.handle.net/11449/193347
identifier_str_mv 33004153073P2
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv repositoriounesp@unesp.br
_version_ 1854954971636695040