Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Souza, Edson Melo de lattes
Orientador(a): Storopoli, José Eduardo lattes
Banca de defesa: Storopoli, José Eduardo lattes, Bido, Diógenes de Souza lattes, Chalco, Jesús Pascual Mena lattes, Vils, Leonardo lattes, Marns, Fellipe Silva
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Nove de Julho
Programa de Pós-Graduação: Programa de Pós-Graduação em Informática e Gestão do Conhecimento
Departamento: Informática
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://bibliotecatede.uninove.br/handle/tede/2788
Resumo: In recent years, there has been an increase in the number of authors listed in articles and the issue of authorship and scientific contributions is still open in the literature since there is no formal definition or recommendation for the authors’ position. Objective: In this dissertation, I’ve scrutinized the relationship between scientific contribution and authorship ethical issues. My main objective was to study contributions types and its impact in authorship position. Methodology: I’ve collected 2, 024 articles containing 17, 385 authors from the following data sources: SCImago, Scopus, and the following jour- nals: Annals of Internal Medicine (Ann. Intern. Med.), Journal of the American Medical Association (JAMA), and PLoS Medicine (PLoS Med.). All of those being journals from the biological sciences and medicine areas. To analyze the data I’ve employed statisti- cal techniques, specifically Factor Analysis; and also data science techniques, specifically Linear Regression. Furthermore, for data collection and cleaning automation, I’ve deve- loped robots with data scraping techniques. Results: My study revealed the existence of mainly two scientific contribution categories (“Theory” and “Methodology/Logistics” ). I’ve also proposed an universal categorical model of scientific contribution based on th- ree main categories: theory, methodology, and logistic. Furthermore, I’ve also developed algorithms to automate data collection by robots/crawler. Conclusion: Data science te- chniques have allowed the construction of robots to automate data collection in scientific databases and publications together with developed algorithms, substantially reducing the collection time and improving the accuracy of the processes. The grouping of sci- entific contributions showed that the largest contributions are found in the theoretical group, indicating that the academic experience of the authors is a major factor, while the methodological and logistical contributions represent substantial contributions. The categorical model proposed for the study of the relationship between authorial positioning and scientific contributions shows that authors who contribute theoretically tend to be the first authors. Logistic contributions, on the other hand, tend to place an author last. Methodological contributions do not have an impact on author position. Finally, the small effect registered in the correlation between the contribution variables evidences that the author’s position is not defined by the authors’ contributions.
id NOVE_cd5912e22b987047e9403dffd7063c80
oai_identifier_str oai:localhost:tede/2788
network_acronym_str NOVE
network_name_str Biblioteca Digital de Teses e Dissertações da Uninove
repository_id_str
spelling Storopoli, José Eduardohttp://lattes.cnpq.br/2281909649311607Storopoli, José Eduardohttp://lattes.cnpq.br/2281909649311607Bido, Diógenes de Souzahttp://lattes.cnpq.br/7757562071320086Chalco, Jesús Pascual Menahttp://lattes.cnpq.br/4727357182510680Vils, Leonardohttp://lattes.cnpq.br/3969955798466284Marns, Fellipe Silvahttp://lattes.cnpq.br/2641658716558510Souza, Edson Melo de2021-12-02T14:36:50Z2021-06-28Souza, Edson Melo de. Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos. 2021. 119 f. Tese( Programa de Pós-Graduação em Informática e Gestão do Conhecimento) - Universidade Nove de Julho, São Paulo.http://bibliotecatede.uninove.br/handle/tede/2788In recent years, there has been an increase in the number of authors listed in articles and the issue of authorship and scientific contributions is still open in the literature since there is no formal definition or recommendation for the authors’ position. Objective: In this dissertation, I’ve scrutinized the relationship between scientific contribution and authorship ethical issues. My main objective was to study contributions types and its impact in authorship position. Methodology: I’ve collected 2, 024 articles containing 17, 385 authors from the following data sources: SCImago, Scopus, and the following jour- nals: Annals of Internal Medicine (Ann. Intern. Med.), Journal of the American Medical Association (JAMA), and PLoS Medicine (PLoS Med.). All of those being journals from the biological sciences and medicine areas. To analyze the data I’ve employed statisti- cal techniques, specifically Factor Analysis; and also data science techniques, specifically Linear Regression. Furthermore, for data collection and cleaning automation, I’ve deve- loped robots with data scraping techniques. Results: My study revealed the existence of mainly two scientific contribution categories (“Theory” and “Methodology/Logistics” ). I’ve also proposed an universal categorical model of scientific contribution based on th- ree main categories: theory, methodology, and logistic. Furthermore, I’ve also developed algorithms to automate data collection by robots/crawler. Conclusion: Data science te- chniques have allowed the construction of robots to automate data collection in scientific databases and publications together with developed algorithms, substantially reducing the collection time and improving the accuracy of the processes. The grouping of sci- entific contributions showed that the largest contributions are found in the theoretical group, indicating that the academic experience of the authors is a major factor, while the methodological and logistical contributions represent substantial contributions. The categorical model proposed for the study of the relationship between authorial positioning and scientific contributions shows that authors who contribute theoretically tend to be the first authors. Logistic contributions, on the other hand, tend to place an author last. Methodological contributions do not have an impact on author position. Finally, the small effect registered in the correlation between the contribution variables evidences that the author’s position is not defined by the authors’ contributions.Contexto: Nos últimos anos houve crescimento do número de autores listados em artigos e a questão do posicionamento autoral e das contribuições científicas ainda se encontra em aberto na literatura, uma vez que não há definição ou recomendação formal para o posicionamento dos autores. Objetivo: Neste trabalho foram estudadas as categorias de contribuição e a questão da posição autoral em relação às contribuições dos autores em publicações científicas na área de ciências biológicas e medicina. Método: O estudo foi realizado utilizando técnicas estatísticas, em especial Análise Fatorial, e de ciência de dados, em especial Regressão Linear sobre os dados de 2.024 artigos contendo 17.385 au- tores das fontes de dados: SCImago, Scopus e dos periódicos da área de ciências biológicas e medicina Annals of Internal Medicine (Anna. Intern. Med.), Journal of the American Medical Association (JAMA) e PLoS Medicine (PLoS Med). Para coleta e limpeza dos dados foram desenvolvidos robôs com técnicas de raspagem de dados para automatização dos processos. Resultados: O estudo mostrou a existência de dois grupos de contri- buição (“Theory” e “Methodology/Logistic” ), além da proposta de um modelo universal de contribuições com três categorias: teórica, metodológica e logística. Ademais, foram desenvolvidos algoritmos para automatização dos tratamentos de dados coletados pelos robôs. Conclusão As técnicas de ciência de dados permitiram a construção de robôs para automatização da coleta de dados em bases e publicações científicas em conjunto com os algoritmos desenvolvidos, reduzindo substancialmente o tempo de coleta e melhorando a acurácia dos processos. O agrupamento das contribuições científicas evidenciou que as maiores contribuições se encontram no grupo teórico, sinalizando que a experiência aca- dêmica dos autores é um fator preponderante, enquanto as contribuições metodológicas e logísticas representam contribuições substanciais. O modelo categórico proposto para o estudo da relação entre o posicionamento autoral e as contribuições científicas mostrou que autores com contribuições teóricas tendem a ser o primeiro autor. Já as contribuições logísticas tendem a posicionar um autor como último. As contribuições metodológicas não evidenciam impacto no posicionamento autoral. Por fim, o pequeno efeito registrado na correlação entre as variáveis de contribuição evidencia que o posicionamento autoral não é definido pelas contribuições dos autores.Submitted by Nadir Basilio (nadirsb@uninove.br) on 2021-12-02T14:36:50Z No. of bitstreams: 1 Edson Melo de Souza.pdf: 8553169 bytes, checksum: b6e70c64cf3cb3cc9cb2e642f6ea121e (MD5)Made available in DSpace on 2021-12-02T14:36:50Z (GMT). No. of bitstreams: 1 Edson Melo de Souza.pdf: 8553169 bytes, checksum: b6e70c64cf3cb3cc9cb2e642f6ea121e (MD5) Previous issue date: 2021-06-28application/pdfporUniversidade Nove de JulhoPrograma de Pós-Graduação em Informática e Gestão do ConhecimentoUNINOVEBrasilInformáticaciência de dadosposição autorallista de contribuiçõesbylinedata scienceauthor positioncontribution listbylineCIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOAplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis8930092515683771531600info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da Uninoveinstname:Universidade Nove de Julho (UNINOVE)instacron:UNINOVEORIGINALEdson Melo de Souza.pdfEdson Melo de Souza.pdfapplication/pdf8553169http://localhost:8080/tede/bitstream/tede/2788/2/Edson+Melo+de+Souza.pdfb6e70c64cf3cb3cc9cb2e642f6ea121eMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82165http://localhost:8080/tede/bitstream/tede/2788/1/license.txtbd3efa91386c1718a7f26a329fdcb468MD51tede/27882021-12-02 12:36:50.421oai:localhost:tede/2788Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSw5NQUklBIExJQ0VOw4dBCkVzdGEgbGljZW7Dp2EgZGUgZXhlbXBsbyDDqSBmb3JuZWNpZGEgYXBlbmFzIHBhcmEgZmlucyBpbmZvcm1hdGl2b3MuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgClhYWCAoU2lnbGEgZGEgVW5pdmVyc2lkYWRlKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyAKVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://bibliotecatede.uninove.br/PRIhttp://bibliotecatede.uninove.br/oai/requestbibliotecatede@uninove.br||bibliotecatede@uninove.bropendoar:2021-12-02T14:36:50Biblioteca Digital de Teses e Dissertações da Uninove - Universidade Nove de Julho (UNINOVE)false
dc.title.por.fl_str_mv Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos
title Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos
spellingShingle Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos
Souza, Edson Melo de
ciência de dados
posição autoral
lista de contribuições
byline
data science
author position
contribution list
byline
CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
title_short Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos
title_full Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos
title_fullStr Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos
title_full_unstemmed Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos
title_sort Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos
author Souza, Edson Melo de
author_facet Souza, Edson Melo de
author_role author
dc.contributor.advisor1.fl_str_mv Storopoli, José Eduardo
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/2281909649311607
dc.contributor.referee1.fl_str_mv Storopoli, José Eduardo
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/2281909649311607
dc.contributor.referee2.fl_str_mv Bido, Diógenes de Souza
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/7757562071320086
dc.contributor.referee3.fl_str_mv Chalco, Jesús Pascual Mena
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/4727357182510680
dc.contributor.referee4.fl_str_mv Vils, Leonardo
dc.contributor.referee4Lattes.fl_str_mv http://lattes.cnpq.br/3969955798466284
dc.contributor.referee5.fl_str_mv Marns, Fellipe Silva
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/2641658716558510
dc.contributor.author.fl_str_mv Souza, Edson Melo de
contributor_str_mv Storopoli, José Eduardo
Storopoli, José Eduardo
Bido, Diógenes de Souza
Chalco, Jesús Pascual Mena
Vils, Leonardo
Marns, Fellipe Silva
dc.subject.por.fl_str_mv ciência de dados
posição autoral
lista de contribuições
byline
topic ciência de dados
posição autoral
lista de contribuições
byline
data science
author position
contribution list
byline
CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
dc.subject.eng.fl_str_mv data science
author position
contribution list
byline
dc.subject.cnpq.fl_str_mv CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
description In recent years, there has been an increase in the number of authors listed in articles and the issue of authorship and scientific contributions is still open in the literature since there is no formal definition or recommendation for the authors’ position. Objective: In this dissertation, I’ve scrutinized the relationship between scientific contribution and authorship ethical issues. My main objective was to study contributions types and its impact in authorship position. Methodology: I’ve collected 2, 024 articles containing 17, 385 authors from the following data sources: SCImago, Scopus, and the following jour- nals: Annals of Internal Medicine (Ann. Intern. Med.), Journal of the American Medical Association (JAMA), and PLoS Medicine (PLoS Med.). All of those being journals from the biological sciences and medicine areas. To analyze the data I’ve employed statisti- cal techniques, specifically Factor Analysis; and also data science techniques, specifically Linear Regression. Furthermore, for data collection and cleaning automation, I’ve deve- loped robots with data scraping techniques. Results: My study revealed the existence of mainly two scientific contribution categories (“Theory” and “Methodology/Logistics” ). I’ve also proposed an universal categorical model of scientific contribution based on th- ree main categories: theory, methodology, and logistic. Furthermore, I’ve also developed algorithms to automate data collection by robots/crawler. Conclusion: Data science te- chniques have allowed the construction of robots to automate data collection in scientific databases and publications together with developed algorithms, substantially reducing the collection time and improving the accuracy of the processes. The grouping of sci- entific contributions showed that the largest contributions are found in the theoretical group, indicating that the academic experience of the authors is a major factor, while the methodological and logistical contributions represent substantial contributions. The categorical model proposed for the study of the relationship between authorial positioning and scientific contributions shows that authors who contribute theoretically tend to be the first authors. Logistic contributions, on the other hand, tend to place an author last. Methodological contributions do not have an impact on author position. Finally, the small effect registered in the correlation between the contribution variables evidences that the author’s position is not defined by the authors’ contributions.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-12-02T14:36:50Z
dc.date.issued.fl_str_mv 2021-06-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv Souza, Edson Melo de. Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos. 2021. 119 f. Tese( Programa de Pós-Graduação em Informática e Gestão do Conhecimento) - Universidade Nove de Julho, São Paulo.
dc.identifier.uri.fl_str_mv http://bibliotecatede.uninove.br/handle/tede/2788
identifier_str_mv Souza, Edson Melo de. Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos. 2021. 119 f. Tese( Programa de Pós-Graduação em Informática e Gestão do Conhecimento) - Universidade Nove de Julho, São Paulo.
url http://bibliotecatede.uninove.br/handle/tede/2788
dc.language.iso.fl_str_mv por
language por
dc.relation.cnpq.fl_str_mv 8930092515683771531
dc.relation.confidence.fl_str_mv 600
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Nove de Julho
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Informática e Gestão do Conhecimento
dc.publisher.initials.fl_str_mv UNINOVE
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Informática
publisher.none.fl_str_mv Universidade Nove de Julho
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Uninove
instname:Universidade Nove de Julho (UNINOVE)
instacron:UNINOVE
instname_str Universidade Nove de Julho (UNINOVE)
instacron_str UNINOVE
institution UNINOVE
reponame_str Biblioteca Digital de Teses e Dissertações da Uninove
collection Biblioteca Digital de Teses e Dissertações da Uninove
bitstream.url.fl_str_mv http://localhost:8080/tede/bitstream/tede/2788/2/Edson+Melo+de+Souza.pdf
http://localhost:8080/tede/bitstream/tede/2788/1/license.txt
bitstream.checksum.fl_str_mv b6e70c64cf3cb3cc9cb2e642f6ea121e
bd3efa91386c1718a7f26a329fdcb468
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Uninove - Universidade Nove de Julho (UNINOVE)
repository.mail.fl_str_mv bibliotecatede@uninove.br||bibliotecatede@uninove.br
_version_ 1800312440387272704