Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: MENDONÇA, Alisson Emanuel Goes de lattes
Orientador(a): COUTINHO, Luciano Reis lattes
Banca de defesa: COUTINHO, Luciano Reis lattes, SILVA, Francisco José da Silva e lattes, COSTA, Evandro de Barros lattes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Maranhão
Programa de Pós-Graduação: PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCET
Departamento: DEPARTAMENTO DE INFORMÁTICA/CCET
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://tedebc.ufma.br/jspui/handle/tede/5484
Resumo: In Brazil, the Tax on Operations Related to the Circulation of Goods and the Rendering of Interstate and Intermunicipal Transportation and Communication Services, known by the acronym ICMS, holds significant prominence in the revenue of the federative units, accounting for approximately 90%. As a consumption tax, its value depends on economic activity, whose tax information the taxpayers record in electronic invoices issued to the tax agencies of each federative unit. This work proposes a learning model to predict ICMS revenue through a dataset derived from tax information in electronic invoices. The learning model uses a segmented approach that starts with splitting the training and validation datasets according to a given parameter. After that, the architecture fits several machine learning models for each split subset (segment). Finally, the architecture chooses the fit machine learning model (learning instance) that produces the best prediction result for each segment. These learning instances compose a hybrid instance set to predict the records of a test dataset. When comparing the results of the traditional approach without segmentation of the training and validation bases with those of the proposed model, an improvement in the metrics used was obtained by 29.52% and 18.4% for the years 2021 and 2022, respectively. And when comparing the results of the current model of the tax body that supported this research, the proposed model improved the metrics by 60.34% and 51.9% for the years 2021 and 2022, respectively. The improvement in the assertiveness metric used suggests that the model is promising in providing information to support decision-making in public management. Furthermore, the model can assist in solutions to combat tax evasion, analyze impacts resulting from changes in the tax system, and address other related challenges.
id UFMA_eb5754840319aecdfd46a6c107d87bcd
oai_identifier_str oai:tede2:tede/5484
network_acronym_str UFMA
network_name_str Biblioteca Digital de Teses e Dissertações da UFMA
repository_id_str
spelling COUTINHO, Luciano Reishttp://lattes.cnpq.br/5901564732655853COUTINHO, Luciano Reishttp://lattes.cnpq.br/5901564732655853SILVA, Francisco José da Silva ehttp://lattes.cnpq.br/0770343284012942COSTA, Evandro de Barroshttp://lattes.cnpq.br/5760364940162939http://lattes.cnpq.br/0769403199946412MENDONÇA, Alisson Emanuel Goes de2024-09-02T18:52:32Z2024-08-02MENDONÇA, Alisson Emanuel Goes de. Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas. 2024. 69 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São LUís, 2024.https://tedebc.ufma.br/jspui/handle/tede/5484In Brazil, the Tax on Operations Related to the Circulation of Goods and the Rendering of Interstate and Intermunicipal Transportation and Communication Services, known by the acronym ICMS, holds significant prominence in the revenue of the federative units, accounting for approximately 90%. As a consumption tax, its value depends on economic activity, whose tax information the taxpayers record in electronic invoices issued to the tax agencies of each federative unit. This work proposes a learning model to predict ICMS revenue through a dataset derived from tax information in electronic invoices. The learning model uses a segmented approach that starts with splitting the training and validation datasets according to a given parameter. After that, the architecture fits several machine learning models for each split subset (segment). Finally, the architecture chooses the fit machine learning model (learning instance) that produces the best prediction result for each segment. These learning instances compose a hybrid instance set to predict the records of a test dataset. When comparing the results of the traditional approach without segmentation of the training and validation bases with those of the proposed model, an improvement in the metrics used was obtained by 29.52% and 18.4% for the years 2021 and 2022, respectively. And when comparing the results of the current model of the tax body that supported this research, the proposed model improved the metrics by 60.34% and 51.9% for the years 2021 and 2022, respectively. The improvement in the assertiveness metric used suggests that the model is promising in providing information to support decision-making in public management. Furthermore, the model can assist in solutions to combat tax evasion, analyze impacts resulting from changes in the tax system, and address other related challenges.No Brasil, o Imposto sobre Operações relativas à Circulação de Mercadorias e sobre Prestações de Serviços de Transporte Interestadual e Intermunicipal e de Comunicação, conhecido pela sigla ICMS, tem alta representatividade na receita dos entes subnacionais, cerca de 90%. Por ser um imposto sobre o consumo, seu valor está diretamente relacionado à atividade econômica, cujas informações são registradas em notas fiscais eletrônicas emitidas pelos contribuintes e recebidas pelos órgãos fiscalizadores de cada estado. Este trabalho propõe um modelo de aprendizagem para prever a arrecadação de ICMS por meio de um conjunto de dados derivados de informações fiscais em notas fiscais eletrônicas. O modelo de aprendizagem usa uma abordagem segmentada que começa com a divisão dos conjuntos de dados de treinamento e validação em diversos subconjuntos menores de acordo com um determinado parâmetro de segmentação. Depois disso, o modelo ajusta vários algoritmos para cada subconjunto dividido (segmento). Finalmente, o modelo seleciona o algoritmo de aprendizado de máquina adequado (instância de aprendizagem) que produz o melhor resultado preditivo em cada segmento. Essas instâncias de aprendizagem selecionadas compõem um conjunto de instâncias híbridas para prever os registros de um conjunto de dados de teste. Ao se comparar os resultados da abordagem tradicional sem segmentação das bases de treinamento e validação com os do modelo proposto, obteve-se uma melhora na métrica utilizada de 29,52% e 18,4% para os anos de 2021 e 2022, respectivamente. E ao se comparar com os resultados do modelo atual do órgão tributário que apoiou esta pesquisa, o modelo proposto melhorou a métrica utilizada em 60,34% e 51,9 % para os anos de 2021 e 2022, respetivamente. A melhora na métrica de assertividade utilizada sugere que o modelo proposto é promissor no fornecimento de informações para apoiar a tomada de decisões na gestão pública. Além disso, o modelo pode auxiliar em soluções para combater a evasão fiscal, analisar impactos resultantes de mudanças no sistema tributário e enfrentar outros desafios relacionados.Submitted by Daniella Santos (daniella.santos@ufma.br) on 2024-09-02T18:52:32Z No. of bitstreams: 1 AlissonEmanuelGoesdeMendonça.pdf: 3163587 bytes, checksum: 4fbef5f899e97cc8331181171fca9a8c (MD5)Made available in DSpace on 2024-09-02T18:52:32Z (GMT). No. of bitstreams: 1 AlissonEmanuelGoesdeMendonça.pdf: 3163587 bytes, checksum: 4fbef5f899e97cc8331181171fca9a8c (MD5) Previous issue date: 2024-08-02CAPESFAPEMAapplication/pdfporUniversidade Federal do MaranhãoPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCETUFMABrasilDEPARTAMENTO DE INFORMÁTICA/CCETregressão;CNN;MLP;aprendizagem segmentada;previsão de receita fiscal;regression;CNN;MLP;segmented learning;tax revenue forecasting.Ciência da ComputaçãoModelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicasSegmented machine learning model for analytical forecasting of tax revenue based on information from electronic invoicesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFMAinstname:Universidade Federal do Maranhão (UFMA)instacron:UFMAORIGINALAlissonEmanuelGoesdeMendonça.pdfAlissonEmanuelGoesdeMendonça.pdfapplication/pdf3163587http://tedebc.ufma.br:8080/bitstream/tede/5484/2/AlissonEmanuelGoesdeMendon%C3%A7a.pdf4fbef5f899e97cc8331181171fca9a8cMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82255http://tedebc.ufma.br:8080/bitstream/tede/5484/1/license.txt97eeade1fce43278e63fe063657f8083MD51tede/54842024-09-02 15:52:32.563oai:tede2:tede/5484IExJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpDb20gYSBhcHJlc2VudGHDp8OjbyBkZXN0YSBsaWNlbsOnYSxvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBjb25jZWRlIMOgIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRvIE1hcmFuaMOjbyAoVUZNQSkgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IGRpc3RyaWJ1aXIgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBjb25jb3JkYSBxdWUgYSBVRk1BIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGTUEgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVUZNQSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRk1BLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCkEgVUZNQSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgoKRGVjbGFyYSB0YW1iw6ltIHF1ZSB0b2RhcyBhcyBhZmlsaWHDp8O1ZXMgY29ycG9yYXRpdmFzIG91IGluc3RpdHVjaW9uYWlzIGUgdG9kYXMgYXMgZm9udGVzIGRlIGFwb2lvIGZpbmFuY2Vpcm8gYW8gdHJhYmFsaG8gZXN0w6NvIGRldmlkYW1lbnRlIGNpdGFkYXMgb3UgbWVuY2lvbmFkYXMgZSBjZXJ0aWZpY2EgcXVlIG7Do28gaMOhIG5lbmh1bSBpbnRlcmVzc2UgY29tZXJjaWFsIG91IGFzc29jaWF0aXZvIHF1ZSByZXByZXNlbnRlIGNvbmZsaXRvIGRlIGludGVyZXNzZSBlbSBjb25leMOjbyBjb20gbyB0cmFiYWxobyBzdWJtZXRpZG8uCgoKCgoKCgo=Biblioteca Digital de Teses e Dissertaçõeshttps://tedebc.ufma.br/jspui/PUBhttp://tedebc.ufma.br:8080/oai/requestrepositorio@ufma.br||repositorio@ufma.bropendoar:21312024-09-02T18:52:32Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA)false
dc.title.por.fl_str_mv Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas
dc.title.alternative.eng.fl_str_mv Segmented machine learning model for analytical forecasting of tax revenue based on information from electronic invoices
title Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas
spellingShingle Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas
MENDONÇA, Alisson Emanuel Goes de
regressão;
CNN;
MLP;
aprendizagem segmentada;
previsão de receita fiscal;
regression;
CNN;
MLP;
segmented learning;
tax revenue forecasting.
Ciência da Computação
title_short Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas
title_full Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas
title_fullStr Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas
title_full_unstemmed Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas
title_sort Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas
author MENDONÇA, Alisson Emanuel Goes de
author_facet MENDONÇA, Alisson Emanuel Goes de
author_role author
dc.contributor.advisor1.fl_str_mv COUTINHO, Luciano Reis
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/5901564732655853
dc.contributor.referee1.fl_str_mv COUTINHO, Luciano Reis
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/5901564732655853
dc.contributor.referee2.fl_str_mv SILVA, Francisco José da Silva e
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/0770343284012942
dc.contributor.referee3.fl_str_mv COSTA, Evandro de Barros
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/5760364940162939
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/0769403199946412
dc.contributor.author.fl_str_mv MENDONÇA, Alisson Emanuel Goes de
contributor_str_mv COUTINHO, Luciano Reis
COUTINHO, Luciano Reis
SILVA, Francisco José da Silva e
COSTA, Evandro de Barros
dc.subject.por.fl_str_mv regressão;
CNN;
MLP;
aprendizagem segmentada;
previsão de receita fiscal;
topic regressão;
CNN;
MLP;
aprendizagem segmentada;
previsão de receita fiscal;
regression;
CNN;
MLP;
segmented learning;
tax revenue forecasting.
Ciência da Computação
dc.subject.eng.fl_str_mv regression;
CNN;
MLP;
segmented learning;
tax revenue forecasting.
dc.subject.cnpq.fl_str_mv Ciência da Computação
description In Brazil, the Tax on Operations Related to the Circulation of Goods and the Rendering of Interstate and Intermunicipal Transportation and Communication Services, known by the acronym ICMS, holds significant prominence in the revenue of the federative units, accounting for approximately 90%. As a consumption tax, its value depends on economic activity, whose tax information the taxpayers record in electronic invoices issued to the tax agencies of each federative unit. This work proposes a learning model to predict ICMS revenue through a dataset derived from tax information in electronic invoices. The learning model uses a segmented approach that starts with splitting the training and validation datasets according to a given parameter. After that, the architecture fits several machine learning models for each split subset (segment). Finally, the architecture chooses the fit machine learning model (learning instance) that produces the best prediction result for each segment. These learning instances compose a hybrid instance set to predict the records of a test dataset. When comparing the results of the traditional approach without segmentation of the training and validation bases with those of the proposed model, an improvement in the metrics used was obtained by 29.52% and 18.4% for the years 2021 and 2022, respectively. And when comparing the results of the current model of the tax body that supported this research, the proposed model improved the metrics by 60.34% and 51.9% for the years 2021 and 2022, respectively. The improvement in the assertiveness metric used suggests that the model is promising in providing information to support decision-making in public management. Furthermore, the model can assist in solutions to combat tax evasion, analyze impacts resulting from changes in the tax system, and address other related challenges.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-09-02T18:52:32Z
dc.date.issued.fl_str_mv 2024-08-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MENDONÇA, Alisson Emanuel Goes de. Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas. 2024. 69 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São LUís, 2024.
dc.identifier.uri.fl_str_mv https://tedebc.ufma.br/jspui/handle/tede/5484
identifier_str_mv MENDONÇA, Alisson Emanuel Goes de. Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas. 2024. 69 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São LUís, 2024.
url https://tedebc.ufma.br/jspui/handle/tede/5484
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Maranhão
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCET
dc.publisher.initials.fl_str_mv UFMA
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv DEPARTAMENTO DE INFORMÁTICA/CCET
publisher.none.fl_str_mv Universidade Federal do Maranhão
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFMA
instname:Universidade Federal do Maranhão (UFMA)
instacron:UFMA
instname_str Universidade Federal do Maranhão (UFMA)
instacron_str UFMA
institution UFMA
reponame_str Biblioteca Digital de Teses e Dissertações da UFMA
collection Biblioteca Digital de Teses e Dissertações da UFMA
bitstream.url.fl_str_mv http://tedebc.ufma.br:8080/bitstream/tede/5484/2/AlissonEmanuelGoesdeMendon%C3%A7a.pdf
http://tedebc.ufma.br:8080/bitstream/tede/5484/1/license.txt
bitstream.checksum.fl_str_mv 4fbef5f899e97cc8331181171fca9a8c
97eeade1fce43278e63fe063657f8083
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA)
repository.mail.fl_str_mv repositorio@ufma.br||repositorio@ufma.br
_version_ 1853508037084446720