Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | , , |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal do Maranhão
|
| Programa de Pós-Graduação: |
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCET
|
| Departamento: |
DEPARTAMENTO DE INFORMÁTICA/CCET
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://tedebc.ufma.br/jspui/handle/tede/5484 |
Resumo: | In Brazil, the Tax on Operations Related to the Circulation of Goods and the Rendering of Interstate and Intermunicipal Transportation and Communication Services, known by the acronym ICMS, holds significant prominence in the revenue of the federative units, accounting for approximately 90%. As a consumption tax, its value depends on economic activity, whose tax information the taxpayers record in electronic invoices issued to the tax agencies of each federative unit. This work proposes a learning model to predict ICMS revenue through a dataset derived from tax information in electronic invoices. The learning model uses a segmented approach that starts with splitting the training and validation datasets according to a given parameter. After that, the architecture fits several machine learning models for each split subset (segment). Finally, the architecture chooses the fit machine learning model (learning instance) that produces the best prediction result for each segment. These learning instances compose a hybrid instance set to predict the records of a test dataset. When comparing the results of the traditional approach without segmentation of the training and validation bases with those of the proposed model, an improvement in the metrics used was obtained by 29.52% and 18.4% for the years 2021 and 2022, respectively. And when comparing the results of the current model of the tax body that supported this research, the proposed model improved the metrics by 60.34% and 51.9% for the years 2021 and 2022, respectively. The improvement in the assertiveness metric used suggests that the model is promising in providing information to support decision-making in public management. Furthermore, the model can assist in solutions to combat tax evasion, analyze impacts resulting from changes in the tax system, and address other related challenges. |
| id |
UFMA_eb5754840319aecdfd46a6c107d87bcd |
|---|---|
| oai_identifier_str |
oai:tede2:tede/5484 |
| network_acronym_str |
UFMA |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFMA |
| repository_id_str |
|
| spelling |
COUTINHO, Luciano Reishttp://lattes.cnpq.br/5901564732655853COUTINHO, Luciano Reishttp://lattes.cnpq.br/5901564732655853SILVA, Francisco José da Silva ehttp://lattes.cnpq.br/0770343284012942COSTA, Evandro de Barroshttp://lattes.cnpq.br/5760364940162939http://lattes.cnpq.br/0769403199946412MENDONÇA, Alisson Emanuel Goes de2024-09-02T18:52:32Z2024-08-02MENDONÇA, Alisson Emanuel Goes de. Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas. 2024. 69 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São LUís, 2024.https://tedebc.ufma.br/jspui/handle/tede/5484In Brazil, the Tax on Operations Related to the Circulation of Goods and the Rendering of Interstate and Intermunicipal Transportation and Communication Services, known by the acronym ICMS, holds significant prominence in the revenue of the federative units, accounting for approximately 90%. As a consumption tax, its value depends on economic activity, whose tax information the taxpayers record in electronic invoices issued to the tax agencies of each federative unit. This work proposes a learning model to predict ICMS revenue through a dataset derived from tax information in electronic invoices. The learning model uses a segmented approach that starts with splitting the training and validation datasets according to a given parameter. After that, the architecture fits several machine learning models for each split subset (segment). Finally, the architecture chooses the fit machine learning model (learning instance) that produces the best prediction result for each segment. These learning instances compose a hybrid instance set to predict the records of a test dataset. When comparing the results of the traditional approach without segmentation of the training and validation bases with those of the proposed model, an improvement in the metrics used was obtained by 29.52% and 18.4% for the years 2021 and 2022, respectively. And when comparing the results of the current model of the tax body that supported this research, the proposed model improved the metrics by 60.34% and 51.9% for the years 2021 and 2022, respectively. The improvement in the assertiveness metric used suggests that the model is promising in providing information to support decision-making in public management. Furthermore, the model can assist in solutions to combat tax evasion, analyze impacts resulting from changes in the tax system, and address other related challenges.No Brasil, o Imposto sobre Operações relativas à Circulação de Mercadorias e sobre Prestações de Serviços de Transporte Interestadual e Intermunicipal e de Comunicação, conhecido pela sigla ICMS, tem alta representatividade na receita dos entes subnacionais, cerca de 90%. Por ser um imposto sobre o consumo, seu valor está diretamente relacionado à atividade econômica, cujas informações são registradas em notas fiscais eletrônicas emitidas pelos contribuintes e recebidas pelos órgãos fiscalizadores de cada estado. Este trabalho propõe um modelo de aprendizagem para prever a arrecadação de ICMS por meio de um conjunto de dados derivados de informações fiscais em notas fiscais eletrônicas. O modelo de aprendizagem usa uma abordagem segmentada que começa com a divisão dos conjuntos de dados de treinamento e validação em diversos subconjuntos menores de acordo com um determinado parâmetro de segmentação. Depois disso, o modelo ajusta vários algoritmos para cada subconjunto dividido (segmento). Finalmente, o modelo seleciona o algoritmo de aprendizado de máquina adequado (instância de aprendizagem) que produz o melhor resultado preditivo em cada segmento. Essas instâncias de aprendizagem selecionadas compõem um conjunto de instâncias híbridas para prever os registros de um conjunto de dados de teste. Ao se comparar os resultados da abordagem tradicional sem segmentação das bases de treinamento e validação com os do modelo proposto, obteve-se uma melhora na métrica utilizada de 29,52% e 18,4% para os anos de 2021 e 2022, respectivamente. E ao se comparar com os resultados do modelo atual do órgão tributário que apoiou esta pesquisa, o modelo proposto melhorou a métrica utilizada em 60,34% e 51,9 % para os anos de 2021 e 2022, respetivamente. A melhora na métrica de assertividade utilizada sugere que o modelo proposto é promissor no fornecimento de informações para apoiar a tomada de decisões na gestão pública. Além disso, o modelo pode auxiliar em soluções para combater a evasão fiscal, analisar impactos resultantes de mudanças no sistema tributário e enfrentar outros desafios relacionados.Submitted by Daniella Santos (daniella.santos@ufma.br) on 2024-09-02T18:52:32Z No. of bitstreams: 1 AlissonEmanuelGoesdeMendonça.pdf: 3163587 bytes, checksum: 4fbef5f899e97cc8331181171fca9a8c (MD5)Made available in DSpace on 2024-09-02T18:52:32Z (GMT). No. of bitstreams: 1 AlissonEmanuelGoesdeMendonça.pdf: 3163587 bytes, checksum: 4fbef5f899e97cc8331181171fca9a8c (MD5) Previous issue date: 2024-08-02CAPESFAPEMAapplication/pdfporUniversidade Federal do MaranhãoPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCETUFMABrasilDEPARTAMENTO DE INFORMÁTICA/CCETregressão;CNN;MLP;aprendizagem segmentada;previsão de receita fiscal;regression;CNN;MLP;segmented learning;tax revenue forecasting.Ciência da ComputaçãoModelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicasSegmented machine learning model for analytical forecasting of tax revenue based on information from electronic invoicesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFMAinstname:Universidade Federal do Maranhão (UFMA)instacron:UFMAORIGINALAlissonEmanuelGoesdeMendonça.pdfAlissonEmanuelGoesdeMendonça.pdfapplication/pdf3163587http://tedebc.ufma.br:8080/bitstream/tede/5484/2/AlissonEmanuelGoesdeMendon%C3%A7a.pdf4fbef5f899e97cc8331181171fca9a8cMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82255http://tedebc.ufma.br:8080/bitstream/tede/5484/1/license.txt97eeade1fce43278e63fe063657f8083MD51tede/54842024-09-02 15:52:32.563oai:tede2:tede/5484IExJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpDb20gYSBhcHJlc2VudGHDp8OjbyBkZXN0YSBsaWNlbsOnYSxvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBjb25jZWRlIMOgIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRvIE1hcmFuaMOjbyAoVUZNQSkgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IGRpc3RyaWJ1aXIgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBjb25jb3JkYSBxdWUgYSBVRk1BIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGTUEgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVUZNQSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRk1BLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCkEgVUZNQSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgoKRGVjbGFyYSB0YW1iw6ltIHF1ZSB0b2RhcyBhcyBhZmlsaWHDp8O1ZXMgY29ycG9yYXRpdmFzIG91IGluc3RpdHVjaW9uYWlzIGUgdG9kYXMgYXMgZm9udGVzIGRlIGFwb2lvIGZpbmFuY2Vpcm8gYW8gdHJhYmFsaG8gZXN0w6NvIGRldmlkYW1lbnRlIGNpdGFkYXMgb3UgbWVuY2lvbmFkYXMgZSBjZXJ0aWZpY2EgcXVlIG7Do28gaMOhIG5lbmh1bSBpbnRlcmVzc2UgY29tZXJjaWFsIG91IGFzc29jaWF0aXZvIHF1ZSByZXByZXNlbnRlIGNvbmZsaXRvIGRlIGludGVyZXNzZSBlbSBjb25leMOjbyBjb20gbyB0cmFiYWxobyBzdWJtZXRpZG8uCgoKCgoKCgo=Biblioteca Digital de Teses e Dissertaçõeshttps://tedebc.ufma.br/jspui/PUBhttp://tedebc.ufma.br:8080/oai/requestrepositorio@ufma.br||repositorio@ufma.bropendoar:21312024-09-02T18:52:32Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA)false |
| dc.title.por.fl_str_mv |
Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas |
| dc.title.alternative.eng.fl_str_mv |
Segmented machine learning model for analytical forecasting of tax revenue based on information from electronic invoices |
| title |
Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas |
| spellingShingle |
Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas MENDONÇA, Alisson Emanuel Goes de regressão; CNN; MLP; aprendizagem segmentada; previsão de receita fiscal; regression; CNN; MLP; segmented learning; tax revenue forecasting. Ciência da Computação |
| title_short |
Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas |
| title_full |
Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas |
| title_fullStr |
Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas |
| title_full_unstemmed |
Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas |
| title_sort |
Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas |
| author |
MENDONÇA, Alisson Emanuel Goes de |
| author_facet |
MENDONÇA, Alisson Emanuel Goes de |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
COUTINHO, Luciano Reis |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/5901564732655853 |
| dc.contributor.referee1.fl_str_mv |
COUTINHO, Luciano Reis |
| dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/5901564732655853 |
| dc.contributor.referee2.fl_str_mv |
SILVA, Francisco José da Silva e |
| dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/0770343284012942 |
| dc.contributor.referee3.fl_str_mv |
COSTA, Evandro de Barros |
| dc.contributor.referee3Lattes.fl_str_mv |
http://lattes.cnpq.br/5760364940162939 |
| dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/0769403199946412 |
| dc.contributor.author.fl_str_mv |
MENDONÇA, Alisson Emanuel Goes de |
| contributor_str_mv |
COUTINHO, Luciano Reis COUTINHO, Luciano Reis SILVA, Francisco José da Silva e COSTA, Evandro de Barros |
| dc.subject.por.fl_str_mv |
regressão; CNN; MLP; aprendizagem segmentada; previsão de receita fiscal; |
| topic |
regressão; CNN; MLP; aprendizagem segmentada; previsão de receita fiscal; regression; CNN; MLP; segmented learning; tax revenue forecasting. Ciência da Computação |
| dc.subject.eng.fl_str_mv |
regression; CNN; MLP; segmented learning; tax revenue forecasting. |
| dc.subject.cnpq.fl_str_mv |
Ciência da Computação |
| description |
In Brazil, the Tax on Operations Related to the Circulation of Goods and the Rendering of Interstate and Intermunicipal Transportation and Communication Services, known by the acronym ICMS, holds significant prominence in the revenue of the federative units, accounting for approximately 90%. As a consumption tax, its value depends on economic activity, whose tax information the taxpayers record in electronic invoices issued to the tax agencies of each federative unit. This work proposes a learning model to predict ICMS revenue through a dataset derived from tax information in electronic invoices. The learning model uses a segmented approach that starts with splitting the training and validation datasets according to a given parameter. After that, the architecture fits several machine learning models for each split subset (segment). Finally, the architecture chooses the fit machine learning model (learning instance) that produces the best prediction result for each segment. These learning instances compose a hybrid instance set to predict the records of a test dataset. When comparing the results of the traditional approach without segmentation of the training and validation bases with those of the proposed model, an improvement in the metrics used was obtained by 29.52% and 18.4% for the years 2021 and 2022, respectively. And when comparing the results of the current model of the tax body that supported this research, the proposed model improved the metrics by 60.34% and 51.9% for the years 2021 and 2022, respectively. The improvement in the assertiveness metric used suggests that the model is promising in providing information to support decision-making in public management. Furthermore, the model can assist in solutions to combat tax evasion, analyze impacts resulting from changes in the tax system, and address other related challenges. |
| publishDate |
2024 |
| dc.date.accessioned.fl_str_mv |
2024-09-02T18:52:32Z |
| dc.date.issued.fl_str_mv |
2024-08-02 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
MENDONÇA, Alisson Emanuel Goes de. Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas. 2024. 69 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São LUís, 2024. |
| dc.identifier.uri.fl_str_mv |
https://tedebc.ufma.br/jspui/handle/tede/5484 |
| identifier_str_mv |
MENDONÇA, Alisson Emanuel Goes de. Modelo de aprendizagem de máquina segmentado para previsão analítica de arrecadação fiscal baseada em informações de notas fiscais eletrônicas. 2024. 69 f. Dissertação (Programa de Pós-Graduação em Ciência da Computação/CCET) - Universidade Federal do Maranhão, São LUís, 2024. |
| url |
https://tedebc.ufma.br/jspui/handle/tede/5484 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal do Maranhão |
| dc.publisher.program.fl_str_mv |
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO/CCET |
| dc.publisher.initials.fl_str_mv |
UFMA |
| dc.publisher.country.fl_str_mv |
Brasil |
| dc.publisher.department.fl_str_mv |
DEPARTAMENTO DE INFORMÁTICA/CCET |
| publisher.none.fl_str_mv |
Universidade Federal do Maranhão |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFMA instname:Universidade Federal do Maranhão (UFMA) instacron:UFMA |
| instname_str |
Universidade Federal do Maranhão (UFMA) |
| instacron_str |
UFMA |
| institution |
UFMA |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFMA |
| collection |
Biblioteca Digital de Teses e Dissertações da UFMA |
| bitstream.url.fl_str_mv |
http://tedebc.ufma.br:8080/bitstream/tede/5484/2/AlissonEmanuelGoesdeMendon%C3%A7a.pdf http://tedebc.ufma.br:8080/bitstream/tede/5484/1/license.txt |
| bitstream.checksum.fl_str_mv |
4fbef5f899e97cc8331181171fca9a8c 97eeade1fce43278e63fe063657f8083 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA) |
| repository.mail.fl_str_mv |
repositorio@ufma.br||repositorio@ufma.br |
| _version_ |
1853508037084446720 |