Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Santana, Maykon Rocha
Orientador(a): Camargo, Heloisa de Arruda lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação - PPGCC
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/20.500.14289/20494
Resumo: The development of Rule-Based Fuzzy Systems (FRBS) brings with it the need to address issues related to the desirable balance between the conflicting objectives of accuracy (measure related to the system's ability to describe a given problem) and complexity (measure related to interpretability of the FRBS according to the number of rules and rule antecedents). This situation also occurs when considering problems where the input data have large volume and high dimensionality. However, in these cases, a question arises: the number of rules is so large (thousands or even millions of rules) that the extraction of accurate and interpretable Fuzzy Rule Bases (FRB) through classical sequential algorithms becomes computationally very costly and often unfeasible. In this context, Parallel Computing appears as a means to, from a large set of rules, enable the extraction of FRB that are weighted between accuracy and complexity. Therefore, this work proposes a parallel computing approach to generate FRB from high-volume and high-dimensional rule sets. The idea is that, using parallel computing and Multiobjective Evolutionary Fuzzy Systems (MOEFS), it is possible to extract accurate and compact (less complex | more interpretable) FRB from a large set of rules. For the generation of MOEFS, the Multiobjective Non-Dominated Sorting Genetic Algorithms NSGA-DO, MNSGA-DO and the classic NSGA-II were used. Each of these algorithms was tested to generate FRB from sets of Fuzzy rules obtained through the FCA-Based method. With the tests it was noticed that, with the use of AGMO NSGA-DO and MNSGA-DO, it was possible to achieve, in addition to the two main objectives, a better distribution of the solutions along the Pareto Frontier compared to the solutions obtained by the NSGA -II. The tests showed that, through the proposed approach, it was possible to extract accurate and compact BRFs from large sets of rules. Furthermore, tests were performed following a method based on the state-of-the-art FARC-HD approach. It was possible to perceive that the BRF obtained through the approach proposed here had, in general, greater accuracy in relation to the BRF extracted through the method based on the FARC-HD approach.
id SCAR_b3fc4ada292e4325d3430423db9a5fe0
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/20494
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Santana, Maykon RochaCamargo, Heloisa de Arrudahttp://lattes.cnpq.br/0487231065057783http://lattes.cnpq.br/9437028723564473https://orcid.org/0000-0003-1716-4696https://orcid.org/0000-0002-5489-73062024-09-09T12:30:07Z2024-09-09T12:30:07Z2022-07-28SANTANA, Maykon Rocha. Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/20494.https://repositorio.ufscar.br/handle/20.500.14289/20494The development of Rule-Based Fuzzy Systems (FRBS) brings with it the need to address issues related to the desirable balance between the conflicting objectives of accuracy (measure related to the system's ability to describe a given problem) and complexity (measure related to interpretability of the FRBS according to the number of rules and rule antecedents). This situation also occurs when considering problems where the input data have large volume and high dimensionality. However, in these cases, a question arises: the number of rules is so large (thousands or even millions of rules) that the extraction of accurate and interpretable Fuzzy Rule Bases (FRB) through classical sequential algorithms becomes computationally very costly and often unfeasible. In this context, Parallel Computing appears as a means to, from a large set of rules, enable the extraction of FRB that are weighted between accuracy and complexity. Therefore, this work proposes a parallel computing approach to generate FRB from high-volume and high-dimensional rule sets. The idea is that, using parallel computing and Multiobjective Evolutionary Fuzzy Systems (MOEFS), it is possible to extract accurate and compact (less complex | more interpretable) FRB from a large set of rules. For the generation of MOEFS, the Multiobjective Non-Dominated Sorting Genetic Algorithms NSGA-DO, MNSGA-DO and the classic NSGA-II were used. Each of these algorithms was tested to generate FRB from sets of Fuzzy rules obtained through the FCA-Based method. With the tests it was noticed that, with the use of AGMO NSGA-DO and MNSGA-DO, it was possible to achieve, in addition to the two main objectives, a better distribution of the solutions along the Pareto Frontier compared to the solutions obtained by the NSGA -II. The tests showed that, through the proposed approach, it was possible to extract accurate and compact BRFs from large sets of rules. Furthermore, tests were performed following a method based on the state-of-the-art FARC-HD approach. It was possible to perceive that the BRF obtained through the approach proposed here had, in general, greater accuracy in relation to the BRF extracted through the method based on the FARC-HD approach.O desenvolvimento de Sistemas Fuzzy Baseados em Regras (SFBR) traz consigo a necessidade do tratamento de questões relacionadas ao desejável balanceamento entre os objetivos conflitantes de acurácia (medida relacionada à capacidade do sistema de descrever um dado problema) e de complexidade (medida relacionada à interpretabilidade dos SFBR de acordo com o número de regras e de antecedentes das regras). Essa situação também ocorre quando se considera problemas onde os dados de entrada possuem grande volume e alta dimensionalidade. Todavia, nesses casos, surge uma questão: a quantidade de regras é tão grande (milhares ou até mesmo milhões de regras) que a extração de Bases de Regras Fuzzy (BRF) acuradas e interpretáveis por meio dos algoritmos sequenciais clássicos torna-se computacionalmente muito custosa e muitas vezes inviável. Nesse contexto, a Computação Paralela surge como um meio para, a partir de uma grande conjunto de regras, possibilitar a extração de BRF que sejam ponderadas entre a acurácia e a complexidade. Sendo assim, nesse trabalho é proposta uma abordagem de computação paralela para geração de BRF a partir de conjuntos de regras com grande volume e alta dimensionalidade. A ideia é que, usando a Computação Paralela e os Sistemas Fuzzy Evolutivos Multiobjetivos (SFEMO), seja possível extrair BRF acuradas e compactas (menos complexas | mais interpretáveis) a partir de um grande conjunto de regras. Para a geração dos SFEMO foram usados os Algoritmos Genéticos Multiobjetivo de Ordenação por não Dominância NSGA-DO, MNSGA-DO e o clássico NSGA-II. Cada um desses algoritmos foi testado para geração de BRF a partir de conjuntos de regras Fuzzy obtidos por meio do método FCA-Based. Com os testes percebeu-se que, com o uso dos AGMO NSGA-DO e MNSGA-DO, foi possível alcançar, além dos dois objetivos principais, uma melhor distribuição das soluções ao longo da Fronteira de Pareto em comparação com as soluções obtidas pelo NSGA-II. Os testes demonstraram que, por meio da abordagem proposta, foi possível a extração de BRF acuradas e compactas a partir de grandes conjuntos de regras. Além disso, testes foram realizados seguindo um método baseado na abordagem estado-da-arte FARC-HD. Foi possível perceber que as BRF obtidas por meio da abordagem aqui proposta possuíam, em geral, maior acurácia em relação às BRF extraídas por intermédio do método baseado na abordagem FARC-HD.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)88882426797/2019-01porUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessSistemas baseados em regras fuzzyAlgoritmos genéticos multiobjetivoSistemas fuzzyComputação paralelaProblemas de grande volume e alta dimensionalidadeAprendizado de máquinaFuzzy rule based systemsMultiobjective genetic algorithmsFuzzy systemsParallel computingLarge volume and high dimensionality problemsMachine learningCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAbordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominânciaParallel computing approach for generating fuzzy rule bases in large-volume and high-dimensional data problems using non-dominated sorting multi-objective genetic algorithmsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARTEXTCIG__Abordagem_Paralela__Geração_FRB__usando_AGMO__Maykon Santana.pdf.txtCIG__Abordagem_Paralela__Geração_FRB__usando_AGMO__Maykon Santana.pdf.txtExtracted texttext/plain103175https://repositorio.ufscar.br/bitstreams/51912e10-3ee3-4ab0-a46e-5a0c8e014f34/download1af81e90b7628f58b8bb93f31917cb00MD53falseAnonymousREADTHUMBNAILCIG__Abordagem_Paralela__Geração_FRB__usando_AGMO__Maykon Santana.pdf.jpgCIG__Abordagem_Paralela__Geração_FRB__usando_AGMO__Maykon Santana.pdf.jpgGenerated Thumbnailimage/jpeg6341https://repositorio.ufscar.br/bitstreams/bbaf93e7-3857-41a6-a402-ae751eebb650/download8cb55c79f911a0ef9936d098289bbc61MD54falseAnonymousREADORIGINALCIG__Abordagem_Paralela__Geração_FRB__usando_AGMO__Maykon Santana.pdfCIG__Abordagem_Paralela__Geração_FRB__usando_AGMO__Maykon Santana.pdfapplication/pdf5221616https://repositorio.ufscar.br/bitstreams/9ec5f90c-be23-4ec4-b93f-3e918a8107e6/downloadd2782d162ff4506757c00f4eec403e07MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8810https://repositorio.ufscar.br/bitstreams/72d8131e-b881-4d87-a00d-0fc42d605145/downloadf337d95da1fce0a22c77480e5e9a7aecMD52falseAnonymousREAD20.500.14289/204942025-02-06 03:10:25.677http://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/20494https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-06T06:10:25Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância
dc.title.alternative.eng.fl_str_mv Parallel computing approach for generating fuzzy rule bases in large-volume and high-dimensional data problems using non-dominated sorting multi-objective genetic algorithms
title Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância
spellingShingle Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância
Santana, Maykon Rocha
Sistemas baseados em regras fuzzy
Algoritmos genéticos multiobjetivo
Sistemas fuzzy
Computação paralela
Problemas de grande volume e alta dimensionalidade
Aprendizado de máquina
Fuzzy rule based systems
Multiobjective genetic algorithms
Fuzzy systems
Parallel computing
Large volume and high dimensionality problems
Machine learning
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância
title_full Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância
title_fullStr Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância
title_full_unstemmed Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância
title_sort Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância
author Santana, Maykon Rocha
author_facet Santana, Maykon Rocha
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/9437028723564473
dc.contributor.authororcid.por.fl_str_mv https://orcid.org/0000-0003-1716-4696
dc.contributor.advisor1orcid.por.fl_str_mv https://orcid.org/0000-0002-5489-7306
dc.contributor.author.fl_str_mv Santana, Maykon Rocha
dc.contributor.advisor1.fl_str_mv Camargo, Heloisa de Arruda
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/0487231065057783
contributor_str_mv Camargo, Heloisa de Arruda
dc.subject.por.fl_str_mv Sistemas baseados em regras fuzzy
Algoritmos genéticos multiobjetivo
Sistemas fuzzy
Computação paralela
Problemas de grande volume e alta dimensionalidade
Aprendizado de máquina
topic Sistemas baseados em regras fuzzy
Algoritmos genéticos multiobjetivo
Sistemas fuzzy
Computação paralela
Problemas de grande volume e alta dimensionalidade
Aprendizado de máquina
Fuzzy rule based systems
Multiobjective genetic algorithms
Fuzzy systems
Parallel computing
Large volume and high dimensionality problems
Machine learning
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Fuzzy rule based systems
Multiobjective genetic algorithms
Fuzzy systems
Parallel computing
Large volume and high dimensionality problems
Machine learning
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description The development of Rule-Based Fuzzy Systems (FRBS) brings with it the need to address issues related to the desirable balance between the conflicting objectives of accuracy (measure related to the system's ability to describe a given problem) and complexity (measure related to interpretability of the FRBS according to the number of rules and rule antecedents). This situation also occurs when considering problems where the input data have large volume and high dimensionality. However, in these cases, a question arises: the number of rules is so large (thousands or even millions of rules) that the extraction of accurate and interpretable Fuzzy Rule Bases (FRB) through classical sequential algorithms becomes computationally very costly and often unfeasible. In this context, Parallel Computing appears as a means to, from a large set of rules, enable the extraction of FRB that are weighted between accuracy and complexity. Therefore, this work proposes a parallel computing approach to generate FRB from high-volume and high-dimensional rule sets. The idea is that, using parallel computing and Multiobjective Evolutionary Fuzzy Systems (MOEFS), it is possible to extract accurate and compact (less complex | more interpretable) FRB from a large set of rules. For the generation of MOEFS, the Multiobjective Non-Dominated Sorting Genetic Algorithms NSGA-DO, MNSGA-DO and the classic NSGA-II were used. Each of these algorithms was tested to generate FRB from sets of Fuzzy rules obtained through the FCA-Based method. With the tests it was noticed that, with the use of AGMO NSGA-DO and MNSGA-DO, it was possible to achieve, in addition to the two main objectives, a better distribution of the solutions along the Pareto Frontier compared to the solutions obtained by the NSGA -II. The tests showed that, through the proposed approach, it was possible to extract accurate and compact BRFs from large sets of rules. Furthermore, tests were performed following a method based on the state-of-the-art FARC-HD approach. It was possible to perceive that the BRF obtained through the approach proposed here had, in general, greater accuracy in relation to the BRF extracted through the method based on the FARC-HD approach.
publishDate 2022
dc.date.issued.fl_str_mv 2022-07-28
dc.date.accessioned.fl_str_mv 2024-09-09T12:30:07Z
dc.date.available.fl_str_mv 2024-09-09T12:30:07Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SANTANA, Maykon Rocha. Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/20494.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/20.500.14289/20494
identifier_str_mv SANTANA, Maykon Rocha. Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/20494.
url https://repositorio.ufscar.br/handle/20.500.14289/20494
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/51912e10-3ee3-4ab0-a46e-5a0c8e014f34/download
https://repositorio.ufscar.br/bitstreams/bbaf93e7-3857-41a6-a402-ae751eebb650/download
https://repositorio.ufscar.br/bitstreams/9ec5f90c-be23-4ec4-b93f-3e918a8107e6/download
https://repositorio.ufscar.br/bitstreams/72d8131e-b881-4d87-a00d-0fc42d605145/download
bitstream.checksum.fl_str_mv 1af81e90b7628f58b8bb93f31917cb00
8cb55c79f911a0ef9936d098289bbc61
d2782d162ff4506757c00f4eec403e07
f337d95da1fce0a22c77480e5e9a7aec
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688797880713216