Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Ciência da Computação - PPGCC
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.ufscar.br/handle/20.500.14289/20494 |
Resumo: | The development of Rule-Based Fuzzy Systems (FRBS) brings with it the need to address issues related to the desirable balance between the conflicting objectives of accuracy (measure related to the system's ability to describe a given problem) and complexity (measure related to interpretability of the FRBS according to the number of rules and rule antecedents). This situation also occurs when considering problems where the input data have large volume and high dimensionality. However, in these cases, a question arises: the number of rules is so large (thousands or even millions of rules) that the extraction of accurate and interpretable Fuzzy Rule Bases (FRB) through classical sequential algorithms becomes computationally very costly and often unfeasible. In this context, Parallel Computing appears as a means to, from a large set of rules, enable the extraction of FRB that are weighted between accuracy and complexity. Therefore, this work proposes a parallel computing approach to generate FRB from high-volume and high-dimensional rule sets. The idea is that, using parallel computing and Multiobjective Evolutionary Fuzzy Systems (MOEFS), it is possible to extract accurate and compact (less complex | more interpretable) FRB from a large set of rules. For the generation of MOEFS, the Multiobjective Non-Dominated Sorting Genetic Algorithms NSGA-DO, MNSGA-DO and the classic NSGA-II were used. Each of these algorithms was tested to generate FRB from sets of Fuzzy rules obtained through the FCA-Based method. With the tests it was noticed that, with the use of AGMO NSGA-DO and MNSGA-DO, it was possible to achieve, in addition to the two main objectives, a better distribution of the solutions along the Pareto Frontier compared to the solutions obtained by the NSGA -II. The tests showed that, through the proposed approach, it was possible to extract accurate and compact BRFs from large sets of rules. Furthermore, tests were performed following a method based on the state-of-the-art FARC-HD approach. It was possible to perceive that the BRF obtained through the approach proposed here had, in general, greater accuracy in relation to the BRF extracted through the method based on the FARC-HD approach. |
| id |
SCAR_b3fc4ada292e4325d3430423db9a5fe0 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/20494 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
Santana, Maykon RochaCamargo, Heloisa de Arrudahttp://lattes.cnpq.br/0487231065057783http://lattes.cnpq.br/9437028723564473https://orcid.org/0000-0003-1716-4696https://orcid.org/0000-0002-5489-73062024-09-09T12:30:07Z2024-09-09T12:30:07Z2022-07-28SANTANA, Maykon Rocha. Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/20494.https://repositorio.ufscar.br/handle/20.500.14289/20494The development of Rule-Based Fuzzy Systems (FRBS) brings with it the need to address issues related to the desirable balance between the conflicting objectives of accuracy (measure related to the system's ability to describe a given problem) and complexity (measure related to interpretability of the FRBS according to the number of rules and rule antecedents). This situation also occurs when considering problems where the input data have large volume and high dimensionality. However, in these cases, a question arises: the number of rules is so large (thousands or even millions of rules) that the extraction of accurate and interpretable Fuzzy Rule Bases (FRB) through classical sequential algorithms becomes computationally very costly and often unfeasible. In this context, Parallel Computing appears as a means to, from a large set of rules, enable the extraction of FRB that are weighted between accuracy and complexity. Therefore, this work proposes a parallel computing approach to generate FRB from high-volume and high-dimensional rule sets. The idea is that, using parallel computing and Multiobjective Evolutionary Fuzzy Systems (MOEFS), it is possible to extract accurate and compact (less complex | more interpretable) FRB from a large set of rules. For the generation of MOEFS, the Multiobjective Non-Dominated Sorting Genetic Algorithms NSGA-DO, MNSGA-DO and the classic NSGA-II were used. Each of these algorithms was tested to generate FRB from sets of Fuzzy rules obtained through the FCA-Based method. With the tests it was noticed that, with the use of AGMO NSGA-DO and MNSGA-DO, it was possible to achieve, in addition to the two main objectives, a better distribution of the solutions along the Pareto Frontier compared to the solutions obtained by the NSGA -II. The tests showed that, through the proposed approach, it was possible to extract accurate and compact BRFs from large sets of rules. Furthermore, tests were performed following a method based on the state-of-the-art FARC-HD approach. It was possible to perceive that the BRF obtained through the approach proposed here had, in general, greater accuracy in relation to the BRF extracted through the method based on the FARC-HD approach.O desenvolvimento de Sistemas Fuzzy Baseados em Regras (SFBR) traz consigo a necessidade do tratamento de questões relacionadas ao desejável balanceamento entre os objetivos conflitantes de acurácia (medida relacionada à capacidade do sistema de descrever um dado problema) e de complexidade (medida relacionada à interpretabilidade dos SFBR de acordo com o número de regras e de antecedentes das regras). Essa situação também ocorre quando se considera problemas onde os dados de entrada possuem grande volume e alta dimensionalidade. Todavia, nesses casos, surge uma questão: a quantidade de regras é tão grande (milhares ou até mesmo milhões de regras) que a extração de Bases de Regras Fuzzy (BRF) acuradas e interpretáveis por meio dos algoritmos sequenciais clássicos torna-se computacionalmente muito custosa e muitas vezes inviável. Nesse contexto, a Computação Paralela surge como um meio para, a partir de uma grande conjunto de regras, possibilitar a extração de BRF que sejam ponderadas entre a acurácia e a complexidade. Sendo assim, nesse trabalho é proposta uma abordagem de computação paralela para geração de BRF a partir de conjuntos de regras com grande volume e alta dimensionalidade. A ideia é que, usando a Computação Paralela e os Sistemas Fuzzy Evolutivos Multiobjetivos (SFEMO), seja possível extrair BRF acuradas e compactas (menos complexas | mais interpretáveis) a partir de um grande conjunto de regras. Para a geração dos SFEMO foram usados os Algoritmos Genéticos Multiobjetivo de Ordenação por não Dominância NSGA-DO, MNSGA-DO e o clássico NSGA-II. Cada um desses algoritmos foi testado para geração de BRF a partir de conjuntos de regras Fuzzy obtidos por meio do método FCA-Based. Com os testes percebeu-se que, com o uso dos AGMO NSGA-DO e MNSGA-DO, foi possível alcançar, além dos dois objetivos principais, uma melhor distribuição das soluções ao longo da Fronteira de Pareto em comparação com as soluções obtidas pelo NSGA-II. Os testes demonstraram que, por meio da abordagem proposta, foi possível a extração de BRF acuradas e compactas a partir de grandes conjuntos de regras. Além disso, testes foram realizados seguindo um método baseado na abordagem estado-da-arte FARC-HD. Foi possível perceber que as BRF obtidas por meio da abordagem aqui proposta possuíam, em geral, maior acurácia em relação às BRF extraídas por intermédio do método baseado na abordagem FARC-HD.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)88882426797/2019-01porUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessSistemas baseados em regras fuzzyAlgoritmos genéticos multiobjetivoSistemas fuzzyComputação paralelaProblemas de grande volume e alta dimensionalidadeAprendizado de máquinaFuzzy rule based systemsMultiobjective genetic algorithmsFuzzy systemsParallel computingLarge volume and high dimensionality problemsMachine learningCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAbordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominânciaParallel computing approach for generating fuzzy rule bases in large-volume and high-dimensional data problems using non-dominated sorting multi-objective genetic algorithmsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARTEXTCIG__Abordagem_Paralela__Geração_FRB__usando_AGMO__Maykon Santana.pdf.txtCIG__Abordagem_Paralela__Geração_FRB__usando_AGMO__Maykon Santana.pdf.txtExtracted texttext/plain103175https://repositorio.ufscar.br/bitstreams/51912e10-3ee3-4ab0-a46e-5a0c8e014f34/download1af81e90b7628f58b8bb93f31917cb00MD53falseAnonymousREADTHUMBNAILCIG__Abordagem_Paralela__Geração_FRB__usando_AGMO__Maykon Santana.pdf.jpgCIG__Abordagem_Paralela__Geração_FRB__usando_AGMO__Maykon Santana.pdf.jpgGenerated Thumbnailimage/jpeg6341https://repositorio.ufscar.br/bitstreams/bbaf93e7-3857-41a6-a402-ae751eebb650/download8cb55c79f911a0ef9936d098289bbc61MD54falseAnonymousREADORIGINALCIG__Abordagem_Paralela__Geração_FRB__usando_AGMO__Maykon Santana.pdfCIG__Abordagem_Paralela__Geração_FRB__usando_AGMO__Maykon Santana.pdfapplication/pdf5221616https://repositorio.ufscar.br/bitstreams/9ec5f90c-be23-4ec4-b93f-3e918a8107e6/downloadd2782d162ff4506757c00f4eec403e07MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8810https://repositorio.ufscar.br/bitstreams/72d8131e-b881-4d87-a00d-0fc42d605145/downloadf337d95da1fce0a22c77480e5e9a7aecMD52falseAnonymousREAD20.500.14289/204942025-02-06 03:10:25.677http://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/20494https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-06T06:10:25Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
| dc.title.por.fl_str_mv |
Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância |
| dc.title.alternative.eng.fl_str_mv |
Parallel computing approach for generating fuzzy rule bases in large-volume and high-dimensional data problems using non-dominated sorting multi-objective genetic algorithms |
| title |
Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância |
| spellingShingle |
Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância Santana, Maykon Rocha Sistemas baseados em regras fuzzy Algoritmos genéticos multiobjetivo Sistemas fuzzy Computação paralela Problemas de grande volume e alta dimensionalidade Aprendizado de máquina Fuzzy rule based systems Multiobjective genetic algorithms Fuzzy systems Parallel computing Large volume and high dimensionality problems Machine learning CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| title_short |
Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância |
| title_full |
Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância |
| title_fullStr |
Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância |
| title_full_unstemmed |
Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância |
| title_sort |
Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância |
| author |
Santana, Maykon Rocha |
| author_facet |
Santana, Maykon Rocha |
| author_role |
author |
| dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/9437028723564473 |
| dc.contributor.authororcid.por.fl_str_mv |
https://orcid.org/0000-0003-1716-4696 |
| dc.contributor.advisor1orcid.por.fl_str_mv |
https://orcid.org/0000-0002-5489-7306 |
| dc.contributor.author.fl_str_mv |
Santana, Maykon Rocha |
| dc.contributor.advisor1.fl_str_mv |
Camargo, Heloisa de Arruda |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/0487231065057783 |
| contributor_str_mv |
Camargo, Heloisa de Arruda |
| dc.subject.por.fl_str_mv |
Sistemas baseados em regras fuzzy Algoritmos genéticos multiobjetivo Sistemas fuzzy Computação paralela Problemas de grande volume e alta dimensionalidade Aprendizado de máquina |
| topic |
Sistemas baseados em regras fuzzy Algoritmos genéticos multiobjetivo Sistemas fuzzy Computação paralela Problemas de grande volume e alta dimensionalidade Aprendizado de máquina Fuzzy rule based systems Multiobjective genetic algorithms Fuzzy systems Parallel computing Large volume and high dimensionality problems Machine learning CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| dc.subject.eng.fl_str_mv |
Fuzzy rule based systems Multiobjective genetic algorithms Fuzzy systems Parallel computing Large volume and high dimensionality problems Machine learning |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| description |
The development of Rule-Based Fuzzy Systems (FRBS) brings with it the need to address issues related to the desirable balance between the conflicting objectives of accuracy (measure related to the system's ability to describe a given problem) and complexity (measure related to interpretability of the FRBS according to the number of rules and rule antecedents). This situation also occurs when considering problems where the input data have large volume and high dimensionality. However, in these cases, a question arises: the number of rules is so large (thousands or even millions of rules) that the extraction of accurate and interpretable Fuzzy Rule Bases (FRB) through classical sequential algorithms becomes computationally very costly and often unfeasible. In this context, Parallel Computing appears as a means to, from a large set of rules, enable the extraction of FRB that are weighted between accuracy and complexity. Therefore, this work proposes a parallel computing approach to generate FRB from high-volume and high-dimensional rule sets. The idea is that, using parallel computing and Multiobjective Evolutionary Fuzzy Systems (MOEFS), it is possible to extract accurate and compact (less complex | more interpretable) FRB from a large set of rules. For the generation of MOEFS, the Multiobjective Non-Dominated Sorting Genetic Algorithms NSGA-DO, MNSGA-DO and the classic NSGA-II were used. Each of these algorithms was tested to generate FRB from sets of Fuzzy rules obtained through the FCA-Based method. With the tests it was noticed that, with the use of AGMO NSGA-DO and MNSGA-DO, it was possible to achieve, in addition to the two main objectives, a better distribution of the solutions along the Pareto Frontier compared to the solutions obtained by the NSGA -II. The tests showed that, through the proposed approach, it was possible to extract accurate and compact BRFs from large sets of rules. Furthermore, tests were performed following a method based on the state-of-the-art FARC-HD approach. It was possible to perceive that the BRF obtained through the approach proposed here had, in general, greater accuracy in relation to the BRF extracted through the method based on the FARC-HD approach. |
| publishDate |
2022 |
| dc.date.issued.fl_str_mv |
2022-07-28 |
| dc.date.accessioned.fl_str_mv |
2024-09-09T12:30:07Z |
| dc.date.available.fl_str_mv |
2024-09-09T12:30:07Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
SANTANA, Maykon Rocha. Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/20494. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/20.500.14289/20494 |
| identifier_str_mv |
SANTANA, Maykon Rocha. Abordagem de computação paralela para geração de bases de regras fuzzy em problemas de grande volume e de alta dimensionalidade dos dados usando algoritmos genéticos multiobjetivo de ordenação por não dominância. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/20494. |
| url |
https://repositorio.ufscar.br/handle/20.500.14289/20494 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/51912e10-3ee3-4ab0-a46e-5a0c8e014f34/download https://repositorio.ufscar.br/bitstreams/bbaf93e7-3857-41a6-a402-ae751eebb650/download https://repositorio.ufscar.br/bitstreams/9ec5f90c-be23-4ec4-b93f-3e918a8107e6/download https://repositorio.ufscar.br/bitstreams/72d8131e-b881-4d87-a00d-0fc42d605145/download |
| bitstream.checksum.fl_str_mv |
1af81e90b7628f58b8bb93f31917cb00 8cb55c79f911a0ef9936d098289bbc61 d2782d162ff4506757c00f4eec403e07 f337d95da1fce0a22c77480e5e9a7aec |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688797880713216 |