Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: FERNANDES, Thalita Cristine Ribeiro Lucas. lattes
Orientador(a): ARAÚJO, Antonio Carlos Brandão de. lattes
Banca de defesa: P. NETO, Antonio Tavernard., ALVES, José Jailson Nicácio., SILVA, Vimário Simões., SILVA, Sidinei Kleber da., S. JÚNIOR, Heleno Bispo da.
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Campina Grande
Programa de Pós-Graduação: PÓS-GRADUAÇÃO EM ENGENHARIA QUÍMICA
Departamento: Centro de Ciências e Tecnologia - CCT
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://dspace.sti.ufcg.edu.br/handle/riufcg/26560
Resumo: Este trabalho apresenta um algoritmo de aprendizado de máquina automatizado (AutoML) sitemático e simples. A principal contribuição é produzir o modelo de regressão mais simples, sempre que possível (ex.: modelo de regressão polinomial de segunda ordem via seleção de recursos sequenciais baseado nos mínimos quadrados) ou então, gerar modelos não lineares mais complexos (ex.: regressão gaussiana). O algoritmo é capaz de produzir estes resultados usando técnicas de design sequencial para preencher habilmente o espaço amostral com pontos “interessantes”, gerando um conjunto de dados que é utilizado para selecionar o modelo de regressão mais simples possível. Esse modelo mais simples é gerado de forma iterativa a partir de um conjunto predefinido de modelos de regressão candidatos. O objetivo é minimizar o número de chamadas para o processo gerador (simulador), resultando no menor número de amostras. Cada conjunto de dados produzidos iterativamente é usado de forma exaustiva e eficaz, capaz de convergir até mesmo respostas difíceis que requerem um grande número de amostras. A aplicação do algoritmo proposto em casos importantes (equações matemáticas de difícil resolução, coluna de destilação em Aspen Plus e uma Planta de tratamento de efluentes em Simulink) mostra sua efetividade na construção de metamodelos com capacidade preditiva significante. É sugerida a utilização de técnicas de regressão puramente não lineares em situações que as simulações demandem mais tempo do que o processamento do algoritmo. Em geral, um mix de métodos de regressão linear e não linear para a construção dos metamodelos é recomendada para a maioria dos casos, para compensar o tempo de processamento e a capacidade preditiva.
id UFCG_e1aa1bfa185bdb0f1ccaf441f1718dd8
oai_identifier_str oai:dspace.sti.ufcg.edu.br:riufcg/26560
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str
spelling ARAÚJO, Antonio Carlos Brandão de.ARAÚJO, A. C. B.http://lattes.cnpq.br/7308979392690336P. NETO, Antonio Tavernard.ALVES, José Jailson Nicácio.SILVA, Vimário Simões.SILVA, Sidinei Kleber da.S. JÚNIOR, Heleno Bispo da.FERNANDES, T. C. R. L.http://lattes.cnpq.br/2107979968723473FERNANDES, Thalita Cristine Ribeiro Lucas.Este trabalho apresenta um algoritmo de aprendizado de máquina automatizado (AutoML) sitemático e simples. A principal contribuição é produzir o modelo de regressão mais simples, sempre que possível (ex.: modelo de regressão polinomial de segunda ordem via seleção de recursos sequenciais baseado nos mínimos quadrados) ou então, gerar modelos não lineares mais complexos (ex.: regressão gaussiana). O algoritmo é capaz de produzir estes resultados usando técnicas de design sequencial para preencher habilmente o espaço amostral com pontos “interessantes”, gerando um conjunto de dados que é utilizado para selecionar o modelo de regressão mais simples possível. Esse modelo mais simples é gerado de forma iterativa a partir de um conjunto predefinido de modelos de regressão candidatos. O objetivo é minimizar o número de chamadas para o processo gerador (simulador), resultando no menor número de amostras. Cada conjunto de dados produzidos iterativamente é usado de forma exaustiva e eficaz, capaz de convergir até mesmo respostas difíceis que requerem um grande número de amostras. A aplicação do algoritmo proposto em casos importantes (equações matemáticas de difícil resolução, coluna de destilação em Aspen Plus e uma Planta de tratamento de efluentes em Simulink) mostra sua efetividade na construção de metamodelos com capacidade preditiva significante. É sugerida a utilização de técnicas de regressão puramente não lineares em situações que as simulações demandem mais tempo do que o processamento do algoritmo. Em geral, um mix de métodos de regressão linear e não linear para a construção dos metamodelos é recomendada para a maioria dos casos, para compensar o tempo de processamento e a capacidade preditiva.This is an attempt to create a simple, but quite systematic, automated machine learning (AutoML) algorithm. The main contribution is to produce the simplest regression model (e.g., second order polynomial regression model via OLS based sequential feature selection) whenever possible, or else generate more complex, and therefore less desirable, nonlinear (e.g., gaussian process regression) models. It does so by efficiently using sequential design techniques to cleverly fill the sample space with “interesting” points, generating a dataset (which includes the responses obtained by “querying” the actual underlying process) on demand that is used to select the simplest possible regression model, among a predefined set of candidate regression models, in an iteratively way until particular convergence criteria are met. The intended goal is therefore to minimize the number of calls to the generating process, resulting in the least number of samples. Each dataset produced iteratively is exhaustively and effectively used up in an effort to converge even difficult responses that have not met the criteria even with a large number of samples. Application of the proposed algorithm to important cases shows its effectiveness in building metamodels with significant predictive capabilities. It is suggested the use of pure nonlinear regression techniques in situations in which data takes more time to gather than to be processed by the algorithm. In general, a carefully chosen mix of both linear and nonlinear regression methods to metamodel building is recommended for most cases, as a tradeoff between processing time and predictive capacity.Submitted by Maria Medeiros (maria.dilva1@ufcg.edu.br) on 2022-08-11T14:19:47Z No. of bitstreams: 1 THALITA CRISTINE RIBEIRO LUCAS FERNANDES - TESE (PPGEQ) 2022.pdf: 7578317 bytes, checksum: 4a528168cd721b1b0737cdae021ed9b3 (MD5)Made available in DSpace on 2022-08-11T14:19:47Z (GMT). No. of bitstreams: 1 THALITA CRISTINE RIBEIRO LUCAS FERNANDES - TESE (PPGEQ) 2022.pdf: 7578317 bytes, checksum: 4a528168cd721b1b0737cdae021ed9b3 (MD5) Previous issue date: 2022-04-27CapesUniversidade Federal de Campina GrandePÓS-GRADUAÇÃO EM ENGENHARIA QUÍMICAUFCGBrasilCentro de Ciências e Tecnologia - CCTEngenharia QuímicaModelos substitutosAlgoritmoAprendizado de máquinaAutomaçãoProcessos químicosSubstitute modelsAlgorithmMachine learningAutomationChemical processesModelos sustitutosAprendizaje automáticoAutomatizaciónProcesos químicosModèles de substitutionAlgorithmeApprentissage automatiqueAutomatisationProcédés chimiquesAlgoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.Inclusive feedback heuristic algorithm for process data regression.2022-04-272022-08-11T14:19:47Z2022-08-112022-08-11T14:19:47Zhttps://dspace.sti.ufcg.edu.br/handle/riufcg/26560FERNANDES, T. C. R. L. Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. 2022. 190 f. Tese (Doutorado em Engenharia Química) – Programa de Pós-Graduação em Engenharia Química, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2022.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCGTEXTTHALITA CRISTINE RIBEIRO LUCAS FERNANDES - TESE (PPGEQ) 2022.pdf.txtTHALITA CRISTINE RIBEIRO LUCAS FERNANDES - TESE (PPGEQ) 2022.pdf.txttext/plain327903https://dspace.sti.ufcg.edu.br/bitstream/riufcg/26560/3/THALITA+CRISTINE+RIBEIRO+LUCAS+FERNANDES+-+TESE+%28PPGEQ%29+2022.pdf.txt0f8840331fd4f7c8900b16102ec15392MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://dspace.sti.ufcg.edu.br/bitstream/riufcg/26560/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALTHALITA CRISTINE RIBEIRO LUCAS FERNANDES - TESE (PPGEQ) 2022.pdfTHALITA CRISTINE RIBEIRO LUCAS FERNANDES - TESE (PPGEQ) 2022.pdfapplication/pdf7578317https://dspace.sti.ufcg.edu.br/bitstream/riufcg/26560/1/THALITA+CRISTINE+RIBEIRO+LUCAS+FERNANDES+-+TESE+%28PPGEQ%29+2022.pdf4a528168cd721b1b0737cdae021ed9b3MD51riufcg/265602025-07-24 08:39:16.359oai:dspace.sti.ufcg.edu.br:riufcg/26560Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512025-07-24T11:39:16Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.pt_BR.fl_str_mv Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
dc.title.alternative.pt_BR.fl_str_mv Inclusive feedback heuristic algorithm for process data regression.
title Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
spellingShingle Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
FERNANDES, Thalita Cristine Ribeiro Lucas.
Engenharia Química
Modelos substitutos
Algoritmo
Aprendizado de máquina
Automação
Processos químicos
Substitute models
Algorithm
Machine learning
Automation
Chemical processes
Modelos sustitutos
Aprendizaje automático
Automatización
Procesos químicos
Modèles de substitution
Algorithme
Apprentissage automatique
Automatisation
Procédés chimiques
title_short Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
title_full Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
title_fullStr Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
title_full_unstemmed Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
title_sort Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
author FERNANDES, Thalita Cristine Ribeiro Lucas.
author_facet FERNANDES, Thalita Cristine Ribeiro Lucas.
author_role author
dc.contributor.advisor1.fl_str_mv ARAÚJO, Antonio Carlos Brandão de.
dc.contributor.advisor1ID.fl_str_mv ARAÚJO, A. C. B.
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/7308979392690336
dc.contributor.referee1.fl_str_mv P. NETO, Antonio Tavernard.
dc.contributor.referee2.fl_str_mv ALVES, José Jailson Nicácio.
dc.contributor.referee3.fl_str_mv SILVA, Vimário Simões.
dc.contributor.referee4.fl_str_mv SILVA, Sidinei Kleber da.
dc.contributor.referee5.fl_str_mv S. JÚNIOR, Heleno Bispo da.
dc.contributor.authorID.fl_str_mv FERNANDES, T. C. R. L.
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/2107979968723473
dc.contributor.author.fl_str_mv FERNANDES, Thalita Cristine Ribeiro Lucas.
contributor_str_mv ARAÚJO, Antonio Carlos Brandão de.
P. NETO, Antonio Tavernard.
ALVES, José Jailson Nicácio.
SILVA, Vimário Simões.
SILVA, Sidinei Kleber da.
S. JÚNIOR, Heleno Bispo da.
dc.subject.cnpq.fl_str_mv Engenharia Química
topic Engenharia Química
Modelos substitutos
Algoritmo
Aprendizado de máquina
Automação
Processos químicos
Substitute models
Algorithm
Machine learning
Automation
Chemical processes
Modelos sustitutos
Aprendizaje automático
Automatización
Procesos químicos
Modèles de substitution
Algorithme
Apprentissage automatique
Automatisation
Procédés chimiques
dc.subject.por.fl_str_mv Modelos substitutos
Algoritmo
Aprendizado de máquina
Automação
Processos químicos
Substitute models
Algorithm
Machine learning
Automation
Chemical processes
Modelos sustitutos
Aprendizaje automático
Automatización
Procesos químicos
Modèles de substitution
Algorithme
Apprentissage automatique
Automatisation
Procédés chimiques
description Este trabalho apresenta um algoritmo de aprendizado de máquina automatizado (AutoML) sitemático e simples. A principal contribuição é produzir o modelo de regressão mais simples, sempre que possível (ex.: modelo de regressão polinomial de segunda ordem via seleção de recursos sequenciais baseado nos mínimos quadrados) ou então, gerar modelos não lineares mais complexos (ex.: regressão gaussiana). O algoritmo é capaz de produzir estes resultados usando técnicas de design sequencial para preencher habilmente o espaço amostral com pontos “interessantes”, gerando um conjunto de dados que é utilizado para selecionar o modelo de regressão mais simples possível. Esse modelo mais simples é gerado de forma iterativa a partir de um conjunto predefinido de modelos de regressão candidatos. O objetivo é minimizar o número de chamadas para o processo gerador (simulador), resultando no menor número de amostras. Cada conjunto de dados produzidos iterativamente é usado de forma exaustiva e eficaz, capaz de convergir até mesmo respostas difíceis que requerem um grande número de amostras. A aplicação do algoritmo proposto em casos importantes (equações matemáticas de difícil resolução, coluna de destilação em Aspen Plus e uma Planta de tratamento de efluentes em Simulink) mostra sua efetividade na construção de metamodelos com capacidade preditiva significante. É sugerida a utilização de técnicas de regressão puramente não lineares em situações que as simulações demandem mais tempo do que o processamento do algoritmo. Em geral, um mix de métodos de regressão linear e não linear para a construção dos metamodelos é recomendada para a maioria dos casos, para compensar o tempo de processamento e a capacidade preditiva.
publishDate 2022
dc.date.issued.fl_str_mv 2022-04-27
dc.date.accessioned.fl_str_mv 2022-08-11T14:19:47Z
dc.date.available.fl_str_mv 2022-08-11
2022-08-11T14:19:47Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://dspace.sti.ufcg.edu.br/handle/riufcg/26560
dc.identifier.citation.fl_str_mv FERNANDES, T. C. R. L. Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. 2022. 190 f. Tese (Doutorado em Engenharia Química) – Programa de Pós-Graduação em Engenharia Química, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2022.
url https://dspace.sti.ufcg.edu.br/handle/riufcg/26560
identifier_str_mv FERNANDES, T. C. R. L. Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. 2022. 190 f. Tese (Doutorado em Engenharia Química) – Programa de Pós-Graduação em Engenharia Química, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2022.
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
dc.publisher.program.fl_str_mv PÓS-GRADUAÇÃO EM ENGENHARIA QUÍMICA
dc.publisher.initials.fl_str_mv UFCG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Centro de Ciências e Tecnologia - CCT
publisher.none.fl_str_mv Universidade Federal de Campina Grande
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
bitstream.url.fl_str_mv https://dspace.sti.ufcg.edu.br/bitstream/riufcg/26560/3/THALITA+CRISTINE+RIBEIRO+LUCAS+FERNANDES+-+TESE+%28PPGEQ%29+2022.pdf.txt
https://dspace.sti.ufcg.edu.br/bitstream/riufcg/26560/2/license.txt
https://dspace.sti.ufcg.edu.br/bitstream/riufcg/26560/1/THALITA+CRISTINE+RIBEIRO+LUCAS+FERNANDES+-+TESE+%28PPGEQ%29+2022.pdf
bitstream.checksum.fl_str_mv 0f8840331fd4f7c8900b16102ec15392
8a4605be74aa9ea9d79846c1fba20a33
4a528168cd721b1b0737cdae021ed9b3
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1863363519883247616