Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | , , , , |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Campina Grande
|
| Programa de Pós-Graduação: |
PÓS-GRADUAÇÃO EM ENGENHARIA QUÍMICA
|
| Departamento: |
Centro de Ciências e Tecnologia - CCT
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://dspace.sti.ufcg.edu.br/handle/riufcg/26560 |
Resumo: | Este trabalho apresenta um algoritmo de aprendizado de máquina automatizado (AutoML) sitemático e simples. A principal contribuição é produzir o modelo de regressão mais simples, sempre que possível (ex.: modelo de regressão polinomial de segunda ordem via seleção de recursos sequenciais baseado nos mínimos quadrados) ou então, gerar modelos não lineares mais complexos (ex.: regressão gaussiana). O algoritmo é capaz de produzir estes resultados usando técnicas de design sequencial para preencher habilmente o espaço amostral com pontos “interessantes”, gerando um conjunto de dados que é utilizado para selecionar o modelo de regressão mais simples possível. Esse modelo mais simples é gerado de forma iterativa a partir de um conjunto predefinido de modelos de regressão candidatos. O objetivo é minimizar o número de chamadas para o processo gerador (simulador), resultando no menor número de amostras. Cada conjunto de dados produzidos iterativamente é usado de forma exaustiva e eficaz, capaz de convergir até mesmo respostas difíceis que requerem um grande número de amostras. A aplicação do algoritmo proposto em casos importantes (equações matemáticas de difícil resolução, coluna de destilação em Aspen Plus e uma Planta de tratamento de efluentes em Simulink) mostra sua efetividade na construção de metamodelos com capacidade preditiva significante. É sugerida a utilização de técnicas de regressão puramente não lineares em situações que as simulações demandem mais tempo do que o processamento do algoritmo. Em geral, um mix de métodos de regressão linear e não linear para a construção dos metamodelos é recomendada para a maioria dos casos, para compensar o tempo de processamento e a capacidade preditiva. |
| id |
UFCG_e1aa1bfa185bdb0f1ccaf441f1718dd8 |
|---|---|
| oai_identifier_str |
oai:dspace.sti.ufcg.edu.br:riufcg/26560 |
| network_acronym_str |
UFCG |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
| repository_id_str |
|
| spelling |
ARAÚJO, Antonio Carlos Brandão de.ARAÚJO, A. C. B.http://lattes.cnpq.br/7308979392690336P. NETO, Antonio Tavernard.ALVES, José Jailson Nicácio.SILVA, Vimário Simões.SILVA, Sidinei Kleber da.S. JÚNIOR, Heleno Bispo da.FERNANDES, T. C. R. L.http://lattes.cnpq.br/2107979968723473FERNANDES, Thalita Cristine Ribeiro Lucas.Este trabalho apresenta um algoritmo de aprendizado de máquina automatizado (AutoML) sitemático e simples. A principal contribuição é produzir o modelo de regressão mais simples, sempre que possível (ex.: modelo de regressão polinomial de segunda ordem via seleção de recursos sequenciais baseado nos mínimos quadrados) ou então, gerar modelos não lineares mais complexos (ex.: regressão gaussiana). O algoritmo é capaz de produzir estes resultados usando técnicas de design sequencial para preencher habilmente o espaço amostral com pontos “interessantes”, gerando um conjunto de dados que é utilizado para selecionar o modelo de regressão mais simples possível. Esse modelo mais simples é gerado de forma iterativa a partir de um conjunto predefinido de modelos de regressão candidatos. O objetivo é minimizar o número de chamadas para o processo gerador (simulador), resultando no menor número de amostras. Cada conjunto de dados produzidos iterativamente é usado de forma exaustiva e eficaz, capaz de convergir até mesmo respostas difíceis que requerem um grande número de amostras. A aplicação do algoritmo proposto em casos importantes (equações matemáticas de difícil resolução, coluna de destilação em Aspen Plus e uma Planta de tratamento de efluentes em Simulink) mostra sua efetividade na construção de metamodelos com capacidade preditiva significante. É sugerida a utilização de técnicas de regressão puramente não lineares em situações que as simulações demandem mais tempo do que o processamento do algoritmo. Em geral, um mix de métodos de regressão linear e não linear para a construção dos metamodelos é recomendada para a maioria dos casos, para compensar o tempo de processamento e a capacidade preditiva.This is an attempt to create a simple, but quite systematic, automated machine learning (AutoML) algorithm. The main contribution is to produce the simplest regression model (e.g., second order polynomial regression model via OLS based sequential feature selection) whenever possible, or else generate more complex, and therefore less desirable, nonlinear (e.g., gaussian process regression) models. It does so by efficiently using sequential design techniques to cleverly fill the sample space with “interesting” points, generating a dataset (which includes the responses obtained by “querying” the actual underlying process) on demand that is used to select the simplest possible regression model, among a predefined set of candidate regression models, in an iteratively way until particular convergence criteria are met. The intended goal is therefore to minimize the number of calls to the generating process, resulting in the least number of samples. Each dataset produced iteratively is exhaustively and effectively used up in an effort to converge even difficult responses that have not met the criteria even with a large number of samples. Application of the proposed algorithm to important cases shows its effectiveness in building metamodels with significant predictive capabilities. It is suggested the use of pure nonlinear regression techniques in situations in which data takes more time to gather than to be processed by the algorithm. In general, a carefully chosen mix of both linear and nonlinear regression methods to metamodel building is recommended for most cases, as a tradeoff between processing time and predictive capacity.Submitted by Maria Medeiros (maria.dilva1@ufcg.edu.br) on 2022-08-11T14:19:47Z No. of bitstreams: 1 THALITA CRISTINE RIBEIRO LUCAS FERNANDES - TESE (PPGEQ) 2022.pdf: 7578317 bytes, checksum: 4a528168cd721b1b0737cdae021ed9b3 (MD5)Made available in DSpace on 2022-08-11T14:19:47Z (GMT). No. of bitstreams: 1 THALITA CRISTINE RIBEIRO LUCAS FERNANDES - TESE (PPGEQ) 2022.pdf: 7578317 bytes, checksum: 4a528168cd721b1b0737cdae021ed9b3 (MD5) Previous issue date: 2022-04-27CapesUniversidade Federal de Campina GrandePÓS-GRADUAÇÃO EM ENGENHARIA QUÍMICAUFCGBrasilCentro de Ciências e Tecnologia - CCTEngenharia QuímicaModelos substitutosAlgoritmoAprendizado de máquinaAutomaçãoProcessos químicosSubstitute modelsAlgorithmMachine learningAutomationChemical processesModelos sustitutosAprendizaje automáticoAutomatizaciónProcesos químicosModèles de substitutionAlgorithmeApprentissage automatiqueAutomatisationProcédés chimiquesAlgoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.Inclusive feedback heuristic algorithm for process data regression.2022-04-272022-08-11T14:19:47Z2022-08-112022-08-11T14:19:47Zhttps://dspace.sti.ufcg.edu.br/handle/riufcg/26560FERNANDES, T. C. R. L. Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. 2022. 190 f. Tese (Doutorado em Engenharia Química) – Programa de Pós-Graduação em Engenharia Química, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2022.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCGTEXTTHALITA CRISTINE RIBEIRO LUCAS FERNANDES - TESE (PPGEQ) 2022.pdf.txtTHALITA CRISTINE RIBEIRO LUCAS FERNANDES - TESE (PPGEQ) 2022.pdf.txttext/plain327903https://dspace.sti.ufcg.edu.br/bitstream/riufcg/26560/3/THALITA+CRISTINE+RIBEIRO+LUCAS+FERNANDES+-+TESE+%28PPGEQ%29+2022.pdf.txt0f8840331fd4f7c8900b16102ec15392MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://dspace.sti.ufcg.edu.br/bitstream/riufcg/26560/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALTHALITA CRISTINE RIBEIRO LUCAS FERNANDES - TESE (PPGEQ) 2022.pdfTHALITA CRISTINE RIBEIRO LUCAS FERNANDES - TESE (PPGEQ) 2022.pdfapplication/pdf7578317https://dspace.sti.ufcg.edu.br/bitstream/riufcg/26560/1/THALITA+CRISTINE+RIBEIRO+LUCAS+FERNANDES+-+TESE+%28PPGEQ%29+2022.pdf4a528168cd721b1b0737cdae021ed9b3MD51riufcg/265602025-07-24 08:39:16.359oai:dspace.sti.ufcg.edu.br:riufcg/26560Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512025-07-24T11:39:16Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false |
| dc.title.pt_BR.fl_str_mv |
Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. |
| dc.title.alternative.pt_BR.fl_str_mv |
Inclusive feedback heuristic algorithm for process data regression. |
| title |
Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. |
| spellingShingle |
Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. FERNANDES, Thalita Cristine Ribeiro Lucas. Engenharia Química Modelos substitutos Algoritmo Aprendizado de máquina Automação Processos químicos Substitute models Algorithm Machine learning Automation Chemical processes Modelos sustitutos Aprendizaje automático Automatización Procesos químicos Modèles de substitution Algorithme Apprentissage automatique Automatisation Procédés chimiques |
| title_short |
Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. |
| title_full |
Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. |
| title_fullStr |
Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. |
| title_full_unstemmed |
Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. |
| title_sort |
Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. |
| author |
FERNANDES, Thalita Cristine Ribeiro Lucas. |
| author_facet |
FERNANDES, Thalita Cristine Ribeiro Lucas. |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
ARAÚJO, Antonio Carlos Brandão de. |
| dc.contributor.advisor1ID.fl_str_mv |
ARAÚJO, A. C. B. |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/7308979392690336 |
| dc.contributor.referee1.fl_str_mv |
P. NETO, Antonio Tavernard. |
| dc.contributor.referee2.fl_str_mv |
ALVES, José Jailson Nicácio. |
| dc.contributor.referee3.fl_str_mv |
SILVA, Vimário Simões. |
| dc.contributor.referee4.fl_str_mv |
SILVA, Sidinei Kleber da. |
| dc.contributor.referee5.fl_str_mv |
S. JÚNIOR, Heleno Bispo da. |
| dc.contributor.authorID.fl_str_mv |
FERNANDES, T. C. R. L. |
| dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/2107979968723473 |
| dc.contributor.author.fl_str_mv |
FERNANDES, Thalita Cristine Ribeiro Lucas. |
| contributor_str_mv |
ARAÚJO, Antonio Carlos Brandão de. P. NETO, Antonio Tavernard. ALVES, José Jailson Nicácio. SILVA, Vimário Simões. SILVA, Sidinei Kleber da. S. JÚNIOR, Heleno Bispo da. |
| dc.subject.cnpq.fl_str_mv |
Engenharia Química |
| topic |
Engenharia Química Modelos substitutos Algoritmo Aprendizado de máquina Automação Processos químicos Substitute models Algorithm Machine learning Automation Chemical processes Modelos sustitutos Aprendizaje automático Automatización Procesos químicos Modèles de substitution Algorithme Apprentissage automatique Automatisation Procédés chimiques |
| dc.subject.por.fl_str_mv |
Modelos substitutos Algoritmo Aprendizado de máquina Automação Processos químicos Substitute models Algorithm Machine learning Automation Chemical processes Modelos sustitutos Aprendizaje automático Automatización Procesos químicos Modèles de substitution Algorithme Apprentissage automatique Automatisation Procédés chimiques |
| description |
Este trabalho apresenta um algoritmo de aprendizado de máquina automatizado (AutoML) sitemático e simples. A principal contribuição é produzir o modelo de regressão mais simples, sempre que possível (ex.: modelo de regressão polinomial de segunda ordem via seleção de recursos sequenciais baseado nos mínimos quadrados) ou então, gerar modelos não lineares mais complexos (ex.: regressão gaussiana). O algoritmo é capaz de produzir estes resultados usando técnicas de design sequencial para preencher habilmente o espaço amostral com pontos “interessantes”, gerando um conjunto de dados que é utilizado para selecionar o modelo de regressão mais simples possível. Esse modelo mais simples é gerado de forma iterativa a partir de um conjunto predefinido de modelos de regressão candidatos. O objetivo é minimizar o número de chamadas para o processo gerador (simulador), resultando no menor número de amostras. Cada conjunto de dados produzidos iterativamente é usado de forma exaustiva e eficaz, capaz de convergir até mesmo respostas difíceis que requerem um grande número de amostras. A aplicação do algoritmo proposto em casos importantes (equações matemáticas de difícil resolução, coluna de destilação em Aspen Plus e uma Planta de tratamento de efluentes em Simulink) mostra sua efetividade na construção de metamodelos com capacidade preditiva significante. É sugerida a utilização de técnicas de regressão puramente não lineares em situações que as simulações demandem mais tempo do que o processamento do algoritmo. Em geral, um mix de métodos de regressão linear e não linear para a construção dos metamodelos é recomendada para a maioria dos casos, para compensar o tempo de processamento e a capacidade preditiva. |
| publishDate |
2022 |
| dc.date.issued.fl_str_mv |
2022-04-27 |
| dc.date.accessioned.fl_str_mv |
2022-08-11T14:19:47Z |
| dc.date.available.fl_str_mv |
2022-08-11 2022-08-11T14:19:47Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://dspace.sti.ufcg.edu.br/handle/riufcg/26560 |
| dc.identifier.citation.fl_str_mv |
FERNANDES, T. C. R. L. Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. 2022. 190 f. Tese (Doutorado em Engenharia Química) – Programa de Pós-Graduação em Engenharia Química, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2022. |
| url |
https://dspace.sti.ufcg.edu.br/handle/riufcg/26560 |
| identifier_str_mv |
FERNANDES, T. C. R. L. Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. 2022. 190 f. Tese (Doutorado em Engenharia Química) – Programa de Pós-Graduação em Engenharia Química, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2022. |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Campina Grande |
| dc.publisher.program.fl_str_mv |
PÓS-GRADUAÇÃO EM ENGENHARIA QUÍMICA |
| dc.publisher.initials.fl_str_mv |
UFCG |
| dc.publisher.country.fl_str_mv |
Brasil |
| dc.publisher.department.fl_str_mv |
Centro de Ciências e Tecnologia - CCT |
| publisher.none.fl_str_mv |
Universidade Federal de Campina Grande |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG |
| instname_str |
Universidade Federal de Campina Grande (UFCG) |
| instacron_str |
UFCG |
| institution |
UFCG |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
| collection |
Biblioteca Digital de Teses e Dissertações da UFCG |
| bitstream.url.fl_str_mv |
https://dspace.sti.ufcg.edu.br/bitstream/riufcg/26560/3/THALITA+CRISTINE+RIBEIRO+LUCAS+FERNANDES+-+TESE+%28PPGEQ%29+2022.pdf.txt https://dspace.sti.ufcg.edu.br/bitstream/riufcg/26560/2/license.txt https://dspace.sti.ufcg.edu.br/bitstream/riufcg/26560/1/THALITA+CRISTINE+RIBEIRO+LUCAS+FERNANDES+-+TESE+%28PPGEQ%29+2022.pdf |
| bitstream.checksum.fl_str_mv |
0f8840331fd4f7c8900b16102ec15392 8a4605be74aa9ea9d79846c1fba20a33 4a528168cd721b1b0737cdae021ed9b3 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG) |
| repository.mail.fl_str_mv |
bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br |
| _version_ |
1863363519883247616 |