Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: FERNANDES, Thalita Cristine Ribeiro Lucas.
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Campina Grande
Brasil
Centro de Ciências e Tecnologia - CCT
PÓS-GRADUAÇÃO EM ENGENHARIA QUÍMICA
UFCG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/26560
Resumo: Este trabalho apresenta um algoritmo de aprendizado de máquina automatizado (AutoML) sitemático e simples. A principal contribuição é produzir o modelo de regressão mais simples, sempre que possível (ex.: modelo de regressão polinomial de segunda ordem via seleção de recursos sequenciais baseado nos mínimos quadrados) ou então, gerar modelos não lineares mais complexos (ex.: regressão gaussiana). O algoritmo é capaz de produzir estes resultados usando técnicas de design sequencial para preencher habilmente o espaço amostral com pontos “interessantes”, gerando um conjunto de dados que é utilizado para selecionar o modelo de regressão mais simples possível. Esse modelo mais simples é gerado de forma iterativa a partir de um conjunto predefinido de modelos de regressão candidatos. O objetivo é minimizar o número de chamadas para o processo gerador (simulador), resultando no menor número de amostras. Cada conjunto de dados produzidos iterativamente é usado de forma exaustiva e eficaz, capaz de convergir até mesmo respostas difíceis que requerem um grande número de amostras. A aplicação do algoritmo proposto em casos importantes (equações matemáticas de difícil resolução, coluna de destilação em Aspen Plus e uma Planta de tratamento de efluentes em Simulink) mostra sua efetividade na construção de metamodelos com capacidade preditiva significante. É sugerida a utilização de técnicas de regressão puramente não lineares em situações que as simulações demandem mais tempo do que o processamento do algoritmo. Em geral, um mix de métodos de regressão linear e não linear para a construção dos metamodelos é recomendada para a maioria dos casos, para compensar o tempo de processamento e a capacidade preditiva.
id UCB-2_e70452c87f1caa5ef43d0ec72ec4f881
oai_identifier_str oai:localhost:riufcg/26560
network_acronym_str UCB-2
network_name_str Repositório Institucional da UCB
repository_id_str
spelling Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.Inclusive feedback heuristic algorithm for process data regression.Modelos substitutosAlgoritmoAprendizado de máquinaAutomaçãoProcessos químicosSubstitute modelsAlgorithmMachine learningAutomationChemical processesModelos sustitutosAprendizaje automáticoAutomatizaciónProcesos químicosModèles de substitutionAlgorithmeApprentissage automatiqueAutomatisationProcédés chimiquesEngenharia QuímicaEste trabalho apresenta um algoritmo de aprendizado de máquina automatizado (AutoML) sitemático e simples. A principal contribuição é produzir o modelo de regressão mais simples, sempre que possível (ex.: modelo de regressão polinomial de segunda ordem via seleção de recursos sequenciais baseado nos mínimos quadrados) ou então, gerar modelos não lineares mais complexos (ex.: regressão gaussiana). O algoritmo é capaz de produzir estes resultados usando técnicas de design sequencial para preencher habilmente o espaço amostral com pontos “interessantes”, gerando um conjunto de dados que é utilizado para selecionar o modelo de regressão mais simples possível. Esse modelo mais simples é gerado de forma iterativa a partir de um conjunto predefinido de modelos de regressão candidatos. O objetivo é minimizar o número de chamadas para o processo gerador (simulador), resultando no menor número de amostras. Cada conjunto de dados produzidos iterativamente é usado de forma exaustiva e eficaz, capaz de convergir até mesmo respostas difíceis que requerem um grande número de amostras. A aplicação do algoritmo proposto em casos importantes (equações matemáticas de difícil resolução, coluna de destilação em Aspen Plus e uma Planta de tratamento de efluentes em Simulink) mostra sua efetividade na construção de metamodelos com capacidade preditiva significante. É sugerida a utilização de técnicas de regressão puramente não lineares em situações que as simulações demandem mais tempo do que o processamento do algoritmo. Em geral, um mix de métodos de regressão linear e não linear para a construção dos metamodelos é recomendada para a maioria dos casos, para compensar o tempo de processamento e a capacidade preditiva.This is an attempt to create a simple, but quite systematic, automated machine learning (AutoML) algorithm. The main contribution is to produce the simplest regression model (e.g., second order polynomial regression model via OLS based sequential feature selection) whenever possible, or else generate more complex, and therefore less desirable, nonlinear (e.g., gaussian process regression) models. It does so by efficiently using sequential design techniques to cleverly fill the sample space with “interesting” points, generating a dataset (which includes the responses obtained by “querying” the actual underlying process) on demand that is used to select the simplest possible regression model, among a predefined set of candidate regression models, in an iteratively way until particular convergence criteria are met. The intended goal is therefore to minimize the number of calls to the generating process, resulting in the least number of samples. Each dataset produced iteratively is exhaustively and effectively used up in an effort to converge even difficult responses that have not met the criteria even with a large number of samples. Application of the proposed algorithm to important cases shows its effectiveness in building metamodels with significant predictive capabilities. It is suggested the use of pure nonlinear regression techniques in situations in which data takes more time to gather than to be processed by the algorithm. In general, a carefully chosen mix of both linear and nonlinear regression methods to metamodel building is recommended for most cases, as a tradeoff between processing time and predictive capacity.CapesUniversidade Federal de Campina GrandeBrasilCentro de Ciências e Tecnologia - CCTPÓS-GRADUAÇÃO EM ENGENHARIA QUÍMICAUFCGARAÚJO, Antonio Carlos Brandão de.ARAÚJO, A. C. B.http://lattes.cnpq.br/7308979392690336P. NETO, Antonio Tavernard.ALVES, José Jailson Nicácio.SILVA, Vimário Simões.SILVA, Sidinei Kleber da.S. JÚNIOR, Heleno Bispo da.FERNANDES, Thalita Cristine Ribeiro Lucas.2022-04-272022-08-11T14:19:47Z2022-08-112022-08-11T14:19:47Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/26560FERNANDES, T. C. R. L. Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. 2022. 190 f. Tese (Doutorado em Engenharia Química) – Programa de Pós-Graduação em Engenharia Química, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2022.porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UCBinstname:Universidade Católica de Brasília (UCB)instacron:UCB2022-08-11T14:19:47Zoai:localhost:riufcg/26560Repositório InstitucionalPRIhttps://repositorio.ucb.br/oai/requestsara.ribeiro@ucb.bropendoar:2022-08-11T14:19:47Repositório Institucional da UCB - Universidade Católica de Brasília (UCB)false
dc.title.none.fl_str_mv Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
Inclusive feedback heuristic algorithm for process data regression.
title Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
spellingShingle Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
FERNANDES, Thalita Cristine Ribeiro Lucas.
Modelos substitutos
Algoritmo
Aprendizado de máquina
Automação
Processos químicos
Substitute models
Algorithm
Machine learning
Automation
Chemical processes
Modelos sustitutos
Aprendizaje automático
Automatización
Procesos químicos
Modèles de substitution
Algorithme
Apprentissage automatique
Automatisation
Procédés chimiques
Engenharia Química
title_short Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
title_full Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
title_fullStr Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
title_full_unstemmed Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
title_sort Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo.
author FERNANDES, Thalita Cristine Ribeiro Lucas.
author_facet FERNANDES, Thalita Cristine Ribeiro Lucas.
author_role author
dc.contributor.none.fl_str_mv ARAÚJO, Antonio Carlos Brandão de.
ARAÚJO, A. C. B.
http://lattes.cnpq.br/7308979392690336
P. NETO, Antonio Tavernard.
ALVES, José Jailson Nicácio.
SILVA, Vimário Simões.
SILVA, Sidinei Kleber da.
S. JÚNIOR, Heleno Bispo da.
dc.contributor.author.fl_str_mv FERNANDES, Thalita Cristine Ribeiro Lucas.
dc.subject.por.fl_str_mv Modelos substitutos
Algoritmo
Aprendizado de máquina
Automação
Processos químicos
Substitute models
Algorithm
Machine learning
Automation
Chemical processes
Modelos sustitutos
Aprendizaje automático
Automatización
Procesos químicos
Modèles de substitution
Algorithme
Apprentissage automatique
Automatisation
Procédés chimiques
Engenharia Química
topic Modelos substitutos
Algoritmo
Aprendizado de máquina
Automação
Processos químicos
Substitute models
Algorithm
Machine learning
Automation
Chemical processes
Modelos sustitutos
Aprendizaje automático
Automatización
Procesos químicos
Modèles de substitution
Algorithme
Apprentissage automatique
Automatisation
Procédés chimiques
Engenharia Química
description Este trabalho apresenta um algoritmo de aprendizado de máquina automatizado (AutoML) sitemático e simples. A principal contribuição é produzir o modelo de regressão mais simples, sempre que possível (ex.: modelo de regressão polinomial de segunda ordem via seleção de recursos sequenciais baseado nos mínimos quadrados) ou então, gerar modelos não lineares mais complexos (ex.: regressão gaussiana). O algoritmo é capaz de produzir estes resultados usando técnicas de design sequencial para preencher habilmente o espaço amostral com pontos “interessantes”, gerando um conjunto de dados que é utilizado para selecionar o modelo de regressão mais simples possível. Esse modelo mais simples é gerado de forma iterativa a partir de um conjunto predefinido de modelos de regressão candidatos. O objetivo é minimizar o número de chamadas para o processo gerador (simulador), resultando no menor número de amostras. Cada conjunto de dados produzidos iterativamente é usado de forma exaustiva e eficaz, capaz de convergir até mesmo respostas difíceis que requerem um grande número de amostras. A aplicação do algoritmo proposto em casos importantes (equações matemáticas de difícil resolução, coluna de destilação em Aspen Plus e uma Planta de tratamento de efluentes em Simulink) mostra sua efetividade na construção de metamodelos com capacidade preditiva significante. É sugerida a utilização de técnicas de regressão puramente não lineares em situações que as simulações demandem mais tempo do que o processamento do algoritmo. Em geral, um mix de métodos de regressão linear e não linear para a construção dos metamodelos é recomendada para a maioria dos casos, para compensar o tempo de processamento e a capacidade preditiva.
publishDate 2022
dc.date.none.fl_str_mv 2022-04-27
2022-08-11T14:19:47Z
2022-08-11
2022-08-11T14:19:47Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/26560
FERNANDES, T. C. R. L. Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. 2022. 190 f. Tese (Doutorado em Engenharia Química) – Programa de Pós-Graduação em Engenharia Química, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2022.
url http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/26560
identifier_str_mv FERNANDES, T. C. R. L. Algoritmo heurístico de retroalimentação inclusiva para regressão de dados de processo. 2022. 190 f. Tese (Doutorado em Engenharia Química) – Programa de Pós-Graduação em Engenharia Química, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2022.
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Ciências e Tecnologia - CCT
PÓS-GRADUAÇÃO EM ENGENHARIA QUÍMICA
UFCG
publisher.none.fl_str_mv Universidade Federal de Campina Grande
Brasil
Centro de Ciências e Tecnologia - CCT
PÓS-GRADUAÇÃO EM ENGENHARIA QUÍMICA
UFCG
dc.source.none.fl_str_mv reponame:Repositório Institucional da UCB
instname:Universidade Católica de Brasília (UCB)
instacron:UCB
instname_str Universidade Católica de Brasília (UCB)
instacron_str UCB
institution UCB
reponame_str Repositório Institucional da UCB
collection Repositório Institucional da UCB
repository.name.fl_str_mv Repositório Institucional da UCB - Universidade Católica de Brasília (UCB)
repository.mail.fl_str_mv sara.ribeiro@ucb.br
_version_ 1834013213650321408