Aplicação de técnicas de aprendizado de máquina para a predição do índice de qualidade da água

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Nascimento, Mario Elias Carvalho do
Orientador(a): Dos Reis, Ralpho Rinaldo
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/1884/89304
Resumo: Orientador: Prof. Dr. Ralpho Rinaldo dos Reis
id UFPR_ef4a4d6dc8b06a9c0fe6b1803d82c284
oai_identifier_str oai:acervodigital.ufpr.br:1884/89304
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str
spelling Universidade Federal do Paraná. Setor Palotina. Programa de Pós-Graduação em Engenharia e Tecnologia AmbientalDos Reis, Ralpho RinaldoNascimento, Mario Elias Carvalho do2024-08-08T14:42:00Z2024-08-08T14:42:00Z2024https://hdl.handle.net/1884/89304Orientador: Prof. Dr. Ralpho Rinaldo dos ReisTese (doutorado) - Universidade Federal do Paraná, Setor Palotina, Programa de Pós-Graduação em Engenharia e Tecnologia Ambiental. Defesa : Palotina, 05/04/2024Inclui referênciasResumo: O monitoramento da qualidade da água é um tema relevante para a preservação da vida no planeta Terra. Uma das principais ferramentas empregadas nesse monitoramento é o Índice de Qualidade da Água (IQA), devido à sua fácil interpretação. No entanto, com o aumento da coleta de dados e, consequentemente, da complexidade dos sistemas, surge a necessidade de utilizar técnicas automatizadas e mais modernas. Este estudo teve como objetivo demonstrar a viabilidade técnica da aplicação de algoritmos de aprendizado de máquina para a predição e classificação multiclasse do IQA. Este trabalho de tese é constituído de dois artigos. No primeiro artigo, propôs-se a predição da classificação do IQA, utilizando 10 modelos clássicos de aprendizado de máquina: Análise Discriminante Linear (LDA), Análise Discriminante Quadrática (QDA), Regressão Logística (LR), Perceptron, Classificador Ridge (RC), Naive Bayes Gaussiano (GNB), K-vizinhos Mais Próximos (KNN), Máquina de Vetor de Suporte (SVM), Perceptron multicamadas (MLP) e Árvore de Decisão (DT), além de 5 conjuntos de modelos: AdaBoost (ADA), Bagging (BAG), Extra Trees (ET), Gradiente Boosting (GDB) e Floresta Aleatória (RF). No segundo artigo, propôs-se a predição do valor numérico do IQA, utilizando 6 algoritmos de aprendizado de máquina clássicos: K-vizinhos Mais Próximos (KNN), ElastiNetCV, Máquina de Vetor de Suporte Linear (LSVM), Máquina de Vetor de Suporte (SVM), Perceptron multicamadas (MLP) e Árvore de Decisão (DT); e, também, os 5 conjuntos de modelos anteriormente mencionados. Os modelos foram avaliados estatisticamente por meio das métricas de classificação, como: acurácia balanceada, precisão, revocação, f1 e matriz de confusão e pelas métricas de regressão, como: Erro Quadrático Médio (MSE), Raiz do Erro Quadrático Médio (RMSE) e Erro Médio Absoluto (MAE). Os algoritmos que apresentaram melhor desempenho tanto na classificação quanto na regressão foram: SVM, MLP, GDB e KNN. Além disso, foi demonstrada a possibilidade de redução do número de variáveis explicativas para os modelos de classificação e de regressão, passando de 9 variáveis (pH, oxigênio dissolvido, demanda bioquímica de oxigênio, nitrogênio total, fósforo total, coliformes fecais, sólidos totais, turbidez e temperatura) que compõem o IQA para apenas as 4 variáveis mais importantes (coliformes fecais, oxigênio dissolvido, demanda bioquímica de oxigênio e fósforo total). Para esta redução, foram utilizadas a técnica de importância relativa das variáveis na classificação e o coeficiente de Spearman na regressão. Por fim, observou-se que os algoritmos utilizados na regressão apresentaram valores de métricas ligeiramente melhores em comparação com os algoritmos de classificação.Abstract: Monitoring water quality is a relevant topic for sustaining life on planet Earth. One of the main tools used for this monitoring is the Water Quality Index (WQI), due to its easy interpretation. However, with the increase in data collection and consequently in the complexity of systems, there is a need for the use of automated and more modern techniques. This study aimed to demonstrate the technical feasibility of applying machine learning algorithms for the prediction and multiclass classification of the Water Quality Index (WQI). In the first article, the classification of WQI as a qualitative variable was proposed using 10 classic machine learning models, including Linear Discriminant Analysis (LDA), Quadratic Discriminant Analysis (QDA), Logistic Regression (LR), Perceptron, Ridge Classifier (RC), Gaussian Naive Bayes (GNB), K-Nearest Neighbors (KNN), Support Vector Machine (SVM), Multilayer Perceptron (MLP), and Decision Tree (DT), in addition to the 5 ensembles models: AdaBoost (ADA), Bagging (BAG), Extra Trees (ET), Gradient Boosting (GDB), and Random Forest (RF). In the second article, the prediction of the numerical value of the WQI was proposed using 11 machine learning algorithms, including 6 classic models: K-Nearest Neighbors (KNN), ElastiNetCV, Linear Support Vector Machine (LSVM), Support Vector Machine (SVM), Multilayer Perceptron (MLP), and Decision Tree (DT), as well as the 5 ensembles models mentioned earlier. The models were statistically evaluated using regression metrics such as Mean Squared Error (MSE), Root Mean Squared Error (RMSE), and Mean Absolute Error (MAE), as well as classification metrics including balanced accuracy, precision, recall, f1-score, and confusion matrix. The algorithms that showed the best performance in both prediction and classification were: SVM, MLP, GDB, and KNN. It was demonstrated that it is possible to reduce the number of explanatory variables for both tasks, going from the 9 variables (pH, dissolved oxygen, biochemical oxygen demand, total nitrogen, total phosphorus, fecal coliforms, total solids, turbidity, and temperature) that compose the WQI to only the 4 most important variables (fecal coliforms, dissolved oxygen, biochemical oxygen demand, and total phosphorus). For this reduction, techniques of relative importance of variables for classification and the Spearman coefficient for regression were used. Finally, it was observed that the regression technique presented slightly better metric values compared to the classification technique.1 recurso online : PDF.application/pdfInteligencia artificial - Aplicações educacionaisAprendizado do computadorAnalise de regressãoEngenharia SanitáriaAplicação de técnicas de aprendizado de máquina para a predição do índice de qualidade da águainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - T - MARIO ELIAS CARVALHO DO NASCIMENTO.pdfapplication/pdf2931355https://acervodigital.ufpr.br/bitstream/1884/89304/1/R%20-%20T%20-%20MARIO%20ELIAS%20CARVALHO%20DO%20NASCIMENTO.pdf151d54437486f06768c3e05d74c70a9aMD51open access1884/893042024-08-08 11:42:00.223open accessoai:acervodigital.ufpr.br:1884/89304Repositório InstitucionalPUBhttp://acervodigital.ufpr.br/oai/requestinformacaodigital@ufpr.bropendoar:3082024-08-08T14:42Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Aplicação de técnicas de aprendizado de máquina para a predição do índice de qualidade da água
title Aplicação de técnicas de aprendizado de máquina para a predição do índice de qualidade da água
spellingShingle Aplicação de técnicas de aprendizado de máquina para a predição do índice de qualidade da água
Nascimento, Mario Elias Carvalho do
Inteligencia artificial - Aplicações educacionais
Aprendizado do computador
Analise de regressão
Engenharia Sanitária
title_short Aplicação de técnicas de aprendizado de máquina para a predição do índice de qualidade da água
title_full Aplicação de técnicas de aprendizado de máquina para a predição do índice de qualidade da água
title_fullStr Aplicação de técnicas de aprendizado de máquina para a predição do índice de qualidade da água
title_full_unstemmed Aplicação de técnicas de aprendizado de máquina para a predição do índice de qualidade da água
title_sort Aplicação de técnicas de aprendizado de máquina para a predição do índice de qualidade da água
author Nascimento, Mario Elias Carvalho do
author_facet Nascimento, Mario Elias Carvalho do
author_role author
dc.contributor.other.pt_BR.fl_str_mv Universidade Federal do Paraná. Setor Palotina. Programa de Pós-Graduação em Engenharia e Tecnologia Ambiental
dc.contributor.advisor1.fl_str_mv Dos Reis, Ralpho Rinaldo
dc.contributor.author.fl_str_mv Nascimento, Mario Elias Carvalho do
contributor_str_mv Dos Reis, Ralpho Rinaldo
dc.subject.por.fl_str_mv Inteligencia artificial - Aplicações educacionais
Aprendizado do computador
Analise de regressão
Engenharia Sanitária
topic Inteligencia artificial - Aplicações educacionais
Aprendizado do computador
Analise de regressão
Engenharia Sanitária
description Orientador: Prof. Dr. Ralpho Rinaldo dos Reis
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-08-08T14:42:00Z
dc.date.available.fl_str_mv 2024-08-08T14:42:00Z
dc.date.issued.fl_str_mv 2024
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/89304
url https://hdl.handle.net/1884/89304
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 1 recurso online : PDF.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/89304/1/R%20-%20T%20-%20MARIO%20ELIAS%20CARVALHO%20DO%20NASCIMENTO.pdf
bitstream.checksum.fl_str_mv 151d54437486f06768c3e05d74c70a9a
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv informacaodigital@ufpr.br
_version_ 1847526057787260928