Exportação concluída — 

Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: PORTO, Wellington Weikamp
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Catolica de Pelotas
Centro de Ciencias Sociais e Tecnologicas
Brasil
UCPel
Mestrado em Engenharia Eletronica e Computacao
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://tede.ucpel.edu.br:8080/jspui/handle/jspui/1030
Resumo: A água potável é crucial para diversos aspectos da vida, influenciando diretamente na saúde, no desenvolvimento socioeconômico e na preservação ambiental. A Organização Mundial da Saúde (OMS) estima que aproximadamente 1 milhão de mortes ocorram anualmente devido a doenças causadas pela ingestão de água contaminada, falta de saneamento e práticas inadequa das de higiene. Para promover a garantia da qualidade da água, a OMS destaca a importância do tratamento e da análise rigorosa, utilizando parâmetros padronizados para determinar sua ade quação para consumo humano. Neste contexto, empregamos um conjunto de dados composto por 3276 amostras, cada uma caracterizada por dez atributos e uma variável de desfecho indi cando a potabilidade da água, obtido no repositório Kaggle. Utilizando técnicas de inteligência artificial, especialmente modelos de aprendizagem supervisionada, visamos classificar a potabi lidade da água. Os modelos desenvolvidos foram treinados com diversos algoritmos, incluindo Naive Bayes (NB), Logistic Regression (LR), Decision Trees (DT), Support Vector Machine (SVM), Random Forest (RF) e Multilayer Perceptron (MLP). A avaliação de desempenho de cada modelo baseou-se em métricas como acurácia, precisão e a AUC. Para manipulação e de senvolvimento dos modelos, empregamos a linguagem Python e suas bibliotecas especializadas em inteligência artificial. Aplicamos técnicas de pré-processamento para lidar com dados faltan tes, outliers, redimensionamento e balanceamento da variável de desfecho. Destacamos ainda que implementamos os modelos utilizando diversas técnicas de pré-processamento de dados, incluindo a aplicação do algoritmo Skewed Chi Squared Kernel (SCSK) nos modelos baseados em SVM. O modelo que obteve o melhor desempenho foi o baseado em SVM, alcançando 87% de acurácia após a aplicação da técnica SCSK, combinada com média aritmética para valores nulos, substituição de fora do padrão pela mediana, normalização dos dados utilizando a téc nica mín-máx e balanceamento dos dados por meio da técnica de sobre amostragem minoritária sintética (SMOTE). Esses resultados demonstram um desempenho eficaz na classificação da potabilidade da água, comparável a outros estudos encontrados na literatura, considerando as limitações inerentes ao conjunto de dados utilizado.
id UCPe_adef93b2ab2337bc3a0191a74cc6a31e
oai_identifier_str oai:tede.ucpel.edu.br:jspui/1030
network_acronym_str UCPe
network_name_str Biblioteca Digital de Teses e Dissertações do UCpel
repository_id_str
spelling Uso de modelos de aprendizado supervisionado para classificação da potabilidade da águaaprendizado de máquina; inteligência artificial; qualidade da água; potabilidade da água; aprendizagem supervisionadamachine learning; artificial intelligence; water quality; water potability; super vised learningENGENHARIASA água potável é crucial para diversos aspectos da vida, influenciando diretamente na saúde, no desenvolvimento socioeconômico e na preservação ambiental. A Organização Mundial da Saúde (OMS) estima que aproximadamente 1 milhão de mortes ocorram anualmente devido a doenças causadas pela ingestão de água contaminada, falta de saneamento e práticas inadequa das de higiene. Para promover a garantia da qualidade da água, a OMS destaca a importância do tratamento e da análise rigorosa, utilizando parâmetros padronizados para determinar sua ade quação para consumo humano. Neste contexto, empregamos um conjunto de dados composto por 3276 amostras, cada uma caracterizada por dez atributos e uma variável de desfecho indi cando a potabilidade da água, obtido no repositório Kaggle. Utilizando técnicas de inteligência artificial, especialmente modelos de aprendizagem supervisionada, visamos classificar a potabi lidade da água. Os modelos desenvolvidos foram treinados com diversos algoritmos, incluindo Naive Bayes (NB), Logistic Regression (LR), Decision Trees (DT), Support Vector Machine (SVM), Random Forest (RF) e Multilayer Perceptron (MLP). A avaliação de desempenho de cada modelo baseou-se em métricas como acurácia, precisão e a AUC. Para manipulação e de senvolvimento dos modelos, empregamos a linguagem Python e suas bibliotecas especializadas em inteligência artificial. Aplicamos técnicas de pré-processamento para lidar com dados faltan tes, outliers, redimensionamento e balanceamento da variável de desfecho. Destacamos ainda que implementamos os modelos utilizando diversas técnicas de pré-processamento de dados, incluindo a aplicação do algoritmo Skewed Chi Squared Kernel (SCSK) nos modelos baseados em SVM. O modelo que obteve o melhor desempenho foi o baseado em SVM, alcançando 87% de acurácia após a aplicação da técnica SCSK, combinada com média aritmética para valores nulos, substituição de fora do padrão pela mediana, normalização dos dados utilizando a téc nica mín-máx e balanceamento dos dados por meio da técnica de sobre amostragem minoritária sintética (SMOTE). Esses resultados demonstram um desempenho eficaz na classificação da potabilidade da água, comparável a outros estudos encontrados na literatura, considerando as limitações inerentes ao conjunto de dados utilizado.Potable water is crucial for various aspects of life, directly influencing health, socioeconomic development, and environmental preservation. The World Health Organization (WHO) esti mates that approximately 1 million deaths occur annually due to diseases caused by the inges tion of contaminated water, lack of sanitation, and inadequate hygiene practices. To promote water quality assurance, WHO emphasizes the importance of treatment and rigorous analysis, using standardized parameters to determine its suitability for human consumption. In this con text, we employed a dataset consisting of 3276 samples, each characterized by ten attributes and an outcome variable indicating water potability, obtained from the Kaggle repository. Using ar tificial intelligence techniques, particularly supervised learning models, we aimed to classify water potability. The developed models were trained with various algorithms, including Naive Bayes (NB), Logistic Regression (LR), Decision Trees (DT), Support Vector Machine (SVM), Random Forest (RF), and Multilayer Perceptron (MLP). The performance evaluation of each model was based on metrics such as accuracy, precision, and the AUC. For data manipula tion and model development, we employed the Python language and its specialized libraries in artificial intelligence. We applied preprocessing techniques to handle missing data, outliers, resizing, and balancing of the outcome variable. We also highlight that we implemented the models using various data preprocessing techniques, including the application of the Skewed Chi Squared Kernel (SCSK) algorithm in SVM-based models. The model that achieved the best performance was based on SVM, reaching 87% accuracy after applying the SCSK tech nique, combined with arithmetic mean for null values, replacement of outliers by the median, data normalization using min-max technique, and data balancing through the synthetic minority oversampling technique (SMOTE). These results demonstrate effective performance in classify ing water potability, comparable to other studies found in the literature, considering the inherent limitations of the dataset used.Universidade Catolica de PelotasCentro de Ciencias Sociais e TecnologicasBrasilUCPelMestrado em Engenharia Eletronica e ComputacaoALMEIDA, Sérgio José Melo deOLIVEIRA, Lizandro de SouzaSOARES, Rafael IankowskiMOTA, Fernanda PintoPORTO, Wellington Weikamp2024-08-08T14:06:12Z2024-03-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfPORTO, Wellington Weikamp. Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água. 2024. 82 f. Dissertação( Mestrado em Engenharia Eletrônica e Computação) - Universidade Católica de Pelotas, Pelotas.http://tede.ucpel.edu.br:8080/jspui/handle/jspui/1030porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do UCpelinstname:Universidade Católica de Pelotas (UCPEL)instacron:UCPEL2024-08-09T04:32:48Zoai:tede.ucpel.edu.br:jspui/1030Biblioteca Digital de Teses e Dissertaçõeshttp://www2.ufpel.edu.br/tede/http://tede.ucpel.edu.br:8080/oai/requestbiblioteca@ucpel.edu.br||cristiane.chim@ucpel.tche.bropendoar:2024-08-09T04:32:48Biblioteca Digital de Teses e Dissertações do UCpel - Universidade Católica de Pelotas (UCPEL)false
dc.title.none.fl_str_mv Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água
title Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água
spellingShingle Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água
PORTO, Wellington Weikamp
aprendizado de máquina; inteligência artificial; qualidade da água; potabilidade da água; aprendizagem supervisionada
machine learning; artificial intelligence; water quality; water potability; super vised learning
ENGENHARIAS
title_short Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água
title_full Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água
title_fullStr Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água
title_full_unstemmed Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água
title_sort Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água
author PORTO, Wellington Weikamp
author_facet PORTO, Wellington Weikamp
author_role author
dc.contributor.none.fl_str_mv ALMEIDA, Sérgio José Melo de
OLIVEIRA, Lizandro de Souza
SOARES, Rafael Iankowski
MOTA, Fernanda Pinto
dc.contributor.author.fl_str_mv PORTO, Wellington Weikamp
dc.subject.por.fl_str_mv aprendizado de máquina; inteligência artificial; qualidade da água; potabilidade da água; aprendizagem supervisionada
machine learning; artificial intelligence; water quality; water potability; super vised learning
ENGENHARIAS
topic aprendizado de máquina; inteligência artificial; qualidade da água; potabilidade da água; aprendizagem supervisionada
machine learning; artificial intelligence; water quality; water potability; super vised learning
ENGENHARIAS
description A água potável é crucial para diversos aspectos da vida, influenciando diretamente na saúde, no desenvolvimento socioeconômico e na preservação ambiental. A Organização Mundial da Saúde (OMS) estima que aproximadamente 1 milhão de mortes ocorram anualmente devido a doenças causadas pela ingestão de água contaminada, falta de saneamento e práticas inadequa das de higiene. Para promover a garantia da qualidade da água, a OMS destaca a importância do tratamento e da análise rigorosa, utilizando parâmetros padronizados para determinar sua ade quação para consumo humano. Neste contexto, empregamos um conjunto de dados composto por 3276 amostras, cada uma caracterizada por dez atributos e uma variável de desfecho indi cando a potabilidade da água, obtido no repositório Kaggle. Utilizando técnicas de inteligência artificial, especialmente modelos de aprendizagem supervisionada, visamos classificar a potabi lidade da água. Os modelos desenvolvidos foram treinados com diversos algoritmos, incluindo Naive Bayes (NB), Logistic Regression (LR), Decision Trees (DT), Support Vector Machine (SVM), Random Forest (RF) e Multilayer Perceptron (MLP). A avaliação de desempenho de cada modelo baseou-se em métricas como acurácia, precisão e a AUC. Para manipulação e de senvolvimento dos modelos, empregamos a linguagem Python e suas bibliotecas especializadas em inteligência artificial. Aplicamos técnicas de pré-processamento para lidar com dados faltan tes, outliers, redimensionamento e balanceamento da variável de desfecho. Destacamos ainda que implementamos os modelos utilizando diversas técnicas de pré-processamento de dados, incluindo a aplicação do algoritmo Skewed Chi Squared Kernel (SCSK) nos modelos baseados em SVM. O modelo que obteve o melhor desempenho foi o baseado em SVM, alcançando 87% de acurácia após a aplicação da técnica SCSK, combinada com média aritmética para valores nulos, substituição de fora do padrão pela mediana, normalização dos dados utilizando a téc nica mín-máx e balanceamento dos dados por meio da técnica de sobre amostragem minoritária sintética (SMOTE). Esses resultados demonstram um desempenho eficaz na classificação da potabilidade da água, comparável a outros estudos encontrados na literatura, considerando as limitações inerentes ao conjunto de dados utilizado.
publishDate 2024
dc.date.none.fl_str_mv 2024-08-08T14:06:12Z
2024-03-25
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PORTO, Wellington Weikamp. Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água. 2024. 82 f. Dissertação( Mestrado em Engenharia Eletrônica e Computação) - Universidade Católica de Pelotas, Pelotas.
http://tede.ucpel.edu.br:8080/jspui/handle/jspui/1030
identifier_str_mv PORTO, Wellington Weikamp. Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água. 2024. 82 f. Dissertação( Mestrado em Engenharia Eletrônica e Computação) - Universidade Católica de Pelotas, Pelotas.
url http://tede.ucpel.edu.br:8080/jspui/handle/jspui/1030
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Catolica de Pelotas
Centro de Ciencias Sociais e Tecnologicas
Brasil
UCPel
Mestrado em Engenharia Eletronica e Computacao
publisher.none.fl_str_mv Universidade Catolica de Pelotas
Centro de Ciencias Sociais e Tecnologicas
Brasil
UCPel
Mestrado em Engenharia Eletronica e Computacao
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do UCpel
instname:Universidade Católica de Pelotas (UCPEL)
instacron:UCPEL
instname_str Universidade Católica de Pelotas (UCPEL)
instacron_str UCPEL
institution UCPEL
reponame_str Biblioteca Digital de Teses e Dissertações do UCpel
collection Biblioteca Digital de Teses e Dissertações do UCpel
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do UCpel - Universidade Católica de Pelotas (UCPEL)
repository.mail.fl_str_mv biblioteca@ucpel.edu.br||cristiane.chim@ucpel.tche.br
_version_ 1840084803886514176