Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Catolica de Pelotas
Centro de Ciencias Sociais e Tecnologicas Brasil UCPel Mestrado em Engenharia Eletronica e Computacao |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://tede.ucpel.edu.br:8080/jspui/handle/jspui/1030 |
Resumo: | A água potável é crucial para diversos aspectos da vida, influenciando diretamente na saúde, no desenvolvimento socioeconômico e na preservação ambiental. A Organização Mundial da Saúde (OMS) estima que aproximadamente 1 milhão de mortes ocorram anualmente devido a doenças causadas pela ingestão de água contaminada, falta de saneamento e práticas inadequa das de higiene. Para promover a garantia da qualidade da água, a OMS destaca a importância do tratamento e da análise rigorosa, utilizando parâmetros padronizados para determinar sua ade quação para consumo humano. Neste contexto, empregamos um conjunto de dados composto por 3276 amostras, cada uma caracterizada por dez atributos e uma variável de desfecho indi cando a potabilidade da água, obtido no repositório Kaggle. Utilizando técnicas de inteligência artificial, especialmente modelos de aprendizagem supervisionada, visamos classificar a potabi lidade da água. Os modelos desenvolvidos foram treinados com diversos algoritmos, incluindo Naive Bayes (NB), Logistic Regression (LR), Decision Trees (DT), Support Vector Machine (SVM), Random Forest (RF) e Multilayer Perceptron (MLP). A avaliação de desempenho de cada modelo baseou-se em métricas como acurácia, precisão e a AUC. Para manipulação e de senvolvimento dos modelos, empregamos a linguagem Python e suas bibliotecas especializadas em inteligência artificial. Aplicamos técnicas de pré-processamento para lidar com dados faltan tes, outliers, redimensionamento e balanceamento da variável de desfecho. Destacamos ainda que implementamos os modelos utilizando diversas técnicas de pré-processamento de dados, incluindo a aplicação do algoritmo Skewed Chi Squared Kernel (SCSK) nos modelos baseados em SVM. O modelo que obteve o melhor desempenho foi o baseado em SVM, alcançando 87% de acurácia após a aplicação da técnica SCSK, combinada com média aritmética para valores nulos, substituição de fora do padrão pela mediana, normalização dos dados utilizando a téc nica mín-máx e balanceamento dos dados por meio da técnica de sobre amostragem minoritária sintética (SMOTE). Esses resultados demonstram um desempenho eficaz na classificação da potabilidade da água, comparável a outros estudos encontrados na literatura, considerando as limitações inerentes ao conjunto de dados utilizado. |
| id |
UCPe_adef93b2ab2337bc3a0191a74cc6a31e |
|---|---|
| oai_identifier_str |
oai:tede.ucpel.edu.br:jspui/1030 |
| network_acronym_str |
UCPe |
| network_name_str |
Biblioteca Digital de Teses e Dissertações do UCpel |
| repository_id_str |
|
| spelling |
Uso de modelos de aprendizado supervisionado para classificação da potabilidade da águaaprendizado de máquina; inteligência artificial; qualidade da água; potabilidade da água; aprendizagem supervisionadamachine learning; artificial intelligence; water quality; water potability; super vised learningENGENHARIASA água potável é crucial para diversos aspectos da vida, influenciando diretamente na saúde, no desenvolvimento socioeconômico e na preservação ambiental. A Organização Mundial da Saúde (OMS) estima que aproximadamente 1 milhão de mortes ocorram anualmente devido a doenças causadas pela ingestão de água contaminada, falta de saneamento e práticas inadequa das de higiene. Para promover a garantia da qualidade da água, a OMS destaca a importância do tratamento e da análise rigorosa, utilizando parâmetros padronizados para determinar sua ade quação para consumo humano. Neste contexto, empregamos um conjunto de dados composto por 3276 amostras, cada uma caracterizada por dez atributos e uma variável de desfecho indi cando a potabilidade da água, obtido no repositório Kaggle. Utilizando técnicas de inteligência artificial, especialmente modelos de aprendizagem supervisionada, visamos classificar a potabi lidade da água. Os modelos desenvolvidos foram treinados com diversos algoritmos, incluindo Naive Bayes (NB), Logistic Regression (LR), Decision Trees (DT), Support Vector Machine (SVM), Random Forest (RF) e Multilayer Perceptron (MLP). A avaliação de desempenho de cada modelo baseou-se em métricas como acurácia, precisão e a AUC. Para manipulação e de senvolvimento dos modelos, empregamos a linguagem Python e suas bibliotecas especializadas em inteligência artificial. Aplicamos técnicas de pré-processamento para lidar com dados faltan tes, outliers, redimensionamento e balanceamento da variável de desfecho. Destacamos ainda que implementamos os modelos utilizando diversas técnicas de pré-processamento de dados, incluindo a aplicação do algoritmo Skewed Chi Squared Kernel (SCSK) nos modelos baseados em SVM. O modelo que obteve o melhor desempenho foi o baseado em SVM, alcançando 87% de acurácia após a aplicação da técnica SCSK, combinada com média aritmética para valores nulos, substituição de fora do padrão pela mediana, normalização dos dados utilizando a téc nica mín-máx e balanceamento dos dados por meio da técnica de sobre amostragem minoritária sintética (SMOTE). Esses resultados demonstram um desempenho eficaz na classificação da potabilidade da água, comparável a outros estudos encontrados na literatura, considerando as limitações inerentes ao conjunto de dados utilizado.Potable water is crucial for various aspects of life, directly influencing health, socioeconomic development, and environmental preservation. The World Health Organization (WHO) esti mates that approximately 1 million deaths occur annually due to diseases caused by the inges tion of contaminated water, lack of sanitation, and inadequate hygiene practices. To promote water quality assurance, WHO emphasizes the importance of treatment and rigorous analysis, using standardized parameters to determine its suitability for human consumption. In this con text, we employed a dataset consisting of 3276 samples, each characterized by ten attributes and an outcome variable indicating water potability, obtained from the Kaggle repository. Using ar tificial intelligence techniques, particularly supervised learning models, we aimed to classify water potability. The developed models were trained with various algorithms, including Naive Bayes (NB), Logistic Regression (LR), Decision Trees (DT), Support Vector Machine (SVM), Random Forest (RF), and Multilayer Perceptron (MLP). The performance evaluation of each model was based on metrics such as accuracy, precision, and the AUC. For data manipula tion and model development, we employed the Python language and its specialized libraries in artificial intelligence. We applied preprocessing techniques to handle missing data, outliers, resizing, and balancing of the outcome variable. We also highlight that we implemented the models using various data preprocessing techniques, including the application of the Skewed Chi Squared Kernel (SCSK) algorithm in SVM-based models. The model that achieved the best performance was based on SVM, reaching 87% accuracy after applying the SCSK tech nique, combined with arithmetic mean for null values, replacement of outliers by the median, data normalization using min-max technique, and data balancing through the synthetic minority oversampling technique (SMOTE). These results demonstrate effective performance in classify ing water potability, comparable to other studies found in the literature, considering the inherent limitations of the dataset used.Universidade Catolica de PelotasCentro de Ciencias Sociais e TecnologicasBrasilUCPelMestrado em Engenharia Eletronica e ComputacaoALMEIDA, Sérgio José Melo deOLIVEIRA, Lizandro de SouzaSOARES, Rafael IankowskiMOTA, Fernanda PintoPORTO, Wellington Weikamp2024-08-08T14:06:12Z2024-03-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfPORTO, Wellington Weikamp. Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água. 2024. 82 f. Dissertação( Mestrado em Engenharia Eletrônica e Computação) - Universidade Católica de Pelotas, Pelotas.http://tede.ucpel.edu.br:8080/jspui/handle/jspui/1030porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do UCpelinstname:Universidade Católica de Pelotas (UCPEL)instacron:UCPEL2024-08-09T04:32:48Zoai:tede.ucpel.edu.br:jspui/1030Biblioteca Digital de Teses e Dissertaçõeshttp://www2.ufpel.edu.br/tede/http://tede.ucpel.edu.br:8080/oai/requestbiblioteca@ucpel.edu.br||cristiane.chim@ucpel.tche.bropendoar:2024-08-09T04:32:48Biblioteca Digital de Teses e Dissertações do UCpel - Universidade Católica de Pelotas (UCPEL)false |
| dc.title.none.fl_str_mv |
Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água |
| title |
Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água |
| spellingShingle |
Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água PORTO, Wellington Weikamp aprendizado de máquina; inteligência artificial; qualidade da água; potabilidade da água; aprendizagem supervisionada machine learning; artificial intelligence; water quality; water potability; super vised learning ENGENHARIAS |
| title_short |
Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água |
| title_full |
Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água |
| title_fullStr |
Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água |
| title_full_unstemmed |
Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água |
| title_sort |
Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água |
| author |
PORTO, Wellington Weikamp |
| author_facet |
PORTO, Wellington Weikamp |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
ALMEIDA, Sérgio José Melo de OLIVEIRA, Lizandro de Souza SOARES, Rafael Iankowski MOTA, Fernanda Pinto |
| dc.contributor.author.fl_str_mv |
PORTO, Wellington Weikamp |
| dc.subject.por.fl_str_mv |
aprendizado de máquina; inteligência artificial; qualidade da água; potabilidade da água; aprendizagem supervisionada machine learning; artificial intelligence; water quality; water potability; super vised learning ENGENHARIAS |
| topic |
aprendizado de máquina; inteligência artificial; qualidade da água; potabilidade da água; aprendizagem supervisionada machine learning; artificial intelligence; water quality; water potability; super vised learning ENGENHARIAS |
| description |
A água potável é crucial para diversos aspectos da vida, influenciando diretamente na saúde, no desenvolvimento socioeconômico e na preservação ambiental. A Organização Mundial da Saúde (OMS) estima que aproximadamente 1 milhão de mortes ocorram anualmente devido a doenças causadas pela ingestão de água contaminada, falta de saneamento e práticas inadequa das de higiene. Para promover a garantia da qualidade da água, a OMS destaca a importância do tratamento e da análise rigorosa, utilizando parâmetros padronizados para determinar sua ade quação para consumo humano. Neste contexto, empregamos um conjunto de dados composto por 3276 amostras, cada uma caracterizada por dez atributos e uma variável de desfecho indi cando a potabilidade da água, obtido no repositório Kaggle. Utilizando técnicas de inteligência artificial, especialmente modelos de aprendizagem supervisionada, visamos classificar a potabi lidade da água. Os modelos desenvolvidos foram treinados com diversos algoritmos, incluindo Naive Bayes (NB), Logistic Regression (LR), Decision Trees (DT), Support Vector Machine (SVM), Random Forest (RF) e Multilayer Perceptron (MLP). A avaliação de desempenho de cada modelo baseou-se em métricas como acurácia, precisão e a AUC. Para manipulação e de senvolvimento dos modelos, empregamos a linguagem Python e suas bibliotecas especializadas em inteligência artificial. Aplicamos técnicas de pré-processamento para lidar com dados faltan tes, outliers, redimensionamento e balanceamento da variável de desfecho. Destacamos ainda que implementamos os modelos utilizando diversas técnicas de pré-processamento de dados, incluindo a aplicação do algoritmo Skewed Chi Squared Kernel (SCSK) nos modelos baseados em SVM. O modelo que obteve o melhor desempenho foi o baseado em SVM, alcançando 87% de acurácia após a aplicação da técnica SCSK, combinada com média aritmética para valores nulos, substituição de fora do padrão pela mediana, normalização dos dados utilizando a téc nica mín-máx e balanceamento dos dados por meio da técnica de sobre amostragem minoritária sintética (SMOTE). Esses resultados demonstram um desempenho eficaz na classificação da potabilidade da água, comparável a outros estudos encontrados na literatura, considerando as limitações inerentes ao conjunto de dados utilizado. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-08-08T14:06:12Z 2024-03-25 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
PORTO, Wellington Weikamp. Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água. 2024. 82 f. Dissertação( Mestrado em Engenharia Eletrônica e Computação) - Universidade Católica de Pelotas, Pelotas. http://tede.ucpel.edu.br:8080/jspui/handle/jspui/1030 |
| identifier_str_mv |
PORTO, Wellington Weikamp. Uso de modelos de aprendizado supervisionado para classificação da potabilidade da água. 2024. 82 f. Dissertação( Mestrado em Engenharia Eletrônica e Computação) - Universidade Católica de Pelotas, Pelotas. |
| url |
http://tede.ucpel.edu.br:8080/jspui/handle/jspui/1030 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Catolica de Pelotas Centro de Ciencias Sociais e Tecnologicas Brasil UCPel Mestrado em Engenharia Eletronica e Computacao |
| publisher.none.fl_str_mv |
Universidade Catolica de Pelotas Centro de Ciencias Sociais e Tecnologicas Brasil UCPel Mestrado em Engenharia Eletronica e Computacao |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do UCpel instname:Universidade Católica de Pelotas (UCPEL) instacron:UCPEL |
| instname_str |
Universidade Católica de Pelotas (UCPEL) |
| instacron_str |
UCPEL |
| institution |
UCPEL |
| reponame_str |
Biblioteca Digital de Teses e Dissertações do UCpel |
| collection |
Biblioteca Digital de Teses e Dissertações do UCpel |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do UCpel - Universidade Católica de Pelotas (UCPEL) |
| repository.mail.fl_str_mv |
biblioteca@ucpel.edu.br||cristiane.chim@ucpel.tche.br |
| _version_ |
1840084803886514176 |