Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: Morais, Camilo de Lelis Medeiros de
Orientador(a): Lima, Kassio Michell Gomes de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: PROGRAMA DE PÓS-GRADUAÇÃO EM QUÍMICA
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufrn.br/jspui/handle/123456789/24217
Resumo: Esta dissertação consiste de um aporte teórico sobre a construção de técnicas de classificação supervisionada para aplicações em dados químicos multivariados. Para isso, técnicas quimiométricas baseadas em análise discriminante quadrática (QDA) e máquinas de vetores suporte (SVM) foram construídas em conjunto com análise de componentes principais (PCA), algoritmo de projeções sucessivas (SPA) e algoritmo genético (GA) para classificação supervisionada utilizando redução de dados e seleção de variáveis. Essas técnicas foram empregadas na análise de dados de primeira ordem, constituídos de espectros na região do infravermelho médio com transformada de Fourier e reflectância total atenuada (ATR-FTIR); espectros de massas obtidos por cromatografia líquida com um detector por tempo de vôo (LC/TOF); e espectros de massas obtidos por desorção/ionização por laser de superfície acoplado a um detector por tempo de vôo (SELDI-TOF). Os dados de ATR-FTIR foram utilizados para diferenciar duas classes de fungos do gênero Cryptococcus, enquanto que os dados de espectrometria de massas foram utilizados para identificar câncer de ovário e de próstata em soro sanguíneo. Além disso, novas técnicas de análise discriminante bidimensionais utilizando análise de componentes principais com análise discriminante linear (2D-PCA-LDA), análise discriminante quadrática (2D-PCA-QDA) e máquinas de vetores suporte (2D-PCA-SVM) foram desenvolvidas para aplicações em dados químicos de segunda ordem compostos por matrizes de excitação-emissão (EEM) por fluorescência molecular em amostras simuladas e reais. Os resultados obtidos mostraram que as técnicas desenvolvidas tiveram alto desempenho classificatório tanto para os dados de primeira quanto de segunda ordem, com taxas de acerto, sensibilidade e especificidade atingindo valores entre 90 a 100%. Além disso, as técnicas bidimensionais desenvolvidas tiveram, no geral, desempenho superior do que os métodos tradicionais de classificação multivariada utilizando dados desdobrados, o que mostra seu potencial para outras futuras aplicações analíticas.
id UFRN_4b8e7d185e95908c737f5ac93da8e30e
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/24217
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Morais, Camilo de Lelis Medeiros dehttp://lattes.cnpq.br/6928918856031880Moraes, Edgar Perinhttp://lattes.cnpq.br/0705932816454884Menezes, Fabricio Gavahttp://lattes.cnpq.br/2848745987784319Bruns, Roy EduardLima, Kassio Michell Gomes de2017-11-07T23:52:52Z2017-11-07T23:52:52Z2017-09-29MORAIS, Camilo de Lelis Medeiros de. Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados. 2017. 95f. Dissertação (Mestrado em Química) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017.https://repositorio.ufrn.br/jspui/handle/123456789/24217Esta dissertação consiste de um aporte teórico sobre a construção de técnicas de classificação supervisionada para aplicações em dados químicos multivariados. Para isso, técnicas quimiométricas baseadas em análise discriminante quadrática (QDA) e máquinas de vetores suporte (SVM) foram construídas em conjunto com análise de componentes principais (PCA), algoritmo de projeções sucessivas (SPA) e algoritmo genético (GA) para classificação supervisionada utilizando redução de dados e seleção de variáveis. Essas técnicas foram empregadas na análise de dados de primeira ordem, constituídos de espectros na região do infravermelho médio com transformada de Fourier e reflectância total atenuada (ATR-FTIR); espectros de massas obtidos por cromatografia líquida com um detector por tempo de vôo (LC/TOF); e espectros de massas obtidos por desorção/ionização por laser de superfície acoplado a um detector por tempo de vôo (SELDI-TOF). Os dados de ATR-FTIR foram utilizados para diferenciar duas classes de fungos do gênero Cryptococcus, enquanto que os dados de espectrometria de massas foram utilizados para identificar câncer de ovário e de próstata em soro sanguíneo. Além disso, novas técnicas de análise discriminante bidimensionais utilizando análise de componentes principais com análise discriminante linear (2D-PCA-LDA), análise discriminante quadrática (2D-PCA-QDA) e máquinas de vetores suporte (2D-PCA-SVM) foram desenvolvidas para aplicações em dados químicos de segunda ordem compostos por matrizes de excitação-emissão (EEM) por fluorescência molecular em amostras simuladas e reais. Os resultados obtidos mostraram que as técnicas desenvolvidas tiveram alto desempenho classificatório tanto para os dados de primeira quanto de segunda ordem, com taxas de acerto, sensibilidade e especificidade atingindo valores entre 90 a 100%. Além disso, as técnicas bidimensionais desenvolvidas tiveram, no geral, desempenho superior do que os métodos tradicionais de classificação multivariada utilizando dados desdobrados, o que mostra seu potencial para outras futuras aplicações analíticas.This dissertation is composed by a theoretical contribution about the development of supervised classification techniques for application using multivariate chemical data. For this, chemometric techniques based on quadratic discriminant analysis (QDA) and support vector machines (SVM) were built combined with principal component analysis (PCA), successive projections algorithm (SPA) and genetic algorithm (GA) for supervised classification using data reduction and feature selection. These techniques were employed in analyzing first-order data, composed by attenuated total reflectance Fourier transform infrared spectroscopy (ATRFTIR) and mass spectra obtained from liquid chromatography time of flight (LC/TOF) and surface-enhanced laser desorption/ionization time of flight (SELDI/TOF). ATR-FTIR data were used to differentiate two classes of fungus of Cryptococcus gene, whereas the mass spectra data was used to identify ovarian and prostate cancer in blood serum. In addition, new twodimensional discriminant analysis techniques based on principal component analysis linear discriminant analysis (2D-PCA-LDA), quadratic discriminant analysis (2D-PCA-QDA) and support vectors machine (2D-PCA-SVM) were developed for applications in second-order chemical data composed by excitation-emission matrices (EEM) molecular fluorescence of simulated and real samples. The results show that the developed techniques had better classification performance for both first and second-order data, with classification rates, sensitivity and specificity reaching values between 90 to 100%. Also, the developed twodimensional techniques had overall performance superior than traditional multivariate classification methods using unfolded data, showing its potential to other future analytical applications.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)porCNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICAQuimiometriaClassificação supervisionadaAnálise multivariadaDesenvolvimento de técnicas de classificação supervisionada para dados químicos multivariadosDevelopment of supervised classification techniques for multivariate chemical datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPROGRAMA DE PÓS-GRADUAÇÃO EM QUÍMICAUFRNBrasilinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALCamiloDeLelisMedeirosDeMorais_DISSERT.pdfCamiloDeLelisMedeirosDeMorais_DISSERT.pdfapplication/pdf7310447https://repositorio.ufrn.br/bitstream/123456789/24217/1/CamiloDeLelisMedeirosDeMorais_DISSERT.pdf40a1a97c6143778d4209de7dbd94f53bMD51TEXTCamiloDeLelisMedeirosDeMorais_DISSERT.pdf.txtCamiloDeLelisMedeirosDeMorais_DISSERT.pdf.txtExtracted texttext/plain220286https://repositorio.ufrn.br/bitstream/123456789/24217/2/CamiloDeLelisMedeirosDeMorais_DISSERT.pdf.txt0f8be57c9937b09f46bfbeb228049608MD52THUMBNAILCamiloDeLelisMedeirosDeMorais_DISSERT.pdf.jpgCamiloDeLelisMedeirosDeMorais_DISSERT.pdf.jpgIM Thumbnailimage/jpeg4303https://repositorio.ufrn.br/bitstream/123456789/24217/3/CamiloDeLelisMedeirosDeMorais_DISSERT.pdf.jpg9df6645d8e96ebd8e45b0ee6b37d7ef8MD53123456789/242172022-04-18 17:03:43.302oai:https://repositorio.ufrn.br:123456789/24217Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2022-04-18T20:03:43Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
dc.title.alternative.pt_BR.fl_str_mv Development of supervised classification techniques for multivariate chemical data
title Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
spellingShingle Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
Morais, Camilo de Lelis Medeiros de
CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
Quimiometria
Classificação supervisionada
Análise multivariada
title_short Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
title_full Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
title_fullStr Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
title_full_unstemmed Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
title_sort Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
author Morais, Camilo de Lelis Medeiros de
author_facet Morais, Camilo de Lelis Medeiros de
author_role author
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/6928918856031880
dc.contributor.referees1.none.fl_str_mv Moraes, Edgar Perin
dc.contributor.referees1Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/0705932816454884
dc.contributor.referees2.none.fl_str_mv Menezes, Fabricio Gava
dc.contributor.referees2Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/2848745987784319
dc.contributor.referees3.none.fl_str_mv Bruns, Roy Eduard
dc.contributor.author.fl_str_mv Morais, Camilo de Lelis Medeiros de
dc.contributor.advisor1.fl_str_mv Lima, Kassio Michell Gomes de
contributor_str_mv Lima, Kassio Michell Gomes de
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
topic CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
Quimiometria
Classificação supervisionada
Análise multivariada
dc.subject.por.fl_str_mv Quimiometria
Classificação supervisionada
Análise multivariada
description Esta dissertação consiste de um aporte teórico sobre a construção de técnicas de classificação supervisionada para aplicações em dados químicos multivariados. Para isso, técnicas quimiométricas baseadas em análise discriminante quadrática (QDA) e máquinas de vetores suporte (SVM) foram construídas em conjunto com análise de componentes principais (PCA), algoritmo de projeções sucessivas (SPA) e algoritmo genético (GA) para classificação supervisionada utilizando redução de dados e seleção de variáveis. Essas técnicas foram empregadas na análise de dados de primeira ordem, constituídos de espectros na região do infravermelho médio com transformada de Fourier e reflectância total atenuada (ATR-FTIR); espectros de massas obtidos por cromatografia líquida com um detector por tempo de vôo (LC/TOF); e espectros de massas obtidos por desorção/ionização por laser de superfície acoplado a um detector por tempo de vôo (SELDI-TOF). Os dados de ATR-FTIR foram utilizados para diferenciar duas classes de fungos do gênero Cryptococcus, enquanto que os dados de espectrometria de massas foram utilizados para identificar câncer de ovário e de próstata em soro sanguíneo. Além disso, novas técnicas de análise discriminante bidimensionais utilizando análise de componentes principais com análise discriminante linear (2D-PCA-LDA), análise discriminante quadrática (2D-PCA-QDA) e máquinas de vetores suporte (2D-PCA-SVM) foram desenvolvidas para aplicações em dados químicos de segunda ordem compostos por matrizes de excitação-emissão (EEM) por fluorescência molecular em amostras simuladas e reais. Os resultados obtidos mostraram que as técnicas desenvolvidas tiveram alto desempenho classificatório tanto para os dados de primeira quanto de segunda ordem, com taxas de acerto, sensibilidade e especificidade atingindo valores entre 90 a 100%. Além disso, as técnicas bidimensionais desenvolvidas tiveram, no geral, desempenho superior do que os métodos tradicionais de classificação multivariada utilizando dados desdobrados, o que mostra seu potencial para outras futuras aplicações analíticas.
publishDate 2017
dc.date.accessioned.fl_str_mv 2017-11-07T23:52:52Z
dc.date.available.fl_str_mv 2017-11-07T23:52:52Z
dc.date.issued.fl_str_mv 2017-09-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MORAIS, Camilo de Lelis Medeiros de. Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados. 2017. 95f. Dissertação (Mestrado em Química) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/jspui/handle/123456789/24217
identifier_str_mv MORAIS, Camilo de Lelis Medeiros de. Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados. 2017. 95f. Dissertação (Mestrado em Química) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017.
url https://repositorio.ufrn.br/jspui/handle/123456789/24217
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM QUÍMICA
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/24217/1/CamiloDeLelisMedeirosDeMorais_DISSERT.pdf
https://repositorio.ufrn.br/bitstream/123456789/24217/2/CamiloDeLelisMedeirosDeMorais_DISSERT.pdf.txt
https://repositorio.ufrn.br/bitstream/123456789/24217/3/CamiloDeLelisMedeirosDeMorais_DISSERT.pdf.jpg
bitstream.checksum.fl_str_mv 40a1a97c6143778d4209de7dbd94f53b
0f8be57c9937b09f46bfbeb228049608
9df6645d8e96ebd8e45b0ee6b37d7ef8
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1796767019665719296