Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: Morais, Camilo de Lelis Medeiros de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM QUÍMICA
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufrn.br/jspui/handle/123456789/24217
Resumo: This dissertation is composed by a theoretical contribution about the development of supervised classification techniques for application using multivariate chemical data. For this, chemometric techniques based on quadratic discriminant analysis (QDA) and support vector machines (SVM) were built combined with principal component analysis (PCA), successive projections algorithm (SPA) and genetic algorithm (GA) for supervised classification using data reduction and feature selection. These techniques were employed in analyzing first-order data, composed by attenuated total reflectance Fourier transform infrared spectroscopy (ATRFTIR) and mass spectra obtained from liquid chromatography time of flight (LC/TOF) and surface-enhanced laser desorption/ionization time of flight (SELDI/TOF). ATR-FTIR data were used to differentiate two classes of fungus of Cryptococcus gene, whereas the mass spectra data was used to identify ovarian and prostate cancer in blood serum. In addition, new twodimensional discriminant analysis techniques based on principal component analysis linear discriminant analysis (2D-PCA-LDA), quadratic discriminant analysis (2D-PCA-QDA) and support vectors machine (2D-PCA-SVM) were developed for applications in second-order chemical data composed by excitation-emission matrices (EEM) molecular fluorescence of simulated and real samples. The results show that the developed techniques had better classification performance for both first and second-order data, with classification rates, sensitivity and specificity reaching values between 90 to 100%. Also, the developed twodimensional techniques had overall performance superior than traditional multivariate classification methods using unfolded data, showing its potential to other future analytical applications.
id UFRN_fd3490e0170ff644482e51bb188ea93c
oai_identifier_str oai:repositorio.ufrn.br:123456789/24217
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariadosDevelopment of supervised classification techniques for multivariate chemical dataQuimiometriaClassificação supervisionadaAnálise multivariadaCNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICAThis dissertation is composed by a theoretical contribution about the development of supervised classification techniques for application using multivariate chemical data. For this, chemometric techniques based on quadratic discriminant analysis (QDA) and support vector machines (SVM) were built combined with principal component analysis (PCA), successive projections algorithm (SPA) and genetic algorithm (GA) for supervised classification using data reduction and feature selection. These techniques were employed in analyzing first-order data, composed by attenuated total reflectance Fourier transform infrared spectroscopy (ATRFTIR) and mass spectra obtained from liquid chromatography time of flight (LC/TOF) and surface-enhanced laser desorption/ionization time of flight (SELDI/TOF). ATR-FTIR data were used to differentiate two classes of fungus of Cryptococcus gene, whereas the mass spectra data was used to identify ovarian and prostate cancer in blood serum. In addition, new twodimensional discriminant analysis techniques based on principal component analysis linear discriminant analysis (2D-PCA-LDA), quadratic discriminant analysis (2D-PCA-QDA) and support vectors machine (2D-PCA-SVM) were developed for applications in second-order chemical data composed by excitation-emission matrices (EEM) molecular fluorescence of simulated and real samples. The results show that the developed techniques had better classification performance for both first and second-order data, with classification rates, sensitivity and specificity reaching values between 90 to 100%. Also, the developed twodimensional techniques had overall performance superior than traditional multivariate classification methods using unfolded data, showing its potential to other future analytical applications.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Esta dissertação consiste de um aporte teórico sobre a construção de técnicas de classificação supervisionada para aplicações em dados químicos multivariados. Para isso, técnicas quimiométricas baseadas em análise discriminante quadrática (QDA) e máquinas de vetores suporte (SVM) foram construídas em conjunto com análise de componentes principais (PCA), algoritmo de projeções sucessivas (SPA) e algoritmo genético (GA) para classificação supervisionada utilizando redução de dados e seleção de variáveis. Essas técnicas foram empregadas na análise de dados de primeira ordem, constituídos de espectros na região do infravermelho médio com transformada de Fourier e reflectância total atenuada (ATR-FTIR); espectros de massas obtidos por cromatografia líquida com um detector por tempo de vôo (LC/TOF); e espectros de massas obtidos por desorção/ionização por laser de superfície acoplado a um detector por tempo de vôo (SELDI-TOF). Os dados de ATR-FTIR foram utilizados para diferenciar duas classes de fungos do gênero Cryptococcus, enquanto que os dados de espectrometria de massas foram utilizados para identificar câncer de ovário e de próstata em soro sanguíneo. Além disso, novas técnicas de análise discriminante bidimensionais utilizando análise de componentes principais com análise discriminante linear (2D-PCA-LDA), análise discriminante quadrática (2D-PCA-QDA) e máquinas de vetores suporte (2D-PCA-SVM) foram desenvolvidas para aplicações em dados químicos de segunda ordem compostos por matrizes de excitação-emissão (EEM) por fluorescência molecular em amostras simuladas e reais. Os resultados obtidos mostraram que as técnicas desenvolvidas tiveram alto desempenho classificatório tanto para os dados de primeira quanto de segunda ordem, com taxas de acerto, sensibilidade e especificidade atingindo valores entre 90 a 100%. Além disso, as técnicas bidimensionais desenvolvidas tiveram, no geral, desempenho superior do que os métodos tradicionais de classificação multivariada utilizando dados desdobrados, o que mostra seu potencial para outras futuras aplicações analíticas.BrasilUFRNPROGRAMA DE PÓS-GRADUAÇÃO EM QUÍMICALima, Kassio Michell Gomes dehttp://lattes.cnpq.br/6928918856031880Moraes, Edgar Perinhttp://lattes.cnpq.br/0705932816454884Menezes, Fabricio Gavahttp://lattes.cnpq.br/2848745987784319Bruns, Roy EduardMorais, Camilo de Lelis Medeiros de2017-11-07T23:52:52Z2017-11-07T23:52:52Z2017-09-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfMORAIS, Camilo de Lelis Medeiros de. Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados. 2017. 95f. Dissertação (Mestrado em Química) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017.https://repositorio.ufrn.br/jspui/handle/123456789/24217porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRN2022-04-18T20:03:43Zoai:repositorio.ufrn.br:123456789/24217Repositório InstitucionalPUBhttp://repositorio.ufrn.br/oai/repositorio@bczm.ufrn.bropendoar:2022-04-18T20:03:43Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.none.fl_str_mv Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
Development of supervised classification techniques for multivariate chemical data
title Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
spellingShingle Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
Morais, Camilo de Lelis Medeiros de
Quimiometria
Classificação supervisionada
Análise multivariada
CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
title_short Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
title_full Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
title_fullStr Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
title_full_unstemmed Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
title_sort Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
author Morais, Camilo de Lelis Medeiros de
author_facet Morais, Camilo de Lelis Medeiros de
author_role author
dc.contributor.none.fl_str_mv Lima, Kassio Michell Gomes de
http://lattes.cnpq.br/6928918856031880
Moraes, Edgar Perin
http://lattes.cnpq.br/0705932816454884
Menezes, Fabricio Gava
http://lattes.cnpq.br/2848745987784319
Bruns, Roy Eduard
dc.contributor.author.fl_str_mv Morais, Camilo de Lelis Medeiros de
dc.subject.por.fl_str_mv Quimiometria
Classificação supervisionada
Análise multivariada
CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
topic Quimiometria
Classificação supervisionada
Análise multivariada
CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
description This dissertation is composed by a theoretical contribution about the development of supervised classification techniques for application using multivariate chemical data. For this, chemometric techniques based on quadratic discriminant analysis (QDA) and support vector machines (SVM) were built combined with principal component analysis (PCA), successive projections algorithm (SPA) and genetic algorithm (GA) for supervised classification using data reduction and feature selection. These techniques were employed in analyzing first-order data, composed by attenuated total reflectance Fourier transform infrared spectroscopy (ATRFTIR) and mass spectra obtained from liquid chromatography time of flight (LC/TOF) and surface-enhanced laser desorption/ionization time of flight (SELDI/TOF). ATR-FTIR data were used to differentiate two classes of fungus of Cryptococcus gene, whereas the mass spectra data was used to identify ovarian and prostate cancer in blood serum. In addition, new twodimensional discriminant analysis techniques based on principal component analysis linear discriminant analysis (2D-PCA-LDA), quadratic discriminant analysis (2D-PCA-QDA) and support vectors machine (2D-PCA-SVM) were developed for applications in second-order chemical data composed by excitation-emission matrices (EEM) molecular fluorescence of simulated and real samples. The results show that the developed techniques had better classification performance for both first and second-order data, with classification rates, sensitivity and specificity reaching values between 90 to 100%. Also, the developed twodimensional techniques had overall performance superior than traditional multivariate classification methods using unfolded data, showing its potential to other future analytical applications.
publishDate 2017
dc.date.none.fl_str_mv 2017-11-07T23:52:52Z
2017-11-07T23:52:52Z
2017-09-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv MORAIS, Camilo de Lelis Medeiros de. Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados. 2017. 95f. Dissertação (Mestrado em Química) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017.
https://repositorio.ufrn.br/jspui/handle/123456789/24217
identifier_str_mv MORAIS, Camilo de Lelis Medeiros de. Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados. 2017. 95f. Dissertação (Mestrado em Química) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017.
url https://repositorio.ufrn.br/jspui/handle/123456789/24217
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM QUÍMICA
publisher.none.fl_str_mv Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM QUÍMICA
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv repositorio@bczm.ufrn.br
_version_ 1855758762636214272