Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados
Ano de defesa: | 2017 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
PROGRAMA DE PÓS-GRADUAÇÃO EM QUÍMICA
|
Departamento: |
Não Informado pela instituição
|
País: |
Brasil
|
Palavras-chave em Português: | |
Área do conhecimento CNPq: | |
Link de acesso: | https://repositorio.ufrn.br/jspui/handle/123456789/24217 |
Resumo: | Esta dissertação consiste de um aporte teórico sobre a construção de técnicas de classificação supervisionada para aplicações em dados químicos multivariados. Para isso, técnicas quimiométricas baseadas em análise discriminante quadrática (QDA) e máquinas de vetores suporte (SVM) foram construídas em conjunto com análise de componentes principais (PCA), algoritmo de projeções sucessivas (SPA) e algoritmo genético (GA) para classificação supervisionada utilizando redução de dados e seleção de variáveis. Essas técnicas foram empregadas na análise de dados de primeira ordem, constituídos de espectros na região do infravermelho médio com transformada de Fourier e reflectância total atenuada (ATR-FTIR); espectros de massas obtidos por cromatografia líquida com um detector por tempo de vôo (LC/TOF); e espectros de massas obtidos por desorção/ionização por laser de superfície acoplado a um detector por tempo de vôo (SELDI-TOF). Os dados de ATR-FTIR foram utilizados para diferenciar duas classes de fungos do gênero Cryptococcus, enquanto que os dados de espectrometria de massas foram utilizados para identificar câncer de ovário e de próstata em soro sanguíneo. Além disso, novas técnicas de análise discriminante bidimensionais utilizando análise de componentes principais com análise discriminante linear (2D-PCA-LDA), análise discriminante quadrática (2D-PCA-QDA) e máquinas de vetores suporte (2D-PCA-SVM) foram desenvolvidas para aplicações em dados químicos de segunda ordem compostos por matrizes de excitação-emissão (EEM) por fluorescência molecular em amostras simuladas e reais. Os resultados obtidos mostraram que as técnicas desenvolvidas tiveram alto desempenho classificatório tanto para os dados de primeira quanto de segunda ordem, com taxas de acerto, sensibilidade e especificidade atingindo valores entre 90 a 100%. Além disso, as técnicas bidimensionais desenvolvidas tiveram, no geral, desempenho superior do que os métodos tradicionais de classificação multivariada utilizando dados desdobrados, o que mostra seu potencial para outras futuras aplicações analíticas. |
id |
UFRN_4b8e7d185e95908c737f5ac93da8e30e |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/24217 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Morais, Camilo de Lelis Medeiros dehttp://lattes.cnpq.br/6928918856031880Moraes, Edgar Perinhttp://lattes.cnpq.br/0705932816454884Menezes, Fabricio Gavahttp://lattes.cnpq.br/2848745987784319Bruns, Roy EduardLima, Kassio Michell Gomes de2017-11-07T23:52:52Z2017-11-07T23:52:52Z2017-09-29MORAIS, Camilo de Lelis Medeiros de. Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados. 2017. 95f. Dissertação (Mestrado em Química) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017.https://repositorio.ufrn.br/jspui/handle/123456789/24217Esta dissertação consiste de um aporte teórico sobre a construção de técnicas de classificação supervisionada para aplicações em dados químicos multivariados. Para isso, técnicas quimiométricas baseadas em análise discriminante quadrática (QDA) e máquinas de vetores suporte (SVM) foram construídas em conjunto com análise de componentes principais (PCA), algoritmo de projeções sucessivas (SPA) e algoritmo genético (GA) para classificação supervisionada utilizando redução de dados e seleção de variáveis. Essas técnicas foram empregadas na análise de dados de primeira ordem, constituídos de espectros na região do infravermelho médio com transformada de Fourier e reflectância total atenuada (ATR-FTIR); espectros de massas obtidos por cromatografia líquida com um detector por tempo de vôo (LC/TOF); e espectros de massas obtidos por desorção/ionização por laser de superfície acoplado a um detector por tempo de vôo (SELDI-TOF). Os dados de ATR-FTIR foram utilizados para diferenciar duas classes de fungos do gênero Cryptococcus, enquanto que os dados de espectrometria de massas foram utilizados para identificar câncer de ovário e de próstata em soro sanguíneo. Além disso, novas técnicas de análise discriminante bidimensionais utilizando análise de componentes principais com análise discriminante linear (2D-PCA-LDA), análise discriminante quadrática (2D-PCA-QDA) e máquinas de vetores suporte (2D-PCA-SVM) foram desenvolvidas para aplicações em dados químicos de segunda ordem compostos por matrizes de excitação-emissão (EEM) por fluorescência molecular em amostras simuladas e reais. Os resultados obtidos mostraram que as técnicas desenvolvidas tiveram alto desempenho classificatório tanto para os dados de primeira quanto de segunda ordem, com taxas de acerto, sensibilidade e especificidade atingindo valores entre 90 a 100%. Além disso, as técnicas bidimensionais desenvolvidas tiveram, no geral, desempenho superior do que os métodos tradicionais de classificação multivariada utilizando dados desdobrados, o que mostra seu potencial para outras futuras aplicações analíticas.This dissertation is composed by a theoretical contribution about the development of supervised classification techniques for application using multivariate chemical data. For this, chemometric techniques based on quadratic discriminant analysis (QDA) and support vector machines (SVM) were built combined with principal component analysis (PCA), successive projections algorithm (SPA) and genetic algorithm (GA) for supervised classification using data reduction and feature selection. These techniques were employed in analyzing first-order data, composed by attenuated total reflectance Fourier transform infrared spectroscopy (ATRFTIR) and mass spectra obtained from liquid chromatography time of flight (LC/TOF) and surface-enhanced laser desorption/ionization time of flight (SELDI/TOF). ATR-FTIR data were used to differentiate two classes of fungus of Cryptococcus gene, whereas the mass spectra data was used to identify ovarian and prostate cancer in blood serum. In addition, new twodimensional discriminant analysis techniques based on principal component analysis linear discriminant analysis (2D-PCA-LDA), quadratic discriminant analysis (2D-PCA-QDA) and support vectors machine (2D-PCA-SVM) were developed for applications in second-order chemical data composed by excitation-emission matrices (EEM) molecular fluorescence of simulated and real samples. The results show that the developed techniques had better classification performance for both first and second-order data, with classification rates, sensitivity and specificity reaching values between 90 to 100%. Also, the developed twodimensional techniques had overall performance superior than traditional multivariate classification methods using unfolded data, showing its potential to other future analytical applications.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)porCNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICAQuimiometriaClassificação supervisionadaAnálise multivariadaDesenvolvimento de técnicas de classificação supervisionada para dados químicos multivariadosDevelopment of supervised classification techniques for multivariate chemical datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPROGRAMA DE PÓS-GRADUAÇÃO EM QUÍMICAUFRNBrasilinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALCamiloDeLelisMedeirosDeMorais_DISSERT.pdfCamiloDeLelisMedeirosDeMorais_DISSERT.pdfapplication/pdf7310447https://repositorio.ufrn.br/bitstream/123456789/24217/1/CamiloDeLelisMedeirosDeMorais_DISSERT.pdf40a1a97c6143778d4209de7dbd94f53bMD51TEXTCamiloDeLelisMedeirosDeMorais_DISSERT.pdf.txtCamiloDeLelisMedeirosDeMorais_DISSERT.pdf.txtExtracted texttext/plain220286https://repositorio.ufrn.br/bitstream/123456789/24217/2/CamiloDeLelisMedeirosDeMorais_DISSERT.pdf.txt0f8be57c9937b09f46bfbeb228049608MD52THUMBNAILCamiloDeLelisMedeirosDeMorais_DISSERT.pdf.jpgCamiloDeLelisMedeirosDeMorais_DISSERT.pdf.jpgIM Thumbnailimage/jpeg4303https://repositorio.ufrn.br/bitstream/123456789/24217/3/CamiloDeLelisMedeirosDeMorais_DISSERT.pdf.jpg9df6645d8e96ebd8e45b0ee6b37d7ef8MD53123456789/242172022-04-18 17:03:43.302oai:https://repositorio.ufrn.br:123456789/24217Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2022-04-18T20:03:43Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados |
dc.title.alternative.pt_BR.fl_str_mv |
Development of supervised classification techniques for multivariate chemical data |
title |
Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados |
spellingShingle |
Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados Morais, Camilo de Lelis Medeiros de CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA Quimiometria Classificação supervisionada Análise multivariada |
title_short |
Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados |
title_full |
Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados |
title_fullStr |
Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados |
title_full_unstemmed |
Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados |
title_sort |
Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados |
author |
Morais, Camilo de Lelis Medeiros de |
author_facet |
Morais, Camilo de Lelis Medeiros de |
author_role |
author |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/6928918856031880 |
dc.contributor.referees1.none.fl_str_mv |
Moraes, Edgar Perin |
dc.contributor.referees1Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/0705932816454884 |
dc.contributor.referees2.none.fl_str_mv |
Menezes, Fabricio Gava |
dc.contributor.referees2Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/2848745987784319 |
dc.contributor.referees3.none.fl_str_mv |
Bruns, Roy Eduard |
dc.contributor.author.fl_str_mv |
Morais, Camilo de Lelis Medeiros de |
dc.contributor.advisor1.fl_str_mv |
Lima, Kassio Michell Gomes de |
contributor_str_mv |
Lima, Kassio Michell Gomes de |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA Quimiometria Classificação supervisionada Análise multivariada |
dc.subject.por.fl_str_mv |
Quimiometria Classificação supervisionada Análise multivariada |
description |
Esta dissertação consiste de um aporte teórico sobre a construção de técnicas de classificação supervisionada para aplicações em dados químicos multivariados. Para isso, técnicas quimiométricas baseadas em análise discriminante quadrática (QDA) e máquinas de vetores suporte (SVM) foram construídas em conjunto com análise de componentes principais (PCA), algoritmo de projeções sucessivas (SPA) e algoritmo genético (GA) para classificação supervisionada utilizando redução de dados e seleção de variáveis. Essas técnicas foram empregadas na análise de dados de primeira ordem, constituídos de espectros na região do infravermelho médio com transformada de Fourier e reflectância total atenuada (ATR-FTIR); espectros de massas obtidos por cromatografia líquida com um detector por tempo de vôo (LC/TOF); e espectros de massas obtidos por desorção/ionização por laser de superfície acoplado a um detector por tempo de vôo (SELDI-TOF). Os dados de ATR-FTIR foram utilizados para diferenciar duas classes de fungos do gênero Cryptococcus, enquanto que os dados de espectrometria de massas foram utilizados para identificar câncer de ovário e de próstata em soro sanguíneo. Além disso, novas técnicas de análise discriminante bidimensionais utilizando análise de componentes principais com análise discriminante linear (2D-PCA-LDA), análise discriminante quadrática (2D-PCA-QDA) e máquinas de vetores suporte (2D-PCA-SVM) foram desenvolvidas para aplicações em dados químicos de segunda ordem compostos por matrizes de excitação-emissão (EEM) por fluorescência molecular em amostras simuladas e reais. Os resultados obtidos mostraram que as técnicas desenvolvidas tiveram alto desempenho classificatório tanto para os dados de primeira quanto de segunda ordem, com taxas de acerto, sensibilidade e especificidade atingindo valores entre 90 a 100%. Além disso, as técnicas bidimensionais desenvolvidas tiveram, no geral, desempenho superior do que os métodos tradicionais de classificação multivariada utilizando dados desdobrados, o que mostra seu potencial para outras futuras aplicações analíticas. |
publishDate |
2017 |
dc.date.accessioned.fl_str_mv |
2017-11-07T23:52:52Z |
dc.date.available.fl_str_mv |
2017-11-07T23:52:52Z |
dc.date.issued.fl_str_mv |
2017-09-29 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
MORAIS, Camilo de Lelis Medeiros de. Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados. 2017. 95f. Dissertação (Mestrado em Química) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/jspui/handle/123456789/24217 |
identifier_str_mv |
MORAIS, Camilo de Lelis Medeiros de. Desenvolvimento de técnicas de classificação supervisionada para dados químicos multivariados. 2017. 95f. Dissertação (Mestrado em Química) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017. |
url |
https://repositorio.ufrn.br/jspui/handle/123456789/24217 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.program.fl_str_mv |
PROGRAMA DE PÓS-GRADUAÇÃO EM QUÍMICA |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/24217/1/CamiloDeLelisMedeirosDeMorais_DISSERT.pdf https://repositorio.ufrn.br/bitstream/123456789/24217/2/CamiloDeLelisMedeirosDeMorais_DISSERT.pdf.txt https://repositorio.ufrn.br/bitstream/123456789/24217/3/CamiloDeLelisMedeirosDeMorais_DISSERT.pdf.jpg |
bitstream.checksum.fl_str_mv |
40a1a97c6143778d4209de7dbd94f53b 0f8be57c9937b09f46bfbeb228049608 9df6645d8e96ebd8e45b0ee6b37d7ef8 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1796767019665719296 |