Otimização multiobjetivo para seleção simultânea de variáveis e objetos em cromossomo duplo de representação inteira para calibração multivariada

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: Bastos, Hélios Kárum de Oliveira lattes
Orientador(a): Soares, Anderson da Silva lattes
Banca de defesa: Soares, Anderson da Silva, Sanches, Danilo Sipoli, Laureano, Gustavo Teodoro
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Goiás
Programa de Pós-Graduação: Programa de Pós-graduação em Ciência da Computação (INF)
Departamento: Instituto de Informática - INF (RG)
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://repositorio.bc.ufg.br/tede/handle/tede/8094
Resumo: Multiobjective Optimization for feature and samples selection in double chromosome of integer representation and variable size for multivariate calibration} In several problems of regression, classification, prediction, approximation Optimization, the original data contain a large number of variables to obtain a better representation of the problem under consideration. However, a significant part of the variables may be irrelevant and redundant from the point of view of machine learning. Indeed, one of the challenges to be overcome is a selection of a subset of variables that has the best perform. One of the breakthroughs in this type of problem is the use of a multiobjective formulation that avoids the overlap of the model to the training data set. Another important point is the process of choosing the objects to be used in the learning stage. Generally, a selection of variables and treatment objects are treated separately and without dependence. This project proposes a multiobjective modeling to select variables and objects simultaneously using a genetic integer representation algorithm with variable size chromosomes. It is expected that a simultaneous selection of objects and variables on a multiobjective context produce better results in a traditional approach. As a case study this work utilized an analysis of near infrared (NIR) material on oil samples for the purpose of estimating the concentration of an interest properties such set was used in the competition conducted at the International Diffuse Reflectance Conference (IDRC) in the year 2014.
id UFG-2_73cd002b9bab285befadba26744028b9
oai_identifier_str oai:repositorio.bc.ufg.br:tede/8094
network_acronym_str UFG-2
network_name_str Repositório Institucional da UFG
repository_id_str
spelling Soares, Anderson da Silvahttp://lattes.cnpq.br/1096941114079527Soares, Anderson da SilvaSanches, Danilo SipoliLaureano, Gustavo Teodorohttp://lattes.cnpq.br/7390577986848029Bastos, Hélios Kárum de Oliveira2018-01-10T09:42:46Z2017-08-24BASTOS, H. K. O. Otimização multiobjetivo para seleção simultânea de variáveis e objetos em cromossomo duplo de representação inteira para calibração multivariada. 2017. 76 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2017.http://repositorio.bc.ufg.br/tede/handle/tede/8094Multiobjective Optimization for feature and samples selection in double chromosome of integer representation and variable size for multivariate calibration} In several problems of regression, classification, prediction, approximation Optimization, the original data contain a large number of variables to obtain a better representation of the problem under consideration. However, a significant part of the variables may be irrelevant and redundant from the point of view of machine learning. Indeed, one of the challenges to be overcome is a selection of a subset of variables that has the best perform. One of the breakthroughs in this type of problem is the use of a multiobjective formulation that avoids the overlap of the model to the training data set. Another important point is the process of choosing the objects to be used in the learning stage. Generally, a selection of variables and treatment objects are treated separately and without dependence. This project proposes a multiobjective modeling to select variables and objects simultaneously using a genetic integer representation algorithm with variable size chromosomes. It is expected that a simultaneous selection of objects and variables on a multiobjective context produce better results in a traditional approach. As a case study this work utilized an analysis of near infrared (NIR) material on oil samples for the purpose of estimating the concentration of an interest properties such set was used in the competition conducted at the International Diffuse Reflectance Conference (IDRC) in the year 2014.Em diversos problemas de regressão, classificação, previsão, aproximação e otimização, os dados originais contêm um grande número de variáveis introduzidas para se obter uma melhor representação do problema considerado. Entretanto, uma parte significativa destas variáveis podem ser irrelevantes e/ou redundantes do ponto de vista do aprendizado de máquina acerca do problema. Com efeito, um dos desafios a ser superados é a seleção de um subconjunto de variáveis que apresentem um melhor desempenho. Um dos avanços recentes neste tipo de problema está no uso de uma formulação multiobjetivo que evita o superajuste do modelo ao conjunto de dados de treinamento. Outro ponto importante refere-se ao processo de escolha adequada dos objetos a serem utilizados na etapa de aprendizado. Geralmente, a seleção de variáveis e de objetos de treinamento são tratados de forma separada e sem dependência. Este projeto propõe uma modelagem multiobjetivo para seleção de variáveis e objetos de forma simultânea utilizando-se de algoritmo genético de representação inteira com cromossomos de tamanho variáveis. Espera-se que a seleção simultânea de objetos e variáveis no contexto multiobjetivo produza melhores resultados em relação a abordagem tradicional. Como estudo de caso este trabalho utiliza dados obtidos por uma análise de material com ondas de infravermelho próximo (NIR) sobre amostras de petróleo com o propósito de estimar a concentração de uma propriedade de interesse, tal conjunto foi utilizado na competição realizada no International Diffuse Reflectance Conference (IDRC) (\url{http://cnirs.clubexpress.com/content.aspx?page_id=22&club_id=409746&module_id=19 0211}), no ano de 2015.Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2018-01-10T09:42:22Z No. of bitstreams: 2 Dissertação - Hélios Kárum de Oliveira Bastos - 2017.pdf: 2219804 bytes, checksum: ba853c18f7e7e2c65eb0a342d4a34640 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2018-01-10T09:42:46Z (GMT) No. of bitstreams: 2 Dissertação - Hélios Kárum de Oliveira Bastos - 2017.pdf: 2219804 bytes, checksum: ba853c18f7e7e2c65eb0a342d4a34640 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)Made available in DSpace on 2018-01-10T09:42:46Z (GMT). No. of bitstreams: 2 Dissertação - Hélios Kárum de Oliveira Bastos - 2017.pdf: 2219804 bytes, checksum: ba853c18f7e7e2c65eb0a342d4a34640 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2017-08-24application/pdfporUniversidade Federal de GoiásPrograma de Pós-graduação em Ciência da Computação (INF)UFGBrasilInstituto de Informática - INF (RG)http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessCalibração multivariadaAlgoritmo genéticoOtimização multiobjetivoNSGA-IIRepresentação inteiraMultivariate calibrationGenetic algorithmMultiobjective optimizationNSGA-IIInteger representationCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOOtimização multiobjetivo para seleção simultânea de variáveis e objetos em cromossomo duplo de representação inteira para calibração multivariadaMultiobjective optimization for feature and samples selection in double chromosome of integer representation and variable size for multivariate calibrationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-3303550325223384799600600600-77122667346336447683671711205811204509reponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGLICENSElicense.txtlicense.txttext/plain; charset=utf-82165http://repositorio.bc.ufg.br/tede/bitstreams/82e61e4e-ba2d-493b-947d-4cc6253cb998/downloadbd3efa91386c1718a7f26a329fdcb468MD51CC-LICENSElicense_urllicense_urltext/plain; charset=utf-849http://repositorio.bc.ufg.br/tede/bitstreams/6806a943-733e-45a0-adcc-e96a775721fb/download4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_texttext/html; charset=utf-80http://repositorio.bc.ufg.br/tede/bitstreams/b375eb33-641c-4b58-8647-2beef22a384c/downloadd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-80http://repositorio.bc.ufg.br/tede/bitstreams/6c5ff7db-6203-444c-8a87-04691acff10b/downloadd41d8cd98f00b204e9800998ecf8427eMD54ORIGINALDissertação - Hélios Kárum de Oliveira Bastos - 2017.pdfDissertação - Hélios Kárum de Oliveira Bastos - 2017.pdfapplication/pdf2219804http://repositorio.bc.ufg.br/tede/bitstreams/481f1ef2-2775-4816-bc02-e0092140694d/downloadba853c18f7e7e2c65eb0a342d4a34640MD55tede/80942018-01-10 07:42:46.873http://creativecommons.org/licenses/by-nc-nd/4.0/Acesso Abertoopen.accessoai:repositorio.bc.ufg.br:tede/8094http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttp://repositorio.bc.ufg.br/oai/requesttasesdissertacoes.bc@ufg.bropendoar:2018-01-10T09:42:46Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSw5NQUklBIExJQ0VOw4dBCkVzdGEgbGljZW7Dp2EgZGUgZXhlbXBsbyDDqSBmb3JuZWNpZGEgYXBlbmFzIHBhcmEgZmlucyBpbmZvcm1hdGl2b3MuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgClhYWCAoU2lnbGEgZGEgVW5pdmVyc2lkYWRlKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyAKVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=
dc.title.eng.fl_str_mv Otimização multiobjetivo para seleção simultânea de variáveis e objetos em cromossomo duplo de representação inteira para calibração multivariada
dc.title.alternative.eng.fl_str_mv Multiobjective optimization for feature and samples selection in double chromosome of integer representation and variable size for multivariate calibration
title Otimização multiobjetivo para seleção simultânea de variáveis e objetos em cromossomo duplo de representação inteira para calibração multivariada
spellingShingle Otimização multiobjetivo para seleção simultânea de variáveis e objetos em cromossomo duplo de representação inteira para calibração multivariada
Bastos, Hélios Kárum de Oliveira
Calibração multivariada
Algoritmo genético
Otimização multiobjetivo
NSGA-II
Representação inteira
Multivariate calibration
Genetic algorithm
Multiobjective optimization
NSGA-II
Integer representation
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Otimização multiobjetivo para seleção simultânea de variáveis e objetos em cromossomo duplo de representação inteira para calibração multivariada
title_full Otimização multiobjetivo para seleção simultânea de variáveis e objetos em cromossomo duplo de representação inteira para calibração multivariada
title_fullStr Otimização multiobjetivo para seleção simultânea de variáveis e objetos em cromossomo duplo de representação inteira para calibração multivariada
title_full_unstemmed Otimização multiobjetivo para seleção simultânea de variáveis e objetos em cromossomo duplo de representação inteira para calibração multivariada
title_sort Otimização multiobjetivo para seleção simultânea de variáveis e objetos em cromossomo duplo de representação inteira para calibração multivariada
author Bastos, Hélios Kárum de Oliveira
author_facet Bastos, Hélios Kárum de Oliveira
author_role author
dc.contributor.advisor1.fl_str_mv Soares, Anderson da Silva
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/1096941114079527
dc.contributor.referee1.fl_str_mv Soares, Anderson da Silva
dc.contributor.referee2.fl_str_mv Sanches, Danilo Sipoli
dc.contributor.referee3.fl_str_mv Laureano, Gustavo Teodoro
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/7390577986848029
dc.contributor.author.fl_str_mv Bastos, Hélios Kárum de Oliveira
contributor_str_mv Soares, Anderson da Silva
Soares, Anderson da Silva
Sanches, Danilo Sipoli
Laureano, Gustavo Teodoro
dc.subject.por.fl_str_mv Calibração multivariada
Algoritmo genético
Otimização multiobjetivo
NSGA-II
Representação inteira
topic Calibração multivariada
Algoritmo genético
Otimização multiobjetivo
NSGA-II
Representação inteira
Multivariate calibration
Genetic algorithm
Multiobjective optimization
NSGA-II
Integer representation
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Multivariate calibration
Genetic algorithm
Multiobjective optimization
NSGA-II
Integer representation
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Multiobjective Optimization for feature and samples selection in double chromosome of integer representation and variable size for multivariate calibration} In several problems of regression, classification, prediction, approximation Optimization, the original data contain a large number of variables to obtain a better representation of the problem under consideration. However, a significant part of the variables may be irrelevant and redundant from the point of view of machine learning. Indeed, one of the challenges to be overcome is a selection of a subset of variables that has the best perform. One of the breakthroughs in this type of problem is the use of a multiobjective formulation that avoids the overlap of the model to the training data set. Another important point is the process of choosing the objects to be used in the learning stage. Generally, a selection of variables and treatment objects are treated separately and without dependence. This project proposes a multiobjective modeling to select variables and objects simultaneously using a genetic integer representation algorithm with variable size chromosomes. It is expected that a simultaneous selection of objects and variables on a multiobjective context produce better results in a traditional approach. As a case study this work utilized an analysis of near infrared (NIR) material on oil samples for the purpose of estimating the concentration of an interest properties such set was used in the competition conducted at the International Diffuse Reflectance Conference (IDRC) in the year 2014.
publishDate 2017
dc.date.issued.fl_str_mv 2017-08-24
dc.date.accessioned.fl_str_mv 2018-01-10T09:42:46Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv BASTOS, H. K. O. Otimização multiobjetivo para seleção simultânea de variáveis e objetos em cromossomo duplo de representação inteira para calibração multivariada. 2017. 76 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2017.
dc.identifier.uri.fl_str_mv http://repositorio.bc.ufg.br/tede/handle/tede/8094
identifier_str_mv BASTOS, H. K. O. Otimização multiobjetivo para seleção simultânea de variáveis e objetos em cromossomo duplo de representação inteira para calibração multivariada. 2017. 76 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2017.
url http://repositorio.bc.ufg.br/tede/handle/tede/8094
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv -3303550325223384799
dc.relation.confidence.fl_str_mv 600
600
600
dc.relation.department.fl_str_mv -7712266734633644768
dc.relation.cnpq.fl_str_mv 3671711205811204509
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Goiás
dc.publisher.program.fl_str_mv Programa de Pós-graduação em Ciência da Computação (INF)
dc.publisher.initials.fl_str_mv UFG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Informática - INF (RG)
publisher.none.fl_str_mv Universidade Federal de Goiás
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFG
instname:Universidade Federal de Goiás (UFG)
instacron:UFG
instname_str Universidade Federal de Goiás (UFG)
instacron_str UFG
institution UFG
reponame_str Repositório Institucional da UFG
collection Repositório Institucional da UFG
bitstream.url.fl_str_mv http://repositorio.bc.ufg.br/tede/bitstreams/82e61e4e-ba2d-493b-947d-4cc6253cb998/download
http://repositorio.bc.ufg.br/tede/bitstreams/6806a943-733e-45a0-adcc-e96a775721fb/download
http://repositorio.bc.ufg.br/tede/bitstreams/b375eb33-641c-4b58-8647-2beef22a384c/download
http://repositorio.bc.ufg.br/tede/bitstreams/6c5ff7db-6203-444c-8a87-04691acff10b/download
http://repositorio.bc.ufg.br/tede/bitstreams/481f1ef2-2775-4816-bc02-e0092140694d/download
bitstream.checksum.fl_str_mv bd3efa91386c1718a7f26a329fdcb468
4afdbb8c545fd630ea7db775da747b2f
d41d8cd98f00b204e9800998ecf8427e
d41d8cd98f00b204e9800998ecf8427e
ba853c18f7e7e2c65eb0a342d4a34640
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)
repository.mail.fl_str_mv tasesdissertacoes.bc@ufg.br
_version_ 1798044976703078400