Avaliação do desempenho estatístico dos algoritmos de classificação Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) para imagens de satélite com diferentes cubos de dados: estudo de caso no bioma cerrado

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Carlos Eduardo Fernandes de Holanda lattes
Orientador(a): Diego Rodrigues Macedo lattes
Banca de defesa: Glauco José de Matos Umbelino, Úrsula Ruchkys de Azevedo
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Minas Gerais
Programa de Pós-Graduação: Programa de Pós-Graduação em Geografia
Departamento: IGC - DEPARTAMENTO DE GEOGRAFIA
País: Brasil
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/1843/43270
Resumo: O principal objetivo deste trabalho é analisar e comparar o desempenho de três algoritmos baseados em aprendizado de máquina: Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) na classificação de imagens de satélite de uso e cobertura da terra utilizando informações altimétricas em diferentes cubos de dados. Nesse sentido, foram interpretados os resultados encontrados nos índices estatísticos de validação e na concordância entre as classes na matriz de confusão, o que pode auxiliar estudantes e pesquisadores da área de sensoriamento remoto a escolherem o algoritmo de classificação que melhor se adeque às suas pesquisas. Para este estudo foram utilizadas imagens do satélite Sentinel 2 e outra imagem que empilha as do Sentinel 2 com imagens derivadas da missão Shuttle Radar Topography Mission (SRTM) no intuito de identificar e interpretar as diferenças nas classificações dessas imagens. O classificador que obteve os melhores desempenhos foi o SVM, tanto para as imagens com os dados altimétricos quanto para as imagens sem estas informações complementares. Apesar do DT ter apresentado resultados satisfatórios, mas inferiores ao SVM, o classificador de DT obteve tempo de processamento para a classificação de imagens muito menor que o do SVM. Diante desse dado, observa-se que, caso a área de pesquisa seja muito extensa ou tenha várias pequenas áreas aliadas a um computador com processador não adequado, o classificador SVM não seria a melhor opção. O algoritmo RF obteve praticamente o mesmo tempo de processamento que o DT, mas atingiu os menores índices estatísticos entre os três classificadores. Ainda, verificou-se que a utilização do cubo de dados com a imagem do SRTM e suas derivações como declividade e rugosidade na classificação do uso e cobertura da terra para os três algoritmos mostraram resultados superiores em comparação com as imagens sem estes dados altimétricos.
id UFMG_7959bda1cfdf94c2114d2f011cd0edb8
oai_identifier_str oai:repositorio.ufmg.br:1843/43270
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Diego Rodrigues Macedohttp://lattes.cnpq.br/0805217613268162Rodrigo Affonso de Albuquerque NóbregaGlauco José de Matos UmbelinoÚrsula Ruchkys de Azevedohttp://lattes.cnpq.br/2052225522830493Carlos Eduardo Fernandes de Holanda2022-07-14T16:29:12Z2022-07-14T16:29:12Z2021-11-30http://hdl.handle.net/1843/43270O principal objetivo deste trabalho é analisar e comparar o desempenho de três algoritmos baseados em aprendizado de máquina: Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) na classificação de imagens de satélite de uso e cobertura da terra utilizando informações altimétricas em diferentes cubos de dados. Nesse sentido, foram interpretados os resultados encontrados nos índices estatísticos de validação e na concordância entre as classes na matriz de confusão, o que pode auxiliar estudantes e pesquisadores da área de sensoriamento remoto a escolherem o algoritmo de classificação que melhor se adeque às suas pesquisas. Para este estudo foram utilizadas imagens do satélite Sentinel 2 e outra imagem que empilha as do Sentinel 2 com imagens derivadas da missão Shuttle Radar Topography Mission (SRTM) no intuito de identificar e interpretar as diferenças nas classificações dessas imagens. O classificador que obteve os melhores desempenhos foi o SVM, tanto para as imagens com os dados altimétricos quanto para as imagens sem estas informações complementares. Apesar do DT ter apresentado resultados satisfatórios, mas inferiores ao SVM, o classificador de DT obteve tempo de processamento para a classificação de imagens muito menor que o do SVM. Diante desse dado, observa-se que, caso a área de pesquisa seja muito extensa ou tenha várias pequenas áreas aliadas a um computador com processador não adequado, o classificador SVM não seria a melhor opção. O algoritmo RF obteve praticamente o mesmo tempo de processamento que o DT, mas atingiu os menores índices estatísticos entre os três classificadores. Ainda, verificou-se que a utilização do cubo de dados com a imagem do SRTM e suas derivações como declividade e rugosidade na classificação do uso e cobertura da terra para os três algoritmos mostraram resultados superiores em comparação com as imagens sem estes dados altimétricos.The main objective of this work is to analyze and compare the performance of three algorithms based on machine learning: Random Forest (RF), Decision Tree (DT) and Support Vector Machine (SVM) in the classification of land use and land cover satellite images using altimetric information in different data cubes. In this sense, the results found in the statistical indices of validation and agreement between classes in the confusion matrix were interpreted, which can help students and researchers in the field of remote sensing to choose the classification algorithm that best suits their research. For this study, images from the Sentinel 2 satellite and another image that stacks those from Sentinel 2 with images derived from the Shuttle Radar Topography Mission (SRTM) were used in order to identify and interpret the differences in the classifications of these images. The classifier that obtained the best performance was the SVM, both for images with altimetric data and for images without this additional information. Although the DT presented satisfactory results, but inferior to the SVM, the DT classifier had much lower processing time for the classification of images than the SVM. Given this data, it is observed that, if the research area is very extensive or has several small areas combined with a computer with an unsuitable processor, the SVM classifier would not be the best option. The RF algorithm obtained practically the same processing time as the DT, but reached the lowest statistical indexes among the three classifiers. Furthermore, it was found that the use of the data cube with the SRTM image and its derivations such as slope and roughness in the classification of land use and land cover for the three algorithms showed superior results compared to the images without these altimetric data.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de Minas GeraisPrograma de Pós-Graduação em GeografiaUFMGBrasilIGC - DEPARTAMENTO DE GEOGRAFIAAprendizado do computadorSolo – UsoMapeamento da cobertura do soloSensoriamento remotoAprendizado de MáquinaUso e cobertura da terraDados altimétricosSensoriamento RemotoAvaliação do desempenho estatístico dos algoritmos de classificação Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) para imagens de satélite com diferentes cubos de dados: estudo de caso no bioma cerradoStatistical performance evaluation of Random Forest (RF), Decision Tree (DT) and Support Vector Machine (SVM) classification algorithms for satellite images with different data cubes: a case study in the cerrado biomeinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALAvaliação do desempenho estatístico dos algoritmos de classificação Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) para imagens de satélite com diferentes cubos de dados estudo de caso no bioma cerrado.pdfAvaliação do desempenho estatístico dos algoritmos de classificação Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) para imagens de satélite com diferentes cubos de dados estudo de caso no bioma cerrado.pdfapplication/pdf6313405https://repositorio.ufmg.br/bitstream/1843/43270/1/Avalia%c3%a7%c3%a3o%20do%20desempenho%20estat%c3%adstico%20dos%20algoritmos%20de%20classi%ef%ac%81ca%c3%a7%c3%a3o%20Random%20Forest%20%28RF%29%2c%20Decision%20Tree%20%28DT%29%20e%20Support%20Vector%20Machine%20%28SVM%29%20para%20imagens%20de%20sat%c3%a9lite%20com%20diferentes%20cubos%20de%20dados%20estudo%20de%20caso%20no%20bioma%20cerrado.pdf754ef7d48247c2c3d57f3a7d4021cd13MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82118https://repositorio.ufmg.br/bitstream/1843/43270/2/license.txtcda590c95a0b51b4d15f60c9642ca272MD521843/432702023-05-08 14:19:50.893oai:repositorio.ufmg.br:1843/43270TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2023-05-08T17:19:50Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Avaliação do desempenho estatístico dos algoritmos de classificação Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) para imagens de satélite com diferentes cubos de dados: estudo de caso no bioma cerrado
dc.title.alternative.pt_BR.fl_str_mv Statistical performance evaluation of Random Forest (RF), Decision Tree (DT) and Support Vector Machine (SVM) classification algorithms for satellite images with different data cubes: a case study in the cerrado biome
title Avaliação do desempenho estatístico dos algoritmos de classificação Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) para imagens de satélite com diferentes cubos de dados: estudo de caso no bioma cerrado
spellingShingle Avaliação do desempenho estatístico dos algoritmos de classificação Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) para imagens de satélite com diferentes cubos de dados: estudo de caso no bioma cerrado
Carlos Eduardo Fernandes de Holanda
Aprendizado de Máquina
Uso e cobertura da terra
Dados altimétricos
Sensoriamento Remoto
Aprendizado do computador
Solo – Uso
Mapeamento da cobertura do solo
Sensoriamento remoto
title_short Avaliação do desempenho estatístico dos algoritmos de classificação Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) para imagens de satélite com diferentes cubos de dados: estudo de caso no bioma cerrado
title_full Avaliação do desempenho estatístico dos algoritmos de classificação Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) para imagens de satélite com diferentes cubos de dados: estudo de caso no bioma cerrado
title_fullStr Avaliação do desempenho estatístico dos algoritmos de classificação Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) para imagens de satélite com diferentes cubos de dados: estudo de caso no bioma cerrado
title_full_unstemmed Avaliação do desempenho estatístico dos algoritmos de classificação Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) para imagens de satélite com diferentes cubos de dados: estudo de caso no bioma cerrado
title_sort Avaliação do desempenho estatístico dos algoritmos de classificação Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) para imagens de satélite com diferentes cubos de dados: estudo de caso no bioma cerrado
author Carlos Eduardo Fernandes de Holanda
author_facet Carlos Eduardo Fernandes de Holanda
author_role author
dc.contributor.advisor1.fl_str_mv Diego Rodrigues Macedo
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/0805217613268162
dc.contributor.advisor-co1.fl_str_mv Rodrigo Affonso de Albuquerque Nóbrega
dc.contributor.referee1.fl_str_mv Glauco José de Matos Umbelino
dc.contributor.referee2.fl_str_mv Úrsula Ruchkys de Azevedo
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/2052225522830493
dc.contributor.author.fl_str_mv Carlos Eduardo Fernandes de Holanda
contributor_str_mv Diego Rodrigues Macedo
Rodrigo Affonso de Albuquerque Nóbrega
Glauco José de Matos Umbelino
Úrsula Ruchkys de Azevedo
dc.subject.por.fl_str_mv Aprendizado de Máquina
Uso e cobertura da terra
Dados altimétricos
Sensoriamento Remoto
topic Aprendizado de Máquina
Uso e cobertura da terra
Dados altimétricos
Sensoriamento Remoto
Aprendizado do computador
Solo – Uso
Mapeamento da cobertura do solo
Sensoriamento remoto
dc.subject.other.pt_BR.fl_str_mv Aprendizado do computador
Solo – Uso
Mapeamento da cobertura do solo
Sensoriamento remoto
description O principal objetivo deste trabalho é analisar e comparar o desempenho de três algoritmos baseados em aprendizado de máquina: Random Forest (RF), Decision Tree (DT) e Support Vector Machine (SVM) na classificação de imagens de satélite de uso e cobertura da terra utilizando informações altimétricas em diferentes cubos de dados. Nesse sentido, foram interpretados os resultados encontrados nos índices estatísticos de validação e na concordância entre as classes na matriz de confusão, o que pode auxiliar estudantes e pesquisadores da área de sensoriamento remoto a escolherem o algoritmo de classificação que melhor se adeque às suas pesquisas. Para este estudo foram utilizadas imagens do satélite Sentinel 2 e outra imagem que empilha as do Sentinel 2 com imagens derivadas da missão Shuttle Radar Topography Mission (SRTM) no intuito de identificar e interpretar as diferenças nas classificações dessas imagens. O classificador que obteve os melhores desempenhos foi o SVM, tanto para as imagens com os dados altimétricos quanto para as imagens sem estas informações complementares. Apesar do DT ter apresentado resultados satisfatórios, mas inferiores ao SVM, o classificador de DT obteve tempo de processamento para a classificação de imagens muito menor que o do SVM. Diante desse dado, observa-se que, caso a área de pesquisa seja muito extensa ou tenha várias pequenas áreas aliadas a um computador com processador não adequado, o classificador SVM não seria a melhor opção. O algoritmo RF obteve praticamente o mesmo tempo de processamento que o DT, mas atingiu os menores índices estatísticos entre os três classificadores. Ainda, verificou-se que a utilização do cubo de dados com a imagem do SRTM e suas derivações como declividade e rugosidade na classificação do uso e cobertura da terra para os três algoritmos mostraram resultados superiores em comparação com as imagens sem estes dados altimétricos.
publishDate 2021
dc.date.issued.fl_str_mv 2021-11-30
dc.date.accessioned.fl_str_mv 2022-07-14T16:29:12Z
dc.date.available.fl_str_mv 2022-07-14T16:29:12Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/43270
url http://hdl.handle.net/1843/43270
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Geografia
dc.publisher.initials.fl_str_mv UFMG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv IGC - DEPARTAMENTO DE GEOGRAFIA
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/43270/1/Avalia%c3%a7%c3%a3o%20do%20desempenho%20estat%c3%adstico%20dos%20algoritmos%20de%20classi%ef%ac%81ca%c3%a7%c3%a3o%20Random%20Forest%20%28RF%29%2c%20Decision%20Tree%20%28DT%29%20e%20Support%20Vector%20Machine%20%28SVM%29%20para%20imagens%20de%20sat%c3%a9lite%20com%20diferentes%20cubos%20de%20dados%20estudo%20de%20caso%20no%20bioma%20cerrado.pdf
https://repositorio.ufmg.br/bitstream/1843/43270/2/license.txt
bitstream.checksum.fl_str_mv 754ef7d48247c2c3d57f3a7d4021cd13
cda590c95a0b51b4d15f60c9642ca272
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1801677141637595136