Modelagem simbólica de padrões morfológicos para classificação de séries temporais
| Ano de defesa: | 2015 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://hdl.handle.net/1884/41324 |
Resumo: | Orientador: Prof. Dr. Fabiano Silva |
| id |
UFPR_9fa8f279aef76576ad8deab7fe97d913 |
|---|---|
| oai_identifier_str |
oai:acervodigital.ufpr.br:1884/41324 |
| network_acronym_str |
UFPR |
| network_name_str |
Repositório Institucional da UFPR |
| repository_id_str |
|
| spelling |
Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em InformáticaSilva, Fabiano, 1972-Zalewski, Willian2024-11-04T17:33:26Z2024-11-04T17:33:26Z2015https://hdl.handle.net/1884/41324Orientador: Prof. Dr. Fabiano SilvaTese (Doutorado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 14/09/2015Inclui referências : f. 149-167Resumo: O contínuo armazenamento de dados ao longo do tempo, tais como séries temporais, tem motivado o desenvolvimento de novas abordagens baseadas em métodos de mineração de dados. Nesse cenário, uma nova área de pesquisa emergiu durante as últimas duas décadas, a mineração de dados em séries temporais. Mais especificamente, as abordagens baseadas em técnicas de aprendizado de máquina têm apresentado maior interesse entre os pesquisadores. Dentre as tarefas de mineração de dados, a classificação de séries temporais tem sido amplamente explorada, de modo que estudos recentes, utilizando algoritmos de aprendizado não simbólicos, têm reportado resultados significativos, em termos da acurácia de classificação. No entanto, em aplicações que envolvem processos de auxílio à tomada de decisão, tais como diagnóstico médico, controle de produção industrial, sistemas de monitoração de segurança em aeronaves ou usinas de energia elétrica, é necessário possibilitar o entendimento do raciocínio utilizado no processo de classificação. A primitiva shapelet foi proposta na literatura como um descritor de características morfológicas locais para possibilitar melhor compreensão dos conceitos, devido a sua maior proximidade com a percepção humana na identificação de padrões em séries temporais. Contudo, a maioria dos trabalhos relacionados ao estudo dessa primitiva tem se dedicado ao desenvolvimento de abordagens mais eficientes em termos de tempo e de acurácia, desconsiderando a necessidade da inteligibilidade dos classificadores. Nesse contexto, neste trabalho foi proposto um método que utiliza a transformada shapelet para a construção de modelos simbólicos de classificação por meio de uma abordagem híbrida que combina a representação de árvore de decisão com o algoritmo vizinho mais próximo. Também, foram desenvolvidas estratégias para melhorar a qualidade de representação da transformada shapelet na utilização de classificadores simbólicos, como árvores de decisão. Para avaliar o desempenho dessas propostas, foi conduzida uma avaliação experimental que envolveu a comparação com os algoritmos considerados estado da arte usando conjuntos de dados amplamente estudados na literatura de classificação de séries temporais. Com base nos resultados e análises realizadas nesta tese, foi possível verificar que a melhoria do processo de identificação de shapelets possibilita a construção de classificadores inteligíveis e competitivos; e que métodos híbridos podem contribuir para prover uma representação simbólica dos modelos, com desempenho equivalente ou até mesmo superior aos métodos não simbólicos.Abstract: The large amount of stored data over time, such as time series, has motivated the development of new approaches based on data mining methods. In this context, a new research area has emerged over the last two decades, the time series data mining. In particular, the approaches based on machine learning techniques have shown large interest among researchers. Among the data mining tasks, the time series classification has been widely exploited. Recent studies using non-symbolic learning algorithms have reported significant results in terms of classification accuracy. However, in applications related to decision making process, such as medical diagnosis, industrial production control, security monitoring systems in aircraft and in power plants, it is necessary allow the understanding of the reasoning used in the classification process. To take this into account, the shapelet primitive has been proposed in the literature as a descriptor of local morphological characteristics, which is closer to human perception for patterns identification in time series. On the other hand, most of the existing work related to shapelets has been dedicated to the development of more effective approaches in terms of time and accuracy, disregarding the need for interpretability of the classifiers. In this work, we propose to build symbolic models for time series classification using the shapelet transformation. This method is based on a hybrid approach that merges the decision tree representation and the nearest neighbor algorithm. Also, we developed strategies to improve the representation quality of the shapelet transformation using feature selection algorithms. We performed an experimental evaluation to analyze the performance of our proposals in comparison to the algorithms considered state of the art using datasets widely studied in the literature of time series classification. Based on the results and analysis carried out in this thesis, we found that the improvement of shapelet representation allows the construction of interpretable and competitive classifiers. Moreover, we found that the hybrid methods can help to provide symbolic models with equivalent or even superior performance to non-symbolic methods.176 p. : il. algumas color., tabs.application/pdfDisponível em formato digitalCiência da computaçãoAnalise de series temporais - Processamento de dadosMineração de dados (Computação)Modelagem simbólica de padrões morfológicos para classificação de séries temporaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessTEXTR - T - WILLIAN ZALEWSKI.pdf.txtExtracted Texttext/plain371511https://acervodigital.ufpr.br/bitstream/1884/41324/1/R%20-%20T%20-%20WILLIAN%20ZALEWSKI.pdf.txtfb82c96b69f8385c22f5de30bda5a34bMD51open accessORIGINALR - T - WILLIAN ZALEWSKI.pdfapplication/pdf3332028https://acervodigital.ufpr.br/bitstream/1884/41324/2/R%20-%20T%20-%20WILLIAN%20ZALEWSKI.pdf164a0d60170254fb69f38e222c9b5a5cMD52open accessTHUMBNAILR - T - WILLIAN ZALEWSKI.pdf.jpgGenerated Thumbnailimage/jpeg1108https://acervodigital.ufpr.br/bitstream/1884/41324/3/R%20-%20T%20-%20WILLIAN%20ZALEWSKI.pdf.jpgc53f441beb6a3daab10c71e63ea9a2e5MD53open access1884/413242024-11-04 14:33:26.706open accessoai:acervodigital.ufpr.br:1884/41324Repositório InstitucionalPUBhttp://acervodigital.ufpr.br/oai/requestinformacaodigital@ufpr.bropendoar:3082024-11-04T17:33:26Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false |
| dc.title.pt_BR.fl_str_mv |
Modelagem simbólica de padrões morfológicos para classificação de séries temporais |
| title |
Modelagem simbólica de padrões morfológicos para classificação de séries temporais |
| spellingShingle |
Modelagem simbólica de padrões morfológicos para classificação de séries temporais Zalewski, Willian Ciência da computação Analise de series temporais - Processamento de dados Mineração de dados (Computação) |
| title_short |
Modelagem simbólica de padrões morfológicos para classificação de séries temporais |
| title_full |
Modelagem simbólica de padrões morfológicos para classificação de séries temporais |
| title_fullStr |
Modelagem simbólica de padrões morfológicos para classificação de séries temporais |
| title_full_unstemmed |
Modelagem simbólica de padrões morfológicos para classificação de séries temporais |
| title_sort |
Modelagem simbólica de padrões morfológicos para classificação de séries temporais |
| author |
Zalewski, Willian |
| author_facet |
Zalewski, Willian |
| author_role |
author |
| dc.contributor.other.pt_BR.fl_str_mv |
Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática |
| dc.contributor.advisor1.fl_str_mv |
Silva, Fabiano, 1972- |
| dc.contributor.author.fl_str_mv |
Zalewski, Willian |
| contributor_str_mv |
Silva, Fabiano, 1972- |
| dc.subject.por.fl_str_mv |
Ciência da computação Analise de series temporais - Processamento de dados Mineração de dados (Computação) |
| topic |
Ciência da computação Analise de series temporais - Processamento de dados Mineração de dados (Computação) |
| description |
Orientador: Prof. Dr. Fabiano Silva |
| publishDate |
2015 |
| dc.date.issued.fl_str_mv |
2015 |
| dc.date.accessioned.fl_str_mv |
2024-11-04T17:33:26Z |
| dc.date.available.fl_str_mv |
2024-11-04T17:33:26Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1884/41324 |
| url |
https://hdl.handle.net/1884/41324 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.pt_BR.fl_str_mv |
Disponível em formato digital |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
176 p. : il. algumas color., tabs. application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná (UFPR) instacron:UFPR |
| instname_str |
Universidade Federal do Paraná (UFPR) |
| instacron_str |
UFPR |
| institution |
UFPR |
| reponame_str |
Repositório Institucional da UFPR |
| collection |
Repositório Institucional da UFPR |
| bitstream.url.fl_str_mv |
https://acervodigital.ufpr.br/bitstream/1884/41324/1/R%20-%20T%20-%20WILLIAN%20ZALEWSKI.pdf.txt https://acervodigital.ufpr.br/bitstream/1884/41324/2/R%20-%20T%20-%20WILLIAN%20ZALEWSKI.pdf https://acervodigital.ufpr.br/bitstream/1884/41324/3/R%20-%20T%20-%20WILLIAN%20ZALEWSKI.pdf.jpg |
| bitstream.checksum.fl_str_mv |
fb82c96b69f8385c22f5de30bda5a34b 164a0d60170254fb69f38e222c9b5a5c c53f441beb6a3daab10c71e63ea9a2e5 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR) |
| repository.mail.fl_str_mv |
informacaodigital@ufpr.br |
| _version_ |
1847526260097417216 |