Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos

Detalhes bibliográficos
Ano de defesa: 2013
Autor(a) principal: Silveira Junior, Carlos Roberto
Orientador(a): Santos, Marilde Terezinha Prado lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação - PPGCC
Departamento: Não Informado pela instituição
País: BR
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/ufscar/550
Resumo: The mining of sequential patterns in data from environmental sensors is a challenging task: the data may show noise and may also contain sparse patterns that are difficult to detect. The knowledge extracted from environmental sensor data can be used to determine climate change, for example. However, there is a lack of methods that can handle this type of database. In order to reduce this gap, the algorithm Incremental Miner of Stretchy Time Sequences with Post-Processing (IncMSTS-PP) was proposed. The IncMSTS-PP applies incremental extraction of sequential patterns with post-processing based on ontology for the generalization of the patterns. The post-processing makes the patterns semantically richer. Generalized patterns synthesize the information and makes it easier to be interpreted. IncMSTS-PP implements the Stretchy Time Window (STW) that allows stretchy time patterns (patterns with temporal intervals) are mined from bases that have noises. In comparison with GSP algorithm, IncMSTS-PP can return 2.3 times more patterns and patterns with 5 times more itemsets. The post-processing module is responsible for the reduction in 22.47% of the number of patterns presented to the user, but the returned patterns are semantically richer. Thus, the IncMSTS-PP showed good performance and mined relevant patterns showing, that way, that IncMSTS-PP is effective, efficient and appropriate for domain of environmental sensor data.
id SCAR_52240425c5bb58aae652062edd22d08c
oai_identifier_str oai:repositorio.ufscar.br:ufscar/550
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Silveira Junior, Carlos RobertoSantos, Marilde Terezinha Pradohttp://lattes.cnpq.br/9826026025118073http://lattes.cnpq.br/9893034966040171b514b8de-d381-4b18-a0d0-2720637b182c2016-06-02T19:06:09Z2013-11-072016-06-02T19:06:09Z2013-06-07SILVEIRA JUNIOR, Carlos Roberto. Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos. 2013. 119 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2013.https://repositorio.ufscar.br/handle/ufscar/550The mining of sequential patterns in data from environmental sensors is a challenging task: the data may show noise and may also contain sparse patterns that are difficult to detect. The knowledge extracted from environmental sensor data can be used to determine climate change, for example. However, there is a lack of methods that can handle this type of database. In order to reduce this gap, the algorithm Incremental Miner of Stretchy Time Sequences with Post-Processing (IncMSTS-PP) was proposed. The IncMSTS-PP applies incremental extraction of sequential patterns with post-processing based on ontology for the generalization of the patterns. The post-processing makes the patterns semantically richer. Generalized patterns synthesize the information and makes it easier to be interpreted. IncMSTS-PP implements the Stretchy Time Window (STW) that allows stretchy time patterns (patterns with temporal intervals) are mined from bases that have noises. In comparison with GSP algorithm, IncMSTS-PP can return 2.3 times more patterns and patterns with 5 times more itemsets. The post-processing module is responsible for the reduction in 22.47% of the number of patterns presented to the user, but the returned patterns are semantically richer. Thus, the IncMSTS-PP showed good performance and mined relevant patterns showing, that way, that IncMSTS-PP is effective, efficient and appropriate for domain of environmental sensor data.A mineração de padrões sequenciais em dados de sensores ambientais é uma tarefa desafiadora: os dados podem apresentar ruídos e podem, também, conter padrões esparsos que são difíceis de serem detectados. O conhecimento extraído de dados de sensores ambientais pode ser usado para determinar mudanças climáticas, por exemplo. Entretanto, há uma lacuna de métodos que podem lidar com este tipo de banco de dados. Com o intuito de diminuir esta lacuna, o algoritmo Incremental Miner of Stretchy Time Sequences with Post- Processing (IncMSTS-PP) foi proposto. O IncMSTS-PP aplica a extração incremental de padrões sequencias com pós-processamento baseado em ontologia para a generalização dos padrões obtidos que acarreta o enriquecimento semântico desses padrões. Padrões generalizados sintetizam a informação e a torna mais fácil de ser interpretada. IncMSTS-PP implementa o método Stretchy Time Window (STW) que permite que padrões de tempo elástico (padrões com intervalos temporais) sejam extraídos em bases que apresentam ruídos. Em comparação com o algoritmo GSP, o IncMSTS-PP pode retornar 2,3 vezes mais sequencias e sequencias com 5 vezes mais itemsets. O módulo de pós-processamento é responsável pela redução em 22,47% do número de padrões apresentados ao usuário, porém os padrões retornados são semanticamente mais ricos, se comparados aos padrões não generalizados. Assim sendo, o IncMSTS-PP apresentou bons resultados de desempenho e minerou padrões relevantes mostrando, assim, que IncMSTS-PP é eficaz, eficiente e apropriado em domínio de dados de sensores ambientais.application/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarBRData mining (Mineração de dados)Dados espaçotemporaisExtração de padrões sequenciaisJanelamento de dadosOntologia difusaAlgoritmo de mineração de dadosDados reaisGeneralização de padrõesIncrementalData mining algorithmTime-spacial dataReal dataSequential pattern extractionPatterns generalizationData windowingIncremental data miningFuzzy ontologyCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAlgoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-11bdb200e-99c1-45c7-8e62-ff292489211einfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINAL5554.pdfapplication/pdf2294386https://repositorio.ufscar.br/bitstream/ufscar/550/1/5554.pdfce6dc6cd7128337c0533ddd23c0bc601MD51TEXT5554.pdf.txt5554.pdf.txtExtracted texttext/plain0https://repositorio.ufscar.br/bitstream/ufscar/550/2/5554.pdf.txtd41d8cd98f00b204e9800998ecf8427eMD52THUMBNAIL5554.pdf.jpg5554.pdf.jpgIM Thumbnailimage/jpeg13631https://repositorio.ufscar.br/bitstream/ufscar/550/3/5554.pdf.jpgc8e6ed4d85380a178cee60f40ee3d4a1MD53ufscar/5502023-09-18 18:31:43.844oai:repositorio.ufscar.br:ufscar/550Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:43Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos
title Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos
spellingShingle Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos
Silveira Junior, Carlos Roberto
Data mining (Mineração de dados)
Dados espaçotemporais
Extração de padrões sequenciais
Janelamento de dados
Ontologia difusa
Algoritmo de mineração de dados
Dados reais
Generalização de padrões
Incremental
Data mining algorithm
Time-spacial data
Real data
Sequential pattern extraction
Patterns generalization
Data windowing
Incremental data mining
Fuzzy ontology
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos
title_full Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos
title_fullStr Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos
title_full_unstemmed Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos
title_sort Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos
author Silveira Junior, Carlos Roberto
author_facet Silveira Junior, Carlos Roberto
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/9893034966040171
dc.contributor.author.fl_str_mv Silveira Junior, Carlos Roberto
dc.contributor.advisor1.fl_str_mv Santos, Marilde Terezinha Prado
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/9826026025118073
dc.contributor.authorID.fl_str_mv b514b8de-d381-4b18-a0d0-2720637b182c
contributor_str_mv Santos, Marilde Terezinha Prado
dc.subject.por.fl_str_mv Data mining (Mineração de dados)
Dados espaçotemporais
Extração de padrões sequenciais
Janelamento de dados
Ontologia difusa
Algoritmo de mineração de dados
Dados reais
Generalização de padrões
Incremental
topic Data mining (Mineração de dados)
Dados espaçotemporais
Extração de padrões sequenciais
Janelamento de dados
Ontologia difusa
Algoritmo de mineração de dados
Dados reais
Generalização de padrões
Incremental
Data mining algorithm
Time-spacial data
Real data
Sequential pattern extraction
Patterns generalization
Data windowing
Incremental data mining
Fuzzy ontology
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Data mining algorithm
Time-spacial data
Real data
Sequential pattern extraction
Patterns generalization
Data windowing
Incremental data mining
Fuzzy ontology
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description The mining of sequential patterns in data from environmental sensors is a challenging task: the data may show noise and may also contain sparse patterns that are difficult to detect. The knowledge extracted from environmental sensor data can be used to determine climate change, for example. However, there is a lack of methods that can handle this type of database. In order to reduce this gap, the algorithm Incremental Miner of Stretchy Time Sequences with Post-Processing (IncMSTS-PP) was proposed. The IncMSTS-PP applies incremental extraction of sequential patterns with post-processing based on ontology for the generalization of the patterns. The post-processing makes the patterns semantically richer. Generalized patterns synthesize the information and makes it easier to be interpreted. IncMSTS-PP implements the Stretchy Time Window (STW) that allows stretchy time patterns (patterns with temporal intervals) are mined from bases that have noises. In comparison with GSP algorithm, IncMSTS-PP can return 2.3 times more patterns and patterns with 5 times more itemsets. The post-processing module is responsible for the reduction in 22.47% of the number of patterns presented to the user, but the returned patterns are semantically richer. Thus, the IncMSTS-PP showed good performance and mined relevant patterns showing, that way, that IncMSTS-PP is effective, efficient and appropriate for domain of environmental sensor data.
publishDate 2013
dc.date.available.fl_str_mv 2013-11-07
2016-06-02T19:06:09Z
dc.date.issued.fl_str_mv 2013-06-07
dc.date.accessioned.fl_str_mv 2016-06-02T19:06:09Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVEIRA JUNIOR, Carlos Roberto. Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos. 2013. 119 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2013.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/550
identifier_str_mv SILVEIRA JUNIOR, Carlos Roberto. Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos. 2013. 119 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2013.
url https://repositorio.ufscar.br/handle/ufscar/550
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv -1
-1
dc.relation.authority.fl_str_mv 1bdb200e-99c1-45c7-8e62-ff292489211e
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/550/1/5554.pdf
https://repositorio.ufscar.br/bitstream/ufscar/550/2/5554.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/550/3/5554.pdf.jpg
bitstream.checksum.fl_str_mv ce6dc6cd7128337c0533ddd23c0bc601
d41d8cd98f00b204e9800998ecf8427e
c8e6ed4d85380a178cee60f40ee3d4a1
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1802136459435573248