Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos
Ano de defesa: | 2013 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de São Carlos
|
Programa de Pós-Graduação: |
Programa de Pós-Graduação em Ciência da Computação - PPGCC
|
Departamento: |
Não Informado pela instituição
|
País: |
BR
|
Palavras-chave em Português: | |
Palavras-chave em Inglês: | |
Área do conhecimento CNPq: | |
Link de acesso: | https://repositorio.ufscar.br/handle/ufscar/550 |
Resumo: | The mining of sequential patterns in data from environmental sensors is a challenging task: the data may show noise and may also contain sparse patterns that are difficult to detect. The knowledge extracted from environmental sensor data can be used to determine climate change, for example. However, there is a lack of methods that can handle this type of database. In order to reduce this gap, the algorithm Incremental Miner of Stretchy Time Sequences with Post-Processing (IncMSTS-PP) was proposed. The IncMSTS-PP applies incremental extraction of sequential patterns with post-processing based on ontology for the generalization of the patterns. The post-processing makes the patterns semantically richer. Generalized patterns synthesize the information and makes it easier to be interpreted. IncMSTS-PP implements the Stretchy Time Window (STW) that allows stretchy time patterns (patterns with temporal intervals) are mined from bases that have noises. In comparison with GSP algorithm, IncMSTS-PP can return 2.3 times more patterns and patterns with 5 times more itemsets. The post-processing module is responsible for the reduction in 22.47% of the number of patterns presented to the user, but the returned patterns are semantically richer. Thus, the IncMSTS-PP showed good performance and mined relevant patterns showing, that way, that IncMSTS-PP is effective, efficient and appropriate for domain of environmental sensor data. |
id |
SCAR_52240425c5bb58aae652062edd22d08c |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/550 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
|
spelling |
Silveira Junior, Carlos RobertoSantos, Marilde Terezinha Pradohttp://lattes.cnpq.br/9826026025118073http://lattes.cnpq.br/9893034966040171b514b8de-d381-4b18-a0d0-2720637b182c2016-06-02T19:06:09Z2013-11-072016-06-02T19:06:09Z2013-06-07SILVEIRA JUNIOR, Carlos Roberto. Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos. 2013. 119 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2013.https://repositorio.ufscar.br/handle/ufscar/550The mining of sequential patterns in data from environmental sensors is a challenging task: the data may show noise and may also contain sparse patterns that are difficult to detect. The knowledge extracted from environmental sensor data can be used to determine climate change, for example. However, there is a lack of methods that can handle this type of database. In order to reduce this gap, the algorithm Incremental Miner of Stretchy Time Sequences with Post-Processing (IncMSTS-PP) was proposed. The IncMSTS-PP applies incremental extraction of sequential patterns with post-processing based on ontology for the generalization of the patterns. The post-processing makes the patterns semantically richer. Generalized patterns synthesize the information and makes it easier to be interpreted. IncMSTS-PP implements the Stretchy Time Window (STW) that allows stretchy time patterns (patterns with temporal intervals) are mined from bases that have noises. In comparison with GSP algorithm, IncMSTS-PP can return 2.3 times more patterns and patterns with 5 times more itemsets. The post-processing module is responsible for the reduction in 22.47% of the number of patterns presented to the user, but the returned patterns are semantically richer. Thus, the IncMSTS-PP showed good performance and mined relevant patterns showing, that way, that IncMSTS-PP is effective, efficient and appropriate for domain of environmental sensor data.A mineração de padrões sequenciais em dados de sensores ambientais é uma tarefa desafiadora: os dados podem apresentar ruídos e podem, também, conter padrões esparsos que são difíceis de serem detectados. O conhecimento extraído de dados de sensores ambientais pode ser usado para determinar mudanças climáticas, por exemplo. Entretanto, há uma lacuna de métodos que podem lidar com este tipo de banco de dados. Com o intuito de diminuir esta lacuna, o algoritmo Incremental Miner of Stretchy Time Sequences with Post- Processing (IncMSTS-PP) foi proposto. O IncMSTS-PP aplica a extração incremental de padrões sequencias com pós-processamento baseado em ontologia para a generalização dos padrões obtidos que acarreta o enriquecimento semântico desses padrões. Padrões generalizados sintetizam a informação e a torna mais fácil de ser interpretada. IncMSTS-PP implementa o método Stretchy Time Window (STW) que permite que padrões de tempo elástico (padrões com intervalos temporais) sejam extraídos em bases que apresentam ruídos. Em comparação com o algoritmo GSP, o IncMSTS-PP pode retornar 2,3 vezes mais sequencias e sequencias com 5 vezes mais itemsets. O módulo de pós-processamento é responsável pela redução em 22,47% do número de padrões apresentados ao usuário, porém os padrões retornados são semanticamente mais ricos, se comparados aos padrões não generalizados. Assim sendo, o IncMSTS-PP apresentou bons resultados de desempenho e minerou padrões relevantes mostrando, assim, que IncMSTS-PP é eficaz, eficiente e apropriado em domínio de dados de sensores ambientais.application/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarBRData mining (Mineração de dados)Dados espaçotemporaisExtração de padrões sequenciaisJanelamento de dadosOntologia difusaAlgoritmo de mineração de dadosDados reaisGeneralização de padrõesIncrementalData mining algorithmTime-spacial dataReal dataSequential pattern extractionPatterns generalizationData windowingIncremental data miningFuzzy ontologyCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAlgoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-11bdb200e-99c1-45c7-8e62-ff292489211einfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINAL5554.pdfapplication/pdf2294386https://repositorio.ufscar.br/bitstream/ufscar/550/1/5554.pdfce6dc6cd7128337c0533ddd23c0bc601MD51TEXT5554.pdf.txt5554.pdf.txtExtracted texttext/plain0https://repositorio.ufscar.br/bitstream/ufscar/550/2/5554.pdf.txtd41d8cd98f00b204e9800998ecf8427eMD52THUMBNAIL5554.pdf.jpg5554.pdf.jpgIM Thumbnailimage/jpeg13631https://repositorio.ufscar.br/bitstream/ufscar/550/3/5554.pdf.jpgc8e6ed4d85380a178cee60f40ee3d4a1MD53ufscar/5502023-09-18 18:31:43.844oai:repositorio.ufscar.br:ufscar/550Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:43Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos |
title |
Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos |
spellingShingle |
Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos Silveira Junior, Carlos Roberto Data mining (Mineração de dados) Dados espaçotemporais Extração de padrões sequenciais Janelamento de dados Ontologia difusa Algoritmo de mineração de dados Dados reais Generalização de padrões Incremental Data mining algorithm Time-spacial data Real data Sequential pattern extraction Patterns generalization Data windowing Incremental data mining Fuzzy ontology CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos |
title_full |
Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos |
title_fullStr |
Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos |
title_full_unstemmed |
Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos |
title_sort |
Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos |
author |
Silveira Junior, Carlos Roberto |
author_facet |
Silveira Junior, Carlos Roberto |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/9893034966040171 |
dc.contributor.author.fl_str_mv |
Silveira Junior, Carlos Roberto |
dc.contributor.advisor1.fl_str_mv |
Santos, Marilde Terezinha Prado |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/9826026025118073 |
dc.contributor.authorID.fl_str_mv |
b514b8de-d381-4b18-a0d0-2720637b182c |
contributor_str_mv |
Santos, Marilde Terezinha Prado |
dc.subject.por.fl_str_mv |
Data mining (Mineração de dados) Dados espaçotemporais Extração de padrões sequenciais Janelamento de dados Ontologia difusa Algoritmo de mineração de dados Dados reais Generalização de padrões Incremental |
topic |
Data mining (Mineração de dados) Dados espaçotemporais Extração de padrões sequenciais Janelamento de dados Ontologia difusa Algoritmo de mineração de dados Dados reais Generalização de padrões Incremental Data mining algorithm Time-spacial data Real data Sequential pattern extraction Patterns generalization Data windowing Incremental data mining Fuzzy ontology CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Data mining algorithm Time-spacial data Real data Sequential pattern extraction Patterns generalization Data windowing Incremental data mining Fuzzy ontology |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
The mining of sequential patterns in data from environmental sensors is a challenging task: the data may show noise and may also contain sparse patterns that are difficult to detect. The knowledge extracted from environmental sensor data can be used to determine climate change, for example. However, there is a lack of methods that can handle this type of database. In order to reduce this gap, the algorithm Incremental Miner of Stretchy Time Sequences with Post-Processing (IncMSTS-PP) was proposed. The IncMSTS-PP applies incremental extraction of sequential patterns with post-processing based on ontology for the generalization of the patterns. The post-processing makes the patterns semantically richer. Generalized patterns synthesize the information and makes it easier to be interpreted. IncMSTS-PP implements the Stretchy Time Window (STW) that allows stretchy time patterns (patterns with temporal intervals) are mined from bases that have noises. In comparison with GSP algorithm, IncMSTS-PP can return 2.3 times more patterns and patterns with 5 times more itemsets. The post-processing module is responsible for the reduction in 22.47% of the number of patterns presented to the user, but the returned patterns are semantically richer. Thus, the IncMSTS-PP showed good performance and mined relevant patterns showing, that way, that IncMSTS-PP is effective, efficient and appropriate for domain of environmental sensor data. |
publishDate |
2013 |
dc.date.available.fl_str_mv |
2013-11-07 2016-06-02T19:06:09Z |
dc.date.issued.fl_str_mv |
2013-06-07 |
dc.date.accessioned.fl_str_mv |
2016-06-02T19:06:09Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SILVEIRA JUNIOR, Carlos Roberto. Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos. 2013. 119 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2013. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/550 |
identifier_str_mv |
SILVEIRA JUNIOR, Carlos Roberto. Algoritmo para a extração incremental de sequências relevantes com janelamento e pós-processamento aplicado a dados hidrográficos. 2013. 119 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2013. |
url |
https://repositorio.ufscar.br/handle/ufscar/550 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
-1 -1 |
dc.relation.authority.fl_str_mv |
1bdb200e-99c1-45c7-8e62-ff292489211e |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
dc.publisher.initials.fl_str_mv |
UFSCar |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/550/1/5554.pdf https://repositorio.ufscar.br/bitstream/ufscar/550/2/5554.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/550/3/5554.pdf.jpg |
bitstream.checksum.fl_str_mv |
ce6dc6cd7128337c0533ddd23c0bc601 d41d8cd98f00b204e9800998ecf8427e c8e6ed4d85380a178cee60f40ee3d4a1 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1802136459435573248 |