Data suppression in sensor networks: improving the quality of estimates and the robustness to aberrant readings

Sensor networks comprise small electro-mechanical devices that communicate over a wireless network. These devices collect environmental data and send them to a remote base station. The main goal of a data collection scheme for sensor networks is to keep the networks database updated while saving the...

Nível de Acesso:openAccess
Publication Date:2008
Main Author: Ilka Afonso Reis
Orientador/a: Gilberto Câmara
Banca: Camilo Daleles Rennó, Assunção Renato Martins, Alejandro Cesar Frery Orgambide
Format: Tese
Language:eng
Published: Instituto Nacional de Pesquisas Espaciais
Programa: Programa de Pós-Graduação do INPE em Sensoriamento Remoto
Online Access:http://urlib.net/sid.inpe.br/mtc-m18@80/2008/11.19.20.24
Resumo Português:Sensor networks comprise small electro-mechanical devices that communicate over a wireless network. These devices collect environmental data and send them to a remote base station. The main goal of a data collection scheme for sensor networks is to keep the networks database updated while saving the limited nodes energy as much as possible. To achieve this goal without continuous reporting, data suppression is a key strategy. The basic idea behind data suppression schemes is to send data to the base station only when the nodes readings are different from what both nodes and base station expect. One alternative of data suppression is to cluster the nodes, aggregate their data and send only a summary to the base station. We propose to group the nodes into spatially homogeneous clusters, which consider both the geographical distance and the similarity of measurements between the neighboring nodes. Through simulated experiments, we have concluded that spatially homogeneous clusters produce data summaries with a higher statistical quality if compared with the usual ordinary clustering methods. Since distributed clustering algorithms play an important role in energy-efficient data collection proposals for sensor networks, we present Distributed Data-aware Representative Clustering (DARC) algorithm and Data-Aware Distributed Clustering Algorithm (DA-DCA). DARC and DCA build clusters around clusters representatives, which are able to produce more homogeneous clusters than the usual clustering proposals. Then, they produce data summaries that estimate the nodes data with a smaller error if compared with the usual data-aware clustering proposals. Another important characteristic of data suppression schemes is their sensitiveness to aberrant readings, since these outlying observations mean a change in the expected behavior for the readings sequence. Transmitting these erroneous readings is a waste of energy. In this thesis, we present a temporal suppression scheme that is robust to aberrant readings. We propose to use a technique to detect outliers from a time series. Since outliers can suggest a distribution change-point or an aberrant reading, our proposal classifies the detected outliers as aberrant readings or change-points using a post-monitoring window. This idea is the basis for a temporal suppression scheme named TS-SOUND (Temporal Suppression by Statistical OUtlier Notice and Detection). TS-SOUND detects outliers in the sequence of sensor readings and sends data to the base station only when a change-point is detected. Therefore, TS-SOUND filters aberrant readings and, even when this filter fails, TS-SOUND does not send the deviated reading to the base station. Experiments with real and simulated data have shown that TS-SOUND scheme is more robust to aberrant readings than other temporal suppression schemes proposed in the literature (value-based temporal suppression, PAQ and exponential regression). Furthermore, TS-SOUND has got suppression rates comparable or greater than the rates of the cited schemes, in addition to keeping the prediction errors at acceptable levels.
Resumo inglês:Redes de sensores são formadas por minúsculos componentes eletromecânicos que coletam dados ambientais e os enviam até uma estação-base remota por meio da comunicação sem fio entre os nós-sensores. O principal objetivo de um esquema de coleta de dados para rede de sensores é manter a estação-base atualizada enquanto economiza a maior quantidade de energia possível. Para atingir este objetivo sem um monitoramento contínuo, a supressão de dados é uma estratégia chave. A idéia da supressão de dados é enviar dados para a estação-base somente quando os dados dos nós-sensores forem diferentes do que os nós e a estação-base esperam. Uma forma de suprimir dados é agrupar os nóssensores, agregar seus dados e enviar somente um resumo para a estação-base. Esta tese propõe agrupar os nós-sensores em conglomerados espacialmente homogêneos, que consideram tanto a distância geográfica e a similaridade de medidas entre nós-sensores vizinhos. Utilizando experimentos simulados, nós concluímos que conglomerados espacialmente homogêneos produzem resumos que possuem uma qualidade estatística melhor se comparados com os resumos produzidos pelos métodos de aglomeração usuais (ordinary clustering). Visto que algoritmos de aglomeração distribuídos têm um papel importante na eficiência energética das propostas para coleta de dados em redes de sensores, nós apresentamos o algoritmo Distributed Data-aware Representative Clustering (DARC) e o Data-Aware Distributed Clustering Algorithm (DA-DCA). Os algoritmos DARC e DCA formam conglomerados de nós-sensores em torno de um representante dos conglomerados, o que gera conglomerados mais homogêneos do que aqueles formados pelas propostas usuais na literatura. Assim, estes conglomerados produzem resumos que estimam os dados dos nós-sensores com um erro menor se comparado aos algoritmos de aglomeração data-aware usuais. Outra característica importante dos esquemas de supressão de dados é a sua sensibilidade a dados aberrantes. Estas observações discrepantes significam uma mudança no comportamento esperado para aquela sequência de observações. Transmitir estes dados errôneos para a estação-base é um desperdício de energia. Nesta tese, nós apresentamos um esquema de supressão temporal que é robusto a observações aberrantes. Nós propomos usar uma técnica de detecção de outliers em uma série temporal. Visto que outliers podem ser um indício de ponto de mudança na série ou uma observação aberrante, nossa proposta é classificar os outliers detectados como observação aberrante ou pontos de mudança usando uma janela de pós-monitoramento. Esta é a idéia por trás do TS-SOUND (Temporal Suppression by Statistical OUtlier Notice and Detection). TS-SOUND é a nossa proposta para um esquema de supressão temporal de dados. Ele detecta outliers na sequência dos dados de um nó-sensor e envia dados para a estação-base somente quando uma mudança é detectada. Deste modo, o TS-SOUND filtra as observações aberrantes e, mesmo que este filtro falhe, o TS-SOUND não envia a observação discrepante para a estação-base. Experimentos com dados reais e simulados mostraram que o TS-SOUND é mais robusto a observações aberrantes do que outros esquemas de supressão temporal propostos na literatura. Além disto, TS-SOUND consegue taxas de supressão comparáveis ou maiores do que as taxas de supressão de outros esquemas além de manter os erros de predição em níveis aceitáveis.