Métodos robustos em regressão linear para dados simbólicos do tipo intervalo
| Ano de defesa: | 2010 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Pernambuco
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufpe.br/handle/123456789/1700 |
Resumo: | A análise de dados simbólicos (Symbolic Data Analysis - SDA) tem se destacado como um conjunto de ferramentas úteis à análise de grandes bases de dados, aprendizagem de máquina e reconhecimento de padrões. Os dados simbólicos podem representar variáveis estruturadas, listas, intervalos e distribuições. Nesse contexto, vários métodos estatísticos têm sido estendidos para o domínio de SDA (análise de cluster, estatísticas descritivas, componentes principais, análise fatorial, regressão linear, e outras). Como exemplo, os métodos de regressão linear propostos recentemente para dados simbólicos são extensões do método dos mínimos quadrados para minimização dos erros do modelo. Estes métodos estimam os parâmetros do modelo da regressão linear considerando apenas as informações sobre os pontos médios (centros) das variáveis simbólicas, considerando os valores dos limites inferiores e superiores dos intervalos e considerando os valores dos pontos médios e das amplitudes dos intervalos. Apesar da técnica dos mínimos quadrados ser computacionalmente simples, a qualidade dos ajustes é degradada quando o conjunto sob investigação contém dados atípicos. Na análise de regressão clássica, esses dados atípicos são frequentemente removidos do conjunto de dados sob investigação, sendo normalmente considerados como erros do processo. Contudo, em SDA, esse tipo de procedimento não é aconselhável, haja vista um dado simbólico poder representar a generalização de um conjunto de outras observações clássicas. Este trabalho propõe um método resistente (robusto) de regressão linear para dados simbólicos do tipo intervalo, paramétrico, inspirado na análise de regressão simétrica, cujos estimadores tenham alto ponto de ruptura . O método proposto permite ainda a construção de intervalos de confiança e testes de hipóteses para os parâmetros do ajuste, enquanto os métodos encontrados na literatura não estabelecem suposições probabilísticas. Além disso, considerando que a ausência de observações atípicas em um conjunto de dados indica a possibilidade de utilização de métodos baseados nos mínimos quadrados, esta tese também propõe um conjunto de técnicas para a identificação de dados simbólicos intervalares atípicos |
| id |
UFPE_200ea2def346d94cc940ea77b1ff1146 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufpe.br:123456789/1700 |
| network_acronym_str |
UFPE |
| network_name_str |
Repositório Institucional da UFPE |
| repository_id_str |
|
| spelling |
Métodos robustos em regressão linear para dados simbólicos do tipo intervaloAnálise de dados simbólicosModelo resistente de regressão linear simbólicaDetecção de outliers simbólicos intervalaresA análise de dados simbólicos (Symbolic Data Analysis - SDA) tem se destacado como um conjunto de ferramentas úteis à análise de grandes bases de dados, aprendizagem de máquina e reconhecimento de padrões. Os dados simbólicos podem representar variáveis estruturadas, listas, intervalos e distribuições. Nesse contexto, vários métodos estatísticos têm sido estendidos para o domínio de SDA (análise de cluster, estatísticas descritivas, componentes principais, análise fatorial, regressão linear, e outras). Como exemplo, os métodos de regressão linear propostos recentemente para dados simbólicos são extensões do método dos mínimos quadrados para minimização dos erros do modelo. Estes métodos estimam os parâmetros do modelo da regressão linear considerando apenas as informações sobre os pontos médios (centros) das variáveis simbólicas, considerando os valores dos limites inferiores e superiores dos intervalos e considerando os valores dos pontos médios e das amplitudes dos intervalos. Apesar da técnica dos mínimos quadrados ser computacionalmente simples, a qualidade dos ajustes é degradada quando o conjunto sob investigação contém dados atípicos. Na análise de regressão clássica, esses dados atípicos são frequentemente removidos do conjunto de dados sob investigação, sendo normalmente considerados como erros do processo. Contudo, em SDA, esse tipo de procedimento não é aconselhável, haja vista um dado simbólico poder representar a generalização de um conjunto de outras observações clássicas. Este trabalho propõe um método resistente (robusto) de regressão linear para dados simbólicos do tipo intervalo, paramétrico, inspirado na análise de regressão simétrica, cujos estimadores tenham alto ponto de ruptura . O método proposto permite ainda a construção de intervalos de confiança e testes de hipóteses para os parâmetros do ajuste, enquanto os métodos encontrados na literatura não estabelecem suposições probabilísticas. Além disso, considerando que a ausência de observações atípicas em um conjunto de dados indica a possibilidade de utilização de métodos baseados nos mínimos quadrados, esta tese também propõe um conjunto de técnicas para a identificação de dados simbólicos intervalares atípicosFundação de Amparo à Pesquisa do Estado do AmazonasUniversidade Federal de PernambucoSOUZA, Renata Maria Cardoso Rodrigues deDOMINGUES, Marco Antonio de Oliveira2014-06-12T15:51:56Z2014-06-12T15:51:56Z2010-01-31info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfAntonio de Oliveira Domingues, Marco; Maria Cardoso Rodrigues de Souza, Renata. Métodos robustos em regressão linear para dados simbólicos do tipo intervalo. 2010. Tese (Doutorado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2010.https://repositorio.ufpe.br/handle/123456789/1700porAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPE2019-10-25T05:57:22Zoai:repositorio.ufpe.br:123456789/1700Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T05:57:22Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
| dc.title.none.fl_str_mv |
Métodos robustos em regressão linear para dados simbólicos do tipo intervalo |
| title |
Métodos robustos em regressão linear para dados simbólicos do tipo intervalo |
| spellingShingle |
Métodos robustos em regressão linear para dados simbólicos do tipo intervalo DOMINGUES, Marco Antonio de Oliveira Análise de dados simbólicos Modelo resistente de regressão linear simbólica Detecção de outliers simbólicos intervalares |
| title_short |
Métodos robustos em regressão linear para dados simbólicos do tipo intervalo |
| title_full |
Métodos robustos em regressão linear para dados simbólicos do tipo intervalo |
| title_fullStr |
Métodos robustos em regressão linear para dados simbólicos do tipo intervalo |
| title_full_unstemmed |
Métodos robustos em regressão linear para dados simbólicos do tipo intervalo |
| title_sort |
Métodos robustos em regressão linear para dados simbólicos do tipo intervalo |
| author |
DOMINGUES, Marco Antonio de Oliveira |
| author_facet |
DOMINGUES, Marco Antonio de Oliveira |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
SOUZA, Renata Maria Cardoso Rodrigues de |
| dc.contributor.author.fl_str_mv |
DOMINGUES, Marco Antonio de Oliveira |
| dc.subject.por.fl_str_mv |
Análise de dados simbólicos Modelo resistente de regressão linear simbólica Detecção de outliers simbólicos intervalares |
| topic |
Análise de dados simbólicos Modelo resistente de regressão linear simbólica Detecção de outliers simbólicos intervalares |
| description |
A análise de dados simbólicos (Symbolic Data Analysis - SDA) tem se destacado como um conjunto de ferramentas úteis à análise de grandes bases de dados, aprendizagem de máquina e reconhecimento de padrões. Os dados simbólicos podem representar variáveis estruturadas, listas, intervalos e distribuições. Nesse contexto, vários métodos estatísticos têm sido estendidos para o domínio de SDA (análise de cluster, estatísticas descritivas, componentes principais, análise fatorial, regressão linear, e outras). Como exemplo, os métodos de regressão linear propostos recentemente para dados simbólicos são extensões do método dos mínimos quadrados para minimização dos erros do modelo. Estes métodos estimam os parâmetros do modelo da regressão linear considerando apenas as informações sobre os pontos médios (centros) das variáveis simbólicas, considerando os valores dos limites inferiores e superiores dos intervalos e considerando os valores dos pontos médios e das amplitudes dos intervalos. Apesar da técnica dos mínimos quadrados ser computacionalmente simples, a qualidade dos ajustes é degradada quando o conjunto sob investigação contém dados atípicos. Na análise de regressão clássica, esses dados atípicos são frequentemente removidos do conjunto de dados sob investigação, sendo normalmente considerados como erros do processo. Contudo, em SDA, esse tipo de procedimento não é aconselhável, haja vista um dado simbólico poder representar a generalização de um conjunto de outras observações clássicas. Este trabalho propõe um método resistente (robusto) de regressão linear para dados simbólicos do tipo intervalo, paramétrico, inspirado na análise de regressão simétrica, cujos estimadores tenham alto ponto de ruptura . O método proposto permite ainda a construção de intervalos de confiança e testes de hipóteses para os parâmetros do ajuste, enquanto os métodos encontrados na literatura não estabelecem suposições probabilísticas. Além disso, considerando que a ausência de observações atípicas em um conjunto de dados indica a possibilidade de utilização de métodos baseados nos mínimos quadrados, esta tese também propõe um conjunto de técnicas para a identificação de dados simbólicos intervalares atípicos |
| publishDate |
2010 |
| dc.date.none.fl_str_mv |
2010-01-31 2014-06-12T15:51:56Z 2014-06-12T15:51:56Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
Antonio de Oliveira Domingues, Marco; Maria Cardoso Rodrigues de Souza, Renata. Métodos robustos em regressão linear para dados simbólicos do tipo intervalo. 2010. Tese (Doutorado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2010. https://repositorio.ufpe.br/handle/123456789/1700 |
| identifier_str_mv |
Antonio de Oliveira Domingues, Marco; Maria Cardoso Rodrigues de Souza, Renata. Métodos robustos em regressão linear para dados simbólicos do tipo intervalo. 2010. Tese (Doutorado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2010. |
| url |
https://repositorio.ufpe.br/handle/123456789/1700 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
| publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
| instname_str |
Universidade Federal de Pernambuco (UFPE) |
| instacron_str |
UFPE |
| institution |
UFPE |
| reponame_str |
Repositório Institucional da UFPE |
| collection |
Repositório Institucional da UFPE |
| repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
| repository.mail.fl_str_mv |
attena@ufpe.br |
| _version_ |
1856041942675095552 |