Análise da relevância semântica na seleção de atributos para a mineração de dados

Detalhes bibliográficos
Ano de defesa: 2015
Autor(a) principal: Adriana da Silva Jacinto
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Instituto Tecnológico de Aeronáutica
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=3360
Resumo: A cada dia, mais dados podem ser armazenados e, portanto, analisados. Em cada conjunto de dados, a tendência é haver uma quantidade cada vez maior de atributos. A obtenção de modelos de mineração de dados, que revelem alguma informação importante, depende da seleção dos atributos mais relevantes, mas determinar a relevância de um atributo em certo contexto não é uma tarefa fácil. Por isso mesmo, apenas pela análise dos dados, em geral, os métodos de seleção de atributos falham em identificar atributos relevantes, incluem atributos irrelevantes e não reconhecem quando há atributos redundantes entre si. Por outro lado, quando se leva em conta o domínio de conhecimento de onde os dados foram coletados, a análise do significado de cada atributo pode indicar sua importância, contudo, isso pode não ser facilmente compreendido por alguém que não esteja familiarizado com o domínio considerado. De qualquer forma, na prática, a análise da semântica dos atributos é feita de forma manual, o que pode ocasionar enganos, custos e desperdício de tempo. Assim, partindo da hipótese de que a incorporação de semântica na atividade de seleção de atributos leva à escolha de atributos mais relevantes e à geração de modelos de mineração mais significativos, para a tarefa de classificação em mineração de dados, um modelo semântico estatístico que propicia a incorporação de semântica à seleção feita pelos métodos tradicionais foi definido. O modelo emprega ontologia, base linguística e recuperação de informação. Com base neste modelo e utilizando conjuntos de dados reais, procedeu-se a um estudo de caso, a partir do qual se pôde observar seleção de atributos mais relevantes.
id ITA_db0b7fd72febd81f57db36a4c12aa419
oai_identifier_str oai:agregador.ibict.br.BDTD_ITA:oai:ita.br:3360
network_acronym_str ITA
network_name_str Biblioteca Digital de Teses e Dissertações do ITA
spelling Análise da relevância semântica na seleção de atributos para a mineração de dadosMineração de dadosWeb semânticaRecuperação da informaçãoOntologias (inteligência artificial)ComputaçãoA cada dia, mais dados podem ser armazenados e, portanto, analisados. Em cada conjunto de dados, a tendência é haver uma quantidade cada vez maior de atributos. A obtenção de modelos de mineração de dados, que revelem alguma informação importante, depende da seleção dos atributos mais relevantes, mas determinar a relevância de um atributo em certo contexto não é uma tarefa fácil. Por isso mesmo, apenas pela análise dos dados, em geral, os métodos de seleção de atributos falham em identificar atributos relevantes, incluem atributos irrelevantes e não reconhecem quando há atributos redundantes entre si. Por outro lado, quando se leva em conta o domínio de conhecimento de onde os dados foram coletados, a análise do significado de cada atributo pode indicar sua importância, contudo, isso pode não ser facilmente compreendido por alguém que não esteja familiarizado com o domínio considerado. De qualquer forma, na prática, a análise da semântica dos atributos é feita de forma manual, o que pode ocasionar enganos, custos e desperdício de tempo. Assim, partindo da hipótese de que a incorporação de semântica na atividade de seleção de atributos leva à escolha de atributos mais relevantes e à geração de modelos de mineração mais significativos, para a tarefa de classificação em mineração de dados, um modelo semântico estatístico que propicia a incorporação de semântica à seleção feita pelos métodos tradicionais foi definido. O modelo emprega ontologia, base linguística e recuperação de informação. Com base neste modelo e utilizando conjuntos de dados reais, procedeu-se a um estudo de caso, a partir do qual se pôde observar seleção de atributos mais relevantes.Instituto Tecnológico de AeronáuticaJosé Maria Parente de OliveiraRicardo da Silva SantosAdriana da Silva Jacinto2015-11-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttp://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=3360reponame:Biblioteca Digital de Teses e Dissertações do ITAinstname:Instituto Tecnológico de Aeronáuticainstacron:ITAporinfo:eu-repo/semantics/openAccessapplication/pdf2019-02-02T14:05:10Zoai:agregador.ibict.br.BDTD_ITA:oai:ita.br:3360http://oai.bdtd.ibict.br/requestopendoar:null2020-05-28 19:41:48.38Biblioteca Digital de Teses e Dissertações do ITA - Instituto Tecnológico de Aeronáuticatrue
dc.title.none.fl_str_mv Análise da relevância semântica na seleção de atributos para a mineração de dados
title Análise da relevância semântica na seleção de atributos para a mineração de dados
spellingShingle Análise da relevância semântica na seleção de atributos para a mineração de dados
Adriana da Silva Jacinto
Mineração de dados
Web semântica
Recuperação da informação
Ontologias (inteligência artificial)
Computação
title_short Análise da relevância semântica na seleção de atributos para a mineração de dados
title_full Análise da relevância semântica na seleção de atributos para a mineração de dados
title_fullStr Análise da relevância semântica na seleção de atributos para a mineração de dados
title_full_unstemmed Análise da relevância semântica na seleção de atributos para a mineração de dados
title_sort Análise da relevância semântica na seleção de atributos para a mineração de dados
author Adriana da Silva Jacinto
author_facet Adriana da Silva Jacinto
author_role author
dc.contributor.none.fl_str_mv José Maria Parente de Oliveira
Ricardo da Silva Santos
dc.contributor.author.fl_str_mv Adriana da Silva Jacinto
dc.subject.por.fl_str_mv Mineração de dados
Web semântica
Recuperação da informação
Ontologias (inteligência artificial)
Computação
topic Mineração de dados
Web semântica
Recuperação da informação
Ontologias (inteligência artificial)
Computação
dc.description.none.fl_txt_mv A cada dia, mais dados podem ser armazenados e, portanto, analisados. Em cada conjunto de dados, a tendência é haver uma quantidade cada vez maior de atributos. A obtenção de modelos de mineração de dados, que revelem alguma informação importante, depende da seleção dos atributos mais relevantes, mas determinar a relevância de um atributo em certo contexto não é uma tarefa fácil. Por isso mesmo, apenas pela análise dos dados, em geral, os métodos de seleção de atributos falham em identificar atributos relevantes, incluem atributos irrelevantes e não reconhecem quando há atributos redundantes entre si. Por outro lado, quando se leva em conta o domínio de conhecimento de onde os dados foram coletados, a análise do significado de cada atributo pode indicar sua importância, contudo, isso pode não ser facilmente compreendido por alguém que não esteja familiarizado com o domínio considerado. De qualquer forma, na prática, a análise da semântica dos atributos é feita de forma manual, o que pode ocasionar enganos, custos e desperdício de tempo. Assim, partindo da hipótese de que a incorporação de semântica na atividade de seleção de atributos leva à escolha de atributos mais relevantes e à geração de modelos de mineração mais significativos, para a tarefa de classificação em mineração de dados, um modelo semântico estatístico que propicia a incorporação de semântica à seleção feita pelos métodos tradicionais foi definido. O modelo emprega ontologia, base linguística e recuperação de informação. Com base neste modelo e utilizando conjuntos de dados reais, procedeu-se a um estudo de caso, a partir do qual se pôde observar seleção de atributos mais relevantes.
description A cada dia, mais dados podem ser armazenados e, portanto, analisados. Em cada conjunto de dados, a tendência é haver uma quantidade cada vez maior de atributos. A obtenção de modelos de mineração de dados, que revelem alguma informação importante, depende da seleção dos atributos mais relevantes, mas determinar a relevância de um atributo em certo contexto não é uma tarefa fácil. Por isso mesmo, apenas pela análise dos dados, em geral, os métodos de seleção de atributos falham em identificar atributos relevantes, incluem atributos irrelevantes e não reconhecem quando há atributos redundantes entre si. Por outro lado, quando se leva em conta o domínio de conhecimento de onde os dados foram coletados, a análise do significado de cada atributo pode indicar sua importância, contudo, isso pode não ser facilmente compreendido por alguém que não esteja familiarizado com o domínio considerado. De qualquer forma, na prática, a análise da semântica dos atributos é feita de forma manual, o que pode ocasionar enganos, custos e desperdício de tempo. Assim, partindo da hipótese de que a incorporação de semântica na atividade de seleção de atributos leva à escolha de atributos mais relevantes e à geração de modelos de mineração mais significativos, para a tarefa de classificação em mineração de dados, um modelo semântico estatístico que propicia a incorporação de semântica à seleção feita pelos métodos tradicionais foi definido. O modelo emprega ontologia, base linguística e recuperação de informação. Com base neste modelo e utilizando conjuntos de dados reais, procedeu-se a um estudo de caso, a partir do qual se pôde observar seleção de atributos mais relevantes.
publishDate 2015
dc.date.none.fl_str_mv 2015-11-13
dc.type.driver.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/doctoralThesis
status_str publishedVersion
format doctoralThesis
dc.identifier.uri.fl_str_mv http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=3360
url http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=3360
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Instituto Tecnológico de Aeronáutica
publisher.none.fl_str_mv Instituto Tecnológico de Aeronáutica
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do ITA
instname:Instituto Tecnológico de Aeronáutica
instacron:ITA
reponame_str Biblioteca Digital de Teses e Dissertações do ITA
collection Biblioteca Digital de Teses e Dissertações do ITA
instname_str Instituto Tecnológico de Aeronáutica
instacron_str ITA
institution ITA
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do ITA - Instituto Tecnológico de Aeronáutica
repository.mail.fl_str_mv
subject_por_txtF_mv Mineração de dados
Web semântica
Recuperação da informação
Ontologias (inteligência artificial)
Computação
_version_ 1706805012483538944