Análise da relevância semântica na seleção de atributos para a mineração de dados
| Ano de defesa: | 2015 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Instituto Tecnológico de Aeronáutica
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=3360 |
Resumo: | A cada dia, mais dados podem ser armazenados e, portanto, analisados. Em cada conjunto de dados, a tendência é haver uma quantidade cada vez maior de atributos. A obtenção de modelos de mineração de dados, que revelem alguma informação importante, depende da seleção dos atributos mais relevantes, mas determinar a relevância de um atributo em certo contexto não é uma tarefa fácil. Por isso mesmo, apenas pela análise dos dados, em geral, os métodos de seleção de atributos falham em identificar atributos relevantes, incluem atributos irrelevantes e não reconhecem quando há atributos redundantes entre si. Por outro lado, quando se leva em conta o domínio de conhecimento de onde os dados foram coletados, a análise do significado de cada atributo pode indicar sua importância, contudo, isso pode não ser facilmente compreendido por alguém que não esteja familiarizado com o domínio considerado. De qualquer forma, na prática, a análise da semântica dos atributos é feita de forma manual, o que pode ocasionar enganos, custos e desperdício de tempo. Assim, partindo da hipótese de que a incorporação de semântica na atividade de seleção de atributos leva à escolha de atributos mais relevantes e à geração de modelos de mineração mais significativos, para a tarefa de classificação em mineração de dados, um modelo semântico estatístico que propicia a incorporação de semântica à seleção feita pelos métodos tradicionais foi definido. O modelo emprega ontologia, base linguística e recuperação de informação. Com base neste modelo e utilizando conjuntos de dados reais, procedeu-se a um estudo de caso, a partir do qual se pôde observar seleção de atributos mais relevantes. |
| id |
ITA_db0b7fd72febd81f57db36a4c12aa419 |
|---|---|
| oai_identifier_str |
oai:agregador.ibict.br.BDTD_ITA:oai:ita.br:3360 |
| network_acronym_str |
ITA |
| network_name_str |
Biblioteca Digital de Teses e Dissertações do ITA |
| spelling |
Análise da relevância semântica na seleção de atributos para a mineração de dadosMineração de dadosWeb semânticaRecuperação da informaçãoOntologias (inteligência artificial)ComputaçãoA cada dia, mais dados podem ser armazenados e, portanto, analisados. Em cada conjunto de dados, a tendência é haver uma quantidade cada vez maior de atributos. A obtenção de modelos de mineração de dados, que revelem alguma informação importante, depende da seleção dos atributos mais relevantes, mas determinar a relevância de um atributo em certo contexto não é uma tarefa fácil. Por isso mesmo, apenas pela análise dos dados, em geral, os métodos de seleção de atributos falham em identificar atributos relevantes, incluem atributos irrelevantes e não reconhecem quando há atributos redundantes entre si. Por outro lado, quando se leva em conta o domínio de conhecimento de onde os dados foram coletados, a análise do significado de cada atributo pode indicar sua importância, contudo, isso pode não ser facilmente compreendido por alguém que não esteja familiarizado com o domínio considerado. De qualquer forma, na prática, a análise da semântica dos atributos é feita de forma manual, o que pode ocasionar enganos, custos e desperdício de tempo. Assim, partindo da hipótese de que a incorporação de semântica na atividade de seleção de atributos leva à escolha de atributos mais relevantes e à geração de modelos de mineração mais significativos, para a tarefa de classificação em mineração de dados, um modelo semântico estatístico que propicia a incorporação de semântica à seleção feita pelos métodos tradicionais foi definido. O modelo emprega ontologia, base linguística e recuperação de informação. Com base neste modelo e utilizando conjuntos de dados reais, procedeu-se a um estudo de caso, a partir do qual se pôde observar seleção de atributos mais relevantes.Instituto Tecnológico de AeronáuticaJosé Maria Parente de OliveiraRicardo da Silva SantosAdriana da Silva Jacinto2015-11-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttp://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=3360reponame:Biblioteca Digital de Teses e Dissertações do ITAinstname:Instituto Tecnológico de Aeronáuticainstacron:ITAporinfo:eu-repo/semantics/openAccessapplication/pdf2019-02-02T14:05:10Zoai:agregador.ibict.br.BDTD_ITA:oai:ita.br:3360http://oai.bdtd.ibict.br/requestopendoar:null2020-05-28 19:41:48.38Biblioteca Digital de Teses e Dissertações do ITA - Instituto Tecnológico de Aeronáuticatrue |
| dc.title.none.fl_str_mv |
Análise da relevância semântica na seleção de atributos para a mineração de dados |
| title |
Análise da relevância semântica na seleção de atributos para a mineração de dados |
| spellingShingle |
Análise da relevância semântica na seleção de atributos para a mineração de dados Adriana da Silva Jacinto Mineração de dados Web semântica Recuperação da informação Ontologias (inteligência artificial) Computação |
| title_short |
Análise da relevância semântica na seleção de atributos para a mineração de dados |
| title_full |
Análise da relevância semântica na seleção de atributos para a mineração de dados |
| title_fullStr |
Análise da relevância semântica na seleção de atributos para a mineração de dados |
| title_full_unstemmed |
Análise da relevância semântica na seleção de atributos para a mineração de dados |
| title_sort |
Análise da relevância semântica na seleção de atributos para a mineração de dados |
| author |
Adriana da Silva Jacinto |
| author_facet |
Adriana da Silva Jacinto |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
José Maria Parente de Oliveira Ricardo da Silva Santos |
| dc.contributor.author.fl_str_mv |
Adriana da Silva Jacinto |
| dc.subject.por.fl_str_mv |
Mineração de dados Web semântica Recuperação da informação Ontologias (inteligência artificial) Computação |
| topic |
Mineração de dados Web semântica Recuperação da informação Ontologias (inteligência artificial) Computação |
| dc.description.none.fl_txt_mv |
A cada dia, mais dados podem ser armazenados e, portanto, analisados. Em cada conjunto de dados, a tendência é haver uma quantidade cada vez maior de atributos. A obtenção de modelos de mineração de dados, que revelem alguma informação importante, depende da seleção dos atributos mais relevantes, mas determinar a relevância de um atributo em certo contexto não é uma tarefa fácil. Por isso mesmo, apenas pela análise dos dados, em geral, os métodos de seleção de atributos falham em identificar atributos relevantes, incluem atributos irrelevantes e não reconhecem quando há atributos redundantes entre si. Por outro lado, quando se leva em conta o domínio de conhecimento de onde os dados foram coletados, a análise do significado de cada atributo pode indicar sua importância, contudo, isso pode não ser facilmente compreendido por alguém que não esteja familiarizado com o domínio considerado. De qualquer forma, na prática, a análise da semântica dos atributos é feita de forma manual, o que pode ocasionar enganos, custos e desperdício de tempo. Assim, partindo da hipótese de que a incorporação de semântica na atividade de seleção de atributos leva à escolha de atributos mais relevantes e à geração de modelos de mineração mais significativos, para a tarefa de classificação em mineração de dados, um modelo semântico estatístico que propicia a incorporação de semântica à seleção feita pelos métodos tradicionais foi definido. O modelo emprega ontologia, base linguística e recuperação de informação. Com base neste modelo e utilizando conjuntos de dados reais, procedeu-se a um estudo de caso, a partir do qual se pôde observar seleção de atributos mais relevantes. |
| description |
A cada dia, mais dados podem ser armazenados e, portanto, analisados. Em cada conjunto de dados, a tendência é haver uma quantidade cada vez maior de atributos. A obtenção de modelos de mineração de dados, que revelem alguma informação importante, depende da seleção dos atributos mais relevantes, mas determinar a relevância de um atributo em certo contexto não é uma tarefa fácil. Por isso mesmo, apenas pela análise dos dados, em geral, os métodos de seleção de atributos falham em identificar atributos relevantes, incluem atributos irrelevantes e não reconhecem quando há atributos redundantes entre si. Por outro lado, quando se leva em conta o domínio de conhecimento de onde os dados foram coletados, a análise do significado de cada atributo pode indicar sua importância, contudo, isso pode não ser facilmente compreendido por alguém que não esteja familiarizado com o domínio considerado. De qualquer forma, na prática, a análise da semântica dos atributos é feita de forma manual, o que pode ocasionar enganos, custos e desperdício de tempo. Assim, partindo da hipótese de que a incorporação de semântica na atividade de seleção de atributos leva à escolha de atributos mais relevantes e à geração de modelos de mineração mais significativos, para a tarefa de classificação em mineração de dados, um modelo semântico estatístico que propicia a incorporação de semântica à seleção feita pelos métodos tradicionais foi definido. O modelo emprega ontologia, base linguística e recuperação de informação. Com base neste modelo e utilizando conjuntos de dados reais, procedeu-se a um estudo de caso, a partir do qual se pôde observar seleção de atributos mais relevantes. |
| publishDate |
2015 |
| dc.date.none.fl_str_mv |
2015-11-13 |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis |
| status_str |
publishedVersion |
| format |
doctoralThesis |
| dc.identifier.uri.fl_str_mv |
http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=3360 |
| url |
http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=3360 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Instituto Tecnológico de Aeronáutica |
| publisher.none.fl_str_mv |
Instituto Tecnológico de Aeronáutica |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do ITA instname:Instituto Tecnológico de Aeronáutica instacron:ITA |
| reponame_str |
Biblioteca Digital de Teses e Dissertações do ITA |
| collection |
Biblioteca Digital de Teses e Dissertações do ITA |
| instname_str |
Instituto Tecnológico de Aeronáutica |
| instacron_str |
ITA |
| institution |
ITA |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do ITA - Instituto Tecnológico de Aeronáutica |
| repository.mail.fl_str_mv |
|
| subject_por_txtF_mv |
Mineração de dados Web semântica Recuperação da informação Ontologias (inteligência artificial) Computação |
| _version_ |
1706805012483538944 |