Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado
Ano de defesa: | 2014 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal do Rio Grande do Norte
BR UFRN Programa de Pós-Graduação em Sistemas e Computação Ciência da Computação |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://repositorio.ufrn.br/jspui/handle/123456789/18097 |
Resumo: | The techniques of Machine Learning are applied in classification tasks to acquire knowledge through a set of data or information. Some learning methods proposed in literature are methods based on semissupervised learning; this is represented by small percentage of labeled data (supervised learning) combined with a quantity of label and non-labeled examples (unsupervised learning) during the training phase, which reduces, therefore, the need for a large quantity of labeled instances when only small dataset of labeled instances is available for training. A commom problem in semi-supervised learning is as random selection of instances, since most of paper use a random selection technique which can cause a negative impact. Much of machine learning methods treat single-label problems, in other words, problems where a given set of data are associated with a single class; however, through the requirement existent to classify data in a lot of domain, or more than one class, this classification as called multi-label classification. This work presents an experimental analysis of the results obtained using semissupervised learning in troubles of multi-label classification using reliability parameter as an aid in the classification data. Thus, the use of techniques of semissupervised learning and besides methods of multi-label classification, were essential to show the results |
id |
UFRN_0a3eeea666aff3b9db824816160ca4f2 |
---|---|
oai_identifier_str |
oai:repositorio.ufrn.br:123456789/18097 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionadoAprendizado de máquina. Aprendizado semissupervisionado. Classificação multirrótulo. Parâmetro de confiabilidadeMachine Learning. Semissupervised learning. Multi-label classification. Reliability ParameterCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOThe techniques of Machine Learning are applied in classification tasks to acquire knowledge through a set of data or information. Some learning methods proposed in literature are methods based on semissupervised learning; this is represented by small percentage of labeled data (supervised learning) combined with a quantity of label and non-labeled examples (unsupervised learning) during the training phase, which reduces, therefore, the need for a large quantity of labeled instances when only small dataset of labeled instances is available for training. A commom problem in semi-supervised learning is as random selection of instances, since most of paper use a random selection technique which can cause a negative impact. Much of machine learning methods treat single-label problems, in other words, problems where a given set of data are associated with a single class; however, through the requirement existent to classify data in a lot of domain, or more than one class, this classification as called multi-label classification. This work presents an experimental analysis of the results obtained using semissupervised learning in troubles of multi-label classification using reliability parameter as an aid in the classification data. Thus, the use of techniques of semissupervised learning and besides methods of multi-label classification, were essential to show the resultsConselho Nacional de Desenvolvimento Científico e TecnológicoAs técnicas de Aprendizado de Máquina são aplicadas em tarefas de classificação para a aquisição de conhecimento através de um conjunto de dados ou informações. Alguns métodos de aprendizado utilizados pela literatura são baseados em aprendizado semissupervisionado; este é representado por pequeno percentual de exemplos rotulados (aprendizado supervisionado) combinados com uma quantidade de exemplos rotulados e não rotulados (não-supervisionado) durante a fase de treinamento, reduzindo, portanto, a necessidade de uma grande quantidade de dados rotulados quando apenas um pequeno conjunto de exemplos rotulados está disponível para treinamento. O problema da escolha aleatória das instâncias é comum no aprendizado semissupervisionado, pois a maioria dos trabalhos usam a escolha aleatória dessas instâncias o que pode causar um impacto negativo. Por outro lado, grande parte dos métodos de aprendizado de máquina trata de problemas unirrótulo, ou seja, problemas onde exemplos de um determinado conjunto são associados a uma única classe. Entretanto, diante da necessidade existente de classificar dados em uma grande quantidade de domínios, ou em mais de uma classe, essa classificação citada é denominada classificação multirrótulo. Este trabalho apresenta uma análise experimental dos resultados obtidos por meio da utilização do aprendizado semissupervisionado em problemas de classificação multirrótulo usando um parâmetro de confiabilidade como auxílio na classificação dos dados. Dessa maneira, a utilização de técnicas de aprendizado semissupervisionado, bem como de métodos de classificação multirrótulos, foram imprescindíveis na apresentação dos resultadosUniversidade Federal do Rio Grande do NorteBRUFRNPrograma de Pós-Graduação em Sistemas e ComputaçãoCiência da ComputaçãoCanuto, Anne Magaly de Paulahttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4366670P0http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8Santos, Araken de Medeiroshttp://lattes.cnpq.br/8059198436766378Xavier Júnior, João Carloshttp://lattes.cnpq.br/5088238300241110Bernardini, Flavia Cristinahttp://lattes.cnpq.br/5935862634033333Rodrigues, Fillipe Morais2014-12-17T15:48:09Z2014-11-052014-12-17T15:48:09Z2014-02-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfRODRIGUES, Fillipe Morais. Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado. 2014. 118 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014.https://repositorio.ufrn.br/jspui/handle/123456789/18097porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRN2017-11-04T16:21:09Zoai:repositorio.ufrn.br:123456789/18097Repositório InstitucionalPUBhttp://repositorio.ufrn.br/oai/repositorio@bczm.ufrn.bropendoar:2017-11-04T16:21:09Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.none.fl_str_mv |
Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado |
title |
Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado |
spellingShingle |
Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado Rodrigues, Fillipe Morais Aprendizado de máquina. Aprendizado semissupervisionado. Classificação multirrótulo. Parâmetro de confiabilidade Machine Learning. Semissupervised learning. Multi-label classification. Reliability Parameter CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
title_short |
Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado |
title_full |
Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado |
title_fullStr |
Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado |
title_full_unstemmed |
Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado |
title_sort |
Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado |
author |
Rodrigues, Fillipe Morais |
author_facet |
Rodrigues, Fillipe Morais |
author_role |
author |
dc.contributor.none.fl_str_mv |
Canuto, Anne Magaly de Paula http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4366670P0 http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8 Santos, Araken de Medeiros http://lattes.cnpq.br/8059198436766378 Xavier Júnior, João Carlos http://lattes.cnpq.br/5088238300241110 Bernardini, Flavia Cristina http://lattes.cnpq.br/5935862634033333 |
dc.contributor.author.fl_str_mv |
Rodrigues, Fillipe Morais |
dc.subject.por.fl_str_mv |
Aprendizado de máquina. Aprendizado semissupervisionado. Classificação multirrótulo. Parâmetro de confiabilidade Machine Learning. Semissupervised learning. Multi-label classification. Reliability Parameter CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
topic |
Aprendizado de máquina. Aprendizado semissupervisionado. Classificação multirrótulo. Parâmetro de confiabilidade Machine Learning. Semissupervised learning. Multi-label classification. Reliability Parameter CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
description |
The techniques of Machine Learning are applied in classification tasks to acquire knowledge through a set of data or information. Some learning methods proposed in literature are methods based on semissupervised learning; this is represented by small percentage of labeled data (supervised learning) combined with a quantity of label and non-labeled examples (unsupervised learning) during the training phase, which reduces, therefore, the need for a large quantity of labeled instances when only small dataset of labeled instances is available for training. A commom problem in semi-supervised learning is as random selection of instances, since most of paper use a random selection technique which can cause a negative impact. Much of machine learning methods treat single-label problems, in other words, problems where a given set of data are associated with a single class; however, through the requirement existent to classify data in a lot of domain, or more than one class, this classification as called multi-label classification. This work presents an experimental analysis of the results obtained using semissupervised learning in troubles of multi-label classification using reliability parameter as an aid in the classification data. Thus, the use of techniques of semissupervised learning and besides methods of multi-label classification, were essential to show the results |
publishDate |
2014 |
dc.date.none.fl_str_mv |
2014-12-17T15:48:09Z 2014-11-05 2014-12-17T15:48:09Z 2014-02-21 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
RODRIGUES, Fillipe Morais. Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado. 2014. 118 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014. https://repositorio.ufrn.br/jspui/handle/123456789/18097 |
identifier_str_mv |
RODRIGUES, Fillipe Morais. Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado. 2014. 118 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014. |
url |
https://repositorio.ufrn.br/jspui/handle/123456789/18097 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte BR UFRN Programa de Pós-Graduação em Sistemas e Computação Ciência da Computação |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte BR UFRN Programa de Pós-Graduação em Sistemas e Computação Ciência da Computação |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
repositorio@bczm.ufrn.br |
_version_ |
1834480074140680192 |