Novel semi-supervised algorithms based on extreme learning machine for unbalanced data streams with concept drift
| Ano de defesa: | 2020 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Vitória
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ifes.edu.br/handle/123456789/1859 |
Resumo: | RESUMO: Nos dias atuais, streams de dados são importantes fontes de informação e, com a popularização de dispositivos móveis e sistemas de sensores que coletam todos os tipos de dados, grandes quantidades de informações são geradas a uma velocidade cada vez maior. Esse crescimento no fornecimento de dados apresenta alguns problemas para os algoritmos tradicionais de aprendizado de máquina. Tarefas como classificação, regressão ou clusterização de dados têm algumas limitações em relação a conjuntos de dados muito grandes, variações ou fluxos contínuos de dados. Em geral, algoritmos que funcionam em uma dessas situações podem não funcionar em outras. Além disso, os fluxos de dados apresentam novos desafios aos algoritmos de aprendizado de máquina. O alto custo de se rotular manualmente instâncias para o treinamento de algoritmos de classificação dificulta o uso de métodos totalmente supervisionados. Conjuntos de dados desbalanceados tendem a fazer com que os algoritmos ignorem uma ou mais classes. Além disso, concept drifts nos fluxos de dados exigem que os modelos sejam atualizados periodicamente. Para minimizar os problemas mencionados, nesta tese foram propostos algoritmos semi-supervisionados e on-line baseados em Extreme Learning Machine (ELM). O primeiro algoritmo proposto denominado Semi-Supervised Online Elastic ELM (SSOE-ELM), superou outros da literatura em acurácia e tempo de treinamento, mostrando bons resultados em casos de bases desbalanceadas. O SSOE-ELM usa amostras rotuladas e não rotuladas para treinamento e recebe dados sequencialmente em blocos de uma ou mais instâncias, atualizando continuamente o modelo. Em geral, como um algoritmo baseado em Extreme Learning Machine, seu treinamento é muito rápido em comparação com algoritmos baseados em gradiente descendente. O segundo algoritmo proposto, denominado Semi-Supervised Online Elastic ELM with Forgetting Parameter (SSOE-FP-ELM), é uma extensão do SSOE-ELM para lidar com fluxos de dados com concept drift. O SSOE-FP-ELM usa um parâmetro de esquecimento híbrido que considera instâncias rotuladas e não rotuladas para detectar casos de concept drift gradual e abrupto. Resultados experimentais mostram que os dois algoritmos propostos superam outros na literatura em acurácia e poder de generalização, indicando serem alternativas viáveis para a classificação de fluxos de dados. |
| id |
IFES-2_ac1b8ea6cb53608a2f74ef93e9886f7e |
|---|---|
| oai_identifier_str |
oai:repositorio.ifes.edu.br:123456789/1859 |
| network_acronym_str |
IFES-2 |
| network_name_str |
Repositório Institucional do IFES |
| repository_id_str |
|
| spelling |
Silva, Carlos Alexandre Siqueira daUniversidade Federal do Espírito Santo (Ufes)Braga, Antônio de PáduaCavalieri, Daniel CruzSantos, Celso Alberto SaibelMota, Vinícius Fernandes SoaresKrohling, Renato Antonio2022-04-13T14:10:41Z2022-04-13T14:10:41Z2020SILVA, Carlos Alexandre Siqueira da. Novel semi-supervised algorithms based on extreme learning machine for unbalanced data streams with concept drift. 2020. 113 f. Tese (Doutorado em Informática) - Centro Tecnológico, Universidade Federal do Espírito Santo, Vitória - ES, 2020.https://repositorio.ifes.edu.br/handle/123456789/185930001013007P0RESUMO: Nos dias atuais, streams de dados são importantes fontes de informação e, com a popularização de dispositivos móveis e sistemas de sensores que coletam todos os tipos de dados, grandes quantidades de informações são geradas a uma velocidade cada vez maior. Esse crescimento no fornecimento de dados apresenta alguns problemas para os algoritmos tradicionais de aprendizado de máquina. Tarefas como classificação, regressão ou clusterização de dados têm algumas limitações em relação a conjuntos de dados muito grandes, variações ou fluxos contínuos de dados. Em geral, algoritmos que funcionam em uma dessas situações podem não funcionar em outras. Além disso, os fluxos de dados apresentam novos desafios aos algoritmos de aprendizado de máquina. O alto custo de se rotular manualmente instâncias para o treinamento de algoritmos de classificação dificulta o uso de métodos totalmente supervisionados. Conjuntos de dados desbalanceados tendem a fazer com que os algoritmos ignorem uma ou mais classes. Além disso, concept drifts nos fluxos de dados exigem que os modelos sejam atualizados periodicamente. Para minimizar os problemas mencionados, nesta tese foram propostos algoritmos semi-supervisionados e on-line baseados em Extreme Learning Machine (ELM). O primeiro algoritmo proposto denominado Semi-Supervised Online Elastic ELM (SSOE-ELM), superou outros da literatura em acurácia e tempo de treinamento, mostrando bons resultados em casos de bases desbalanceadas. O SSOE-ELM usa amostras rotuladas e não rotuladas para treinamento e recebe dados sequencialmente em blocos de uma ou mais instâncias, atualizando continuamente o modelo. Em geral, como um algoritmo baseado em Extreme Learning Machine, seu treinamento é muito rápido em comparação com algoritmos baseados em gradiente descendente. O segundo algoritmo proposto, denominado Semi-Supervised Online Elastic ELM with Forgetting Parameter (SSOE-FP-ELM), é uma extensão do SSOE-ELM para lidar com fluxos de dados com concept drift. O SSOE-FP-ELM usa um parâmetro de esquecimento híbrido que considera instâncias rotuladas e não rotuladas para detectar casos de concept drift gradual e abrupto. Resultados experimentais mostram que os dois algoritmos propostos superam outros na literatura em acurácia e poder de generalização, indicando serem alternativas viáveis para a classificação de fluxos de dados.ABSTRACT: Data streams are important sources of information nowadays, and with the popularization of mobile devices and sensor systems that collect all kinds of data, more and more information is generated at an ever increasing speed. This growth in data supply poses some problems for traditional machine learning algorithms. Tasks such as data classification, regression, or data clustering presents some limitations regarding very large datasets, data streams, or variations in data. In general, algorithms that works in one of these situations may not work in others. In addition, data streams pose further challenges to machine learning algorithms. The high cost of labeling instances for training classification algorithms makes it difficult to use fully supervised algorithms. Unbalanced datasets tend to cause algorithms to ignore one or more classes. Moreover, concept drifts in data streams require algorithms to be retrained from time to time. To minimize the problems mentioned, in this thesis semi-supervised and online algorithms based on Extreme Learning Machine (ELM) were proposed. The first proposed algorithm named Semi-Supervised Online Elastic ELM, for short, SSOE-ELM, overperform others in the literature in accuracy and training time, showing good results in cases of unbalanced datasets. SSOE-ELM uses labeled and unlabeled samples for training, and receives data sequentially in chunks of one or more instances, continuously updating the network. In general, as an Extreme Learning Machine based algorithm, its training is very fast compared to gradient descent based algorithms. The second proposed algorithm named Semi-Supervised Online Elastic ELM with Forgetting Parameter, for short, SSOE-FP-ELM, is an extension of SSOE-ELM to deal with data streams with concept drift. SSOE-FP-ELM uses a hybrid forgetting parameter that considers labeled and unlabeled instances to detect gradual and abrupt concept drift cases. Experimental results show that the two proposed algorithms outperform others in the literature in accuracy and generalization ability, showing suitable alternatives for data streams classification.Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)Campus de AlegreMachine learningSemi-supervised learningExtreme learning machine (ELM)Data streamsConcept driftUnbalanced datasetsNovel semi-supervised algorithms based on extreme learning machine for unbalanced data streams with concept driftinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisVitóriaPrograma de Pós-graduação em InformáticaCiências Exatas e da TerraInteligência Computacionalinfo:eu-repo/semantics/openAccessengreponame:Repositório Institucional do IFESinstname:Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)instacron:IFEShttp://lattes.cnpq.br/0802323128828982ORIGINALTese_Carlos_Alexandre_Novel_semi-supervised_algorithms_based_on_extreme_learning_machine_for_unbalanced_data_streams_with_concept_drift.pdfTese_Carlos_Alexandre_Novel_semi-supervised_algorithms_based_on_extreme_learning_machine_for_unbalanced_data_streams_with_concept_drift.pdfapplication/pdf3114333https://repositorio.ifes.edu.br/bitstreams/44741122-ea84-48a7-a821-8b39a304b562/downloadebc407cc6af57a1fd23f0c3ab3a714acMD51trueAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-8934https://repositorio.ifes.edu.br/bitstreams/90c71812-1216-420b-9305-4496f4f8f87b/downloadac7cb971050ed632be934da23d966924MD52falseAnonymousREADTEXTTese_Carlos_Alexandre_Novel_semi-supervised_algorithms_based_on_extreme_learning_machine_for_unbalanced_data_streams_with_concept_drift.pdf.txtTese_Carlos_Alexandre_Novel_semi-supervised_algorithms_based_on_extreme_learning_machine_for_unbalanced_data_streams_with_concept_drift.pdf.txtExtracted texttext/plain216564https://repositorio.ifes.edu.br/bitstreams/81f7b4ff-4c40-4304-826b-bbedf1e7df30/download895315a73b5046c052c8ab5e99eb8d48MD53falseAnonymousREADTHUMBNAILTese_Carlos_Alexandre_Novel_semi-supervised_algorithms_based_on_extreme_learning_machine_for_unbalanced_data_streams_with_concept_drift.pdf.jpgTese_Carlos_Alexandre_Novel_semi-supervised_algorithms_based_on_extreme_learning_machine_for_unbalanced_data_streams_with_concept_drift.pdf.jpgGenerated Thumbnailimage/jpeg2645https://repositorio.ifes.edu.br/bitstreams/c2299009-0563-4ab2-a109-bfabf729d88c/download950ea49c712250ec772e273d9bb91f13MD54falseAnonymousREAD123456789/18592025-06-27T17:04:15.766Zopen.accessoai:repositorio.ifes.edu.br:123456789/1859https://repositorio.ifes.edu.brRepositório InstitucionalPUBhttps://repositorio.ifes.edu.br/server/oai/requestrepositorio@ifes.edu.bropendoar:2025-06-27T17:04:15Repositório Institucional do IFES - Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)falseQXV0b3JlcyBxdWUgc3VibWV0ZW0gYSBlc3RhIGNvbmZlcsOqbmNpYSBjb25jb3JkYW0gY29tIG9zIHNlZ3VpbnRlcyB0ZXJtb3M6CmEpIEF1dG9yZXMgbWFudMOpbSBvcyBkaXJlaXRvcyBhdXRvcmFpcyBzb2JyZSBvIHRyYWJhbGhvLCBwZXJtaXRpbmRvIMOgIGNvbmZlcsOqbmNpYSBjb2xvY8OhLWxvIHNvYiB1bWEgbGljZW7Dp2EgTGljZW7Dp2EgQ3JlYXRpdmUgQ29tbW9ucyBBdHRyaWJ1dGlvbiwgcXVlIHBlcm1pdGUgbGl2cmVtZW50ZSBhIG91dHJvcyBhY2Vzc2FyLCB1c2FyIGUgY29tcGFydGlsaGFyIG8gdHJhYmFsaG8gY29tIG8gY3LDqWRpdG8gZGUgYXV0b3JpYSBlIGFwcmVzZW50YcOnw6NvIGluaWNpYWwgbmVzdGEgY29uZmVyw6puY2lhLgpiKSBBdXRvcmVzIHBvZGVtIGFicmlyIG3Do28gZG9zIHRlcm1vcyBkYSBsaWNlbsOnYSBDQyBlIGRlZmluaXIgY29udHJhdG9zIGFkaWNpb25haXMgcGFyYSBhIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhIGUgc3Vic2Vxw7xlbnRlIHB1YmxpY2HDp8OjbyBkZXN0ZSB0cmFiYWxobyAoZXguOiBwdWJsaWNhciB1bWEgdmVyc8OjbyBhdHVhbGl6YWRhIGVtIHVtIHBlcmnDs2RpY28sIGRpc3BvbmliaWxpemFyIGVtIHJlcG9zaXTDs3JpbyBpbnN0aXR1Y2lvbmFsLCBvdSBwdWJsaWPDoS1sbyBlbSBsaXZybyksIGNvbSBvIGNyw6lkaXRvIGRlIGF1dG9yaWEgZSBhcHJlc2VudGHDp8OjbyBpbmljaWFsIG5lc3RhIGNvbmZlcsOqbmNpYS4KYykgQWzDqW0gZGlzc28sIGF1dG9yZXMgc8OjbyBpbmNlbnRpdmFkb3MgYSBwdWJsaWNhciBlIGNvbXBhcnRpbGhhciBzZXVzIHRyYWJhbGhvcyBvbmxpbmUgKGV4LjogZW0gcmVwb3NpdMOzcmlvIGluc3RpdHVjaW9uYWwgb3UgZW0gc3VhIHDDoWdpbmEgcGVzc29hbCkgYSBxdWFscXVlciBtb21lbnRvIGFudGVzIGUgZGVwb2lzIGRhIGNvbmZlcsOqCg== |
| dc.title.pt_BR.fl_str_mv |
Novel semi-supervised algorithms based on extreme learning machine for unbalanced data streams with concept drift |
| title |
Novel semi-supervised algorithms based on extreme learning machine for unbalanced data streams with concept drift |
| spellingShingle |
Novel semi-supervised algorithms based on extreme learning machine for unbalanced data streams with concept drift Silva, Carlos Alexandre Siqueira da Machine learning Semi-supervised learning Extreme learning machine (ELM) Data streams Concept drift Unbalanced datasets |
| title_short |
Novel semi-supervised algorithms based on extreme learning machine for unbalanced data streams with concept drift |
| title_full |
Novel semi-supervised algorithms based on extreme learning machine for unbalanced data streams with concept drift |
| title_fullStr |
Novel semi-supervised algorithms based on extreme learning machine for unbalanced data streams with concept drift |
| title_full_unstemmed |
Novel semi-supervised algorithms based on extreme learning machine for unbalanced data streams with concept drift |
| title_sort |
Novel semi-supervised algorithms based on extreme learning machine for unbalanced data streams with concept drift |
| author |
Silva, Carlos Alexandre Siqueira da |
| author_facet |
Silva, Carlos Alexandre Siqueira da |
| author_role |
author |
| dc.contributor.institution.pt_BR.fl_str_mv |
Universidade Federal do Espírito Santo (Ufes) |
| dc.contributor.member.none.fl_str_mv |
Braga, Antônio de Pádua Cavalieri, Daniel Cruz Santos, Celso Alberto Saibel Mota, Vinícius Fernandes Soares |
| dc.contributor.author.fl_str_mv |
Silva, Carlos Alexandre Siqueira da |
| dc.contributor.advisor1.fl_str_mv |
Krohling, Renato Antonio |
| contributor_str_mv |
Krohling, Renato Antonio |
| dc.subject.por.fl_str_mv |
Machine learning Semi-supervised learning Extreme learning machine (ELM) Data streams Concept drift Unbalanced datasets |
| topic |
Machine learning Semi-supervised learning Extreme learning machine (ELM) Data streams Concept drift Unbalanced datasets |
| description |
RESUMO: Nos dias atuais, streams de dados são importantes fontes de informação e, com a popularização de dispositivos móveis e sistemas de sensores que coletam todos os tipos de dados, grandes quantidades de informações são geradas a uma velocidade cada vez maior. Esse crescimento no fornecimento de dados apresenta alguns problemas para os algoritmos tradicionais de aprendizado de máquina. Tarefas como classificação, regressão ou clusterização de dados têm algumas limitações em relação a conjuntos de dados muito grandes, variações ou fluxos contínuos de dados. Em geral, algoritmos que funcionam em uma dessas situações podem não funcionar em outras. Além disso, os fluxos de dados apresentam novos desafios aos algoritmos de aprendizado de máquina. O alto custo de se rotular manualmente instâncias para o treinamento de algoritmos de classificação dificulta o uso de métodos totalmente supervisionados. Conjuntos de dados desbalanceados tendem a fazer com que os algoritmos ignorem uma ou mais classes. Além disso, concept drifts nos fluxos de dados exigem que os modelos sejam atualizados periodicamente. Para minimizar os problemas mencionados, nesta tese foram propostos algoritmos semi-supervisionados e on-line baseados em Extreme Learning Machine (ELM). O primeiro algoritmo proposto denominado Semi-Supervised Online Elastic ELM (SSOE-ELM), superou outros da literatura em acurácia e tempo de treinamento, mostrando bons resultados em casos de bases desbalanceadas. O SSOE-ELM usa amostras rotuladas e não rotuladas para treinamento e recebe dados sequencialmente em blocos de uma ou mais instâncias, atualizando continuamente o modelo. Em geral, como um algoritmo baseado em Extreme Learning Machine, seu treinamento é muito rápido em comparação com algoritmos baseados em gradiente descendente. O segundo algoritmo proposto, denominado Semi-Supervised Online Elastic ELM with Forgetting Parameter (SSOE-FP-ELM), é uma extensão do SSOE-ELM para lidar com fluxos de dados com concept drift. O SSOE-FP-ELM usa um parâmetro de esquecimento híbrido que considera instâncias rotuladas e não rotuladas para detectar casos de concept drift gradual e abrupto. Resultados experimentais mostram que os dois algoritmos propostos superam outros na literatura em acurácia e poder de generalização, indicando serem alternativas viáveis para a classificação de fluxos de dados. |
| publishDate |
2020 |
| dc.date.issued.fl_str_mv |
2020 |
| dc.date.accessioned.fl_str_mv |
2022-04-13T14:10:41Z |
| dc.date.available.fl_str_mv |
2022-04-13T14:10:41Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
SILVA, Carlos Alexandre Siqueira da. Novel semi-supervised algorithms based on extreme learning machine for unbalanced data streams with concept drift. 2020. 113 f. Tese (Doutorado em Informática) - Centro Tecnológico, Universidade Federal do Espírito Santo, Vitória - ES, 2020. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ifes.edu.br/handle/123456789/1859 |
| dc.identifier.capes.pt_BR.fl_str_mv |
30001013007P0 |
| identifier_str_mv |
SILVA, Carlos Alexandre Siqueira da. Novel semi-supervised algorithms based on extreme learning machine for unbalanced data streams with concept drift. 2020. 113 f. Tese (Doutorado em Informática) - Centro Tecnológico, Universidade Federal do Espírito Santo, Vitória - ES, 2020. 30001013007P0 |
| url |
https://repositorio.ifes.edu.br/handle/123456789/1859 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Vitória |
| publisher.none.fl_str_mv |
Vitória |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional do IFES instname:Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES) instacron:IFES |
| instname_str |
Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES) |
| instacron_str |
IFES |
| institution |
IFES |
| reponame_str |
Repositório Institucional do IFES |
| collection |
Repositório Institucional do IFES |
| bitstream.url.fl_str_mv |
https://repositorio.ifes.edu.br/bitstreams/44741122-ea84-48a7-a821-8b39a304b562/download https://repositorio.ifes.edu.br/bitstreams/90c71812-1216-420b-9305-4496f4f8f87b/download https://repositorio.ifes.edu.br/bitstreams/81f7b4ff-4c40-4304-826b-bbedf1e7df30/download https://repositorio.ifes.edu.br/bitstreams/c2299009-0563-4ab2-a109-bfabf729d88c/download |
| bitstream.checksum.fl_str_mv |
ebc407cc6af57a1fd23f0c3ab3a714ac ac7cb971050ed632be934da23d966924 895315a73b5046c052c8ab5e99eb8d48 950ea49c712250ec772e273d9bb91f13 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional do IFES - Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES) |
| repository.mail.fl_str_mv |
repositorio@ifes.edu.br |
| _version_ |
1864451021809385472 |