Ponderação baseada em expertise para modelos de regressão com rótulos ruidosos
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
| Programa de Pós-Graduação: |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://hdl.handle.net/20.500.14289/21923 |
Resumo: | Traditional regression methods assume the availability of precise labels for training models. However, in many contexts, obtaining fully accurate labels may not be feasible, requiring reliance on multiple experts whose opinions may diverge due to intrinsic human noise, which is difficult to measure. This noise can be present in the input variables, as different experts may interpret certain observations in distinct ways due to their expertise. In this work, we propose an innovative approach to training regression models in scenarios in which the labels contain noise, resulting from multiple divergent expert opinions. The proposed method first estimates each expert’s expertise both generally and at the instance level, assigning weights to their opinions. Then, a weighted average of these opinions is computed, using the learned weights to adjust the regression model based on the input variables. The proposed approach has a solid theoretical foundation and, through experiments with both simulated and real data, has been empirically demonstrated to outperform traditional methods. In summary, this method provides a simple, fast, and effective solution for training regression models in scenarios with noisy labels generated by differing expert opinions. |
| id |
SCAR_552da6007ec814471267821162406b2e |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/21923 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
dos Santos, Milene ReginaIzbicki, Rafaelhttp://lattes.cnpq.br/9991192137633896http://lattes.cnpq.br/4765047022940745https://orcid.org/0000-0003-0418-062Xhttps://orcid.org/0000-0003-0379-96902025-04-17T17:41:59Z2025-02-18DOS SANTOS, Milene Regina. Ponderação baseada em expertise para modelos de regressão com rótulos ruidosos. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21923.https://hdl.handle.net/20.500.14289/21923Traditional regression methods assume the availability of precise labels for training models. However, in many contexts, obtaining fully accurate labels may not be feasible, requiring reliance on multiple experts whose opinions may diverge due to intrinsic human noise, which is difficult to measure. This noise can be present in the input variables, as different experts may interpret certain observations in distinct ways due to their expertise. In this work, we propose an innovative approach to training regression models in scenarios in which the labels contain noise, resulting from multiple divergent expert opinions. The proposed method first estimates each expert’s expertise both generally and at the instance level, assigning weights to their opinions. Then, a weighted average of these opinions is computed, using the learned weights to adjust the regression model based on the input variables. The proposed approach has a solid theoretical foundation and, through experiments with both simulated and real data, has been empirically demonstrated to outperform traditional methods. In summary, this method provides a simple, fast, and effective solution for training regression models in scenarios with noisy labels generated by differing expert opinions.Os métodos de regressão tradicionais pressupõem a disponibilidade de rótulos precisos para o treinamento dos modelos. No entanto, em muitos contextos, obter rótulos totalmente precisos pode não ser factível, sendo necessário recorrer a múltiplos especialistas cujas opiniões podem divergir devido a ruídos humanos intrínsecos e difíceis de mensurar. Esses ruídos podem estar nas variáveis de entrada, já que diferentes especialistas podem interpretar certas observações de maneiras distintas, devido as expertises. Neste trabalho a proposta é uma abordagem inovadora para o treinamento de modelos deregressão em cenários nos quais os rótulos apresentam ruído, resultante de múltiplas opiniões divergentes de especialistas. O método proposto consiste, primeiramente, em estimar a expertise de cada especialista de forma geral e a nível de instância, atribuindo pesos às suas opiniões. Em seguida, realiza-se uma média ponderada dessas opiniões, utilizando os pesos aprendidos para ajustar o modelo de regressão com base nas variáveis de entrada.A abordagem proposta tem fundamentação teórica sólida e, por meio de experimentos com dados simulados e reais, demonstrou-se empiricamente superior a métodos tradicionais. Em suma, o método oferece uma solução simples, rápida e eficaz para o treinamento de modelos de regressão em cenários com rótulos ruidosos, gerados por diferentes opiniões de especialistas.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarhttps://doi.org/10.1080/03610918.2025.2479843Attribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessModelo ponderadoRótulos ruidososRegressãoWeighted modelNoisy labelsRegressionCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAOPonderação baseada em expertise para modelos de regressão com rótulos ruidososExpertise-based weighting for regression models with noisy labelsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALTese_Doutorado (4).pdfTese_Doutorado (4).pdfapplication/pdf1941510https://repositorio.ufscar.br/bitstreams/fb7d8815-33f2-456b-8763-cbe7cbb1a4fe/download72dac0b069d758b4daff30525b4704c2MD51trueAnonymousREADTEXTTese_Doutorado (4).pdf.txtTese_Doutorado (4).pdf.txtExtracted texttext/plain97407https://repositorio.ufscar.br/bitstreams/c802c411-c9b5-4d7d-a2ee-f1897c7061d3/download7dbd8df72df044415444a86447d60528MD53falseAnonymousREADTHUMBNAILTese_Doutorado (4).pdf.jpgTese_Doutorado (4).pdf.jpgGenerated Thumbnailimage/jpeg6421https://repositorio.ufscar.br/bitstreams/49b3bc7c-0d99-4fea-b0af-0071fab6e032/download72b9df023e929f1a53f8c2d738a78eafMD54falseAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81025https://repositorio.ufscar.br/bitstreams/1a279ffe-fef5-4a7b-82a2-a6f0a1029330/download5a033ee506f3a0a175bee8fc81f0bd66MD52falseAnonymousREAD20.500.14289/219232025-04-18 00:04:05.368http://creativecommons.org/licenses/by/3.0/br/Attribution 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/21923https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-04-18T03:04:05Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
| dc.title.por.fl_str_mv |
Ponderação baseada em expertise para modelos de regressão com rótulos ruidosos |
| dc.title.alternative.eng.fl_str_mv |
Expertise-based weighting for regression models with noisy labels |
| title |
Ponderação baseada em expertise para modelos de regressão com rótulos ruidosos |
| spellingShingle |
Ponderação baseada em expertise para modelos de regressão com rótulos ruidosos dos Santos, Milene Regina Modelo ponderado Rótulos ruidosos Regressão Weighted model Noisy labels Regression CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO |
| title_short |
Ponderação baseada em expertise para modelos de regressão com rótulos ruidosos |
| title_full |
Ponderação baseada em expertise para modelos de regressão com rótulos ruidosos |
| title_fullStr |
Ponderação baseada em expertise para modelos de regressão com rótulos ruidosos |
| title_full_unstemmed |
Ponderação baseada em expertise para modelos de regressão com rótulos ruidosos |
| title_sort |
Ponderação baseada em expertise para modelos de regressão com rótulos ruidosos |
| author |
dos Santos, Milene Regina |
| author_facet |
dos Santos, Milene Regina |
| author_role |
author |
| dc.contributor.authorlattes.none.fl_str_mv |
http://lattes.cnpq.br/4765047022940745 |
| dc.contributor.authororcid.none.fl_str_mv |
https://orcid.org/0000-0003-0418-062X |
| dc.contributor.advisor1orcid.none.fl_str_mv |
https://orcid.org/0000-0003-0379-9690 |
| dc.contributor.author.fl_str_mv |
dos Santos, Milene Regina |
| dc.contributor.advisor1.fl_str_mv |
Izbicki, Rafael |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/9991192137633896 |
| contributor_str_mv |
Izbicki, Rafael |
| dc.subject.por.fl_str_mv |
Modelo ponderado Rótulos ruidosos Regressão |
| topic |
Modelo ponderado Rótulos ruidosos Regressão Weighted model Noisy labels Regression CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO |
| dc.subject.eng.fl_str_mv |
Weighted model Noisy labels Regression |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO |
| description |
Traditional regression methods assume the availability of precise labels for training models. However, in many contexts, obtaining fully accurate labels may not be feasible, requiring reliance on multiple experts whose opinions may diverge due to intrinsic human noise, which is difficult to measure. This noise can be present in the input variables, as different experts may interpret certain observations in distinct ways due to their expertise. In this work, we propose an innovative approach to training regression models in scenarios in which the labels contain noise, resulting from multiple divergent expert opinions. The proposed method first estimates each expert’s expertise both generally and at the instance level, assigning weights to their opinions. Then, a weighted average of these opinions is computed, using the learned weights to adjust the regression model based on the input variables. The proposed approach has a solid theoretical foundation and, through experiments with both simulated and real data, has been empirically demonstrated to outperform traditional methods. In summary, this method provides a simple, fast, and effective solution for training regression models in scenarios with noisy labels generated by differing expert opinions. |
| publishDate |
2025 |
| dc.date.accessioned.fl_str_mv |
2025-04-17T17:41:59Z |
| dc.date.issued.fl_str_mv |
2025-02-18 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
DOS SANTOS, Milene Regina. Ponderação baseada em expertise para modelos de regressão com rótulos ruidosos. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21923. |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.14289/21923 |
| identifier_str_mv |
DOS SANTOS, Milene Regina. Ponderação baseada em expertise para modelos de regressão com rótulos ruidosos. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21923. |
| url |
https://hdl.handle.net/20.500.14289/21923 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.uri.none.fl_str_mv |
https://doi.org/10.1080/03610918.2025.2479843 |
| dc.rights.driver.fl_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.publisher.program.fl_str_mv |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/fb7d8815-33f2-456b-8763-cbe7cbb1a4fe/download https://repositorio.ufscar.br/bitstreams/c802c411-c9b5-4d7d-a2ee-f1897c7061d3/download https://repositorio.ufscar.br/bitstreams/49b3bc7c-0d99-4fea-b0af-0071fab6e032/download https://repositorio.ufscar.br/bitstreams/1a279ffe-fef5-4a7b-82a2-a6f0a1029330/download |
| bitstream.checksum.fl_str_mv |
72dac0b069d758b4daff30525b4704c2 7dbd8df72df044415444a86447d60528 72b9df023e929f1a53f8c2d738a78eaf 5a033ee506f3a0a175bee8fc81f0bd66 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688924940861440 |