Interpretabilidade com agregação de relevância em redes neurais para a predição do absenteísmo
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Tecnológica Federal do Paraná
Cornelio Procopio Brasil Programa de Pós-Graduação em Informática UTFPR |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://repositorio.utfpr.edu.br/jspui/handle/1/30199 |
Resumo: | The lack of attendance of employees is called absenteeism and occurs for various reasons, such as vigorous physical activity, advanced age, and high psychological demands at work. Absenteeism affects direct and indirect costs of companies, and may reach 15% of payroll. Therefore, it is fundamental to know its main causes and contribute to control and mitigation strategies. Neural networks have been successfully applied in the classification of several problems, however they are black boxes, since they do not explain which aspects are considered in their decisions. These aspects are important in healthcare applications, in which it is necessary to clearly explain and interpret the results. In this context, this study presents an approach to classify absenteeism with neural networks, Layer-wise Relevance Propagation (LRP) and relevance aggregation to identify the most relevant features and assign relevance scores individually per class and among all classes. The proposed approach was evaluated by considering a widely used dataset as a reference and comparing with existing methods in the literature. The proposed approach presented the highest assertiveness rate among the compared methods, with an average accuracy of 0.83, identifying the most relevant features for absenteeism classification through a relevance score and it was possible to reduce the dataset features by 75% without significant loss in assertiveness rate. Therefore, the results allow the interpretability of the causes of each absenteeism class and the reduction of dimensionality of the feature space, which contribute to the management of human resources, occupational medicine and the development of strategies for its mitigation. |
| id |
UTFPR-12_04b90611fca1d2e54cb0f3a92f2a9067 |
|---|---|
| oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/30199 |
| network_acronym_str |
UTFPR-12 |
| network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository_id_str |
|
| spelling |
Interpretabilidade com agregação de relevância em redes neurais para a predição do absenteísmoInterpretability with relevance aggregation in neural networks for absenteeism predictionAbsenteísmo (Trabalho)Aprendizado do computadorInteligência artificialAbsenteeism (Labor)Machine learningArtificial intelligenceCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOCiência da ComputaçãoThe lack of attendance of employees is called absenteeism and occurs for various reasons, such as vigorous physical activity, advanced age, and high psychological demands at work. Absenteeism affects direct and indirect costs of companies, and may reach 15% of payroll. Therefore, it is fundamental to know its main causes and contribute to control and mitigation strategies. Neural networks have been successfully applied in the classification of several problems, however they are black boxes, since they do not explain which aspects are considered in their decisions. These aspects are important in healthcare applications, in which it is necessary to clearly explain and interpret the results. In this context, this study presents an approach to classify absenteeism with neural networks, Layer-wise Relevance Propagation (LRP) and relevance aggregation to identify the most relevant features and assign relevance scores individually per class and among all classes. The proposed approach was evaluated by considering a widely used dataset as a reference and comparing with existing methods in the literature. The proposed approach presented the highest assertiveness rate among the compared methods, with an average accuracy of 0.83, identifying the most relevant features for absenteeism classification through a relevance score and it was possible to reduce the dataset features by 75% without significant loss in assertiveness rate. Therefore, the results allow the interpretability of the causes of each absenteeism class and the reduction of dimensionality of the feature space, which contribute to the management of human resources, occupational medicine and the development of strategies for its mitigation.A falta de assiduidade dos funcionários é chamada de absenteísmo e ocorre por vários motivos, como atividade física vigorosa, idade avançada e altas demandas psicológicas no trabalho. O absenteísmo afeta os custos diretos e indiretos das empresas, podendo chegar a 15% da folha de pagamento. Portanto, é fundamental conhecer suas principais causas e contribuir para estratégias de controle e mitigação. As redes neurais foram aplicadas com sucesso na classificação de vários problemas, mas são caixas pretas, dado que não explicam quais aspectos são considerados em suas decisões. Estes aspectos são muito importantes em aplicações de saúde, nas quais é necessário explicar e interpretar claramente os resultados. Neste contexto, este trabalho apresenta uma abordagem para classificar o absenteísmo com redes neurais, propagação de relevância em camadas (LRP) e agregação de relevância para identificar as características mais relevantes e atribuir pontuações de relevância individualmente por classe e entre todas as classes. A abordagem proposta foi avaliada considerando um conjunto de dados amplamente utilizado como referência e comparando com métodos existentes na literatura. A abordagem proposta apresentou maior taxa de assertividade entre os métodos comparados, com precisão média de 0,83, identificando as características mais relevantes para a classificação do absenteísmo por meio de uma pontuação de relevância e foi possível reduzir as características do conjunto de dados em 75% sem perda significativa na taxa de assertividade. Portanto, os resultados permitem a interpretabilidade das causas de cada classe de absenteísmo e a redução de dimensionalidade do espaço de características, que contribuem para a gestão de recursos humanos, medicina do trabalho e o desenvolvimento de estratégias para a sua mitigação.Universidade Tecnológica Federal do ParanáCornelio ProcopioBrasilPrograma de Pós-Graduação em InformáticaUTFPRLopes, Fabricio Martinshttps://orcid.org/0000-0002-8786-3313http://lattes.cnpq.br/1660070580824436Lopes, Fabricio Martinshttp://lattes.cnpq.br/1660070580824436Bugatti, Pedro Henriquehttp://lattes.cnpq.br/2177467029991118Saito, Priscila Tiemi Maedahttp://lattes.cnpq.br/6652293216938994Gomes Junior, Julio Marcos2022-11-29T14:47:46Z2022-11-29T14:47:46Z2022-08-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfGOMES JUNIOR, Julio Marcos. Interpretabilidade com agregação de relevância em redes neurais para a predição do absenteísmo. 2022. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022.http://repositorio.utfpr.edu.br/jspui/handle/1/30199porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2022-11-30T06:07:34Zoai:repositorio.utfpr.edu.br:1/30199Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2022-11-30T06:07:34Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
| dc.title.none.fl_str_mv |
Interpretabilidade com agregação de relevância em redes neurais para a predição do absenteísmo Interpretability with relevance aggregation in neural networks for absenteeism prediction |
| title |
Interpretabilidade com agregação de relevância em redes neurais para a predição do absenteísmo |
| spellingShingle |
Interpretabilidade com agregação de relevância em redes neurais para a predição do absenteísmo Gomes Junior, Julio Marcos Absenteísmo (Trabalho) Aprendizado do computador Inteligência artificial Absenteeism (Labor) Machine learning Artificial intelligence CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Ciência da Computação |
| title_short |
Interpretabilidade com agregação de relevância em redes neurais para a predição do absenteísmo |
| title_full |
Interpretabilidade com agregação de relevância em redes neurais para a predição do absenteísmo |
| title_fullStr |
Interpretabilidade com agregação de relevância em redes neurais para a predição do absenteísmo |
| title_full_unstemmed |
Interpretabilidade com agregação de relevância em redes neurais para a predição do absenteísmo |
| title_sort |
Interpretabilidade com agregação de relevância em redes neurais para a predição do absenteísmo |
| author |
Gomes Junior, Julio Marcos |
| author_facet |
Gomes Junior, Julio Marcos |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Lopes, Fabricio Martins https://orcid.org/0000-0002-8786-3313 http://lattes.cnpq.br/1660070580824436 Lopes, Fabricio Martins http://lattes.cnpq.br/1660070580824436 Bugatti, Pedro Henrique http://lattes.cnpq.br/2177467029991118 Saito, Priscila Tiemi Maeda http://lattes.cnpq.br/6652293216938994 |
| dc.contributor.author.fl_str_mv |
Gomes Junior, Julio Marcos |
| dc.subject.por.fl_str_mv |
Absenteísmo (Trabalho) Aprendizado do computador Inteligência artificial Absenteeism (Labor) Machine learning Artificial intelligence CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Ciência da Computação |
| topic |
Absenteísmo (Trabalho) Aprendizado do computador Inteligência artificial Absenteeism (Labor) Machine learning Artificial intelligence CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Ciência da Computação |
| description |
The lack of attendance of employees is called absenteeism and occurs for various reasons, such as vigorous physical activity, advanced age, and high psychological demands at work. Absenteeism affects direct and indirect costs of companies, and may reach 15% of payroll. Therefore, it is fundamental to know its main causes and contribute to control and mitigation strategies. Neural networks have been successfully applied in the classification of several problems, however they are black boxes, since they do not explain which aspects are considered in their decisions. These aspects are important in healthcare applications, in which it is necessary to clearly explain and interpret the results. In this context, this study presents an approach to classify absenteeism with neural networks, Layer-wise Relevance Propagation (LRP) and relevance aggregation to identify the most relevant features and assign relevance scores individually per class and among all classes. The proposed approach was evaluated by considering a widely used dataset as a reference and comparing with existing methods in the literature. The proposed approach presented the highest assertiveness rate among the compared methods, with an average accuracy of 0.83, identifying the most relevant features for absenteeism classification through a relevance score and it was possible to reduce the dataset features by 75% without significant loss in assertiveness rate. Therefore, the results allow the interpretability of the causes of each absenteeism class and the reduction of dimensionality of the feature space, which contribute to the management of human resources, occupational medicine and the development of strategies for its mitigation. |
| publishDate |
2022 |
| dc.date.none.fl_str_mv |
2022-11-29T14:47:46Z 2022-11-29T14:47:46Z 2022-08-15 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
GOMES JUNIOR, Julio Marcos. Interpretabilidade com agregação de relevância em redes neurais para a predição do absenteísmo. 2022. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022. http://repositorio.utfpr.edu.br/jspui/handle/1/30199 |
| identifier_str_mv |
GOMES JUNIOR, Julio Marcos. Interpretabilidade com agregação de relevância em redes neurais para a predição do absenteísmo. 2022. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022. |
| url |
http://repositorio.utfpr.edu.br/jspui/handle/1/30199 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio Brasil Programa de Pós-Graduação em Informática UTFPR |
| publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio Brasil Programa de Pós-Graduação em Informática UTFPR |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
| instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
| instacron_str |
UTFPR |
| institution |
UTFPR |
| reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
| repository.mail.fl_str_mv |
riut@utfpr.edu.br || sibi@utfpr.edu.br |
| _version_ |
1850498289714069504 |