Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/29531
ORCID:  http://orcid.org/0000-0003-3368-6486
Document type: Dissertação
Access type: Acesso Aberto
Title: Técnicas de agrupamento de dados aplicadas aos dados de acidente de trabalho
Alternate title (s): Data clustering techniques applied to work accident data
Author: Giacomelli, Daniela Freitas
First Advisor: Paiva, Elaine Ribeiro de Faria
First coorientator: Naldi, Murilo Coelho
First member of the Committee: Cerri, Ricardo
Second member of the Committee: Razente, Humberto Luiz
Summary: O Brasil ocupa a 4ª posição no ranking mundial de acidentes de trabalho catalogados. Dentre outros infortúnios, tais ocorrências geram transtornos aos acidentados, perdas na produtividade laboral e pressionam o orçamento público referente aos auxílios e indenizações acidentárias. Esta dissertação objetiva buscar e caracterizar grupos de acidentes de trabalho, conferindo interpretabilidade aos resultados obtidos, a fim de extrair informações que possam ser relevantes aos gestores públicos. Para tanto, os procedimentos metodológicos perpassam pela efetivação de um conjunto de etapas, a saber: pré-processamento dos dados; criação de subconjuntos da base original; seleção dos melhores atributos para realizar a tarefa de agrupamento; aplicação de dois algoritmos de agrupamento hierárquicos, HDBSCAN* e COBWEB; avaliação dos resultados por meio do uso da medida de validação Silhueta Simplificada e emprego da ferramenta PowerBI, para visualizar gráficos que possibilitem avaliar a composição dos grupos encontrados. Tendo isso em vista, fez-se necessária a proposição de uma medida para calcular distância entre duas instâncias, compostas tanto por atributos numéricos como por categóricos. Essa medida possibilitou, na base de dados do presente estudo, a execução de algoritmos relacionais, como o HDBSCAN*, além do cálculo de medidas de validação que mensura a distância entre instâncias, como a Silhueta Simplificada. Os resultados indicam que a medida de distância aqui proposta dificultou a busca de grupos pelo algoritmo. Dessa forma, para certos casos, nenhum grupo foi encontrado, e, para outros, o algoritmo agrupou somente instâncias idênticas. Não apresentando tais inconvenientes, o algoritmo Cobweb não demandou adaptações para trabalhar com os tipos de dados presentes na base, sendo capaz de agregar não apenas as instâncias idênticas, como também as instâncias similares. A pesquisa evidenciou a susceptibilidade dos trabalhadores do sexo masculino, com idade entre 18 e 34 anos, aos acidentes de trabalho que ocasionam lesões nos dedos das mãos, pelo manuseio de máquinas e equipamentos e/ou ferramentas manuais, sobretudo os que exercem as atividades de Pesca e Aquicultura. As ocorrências dessa natureza ganharam destaque, tanto nos maiores grupos de cada ano como no Triângulo Mineiro/Alto Paranaíba e Metropolitana de São Paulo, as duas mesorregiões analisadas. Não obstante, os grupos compostos majoritariamente por vítimas do sexo feminino possuem um delineamento um pouco diferente, com destaque àquelas que atuam na fabricação de celulose, papel e produtos correlatos. Ainda que os dedos das mãos continuem como a parte do corpo mais afetada, as trabalhadoras deste segmento estão suscetíveis a incidentes ocasionados pelo manejo de agentes químicos, biológicos e/ou ferramentas manuais.
Abstract: Brazil occupies the fourth place in the worldwide ranking of catalogued labor accidents. Among other misfortunes, such occurrences generate inconveniences to the injured ones, losses in work productivity and pressure the public budget referring to aids and indemnities due to accidents. This dissertation aims to search and characterize groups of labor accidents, granting interpretability to the obtained results, in order to extract information that can be relevant to public managers. Therefore, the methodological procedures go by the implementation of a set of steps, namely: data pre-processing; creation of subsets from the original dataset; selection of the best attributes to the clustering task; application of two hierarchical clustering, HDBSCAN* and COBWEB; evaluation of the results through the use of the Simplified Silhouette validation measure and the use of the PowerBI tool, to visualize graphics which may able the evaluation and the composition of the clusters found. Therefore, it was necessary to propose a measure to calculate the distance between two instances, composed as by numerical attributes as by categorical ones. This measure enabled, in the dataset of the present study, the execution of relational algorithms, such as HDBSCAN*, besides the calculus of validation measures which measures the distance between instances, such as the Simplified Silhouette. The results show that the distance measure here proposed made the search of clusters by the algorithm hard. Thus, to certain cases, no clusters were found, and, to the other ones, the algorithm clustered only identical instances. Not presenting such inconvenient, the Cobweb algorithm didn’t demand adaptations to work with the kind of data present in the basis, being able to aggregate not only identical instances, but also similar instances. The research demonstrated the susceptibility of male workers, with the age between 18 and 34 years old, the labor accidents which cause injures on the fingers, by handling machines and equipment and/or manual tools, moreover the ones who perform activities such as Fishing and Fish Farming. The occurrences of this nature gained prominence, such as in bigger clusters of each year as in Triângulo Mineiro/Alto Paranaíba and Metropolitan São Paulo, both analyzed mesoregions. Nevertheless, the clusters composed mostly by female victims have a slightly different delineation, especially those who work in the production of cellulose, paper and correlated products. Even though the fingers continue as the most affected body part, the female workers of this segment are likely to accidents occasioned by the management of chemical agents, biological ones and/or manual tools.
Keywords: Acidentes de trabalho
Agrupamento de dados
Descoberta de conhecimento em bases de dados
Comunicações de acidentes de trabalho
Labor accidents
Clustering of data
Knowledge Discovery in Database
Communication of labor accidents
Area (s) of CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Program: Programa de Pós-graduação em Ciência da Computação
Quote: GIACOMELLI, Daniela Freitas. Técnicas de agrupamento aplicadas aos dados de acidente de trabalho. 2020. 99 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2020. Disponível em: http://doi.org/10.14393/ufu.di.2020.487.
Document identifier: http://doi.org/10.14393/ufu.di.2020.487
URI: https://repositorio.ufu.br/handle/123456789/29531
Date of defense: 22-Jun-2020
Appears in Collections:DISSERTAÇÃO - Ciência da Computação

Files in This Item:
File Description SizeFormat 
TecnicasAgrupamentoAplicadas.pdf1.97 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.