Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.ufu.br/handle/123456789/29531
ORCID: | http://orcid.org/0000-0003-3368-6486 |
Tipo de documento: | Dissertação |
Tipo de acceso: | Acesso Aberto |
Título: | Técnicas de agrupamento de dados aplicadas aos dados de acidente de trabalho |
Título (s) alternativo (s): | Data clustering techniques applied to work accident data |
Autor: | Giacomelli, Daniela Freitas |
Primer orientador: | Paiva, Elaine Ribeiro de Faria |
Primer coorientador: | Naldi, Murilo Coelho |
Primer miembro de la banca: | Cerri, Ricardo |
Segundo miembro de la banca: | Razente, Humberto Luiz |
Resumen: | O Brasil ocupa a 4ª posição no ranking mundial de acidentes de trabalho catalogados. Dentre outros infortúnios, tais ocorrências geram transtornos aos acidentados, perdas na produtividade laboral e pressionam o orçamento público referente aos auxílios e indenizações acidentárias. Esta dissertação objetiva buscar e caracterizar grupos de acidentes de trabalho, conferindo interpretabilidade aos resultados obtidos, a fim de extrair informações que possam ser relevantes aos gestores públicos. Para tanto, os procedimentos metodológicos perpassam pela efetivação de um conjunto de etapas, a saber: pré-processamento dos dados; criação de subconjuntos da base original; seleção dos melhores atributos para realizar a tarefa de agrupamento; aplicação de dois algoritmos de agrupamento hierárquicos, HDBSCAN* e COBWEB; avaliação dos resultados por meio do uso da medida de validação Silhueta Simplificada e emprego da ferramenta PowerBI, para visualizar gráficos que possibilitem avaliar a composição dos grupos encontrados. Tendo isso em vista, fez-se necessária a proposição de uma medida para calcular distância entre duas instâncias, compostas tanto por atributos numéricos como por categóricos. Essa medida possibilitou, na base de dados do presente estudo, a execução de algoritmos relacionais, como o HDBSCAN*, além do cálculo de medidas de validação que mensura a distância entre instâncias, como a Silhueta Simplificada. Os resultados indicam que a medida de distância aqui proposta dificultou a busca de grupos pelo algoritmo. Dessa forma, para certos casos, nenhum grupo foi encontrado, e, para outros, o algoritmo agrupou somente instâncias idênticas. Não apresentando tais inconvenientes, o algoritmo Cobweb não demandou adaptações para trabalhar com os tipos de dados presentes na base, sendo capaz de agregar não apenas as instâncias idênticas, como também as instâncias similares. A pesquisa evidenciou a susceptibilidade dos trabalhadores do sexo masculino, com idade entre 18 e 34 anos, aos acidentes de trabalho que ocasionam lesões nos dedos das mãos, pelo manuseio de máquinas e equipamentos e/ou ferramentas manuais, sobretudo os que exercem as atividades de Pesca e Aquicultura. As ocorrências dessa natureza ganharam destaque, tanto nos maiores grupos de cada ano como no Triângulo Mineiro/Alto Paranaíba e Metropolitana de São Paulo, as duas mesorregiões analisadas. Não obstante, os grupos compostos majoritariamente por vítimas do sexo feminino possuem um delineamento um pouco diferente, com destaque àquelas que atuam na fabricação de celulose, papel e produtos correlatos. Ainda que os dedos das mãos continuem como a parte do corpo mais afetada, as trabalhadoras deste segmento estão suscetíveis a incidentes ocasionados pelo manejo de agentes químicos, biológicos e/ou ferramentas manuais. |
Abstract: | Brazil occupies the fourth place in the worldwide ranking of catalogued labor accidents. Among other misfortunes, such occurrences generate inconveniences to the injured ones, losses in work productivity and pressure the public budget referring to aids and indemnities due to accidents. This dissertation aims to search and characterize groups of labor accidents, granting interpretability to the obtained results, in order to extract information that can be relevant to public managers. Therefore, the methodological procedures go by the implementation of a set of steps, namely: data pre-processing; creation of subsets from the original dataset; selection of the best attributes to the clustering task; application of two hierarchical clustering, HDBSCAN* and COBWEB; evaluation of the results through the use of the Simplified Silhouette validation measure and the use of the PowerBI tool, to visualize graphics which may able the evaluation and the composition of the clusters found. Therefore, it was necessary to propose a measure to calculate the distance between two instances, composed as by numerical attributes as by categorical ones. This measure enabled, in the dataset of the present study, the execution of relational algorithms, such as HDBSCAN*, besides the calculus of validation measures which measures the distance between instances, such as the Simplified Silhouette. The results show that the distance measure here proposed made the search of clusters by the algorithm hard. Thus, to certain cases, no clusters were found, and, to the other ones, the algorithm clustered only identical instances. Not presenting such inconvenient, the Cobweb algorithm didn’t demand adaptations to work with the kind of data present in the basis, being able to aggregate not only identical instances, but also similar instances. The research demonstrated the susceptibility of male workers, with the age between 18 and 34 years old, the labor accidents which cause injures on the fingers, by handling machines and equipment and/or manual tools, moreover the ones who perform activities such as Fishing and Fish Farming. The occurrences of this nature gained prominence, such as in bigger clusters of each year as in Triângulo Mineiro/Alto Paranaíba and Metropolitan São Paulo, both analyzed mesoregions. Nevertheless, the clusters composed mostly by female victims have a slightly different delineation, especially those who work in the production of cellulose, paper and correlated products. Even though the fingers continue as the most affected body part, the female workers of this segment are likely to accidents occasioned by the management of chemical agents, biological ones and/or manual tools. |
Palabras clave: | Acidentes de trabalho Agrupamento de dados Descoberta de conhecimento em bases de dados Comunicações de acidentes de trabalho Labor accidents Clustering of data Knowledge Discovery in Database Communication of labor accidents |
Área (s) del CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Idioma: | por |
País: | Brasil |
Editora: | Universidade Federal de Uberlândia |
Programa: | Programa de Pós-graduação em Ciência da Computação |
Cita: | GIACOMELLI, Daniela Freitas. Técnicas de agrupamento aplicadas aos dados de acidente de trabalho. 2020. 99 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2020. DOI http://doi.org/10.14393/ufu.di.2020.487. |
Identificador del documento: | http://doi.org/10.14393/ufu.di.2020.487 |
URI: | https://repositorio.ufu.br/handle/123456789/29531 |
Fecha de defensa: | 22-jun-2020 |
Aparece en las colecciones: | DISSERTAÇÃO - Ciência da Computação |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
TecnicasAgrupamentoAplicadas.pdf | 1.97 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.