Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/29531
Full metadata record
DC FieldValueLanguage
dc.creatorGiacomelli, Daniela Freitas-
dc.date.accessioned2020-07-21T11:52:40Z-
dc.date.available2020-07-21T11:52:40Z-
dc.date.issued2020-06-22-
dc.identifier.citationGIACOMELLI, Daniela Freitas. Técnicas de agrupamento aplicadas aos dados de acidente de trabalho. 2020. 99 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2020. DOI http://doi.org/10.14393/ufu.di.2020.487.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/29531-
dc.description.abstractBrazil occupies the fourth place in the worldwide ranking of catalogued labor accidents. Among other misfortunes, such occurrences generate inconveniences to the injured ones, losses in work productivity and pressure the public budget referring to aids and indemnities due to accidents. This dissertation aims to search and characterize groups of labor accidents, granting interpretability to the obtained results, in order to extract information that can be relevant to public managers. Therefore, the methodological procedures go by the implementation of a set of steps, namely: data pre-processing; creation of subsets from the original dataset; selection of the best attributes to the clustering task; application of two hierarchical clustering, HDBSCAN* and COBWEB; evaluation of the results through the use of the Simplified Silhouette validation measure and the use of the PowerBI tool, to visualize graphics which may able the evaluation and the composition of the clusters found. Therefore, it was necessary to propose a measure to calculate the distance between two instances, composed as by numerical attributes as by categorical ones. This measure enabled, in the dataset of the present study, the execution of relational algorithms, such as HDBSCAN*, besides the calculus of validation measures which measures the distance between instances, such as the Simplified Silhouette. The results show that the distance measure here proposed made the search of clusters by the algorithm hard. Thus, to certain cases, no clusters were found, and, to the other ones, the algorithm clustered only identical instances. Not presenting such inconvenient, the Cobweb algorithm didn’t demand adaptations to work with the kind of data present in the basis, being able to aggregate not only identical instances, but also similar instances. The research demonstrated the susceptibility of male workers, with the age between 18 and 34 years old, the labor accidents which cause injures on the fingers, by handling machines and equipment and/or manual tools, moreover the ones who perform activities such as Fishing and Fish Farming. The occurrences of this nature gained prominence, such as in bigger clusters of each year as in Triângulo Mineiro/Alto Paranaíba and Metropolitan São Paulo, both analyzed mesoregions. Nevertheless, the clusters composed mostly by female victims have a slightly different delineation, especially those who work in the production of cellulose, paper and correlated products. Even though the fingers continue as the most affected body part, the female workers of this segment are likely to accidents occasioned by the management of chemical agents, biological ones and/or manual tools.pt_BR
dc.description.sponsorshipFAPEMIG - Fundação de Amparo a Pesquisa do Estado de Minas Geraispt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectAcidentes de trabalhopt_BR
dc.subjectAgrupamento de dadospt_BR
dc.subjectDescoberta de conhecimento em bases de dadospt_BR
dc.subjectComunicações de acidentes de trabalhopt_BR
dc.subjectLabor accidentspt_BR
dc.subjectClustering of datapt_BR
dc.subjectKnowledge Discovery in Databasept_BR
dc.subjectCommunication of labor accidentspt_BR
dc.titleTécnicas de agrupamento de dados aplicadas aos dados de acidente de trabalhopt_BR
dc.title.alternativeData clustering techniques applied to work accident datapt_BR
dc.typeDissertaçãopt_BR
dc.contributor.advisor-co1Naldi, Murilo Coelho-
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/0573662728816861pt_BR
dc.contributor.advisor1Paiva, Elaine Ribeiro de Faria-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/8238524390290386pt_BR
dc.contributor.referee1Cerri, Ricardo-
dc.contributor.referee2Razente, Humberto Luiz-
dc.creator.Latteshttp://lattes.cnpq.br/8178352177330449pt_BR
dc.description.degreenameDissertação (Mestrado)pt_BR
dc.description.resumoO Brasil ocupa a 4ª posição no ranking mundial de acidentes de trabalho catalogados. Dentre outros infortúnios, tais ocorrências geram transtornos aos acidentados, perdas na produtividade laboral e pressionam o orçamento público referente aos auxílios e indenizações acidentárias. Esta dissertação objetiva buscar e caracterizar grupos de acidentes de trabalho, conferindo interpretabilidade aos resultados obtidos, a fim de extrair informações que possam ser relevantes aos gestores públicos. Para tanto, os procedimentos metodológicos perpassam pela efetivação de um conjunto de etapas, a saber: pré-processamento dos dados; criação de subconjuntos da base original; seleção dos melhores atributos para realizar a tarefa de agrupamento; aplicação de dois algoritmos de agrupamento hierárquicos, HDBSCAN* e COBWEB; avaliação dos resultados por meio do uso da medida de validação Silhueta Simplificada e emprego da ferramenta PowerBI, para visualizar gráficos que possibilitem avaliar a composição dos grupos encontrados. Tendo isso em vista, fez-se necessária a proposição de uma medida para calcular distância entre duas instâncias, compostas tanto por atributos numéricos como por categóricos. Essa medida possibilitou, na base de dados do presente estudo, a execução de algoritmos relacionais, como o HDBSCAN*, além do cálculo de medidas de validação que mensura a distância entre instâncias, como a Silhueta Simplificada. Os resultados indicam que a medida de distância aqui proposta dificultou a busca de grupos pelo algoritmo. Dessa forma, para certos casos, nenhum grupo foi encontrado, e, para outros, o algoritmo agrupou somente instâncias idênticas. Não apresentando tais inconvenientes, o algoritmo Cobweb não demandou adaptações para trabalhar com os tipos de dados presentes na base, sendo capaz de agregar não apenas as instâncias idênticas, como também as instâncias similares. A pesquisa evidenciou a susceptibilidade dos trabalhadores do sexo masculino, com idade entre 18 e 34 anos, aos acidentes de trabalho que ocasionam lesões nos dedos das mãos, pelo manuseio de máquinas e equipamentos e/ou ferramentas manuais, sobretudo os que exercem as atividades de Pesca e Aquicultura. As ocorrências dessa natureza ganharam destaque, tanto nos maiores grupos de cada ano como no Triângulo Mineiro/Alto Paranaíba e Metropolitana de São Paulo, as duas mesorregiões analisadas. Não obstante, os grupos compostos majoritariamente por vítimas do sexo feminino possuem um delineamento um pouco diferente, com destaque àquelas que atuam na fabricação de celulose, papel e produtos correlatos. Ainda que os dedos das mãos continuem como a parte do corpo mais afetada, as trabalhadoras deste segmento estão suscetíveis a incidentes ocasionados pelo manejo de agentes químicos, biológicos e/ou ferramentas manuais.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-graduação em Ciência da Computaçãopt_BR
dc.sizeorduration99pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.identifier.doihttp://doi.org/10.14393/ufu.di.2020.487pt_BR
dc.orcid.putcode77674809-
dc.crossref.doibatchide78d83ad-5dd3-47ec-be82-bd6a78dd2d78-
Appears in Collections:DISSERTAÇÃO - Ciência da Computação

Files in This Item:
File Description SizeFormat 
TecnicasAgrupamentoAplicadas.pdf1.97 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.