Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/44430
Document type: Dissertação
Access type: Acesso Embargado
Embargo Date: 2026-12-05
Title: Infraestrutura de kernel para coleta de dados de eventos de falha no Linux
Alternate title (s): Kernel Infrastructure for Collecting Failure Event Data on Linux
Author: Maciel, Vinícius Fonseca
First Advisor: Matias Junior, Rivalino
First member of the Committee: Frohlich, Antonio Augusto Medeiros
Second member of the Committee: Maziero, Carlos Alberto
Third member of the Committee: Maciel, Paulo Romero Martins
Summary: Sistemas computacionais exigem alta confiabilidade, pois estão intrinsecamente envolvidos em uma variedade de contextos que impactam diretamente as atividades humanas. Falhas, seja em aplicações de usuário, em serviços ou no kernel do sistema operacional, podem resultar desde pequenos inconvenientes até desastres envolvendo vidas. A confiabilidade é uma métrica fundamental para quantificar, de forma estatística, o nível de confiança que se pode depositar em um software. Com base na importância observada de mecanismos específicos para a coleta e análise de falhas em sistemas como o Windows, por meio do Reliability Analysis Component (RAC), identificou-se a necessidade de se realizar análises similares para o Linux. Por este motivo, uma infraestrutura de kernel, Linux Reliability Analysis Component (LRAC), foi criada para permitir a coleta e armazenamento de dados de falhas ambientadas neste sistema operacional. Este trabalho foca na investigação dos mecanismos de falhas General Protection Fault (GPF) e Page Fault (PF), e como elas podem ser identificadas metodologicamente pelo LRAC. As condições de violação para processadores x86, que originam tais falhas, foram analisadas e aplicadas na criação de uma nova taxonomia, com o objetivo de tornar a classificação dessas falhas mais precisas e menos generalistas. Foi incorporado ao LRAC um novo protocolo de coleta de dados para refletir essas especificidades. Posteriormente, testes controlados foram conduzidos para reproduzir eventos de falhas, com o objetivo de testar e avaliar as novas funcionalidades propostas para o LRAC. Os resultados demonstraram que características distintas de falhas frequentemente são diagnosticadas de maneira genérica pelos mecanismos tradicionais do Linux, e que as novas funcionalidades propostas para o LRAC foram eficazes em distinguir e classificar essas diferenças.
Abstract: Computing systems demand high reliability as they are intrinsically involved in various contexts that directly impact human activities. Failures, whether in user applications, services, or the operating system kernel, can range from minor inconveniences to disasters involving lives. Reliability is a fundamental metric to statistically quantify the level of trust one can place in software. Based on the observed importance of specific mechanisms for failure collection and analysis in systems like Windows, through the Reliability Analysis Component (RAC), the need for similar analyses for Linux was identified. For this reason, a kernel infrastructure, the Linux Reliability Analysis Component (LRAC), was created to enable the collection and storage of failure data within this operating system. This work focuses on investigating the mechanisms of General Protection Fault (GPF) and Page Fault (PF) failures and how they can be methodologically identified by LRAC. Violation conditions for x86 processors, which trigger these failures, were analyzed and applied to develop a new taxonomy aimed at making the classification of these failures more precise and less generic. A new data collection protocol was incorporated into LRAC to reflect these specificities. Subsequently, controlled tests were conducted to reproduce failure events to test and evaluate the new functionalities proposed for LRAC. The results demonstrated that distinct failure characteristics are often diagnosed generically by traditional Linux mechanisms and that the new functionalities proposed for LRAC were effective in distinguishing and classifying these differences.
Keywords: Confiabilidade de Software
Software Reliability
Registro de Falhas
Failure Logging
Kernel Linux
Linux Kernel
Area (s) of CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::ARQUITETURA DE SISTEMAS DE COMPUTACAO
Subject: Computação
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Program: Programa de Pós-graduação em Ciência da Computação
Quote: MACIEL, Vinícius Fonseca. Infraestrutura de kernel para coleta de dados de eventos de falha no Linux. 2024. 123 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2024. DOI https://doi.org/10.14393/ufu.di.2024.774.
Document identifier: https://doi.org/10.14393/ufu.di.2024.774
URI: https://repositorio.ufu.br/handle/123456789/44430
Date of defense: 5-Dec-2024
Sustainable Development Goals SDGs: ODS::ODS 9. Indústria, Inovação e infraestrutura - Construir infraestrutura resiliente, promover a industrialização inclusiva e sustentável, e fomentar a inovação.
Appears in Collections:DISSERTAÇÃO - Ciência da Computação

Files in This Item:
File Description SizeFormat 
InfraestruturaKernelColeta.pdf
  Until 2026-12-05
Dissertação6.22 MBAdobe PDFView/Open    Request a copy


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.