Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufu.br/handle/123456789/44430
Tipo de documento: Dissertação
Tipo de acceso: Acesso Embargado
Fecha de embargo: 2026-12-05
Título: Infraestrutura de kernel para coleta de dados de eventos de falha no Linux
Título (s) alternativo (s): Kernel Infrastructure for Collecting Failure Event Data on Linux
Autor: Maciel, Vinícius Fonseca
Primer orientador: Matias Junior, Rivalino
Primer miembro de la banca: Frohlich, Antonio Augusto Medeiros
Segundo miembro de la banca: Maziero, Carlos Alberto
Tercer miembro de la banca: Maciel, Paulo Romero Martins
Resumen: Sistemas computacionais exigem alta confiabilidade, pois estão intrinsecamente envolvidos em uma variedade de contextos que impactam diretamente as atividades humanas. Falhas, seja em aplicações de usuário, em serviços ou no kernel do sistema operacional, podem resultar desde pequenos inconvenientes até desastres envolvendo vidas. A confiabilidade é uma métrica fundamental para quantificar, de forma estatística, o nível de confiança que se pode depositar em um software. Com base na importância observada de mecanismos específicos para a coleta e análise de falhas em sistemas como o Windows, por meio do Reliability Analysis Component (RAC), identificou-se a necessidade de se realizar análises similares para o Linux. Por este motivo, uma infraestrutura de kernel, Linux Reliability Analysis Component (LRAC), foi criada para permitir a coleta e armazenamento de dados de falhas ambientadas neste sistema operacional. Este trabalho foca na investigação dos mecanismos de falhas General Protection Fault (GPF) e Page Fault (PF), e como elas podem ser identificadas metodologicamente pelo LRAC. As condições de violação para processadores x86, que originam tais falhas, foram analisadas e aplicadas na criação de uma nova taxonomia, com o objetivo de tornar a classificação dessas falhas mais precisas e menos generalistas. Foi incorporado ao LRAC um novo protocolo de coleta de dados para refletir essas especificidades. Posteriormente, testes controlados foram conduzidos para reproduzir eventos de falhas, com o objetivo de testar e avaliar as novas funcionalidades propostas para o LRAC. Os resultados demonstraram que características distintas de falhas frequentemente são diagnosticadas de maneira genérica pelos mecanismos tradicionais do Linux, e que as novas funcionalidades propostas para o LRAC foram eficazes em distinguir e classificar essas diferenças.
Abstract: Computing systems demand high reliability as they are intrinsically involved in various contexts that directly impact human activities. Failures, whether in user applications, services, or the operating system kernel, can range from minor inconveniences to disasters involving lives. Reliability is a fundamental metric to statistically quantify the level of trust one can place in software. Based on the observed importance of specific mechanisms for failure collection and analysis in systems like Windows, through the Reliability Analysis Component (RAC), the need for similar analyses for Linux was identified. For this reason, a kernel infrastructure, the Linux Reliability Analysis Component (LRAC), was created to enable the collection and storage of failure data within this operating system. This work focuses on investigating the mechanisms of General Protection Fault (GPF) and Page Fault (PF) failures and how they can be methodologically identified by LRAC. Violation conditions for x86 processors, which trigger these failures, were analyzed and applied to develop a new taxonomy aimed at making the classification of these failures more precise and less generic. A new data collection protocol was incorporated into LRAC to reflect these specificities. Subsequently, controlled tests were conducted to reproduce failure events to test and evaluate the new functionalities proposed for LRAC. The results demonstrated that distinct failure characteristics are often diagnosed generically by traditional Linux mechanisms and that the new functionalities proposed for LRAC were effective in distinguishing and classifying these differences.
Palabras clave: Confiabilidade de Software
Software Reliability
Registro de Falhas
Failure Logging
Kernel Linux
Linux Kernel
Área (s) del CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::ARQUITETURA DE SISTEMAS DE COMPUTACAO
Tema: Computação
Idioma: por
País: Brasil
Editora: Universidade Federal de Uberlândia
Programa: Programa de Pós-graduação em Ciência da Computação
Cita: MACIEL, Vinícius Fonseca. Infraestrutura de kernel para coleta de dados de eventos de falha no Linux. 2024. 123 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2024. DOI https://doi.org/10.14393/ufu.di.2024.774.
Identificador del documento: https://doi.org/10.14393/ufu.di.2024.774
URI: https://repositorio.ufu.br/handle/123456789/44430
Fecha de defensa: 5-dic-2024
Objetivos de Desarrollo Sostenible (ODS): ODS::ODS 9. Indústria, Inovação e infraestrutura - Construir infraestrutura resiliente, promover a industrialização inclusiva e sustentável, e fomentar a inovação.
Aparece en las colecciones:DISSERTAÇÃO - Ciência da Computação

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
InfraestruturaKernelColeta.pdf
  Hasta 2026-12-05
Dissertação6.22 MBAdobe PDFVisualizar/Abrir    Request a copy


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.