Please use this identifier to cite or link to this item:
https://repositorio.ufu.br/handle/123456789/44430
Document type: | Dissertação |
Access type: | Acesso Embargado |
Embargo Date: | 2026-12-05 |
Title: | Infraestrutura de kernel para coleta de dados de eventos de falha no Linux |
Alternate title (s): | Kernel Infrastructure for Collecting Failure Event Data on Linux |
Author: | Maciel, Vinícius Fonseca |
First Advisor: | Matias Junior, Rivalino |
First member of the Committee: | Frohlich, Antonio Augusto Medeiros |
Second member of the Committee: | Maziero, Carlos Alberto |
Third member of the Committee: | Maciel, Paulo Romero Martins |
Summary: | Sistemas computacionais exigem alta confiabilidade, pois estão intrinsecamente envolvidos em uma variedade de contextos que impactam diretamente as atividades humanas. Falhas, seja em aplicações de usuário, em serviços ou no kernel do sistema operacional, podem resultar desde pequenos inconvenientes até desastres envolvendo vidas. A confiabilidade é uma métrica fundamental para quantificar, de forma estatística, o nível de confiança que se pode depositar em um software. Com base na importância observada de mecanismos específicos para a coleta e análise de falhas em sistemas como o Windows, por meio do Reliability Analysis Component (RAC), identificou-se a necessidade de se realizar análises similares para o Linux. Por este motivo, uma infraestrutura de kernel, Linux Reliability Analysis Component (LRAC), foi criada para permitir a coleta e armazenamento de dados de falhas ambientadas neste sistema operacional. Este trabalho foca na investigação dos mecanismos de falhas General Protection Fault (GPF) e Page Fault (PF), e como elas podem ser identificadas metodologicamente pelo LRAC. As condições de violação para processadores x86, que originam tais falhas, foram analisadas e aplicadas na criação de uma nova taxonomia, com o objetivo de tornar a classificação dessas falhas mais precisas e menos generalistas. Foi incorporado ao LRAC um novo protocolo de coleta de dados para refletir essas especificidades. Posteriormente, testes controlados foram conduzidos para reproduzir eventos de falhas, com o objetivo de testar e avaliar as novas funcionalidades propostas para o LRAC. Os resultados demonstraram que características distintas de falhas frequentemente são diagnosticadas de maneira genérica pelos mecanismos tradicionais do Linux, e que as novas funcionalidades propostas para o LRAC foram eficazes em distinguir e classificar essas diferenças. |
Abstract: | Computing systems demand high reliability as they are intrinsically involved in various contexts that directly impact human activities. Failures, whether in user applications, services, or the operating system kernel, can range from minor inconveniences to disasters involving lives. Reliability is a fundamental metric to statistically quantify the level of trust one can place in software. Based on the observed importance of specific mechanisms for failure collection and analysis in systems like Windows, through the Reliability Analysis Component (RAC), the need for similar analyses for Linux was identified. For this reason, a kernel infrastructure, the Linux Reliability Analysis Component (LRAC), was created to enable the collection and storage of failure data within this operating system. This work focuses on investigating the mechanisms of General Protection Fault (GPF) and Page Fault (PF) failures and how they can be methodologically identified by LRAC. Violation conditions for x86 processors, which trigger these failures, were analyzed and applied to develop a new taxonomy aimed at making the classification of these failures more precise and less generic. A new data collection protocol was incorporated into LRAC to reflect these specificities. Subsequently, controlled tests were conducted to reproduce failure events to test and evaluate the new functionalities proposed for LRAC. The results demonstrated that distinct failure characteristics are often diagnosed generically by traditional Linux mechanisms and that the new functionalities proposed for LRAC were effective in distinguishing and classifying these differences. |
Keywords: | Confiabilidade de Software Software Reliability Registro de Falhas Failure Logging Kernel Linux Linux Kernel |
Area (s) of CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::ARQUITETURA DE SISTEMAS DE COMPUTACAO |
Subject: | Computação |
Language: | por |
Country: | Brasil |
Publisher: | Universidade Federal de Uberlândia |
Program: | Programa de Pós-graduação em Ciência da Computação |
Quote: | MACIEL, Vinícius Fonseca. Infraestrutura de kernel para coleta de dados de eventos de falha no Linux. 2024. 123 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2024. DOI https://doi.org/10.14393/ufu.di.2024.774. |
Document identifier: | https://doi.org/10.14393/ufu.di.2024.774 |
URI: | https://repositorio.ufu.br/handle/123456789/44430 |
Date of defense: | 5-Dec-2024 |
Sustainable Development Goals SDGs: | ODS::ODS 9. Indústria, Inovação e infraestrutura - Construir infraestrutura resiliente, promover a industrialização inclusiva e sustentável, e fomentar a inovação. |
Appears in Collections: | DISSERTAÇÃO - Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
InfraestruturaKernelColeta.pdf Until 2026-12-05 | Dissertação | 6.22 MB | Adobe PDF | View/Open Request a copy |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.