GROSC: uma proposta de segmentação de caracteres impressos
orientada a regiões em níveis de cinza

Tavares, Josimeire do Amaral

Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufu.br/handle/123456789/14478

Tipo de documento:	Dissertação
Tipo de acceso:	Acesso Aberto
Título:	GROSC: uma proposta de segmentação de caracteres impressos orientada a regiões em níveis de cinza
Autor:	Tavares, Josimeire do Amaral
Primer orientador:	Yamanaka, Keiji
Primer miembro de la banca:	Nomura, Shigueo
Segundo miembro de la banca:	Neves, Luiz Antônio Pereira
Tercer miembro de la banca:	Faria, Eustáquio São José de
Resumen:	Os sistemas de Optical Character Recognition (OCR, ou Reconhecimento ótico de caracteres em português) designam genericamente tecnologias para reconhecer caracteres a partir de um arquivo de imagem que contenha textos. Permite, por exemplo, que uma folha de texto impresso, ao ser digitalizada, possa ser convertida em um arquivo de texto editável. Esses sistemas foram muito difundidos ao longo dos ´últimos anos, com viárias versões comerciais, incluindo os incorporados em aparelhos scanner. Uma das etapas que definem o sucesso ou fracasso deste tipo de sistema é a correta segmentação das linhas de texto e dos caracteres que o constituem. Atualmente ganhou importância a correta segmentação das palavras contidas no texto, para auxiliar possíveis etapas de pós-processamento para a correção de desvios de reconhecimento. Neste trabalho são apresentados dois métodos diferenciados para segmentação de textos. O primeiro método, denominado Segmentação de Linhas e Palavras baseado no Operador de Energia de Teager (SLP-TEO) é utilizado na segmentação de linhas de texto e segmentação de palavras. O TEO ´e aplicado ao sinal abstraído da projeção linear (horizontal ou vertical) gerada através da imagem binária do texto. Um dos diferenciais do método é que o mesmo pode ser aplicado a textos impressos ou manuscritos, sem nenhum ajuste prévio. Além disso, o mesmo algoritmo é utilizado tanto na segmentação de linhas quanto na segmentação de palavras, impressas ou manuscritas. A base de dados adotada neste projeto (IAM-Database), consagrada em diversas pesquisas de OCR, possui,para todo texto impresso, transcrições manuscritas que também foram alvo do método SLP-TEO. O segundo método, denominado gray-Region Oriented Segmentation of Characters-(gROSC) , em português Segmentação de Caracteres Orientado à Regiões em níveis de cinza , é aplicado às imagens das palavras em tons de cinza com a finalidade de segmentação de caracteres. Este método baseia-se nos métodos de segmentação de regiões em que os pixels conectados são visitados e rotulados. Um dos diferenciais do método é que o mesmo deve ser aplicado às imagens em níveis de cinza das palavras segmentadas. Além disso, utilizando o limiar de Otsu e conhecendo-se os níveis de cinza da imagem, o método determina a variação máxima entre tons de cinza que permite ou não visitar o pixel vizinho, agregando-o à região de interesse a ser segmentada. Na base de dados adotada existem três tipos básicos de caracteres problemáticos: caracteres sobrepostos, caracteres conectados e desenho de fontes. O método gROSC é aplicado às imagens de todas as palavras segmentadas anteriormente e os caracteres são segmentados igualmente sem prévia identificação dos possíveis problemas. Os experimentos e resultados encontrados em todas as etapas de segmentação dos textos com ambos os métodos são bastante relevantes e demonstram a eficiência e simplicidade dos métodos propostos.
Abstract:	Optical Character Recognition systems (OCR) refer generically to technologies applied to recognize characters from an image file that contains text. It allows, for example, that a scanned sheet of printed text could be converted into an editable text file. These systems have been widespread over the past years, with several commercial versions, including the ones embedded within scanner devices. One of the steps that define the success or failure of this type of system is the correct segmentation of text lines and characters that constitute it. Recently, it has gained importance the correct segmentation of words in the textto assist possible post-processing steps to correct deviations of recognition. This paper presents two different methods for segmentation of texts. The first method, called Segmentation of Lines and Words based Teager energy operator (SLP-TEO), based on the Teager energy operator (TEO), is used in the segmentation of text lines and words. The TEO is applied to the signal abstracted from the linear projection (horizontal or vertical) generated by the binary image of the text. A unique feature of this method is that it can be applied to printed texts or manuscripts, without prior arrangements. Moreover, the same algorithm is used to segmentation of text lines and segmentation of words, no matter if they are printed or handwritten. The adopteddatabase for this project (IAM-Database), widely used in OCR researches, has, for all printed text, handwritten transcripts that were also targeted using SLP-TEO method. The second method, called gray-Region Oriented Segmentation of Characters (gROSC) is applied to grayscale word images for the purpose of character segmentation. This method is based on region oriented methodswhere connected pixels that are visited and labeled. A unique feature of the method is that it should be applied to grayscale images of the segmented words. Moreover, using the Otsu threshold and knowing the gray levels of the image in advance, the method determines the maximum variation between shades of gray that allows or not to visit the neighboring pixel, adding it to the target region of interest. In the adopted database, there are three basic types of characters problems to solve: overlapping characters, connected characters, and font design. The gROSCmethod is applied to all previously segmented words images, and the characters are equally segmented, without previous identification of possible character problems. The experiments and results in all stages of segmentation with both methods are very relevant and demonstrate the efficiency and simplicity of the proposed methods.
Palabras clave:	Segmentação de caracteres Segmentação de regiões Segmentação de linhas e palavras Operador de energia de teager Character segmentation Region oriented segmentation Segmentation of lines and words Teager energy operator (TEO) Processamento de palavras Processamento de textos (Computação)
Área (s) del CNPq:	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Idioma:	por
País:	BR
Editora:	Universidade Federal de Uberlândia
Sigla de la institución:	UFU
Departamento:	Engenharias
Programa:	Programa de Pós-graduação em Engenharia Elétrica
Cita:	TAVARES, Josimeire do Amaral. GROSC: uma proposta de segmentação de caracteres impressos orientada a regiões em níveis de cinza. 2011. 123 f. Dissertação (Mestrado em Engenharias) - Universidade Federal de Uberlândia, Uberlândia, 2011. DOI https://doi.org/10.14393/ufu.di.2011.135
Identificador del documento:	https://doi.org/10.14393/ufu.di.2011.135
URI:	https://repositorio.ufu.br/handle/123456789/14478
Fecha de defensa:	28-oct-2011
Aparece en las colecciones:	DISSERTAÇÃO - Engenharia Elétrica

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
d.pdf		8.62 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem