GROSC: uma proposta de segmentação de caracteres impressos
orientada a regiões em níveis de cinza

Tavares, Josimeire do Amaral

Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/14478

Document type:	Dissertação
Access type:	Acesso Aberto
Title:	GROSC: uma proposta de segmentação de caracteres impressos orientada a regiões em níveis de cinza
Author:	Tavares, Josimeire do Amaral
First Advisor:	Yamanaka, Keiji
First member of the Committee:	Nomura, Shigueo
Second member of the Committee:	Neves, Luiz Antônio Pereira
Third member of the Committee:	Faria, Eustáquio São José de
Summary:	Os sistemas de Optical Character Recognition (OCR, ou Reconhecimento ótico de caracteres em português) designam genericamente tecnologias para reconhecer caracteres a partir de um arquivo de imagem que contenha textos. Permite, por exemplo, que uma folha de texto impresso, ao ser digitalizada, possa ser convertida em um arquivo de texto editável. Esses sistemas foram muito difundidos ao longo dos ´últimos anos, com viárias versões comerciais, incluindo os incorporados em aparelhos scanner. Uma das etapas que definem o sucesso ou fracasso deste tipo de sistema é a correta segmentação das linhas de texto e dos caracteres que o constituem. Atualmente ganhou importância a correta segmentação das palavras contidas no texto, para auxiliar possíveis etapas de pós-processamento para a correção de desvios de reconhecimento. Neste trabalho são apresentados dois métodos diferenciados para segmentação de textos. O primeiro método, denominado Segmentação de Linhas e Palavras baseado no Operador de Energia de Teager (SLP-TEO) é utilizado na segmentação de linhas de texto e segmentação de palavras. O TEO ´e aplicado ao sinal abstraído da projeção linear (horizontal ou vertical) gerada através da imagem binária do texto. Um dos diferenciais do método é que o mesmo pode ser aplicado a textos impressos ou manuscritos, sem nenhum ajuste prévio. Além disso, o mesmo algoritmo é utilizado tanto na segmentação de linhas quanto na segmentação de palavras, impressas ou manuscritas. A base de dados adotada neste projeto (IAM-Database), consagrada em diversas pesquisas de OCR, possui,para todo texto impresso, transcrições manuscritas que também foram alvo do método SLP-TEO. O segundo método, denominado gray-Region Oriented Segmentation of Characters-(gROSC) , em português Segmentação de Caracteres Orientado à Regiões em níveis de cinza , é aplicado às imagens das palavras em tons de cinza com a finalidade de segmentação de caracteres. Este método baseia-se nos métodos de segmentação de regiões em que os pixels conectados são visitados e rotulados. Um dos diferenciais do método é que o mesmo deve ser aplicado às imagens em níveis de cinza das palavras segmentadas. Além disso, utilizando o limiar de Otsu e conhecendo-se os níveis de cinza da imagem, o método determina a variação máxima entre tons de cinza que permite ou não visitar o pixel vizinho, agregando-o à região de interesse a ser segmentada. Na base de dados adotada existem três tipos básicos de caracteres problemáticos: caracteres sobrepostos, caracteres conectados e desenho de fontes. O método gROSC é aplicado às imagens de todas as palavras segmentadas anteriormente e os caracteres são segmentados igualmente sem prévia identificação dos possíveis problemas. Os experimentos e resultados encontrados em todas as etapas de segmentação dos textos com ambos os métodos são bastante relevantes e demonstram a eficiência e simplicidade dos métodos propostos.
Abstract:	Optical Character Recognition systems (OCR) refer generically to technologies applied to recognize characters from an image file that contains text. It allows, for example, that a scanned sheet of printed text could be converted into an editable text file. These systems have been widespread over the past years, with several commercial versions, including the ones embedded within scanner devices. One of the steps that define the success or failure of this type of system is the correct segmentation of text lines and characters that constitute it. Recently, it has gained importance the correct segmentation of words in the textto assist possible post-processing steps to correct deviations of recognition. This paper presents two different methods for segmentation of texts. The first method, called Segmentation of Lines and Words based Teager energy operator (SLP-TEO), based on the Teager energy operator (TEO), is used in the segmentation of text lines and words. The TEO is applied to the signal abstracted from the linear projection (horizontal or vertical) generated by the binary image of the text. A unique feature of this method is that it can be applied to printed texts or manuscripts, without prior arrangements. Moreover, the same algorithm is used to segmentation of text lines and segmentation of words, no matter if they are printed or handwritten. The adopteddatabase for this project (IAM-Database), widely used in OCR researches, has, for all printed text, handwritten transcripts that were also targeted using SLP-TEO method. The second method, called gray-Region Oriented Segmentation of Characters (gROSC) is applied to grayscale word images for the purpose of character segmentation. This method is based on region oriented methodswhere connected pixels that are visited and labeled. A unique feature of the method is that it should be applied to grayscale images of the segmented words. Moreover, using the Otsu threshold and knowing the gray levels of the image in advance, the method determines the maximum variation between shades of gray that allows or not to visit the neighboring pixel, adding it to the target region of interest. In the adopted database, there are three basic types of characters problems to solve: overlapping characters, connected characters, and font design. The gROSCmethod is applied to all previously segmented words images, and the characters are equally segmented, without previous identification of possible character problems. The experiments and results in all stages of segmentation with both methods are very relevant and demonstrate the efficiency and simplicity of the proposed methods.
Keywords:	Segmentação de caracteres Segmentação de regiões Segmentação de linhas e palavras Operador de energia de teager Character segmentation Region oriented segmentation Segmentation of lines and words Teager energy operator (TEO) Processamento de palavras Processamento de textos (Computação)
Area (s) of CNPq:	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Language:	por
Country:	BR
Publisher:	Universidade Federal de Uberlândia
Institution Acronym:	UFU
Department:	Engenharias
Program:	Programa de Pós-graduação em Engenharia Elétrica
Quote:	TAVARES, Josimeire do Amaral. GROSC: uma proposta de segmentação de caracteres impressos orientada a regiões em níveis de cinza. 2011. 123 f. Dissertação (Mestrado em Engenharias) - Universidade Federal de Uberlândia, Uberlândia, 2011. DOI https://doi.org/10.14393/ufu.di.2011.135
Document identifier:	https://doi.org/10.14393/ufu.di.2011.135
URI:	https://repositorio.ufu.br/handle/123456789/14478
Date of defense:	28-Oct-2011
Appears in Collections:	DISSERTAÇÃO - Engenharia Elétrica

Files in This Item:

File	Description	Size	Format
d.pdf		8.62 MB	Adobe PDF	View/Open

Show full item record