Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/14273
Document type: Tese
Access type: Acesso Aberto
Title: Descrição de documentos na internet e em eBooks
Author: Honorato, Mauro Jacob
First Advisor: Lima, Luciano Vieira
First member of the Committee: Pereira, Antônio Eduardo Costa
Second member of the Committee: Cury Filho, Reny
Third member of the Committee: Caparelli, Paulo Sérgio
Summary: A Internete e os livros eletrônicos estão substituindo as editoras tradicionais. Enciclopédias, por exemplo, são publicadas principalmente na internete, já que esse tipo de mídia permite melhoramentos, cooperação e correções rápidas. Os leitores eletrônicos diminuíram o custo da publicação de livros e o consumo de recursos naturais (por exemplo: a madeira para papel) necessários para a publicação de documentos. Já faz muito tempo que a tecnologia de publicação alavancou duas linguagens de domínio específicas para a descrição de documentos: LATEX e XML. Atualmente, a XML tornou-se a ferramenta preferida para a internete, o processamento de textos, e a edição eletrônica de livros. Assim sendo, essa dissertação vai oferecer ferramentas para a produção de XML para páginas WWW, e também para a publicação eletrônica. A linguagem de programação Scheme é um dialeto da LISP bastante apropriada para o processamento de textos, já que ela tem uma boa representação para textos estruturados: as listas aninhadas. Assim o autor desse trabalho vai mostrar como usar a Scheme para a criação de páginas dinâmicas baseadas na descrição em XML. Para que a comunicação global torne-se possível, precisamos adaptar-nos aos avanços tecnológicos que os cientistas da Inteligência Artificial fizeram nos campos da representação do conhecimento, captura de contextos, linguagens de domínio específico, reflexividade e processamento de linguagem natural. Em geral, as tecnologias ligadas à inteligência artificial são expressas em linguagens da família LISP. A principal razão disso é que essas linguagens possuem a propriedade do homoiconismo, ou seja, a representação primária dos programas é também uma estrutura de dados em um tipo de dado primitivo da LISP. Essa propriedade torna a meta-programação em LISP mais fácil do que seria em outras linguagens. Este trabalho vai mostrar como utilizar a meta-programação e fechos funcionais para efetuar varreduras de textos pertencentes a domínios específicos, a fim de obter informações sintáticas e semânticas. Uma vez que um sistemade software obtenha as características gerais de um texto, ele pode processá-lo para gerar livros que possam ser instalados em dispositivos dedicados à leitura. É também possível gerar dicionários e digestos que facilitam o processo de ler e interpretar textos.
Abstract: The Internet and ebooks are replacing traditional publishing houses. Encyclopedias, for instance, are published mainly in the Internet, since this media allows fast update, cooperation and corrections. Electronic readers decreased the cost of publishing books, and spare natural resources (wood for papers, for instance) needed for printting documents Since long, publishing technology have advanced two domain specific languages for describing documents: LATEX and XML. In recent years, XML became the choice tool for the Internet, text processing, and electronic edition of books. Therefore, this dissertation will offer tools for producing XML for www pages, and also for electronic publishing. The Scheme programming language is a dialect of LISP well suited for text processing, since it has a good representation for structured text: Nested lists. Thus the author of this work will describe how to use Scheme for creating dynamic pages based on their XML description. If global communication is to become feasible, we must adapt the technological advances that people who work with Artificial Intelligence made in the fields of knowledge representation, context capture, domain specific languages, reflexivity, and natural language processing. In general, AI technologies are expressed in languages of the LISP family, since they are homoiconic, i.e., their primary representation of programs is also a data structure in a primitive type of LISP. This makes metaprogramming easier than in a language without this property. This paper will show how to use metaprogramming and closures for skimming through a restricted domain text in order to grasp its syntactic structure and meaning. Once the software system obtains the general features of a text, it can process it to generate books that can be installed in dedicated reading devices; it can also generate dictionaries and digests to easy the process of reading. Finally this work will address the problem of publishing ebooks, after specifying their structure in XML.
Keywords: Linguagem de programação (Computadores)
Processamento de texto
Livros eletrônicos
Area (s) of CNPq: CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Language: por
Country: BR
Publisher: Universidade Federal de Uberlândia
Institution Acronym: UFU
Department: Engenharias
Program: Programa de Pós-graduação em Engenharia Elétrica
Quote: HONORATO, Mauro Jacob. Descrição de documentos na internet e em eBooks. 2011. 91 f. Tese (Doutorado em Engenharias) - Universidade Federal de Uberlândia, Uberlândia, 2011.
URI: https://repositorio.ufu.br/handle/123456789/14273
Date of defense: 21-Jan-2011
Appears in Collections:TESE - Engenharia Elétrica

Files in This Item:
File Description SizeFormat 
Diss Mauro.pdf481.49 kBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.