[Full Text]

DoIS News
Online reference
Conference Proceedings
Journals List
RSS feeds for LIS journals
About us
New Search
Home >> Working Papers Series >> Jornadas de Bibliotecas Digitales >> Usando técnicas de compresión de textos en bibliotecas digitales

Usando técnicas de compresión de textos en bibliotecas digitales

Iglesias, E. L.
Brisaboa, N. R.
Paramá, J. R.
Fariña, A.
Navarro, G.
Esteller, M. F.

 

Jornadas de Bibliotecas Digitales / .
(ReLIS:jul:juljag:8859)

Abstract:

Resumen El almacenamiento de los textos de una biblioteca digital en formato comprimido es una alternativa que se hace cada vez más interesante a medida que las colecciones textuales crecen. Sin embargo, la mayoría de las técnicas de compresión impiden la búsqueda de palabras sobre el texto comprimido sin descomprimirlo de modo que se hace imposible aplicar eficientemente técnicas de text retrieval. Recientemente han aparecido algunas técnicas específicas de compresión de textos que permiten la búsqueda de palabras directamente sobre el texto comprimido sin necesidad de descomprimirlo. En este trabajo se introducen dichas técnicas y se presenta un nuevo método de compresión de textos que denominamos Código Denso con Post-Etiquetado que no sólo tiene un menor coste computacional sino que, además, consigue mejores ratios de compresión, conservando plenamente las capacidades de búsqueda sobre el texto comprimido de palabras exactas, frases, búsqueda aproximada, etc. de las técnicas anteriores.


Creation: 2003
Keywords: Bibliotecas digitales ; Comprensión de textos

 (go top)



File-URL: http://imhotep.unizar.es/jbidi/jbidi2003/05_2003.pdf


 


  Freely downloadable only

Last updated: 2008-05-23 04:02:23 DoIS team
Italian DoIS