[Full Text]

DoIS News
Online reference
Conference Proceedings
Journals List
RSS feeds for LIS journals
About us
New Search
Home >> Working Papers Series >> Jornadas de Bibliotecas Digitales >> Categorización automática de documentos en español: algunos resultados experimentales

Categorización automática de documentos en español: algunos resultados experimentales

García-Figuerola, Carlos
Alonso Berrocal, José Luis
Zazo Rodríguez, Angel

 

Jornadas de Bibliotecas Digitales / .
(ReLIS:jul:juljag:8776)

Abstract:

La categorización automática puede contemplarse como un proceso de aprendizaje, durante el cual un programa capta las características que distinguen cada categoría o clase de las demás, es decir, aquéllas que deben poseer los documentos para pertenecer a esa categoría. De otro lado, pocos experimentos se han efectuado todavía con documentos en español. Se muestran las posibilidades de elaborar vectores patrón que recojan las características de distintas clases o categorías de documentos, utilizando técnicas basadas en aquéllas aplicadas en la expansión de consultas por relevancia. Al mismo tiempo, se describe un experimento consistente en la aplicación de esas técnicas a una colección de noticias de prensa en español, para su categorización. Los resultados obtenidos son, en conjunto, homologables o incluso mejores que los obtenidos en experimentos similares; para algunas de las categorías, estos resultados han sido muy favorables.


Creation: 2000
Keywords: Recuperación de la información ; Recuperación a texto completo ; Lenguaje natural ; Categorización ; Español

 (go top)



File-URL: http://imhotep.unizar.es/jbidi/jbidi2000/14_2000.pdf


 


  Freely downloadable only

Last updated: 2008-05-13 04:02:22 DoIS team
Italian DoIS