|
|
| Home >> Working Papers Series >> Jornadas de Bibliotecas Digitales >> Categorización automática de documentos en español: algunos resultados experimentales |
|
Categorización automática de documentos en español: algunos resultados experimentales
Jornadas de Bibliotecas Digitales / . Abstract: La categorización automática puede contemplarse como un proceso de aprendizaje, durante el cual un programa capta las características que distinguen cada categoría o clase de las demás, es decir, aquéllas que deben poseer los documentos para pertenecer a esa categoría. De otro lado, pocos experimentos se han efectuado todavía con documentos en español. Se muestran las posibilidades de elaborar vectores patrón que recojan las características de distintas clases o categorías de documentos, utilizando técnicas basadas en aquéllas aplicadas en la expansión de consultas por relevancia. Al mismo tiempo, se describe un experimento consistente en la aplicación de esas técnicas a una colección de noticias de prensa en español, para su categorización. Los resultados obtenidos son, en conjunto, homologables o incluso mejores que los obtenidos en experimentos similares; para algunas de las categorías, estos resultados han sido muy favorables.
(go top) |
Last
updated: 2008-05-13 04:02:22 DoIS team
Italian DoIS