2 de septiembre de 2009

UN SISTEMA DE BÚSQUEDA DE DOCUMENTOS PARA EL PARLAMENTO ANDALUZ MEDIANTE INTELIGENCIA ARTIFICIAL


Hola a todos!

Aquí estamos de nuevo después de las merecidas vacaciones...

Os adjunto una noticia publicada en la página web "Andalucía investiga" sobre un sistema de búsqueda de documentos para el Parlamento Andaluz mediante inteligencia artificial.

Sería interesante que los compañeros del parlamento andaluz nos comentara algo sobre ello...

Enlace a la noticia: http://www.andaluciainvestiga.com/espanol/noticias/9/8267.asp

Texto de la Noticia: 1 de Septiembre de 2009
EXPERTOS CREAN UN SISTEMA DE BÚSQUEDA DE DOCUMENTOS PARA EL PARLAMENTO ANDALUZ MEDIANTE INTELIGENCIA ARTIFICIAL
Diseñado por investigadores de la Universidad de Granada, no hay ningún sistema similar en ningún otro parlamento autonómico español.
L. Hevia

Resultados de búsqueda con vídeoInvestigadores de la Universidad de Granada, dirigidos por Luis M. de Campos Ibáñez, han diseñado un novedoso sistema de búsqueda de información para la página web delParlamento de Andalucía gracias a un proyecto de excelencia e incentivado por la Consejería de Innovación, Ciencia y Empresa con cerca de 130.000 euros. “Se trata de un motor de búsqueda basado en modelos matemáticos bayesianos (sobre cálculos de probabilidades), es decir, basado en Técnicas Avanzadas de Inteligencia Artificial (TIA); algo que no es nada habitual”, explica.
Este buscador permitirá al usuario hacer consultas a través del lenguaje natural; la respuesta, en vez del PDF actual, será más precisa y más flexible. Permitirá al interesado obtener partes concretas de un discurso sólo con introducir una palabra, en vez del discurso completo, o hacer búsquedas estructuradas para ofrecer aún más precisión. Además, estos investigadores han logrado que los vídeos de los plenos aparezcan sincronizados con el texto que busca el usuario.
¿Qué otras diferencias tiene con los buscadores habituales? “Normalmente se utiliza un sistema vectorial, que representa los documentos sólo en función de las palabras que contienen -explica De Campos-. Nuestro modelo es estructurado, y permite aprovechar también los conjuntos de palabras, los párrafos, las secciones, los capítulos... Aprovechamos la estructura del discurso político para hacer la búsqueda más provechosa”.
“Todos los parlamentos tienen un buscador”, comenta el investigador. De hecho, la información documental del Parlamento andaluz cuenta, según los últimos datos registrados a 2005, con más de 2.700 BOPA (unas 130.000 páginas), 2.004 diarios de sesiones (84.500 páginas), y 12.000 horas de grabación; cifras que aumentan día a día. Y el Parlamento quiere que todo el trabajo que allí se desarrolla esté a disposición del público.
“Por eso nosotros hemos querido montar un buscador a través de Internet mucho más sofisticado. No existe algo así en ningún parlamento autonómico español -añade- y, que nosotros sepamos, sólo en Holanda y en Gran Bretaña se están desarrollando sistemas similares”.
Esta herramientaha sido presentada de forma oficial en el Parlamento. El siguiente paso será la mejora de las prestaciones. “De momento, el prototipo funciona con el material de la última legislatura, la octava. Y lo que nosotros queremos es incorporar todo el fondo documental de todas las legislaturas”, asegura.

2 comentarios:

Antonio Serrano dijo...

Hola a todos y todas

Efectivamente se ha desarrollado el proyecto objeto de la noticia. El proyecto ha sido una iniciativa desarrollada por la Universidad de
Granada que tenía como punto colaborador en el Parlamento al Servicio de Publicaciones (dado que el objetivo era desarrollar un buscador más
eficiente sobre las publicaciones oficiales). Casi desde el principio el Servicio de Documentación y Archivo ha tenido una colaboración específica en la búsqueda de un sistema de indización automática mediante “inteligencia artificial”. Igual que en el ámbito del lenguaje natural ha habido un desarrollo importante que ha mejorado de manera
significativa los resultados (incluido la integración con el video), en el tema de la asignación automática de descriptores los resultados han sido muy limitados y parece ser que se quiere desarrollar una segunda fase donde este aspecto estaría mucho más presente.

Quedamos a vuestra disposición para cualquier aclaración que queráis.

Antonio Serrano Cordón
Unidad de Archivo
Parlamento de Andalucía

macarron dijo...

Hola,

Me parece una iniciativa muy interesante pero que sin embargo me platea algunas dudas. La primera esta relacionada con el empleo del lenguaje natural, se realiza ciertamente un analisis semántico de las formulas de búsqueda?
La segunda, esta relacionada con la sincronización de los textos en función del video. La generacion de ficheros como SMIL que permiten llevar a cabo esto, se realizan de forma automática? De ser así, la sincronización es perfecta o los textos estan "fuera de boca"? Y la ultima, me surge cuando se hace referencia a la obtención de resultados de forma estructurada, esto hace referencia a que se ha pasado de tener una base documental a tener toda la informacíón en una base de datos relacional donde se contemplen tablas como, por ejemplo, Sesion->Pto_Orden->Intervencion?
Gracias por todo y enhorabuena por el trabajo.

Otras entradas de interés

Related Posts with Thumbnails