Esta wiki aborda en profundidad contenidos relacionados con la Recuperación
y Organización de la Información en el web.
Introducción a los motores de recuperación de documentos XML / RDF
El objetivo de la web es tratar el papel de los motores de recuperación de documentos XML y RDF dentro de la recuperación y organización de la información, dando algunos ejemplos como swoogle y aclarando algunos conceptos. Para ello se realizara una breve introducción sobre los documentos XML y RDF, y los motores de recuperación de estos documentos.
¿Qué es un documento XML / RDF?
El lenguaje de Internet para la creación de documentos electrónicos más conocido es el HTML, que es con el que se define la estructura y contenido de una página web. Consta de una serie de etiquetas (markups) predefinidas que permiten construir documentos que contienen títulos, párrafos y listas de texto, tablas, imágenes y otro elementos para la presentación de información.
- XML son las siglas de Extensible Markup Language, un lenguaje definido por el W3C. XML fue creado con la idea de añadir un mayor contenido semántico a la web, al ser más flexible y adaptable que el HTML, ya que éste era únicamente un lenguaje de marcado que definía la estructura de la web y no proporcionaba información sobre el contenido. XML describe la estructura de los documentos, pero deja a libre elección el nombre que recibirá cada una de las etiquetas. El número de sublenguajes que pueden crearse a partir del metalenguaje XML es prácticamente ilimitado.
- RDF son las siglas de Resource Description Framework, o lo que es lo mismo: marco de descripción de recursos. Es un estándar que ayuda a convertir la Web en una infraestructura global en la que sea posible compartir y reutilizar datos y documentos entre diferentes tipos de usuarios. RDF proporciona información descriptiva sobre los recursos y documentos que se encuentran en la Web y que se utiliza, por ejemplo, en catálogos de libros, directorios, colecciones personales de música, fotos, eventos, etc.
Objetivo de los motores de recuperación XML / RDF
Los lenguajes de XML, RDF, OWL, etc. han sido diseñados para ser usados por aplicaciones que necesitan procesar el contenido de la información, dando paso a la Web Semántica y cuyo objetivo no es presentar la información para los humanos como sucede en la web tradicional. Los motores de recuperación de documentos XML/RDF, surgen para recuperar esta información y el contenido de dichos documentos.
Hasta ahora los motores de recuperación de información de Internet permiten hacer una búsquedas, y recuperar documentos que contengan dicha búsqueda. A veces, de esos documentos, la unica información que podemos obtener son contextos descontextualizados, es decir, si en un buscador se introduce la palabra Paris Hilton aparecerán resultados sobre los hoteles Hilton, París y la actriz Paris Hilton. En cambio en utilizando un motor de recuperación semántico, el buscador nos debería ir guiando al resultado preguntándonos que tipo de información buscamos: hoteles Hiltón, la ciudad de Paris o la actriz.
El gran problema que presenta la recuperación y organización de la información en esta web semántica es que no existen motores de recuperación de carácter general que permitan búsquedas basadas en documentos RDF / XML por toda la web.
WIKI de recuperación y organización de la información
- Página principal del WIKI
- Evaluación de buscadores web
- Sistemas de Question-Answering
- Metadatos y documentos XML/RDF para recuperación
- Lenguajes de recuperación: XML-Query, XQL y Tolog
- Lenguajes de recuperación: SeRQL y SPARQL
- Almacenamiento, consulta y razonamiento: Sesame y Jena
- Modelos de recuperación
- Motores de recuperación de documentos XML/RDF
- Procesamiento del Lenguaje Natural
- Usabilidad y accesibilidad en el posicionamiento
- Clasificación supervisada
- Clasificación no supervisada: clustering y Kohonen
- Fusión de ontologías de metadatos FCA, Onions y Prompt
- Minería de textos web
- Tutorial XQL
- Tutorial XQuery
- Tutorial TOLOG
- SeRQL
- sparql
- Sistemas Question-Answering
- Recuperación y organización de la información
- Iber-Riego, riegos y maquinaria agrícola en Madridejos
- Tu web de fiestas universitarias en Madrid, Grupo de Canalleo
- Tu web de finde de locura de fiesta en Benidorm