La recuperación de la información comienza cuando a un usuario necesita saber algo muy concreto sobre un tema ("solicitud de búsqueda de la información"). Dicha recuperación consiste en proporcionar información importante y precisa al usuario previamente almacenada mediante herramientas a las cuales se puede acceder mediante ecuaciones de búsqueda para poder satisfacer la búsqueda del usuario.
Este proceso se lleva a cabo mediante consultas a la base de datos donde está almacenada la información estructurada mediante un lenguaje adaptado para que cualquier persona que busque encuentre lo que busque. Para ello es imprescindible utilizar elementos clave que permiten hacer una búsqueda precisa, como son:
- Índices.
- Palabras clave o tesauros.
- fenómenos como: ruido y silencio documental.
Dependiendo de la búsqueda que realice el usuario puede obtener mucha información o todo lo contrario, esto es lo que se llama ruido o silencio documental.
Para acceder a una información previamente almacenada se utilizan componentes esenciales:
- Documentos estructurados: proceso que utiliza herramientas de control de términos e indización.
- Bases de datos: primero analiza la consulta del usuario para saber el idioma que habla y saber las ecuaciones que debería de utilizar para aproximarse a dicha consulta.
Las principales herramientas que se utilizan para la recuperación de la información:
- Base de Datos: explicado en esta entrada http://bygmultimediauahedm.blogspot.com.es/2016/03/sistemas-de-almacenamiento-actuales-y.html. La base de datos utiliza a su vez:
- Buscadores: los cuales permiten localizar y recuperar la información almacenada en internet.
- Directorios: son una serie de istas ordenadas que nos permiten acceder a la información de una forma clara y ordenada.
- Metabuscadores: destacados por buscar información en varias bases de datos.
- Buscadores selectivos: buscan la información en una base de datos especializada en una materia específica.
- Agentes inteligentes: localizan la información de una forma automática predeterminando anteriormente un perfil de búsqueda y dónde debe de hacerla.
- Lenguajes de indización y control terminológico:
- Índices: que son términos normalizados recopilados en una listaque representan un recurso.
- Índices de materias: ordenados según las materias que trata la base de datos.
- Índice alfabético: ordenados alfabéticamente.
- Índice KWIC: se ordena mediante las palabras clave del documento.
- Índice KWOC: varía respecto al índice KWIC en el que las palabras clave se ordenan al principio en línea separada.
- Palabras clave: término que precisa información sobre un tema.
- Meta Keywords: se utilizan para buscar las palabras clave de cada página web, es por eso que las páginas web deben de estar bien etiquetadas.
- Tesauros: es un listado de términos que se enlazan por su significado semántico, ordenados jerárquicamente. Estos pueden estar relacionados de tres formas:
- Jerárquicamente: cuando una palabra es más importante que otra.
- Asociativamente: indican que los términos guardan alguna relación.
- Sinonímicamente: entre dos términos que significan lo mismo utiliza el término que sea más correcto
- Lenguajes de interrogación y Ecuaciones de Búsqueda: Adapta el lenguaje del usuario a otro que pueda ser leído por la base de datos. Se pueden utilizar varios procedimientos de trabajo:
- Plantear el tema desde varios puntos de vista.
- Determinar que se sabe el tema.
- Formular la búsqueda mediante palabras clave o traducción de palabras clave a otros lenguajes.
- Seleccionar herramientas de búsqueda (índices, motores, metabuscadores).
- Aplicando las palabras clave en las herramientas de búsqueda seleccionadas.
- Ecuaciones se utilizan para poder recuperar la información de una forma más eficaz, algunas ecuaciones son:
- Truncamiento nos posibilita recuperar las formas que puede adoptar la raíz de un mismo término.
- Operadores booleanos se utilizan para a ampliar o acotar la búsqueda.
"And" - Reduce
"Or" - Amplía
"Not" - Elimina
- Delimitadores al igual que los booleanos se utilizan para ampliar o acotar la búsqueda.
" = " - Igual que.
" > "/ " < " - Mayor/menor que.
">=" / "<=" - Mayor/menor o igual que.
- Webspirs un programa utilizado para consultar en bases de datos según el contenido que traten (Medicina, Educación, Lengua y Literatura ...)
Algunas Técnicas De Recuperación De La Información.
- Sistemas de recuperación de lógica difusa se utiliza para establecer consultas cuando un usuario estándar introduce la búsqueda. Dicho sistema lo "traduce" para que se pueda buscar en las bases de datos omitiendo palabras muy comunes. (Como son los artículos ...)
- Técnicas de ponderación de términos analiza los términos según la importancia y el valor que tiene en la consulta realizada.
- Técnicas de clustering modelo probabilístico que agrupa los documentos según el orden de importancia que tengan.
- Técnicas de stemming busca por el lexema de las palabras omitiendo los prefijos, postfijos ...
Calidad De La Recuperación.
Uno de ellos es la consistencia, ésta clasifica su sistema con el lenguaje que se ha solicitado la búsqueda. Otro criterio es la exhaustividad es la cualidad de un sistema de información para poder recuperar los documentos relevantes. La relevancia es otro muy utilizado, que muestra a los documentos según el número de visitas que ha tenido dicho documento, este criterio se complementa con la precisión que coordina la ecuación con los documentos más relevantes.
Enlaces:
http://es.slideshare.net/sjaramillo1972/recuperacin-de-la-informacin
http://www.mariapinto.es/e-coms/busqueda-y-recuperacion-de-informacion/
http://www.mariapinto.es/e-coms/bibliotecas/
http://es.geocities.com/recupdeinformacion_ontologias/recuperacioninformacion.htm#suamrio
http://www.comp.lancs.ac.uk/computing/research/stemming/general/
http://eprints.rclis.org/5610/2/busquedapres.pdf
http://delta.cs.cinvestav.mx/~gmorales/ldifll/ldifll.html
http://bygmultimediauahedm.blogspot.com.es/2016/03/sistemas-de-almacenamiento-actuales-y.html
No hay comentarios:
Publicar un comentario