RECUPERACIÓN DE INFORMACIÓN

miércoles, 22 de diciembre de 2010

Morfología y semántica en tesauros

Alcance de descriptores

Cada uno de los descriptores que se utilicen en los tesauros representar un concepto, los descriptores se encuentran en principio en términos de una lengua natural, y ninguno término artificial lo cual deben ser adoptados al tesauro.

Todos los conceptos que son representados por los descriptores se pueden agrupar por categorías lo que es conocido como las fesetas las cuales deben tener características comunes por ejemplo sitios geográficos, cronología, procesos

Existen clases que son únicas y deben ser expresados como nombre propio una elección. Una elección tiene que hacerse entre:

Elección del nombre propio en un idioma para ser utilizado en todos los idiomas.

La utilización del nombre propio en cada idioma que tiene el nombre, y el nombre propio en el idioma general para los idiomas que carecen de ello.

Utilización de traducciones en la medida razonable y posible.

Al determinar cuáles fueron las preferidos se deben anotar aquellos que no lo fueron, es de utilidad una lista actualizada de para cada lengua.

Clasificación y ambigüedad de descriptores

Cada descriptor es restringido con un único significado dentro del tesauro

El significado del descriptor puede es explicado en el contexto y la estructura

Cada uno de los descriptores debe tener el alcance previsto sin importar el idioma

La ambigüedad se debe evitar en la medida de lo posible. Un calificador es a menudo suficiente para los fines de desambiguación.

lunes, 8 de noviembre de 2010

TESAUROS

Lista detérminos normalizados (descriptores) que describen las ideas clave de un área temática. Los creadores de la sbases de datos asignan descriptores del tesauros a cada registro para describir su contenido.

Los tesauros ofrecen además una lista de términos relacionados para cada descriptor.

domingo, 7 de noviembre de 2010

Robot, spider o crawler

Es un programa que accede de forma automática a páginas web y recolecta determinada información sobre su contenido. Las arañas comienzan visitando las URLs, identidica hiperenlances en dichas páginas y las añade a una lista de URLs para visitarlas de una manera más frecuentemente.

URL: Uniform Resource Locator

Localizador Universal de un Recurso
Define la ubicación de un recurso y la forma de acceder a él.
Permite acceder a recursos dispersos.

LOS DOCUMENTOS DE TEXTO Y SU ESTRUCTURA

Un documento se considera como una unidad de información digitalizada que contiene un contenido y un texto en medio digital, sonoro o audiovisual. Este documento tiene una estructura y una sintaxis definida por una aplicación semántica o un estilo de presentación.

Por otro lado, el texto se define como conjunto de palabras con una sintaxis que comunican conocimiento y se presenta con un estilo específico. De esta manera se puede hablar de documentos estructurados, semiestructurados y no estructurados. Los documentos hacen uso de metadatos para definir su estructura, es decir que le permiten al metadato describir el propio documento del texto al que está asociado.

Los siguientes elementos nos ayudaran a comprender los documentos de texto y su estructura

1)La estructura de los documentos en el texto: todo documento está contenido en diferentes maneras, por lo que permite que los documentos se clasifiquen en textos estructurados, semiestructurados y no estructurados.

2)Metadatos: son una información de la manera como están organizados los datos en un documento, los diferentes dominios de los datos y las relaciones existentes entre ellos. Para definir los metadatos nos podemos encontrar con muchos autores y escuelas que hablan del concepto.

3)Formatos y aplicaciones de los metadatos: Formatos tales como Marc, utilizado para definir los atributos de entrada bibliográfica. Dublín Core, que define 15 campos para describir un documento. RDF, que describe nodos en la red.

4)Metadatos descriptivos versus metadatos semánticos: los primeros son aquellos metadatos externos al significado del documento o que pertenecen a la manera como fueron creados los documentos, mientras que los documentos semánticos se refieren a la información que caracteriza el contenido del documento.

5)Lenguajes de marcado: son aquellas marcas que describen acciones de formato, información del documento, significado del texto, atributos y que describen en general la información del texto.

6)La búsqueda de información en los documentos de texto: ante la enorme cantidad de información encontrada en la web y bibliotecas digitales, es necesario que las personas encuentre información relevante y precisa a las necesidades de información que tienen. Para hacer estas búsquedas es necesario observar las: Necesidades de información de los usuarios y la Recuperación de información versus extradición de información.

RECUPERACIÓN DE INFORMACIÓN EN EL MARCO DE LA CIENCIA DE LA DOCUMENTACIÓN POR JOSÉ ANTONIO SALVADOR OLIVAN Y ROSARIO ARQUERO AVILÉS

Antes de desarrollar este documento/video es necesario dar algunas definiciones que proponen algunos autores a partir del término recuperación de información. Para Calvin Mooers hacia 1951 definió la recuperación de información como “aquella que barca los aspectos intelectuales de la descripción de información y su especificación para la búsqueda, y también cualquier sistema, técnica o maquina que se utilice para llevar a cabo la recuperación”[1]; por otro lado Jean Tague-Sutcliffe define las siguientes variables en el campo de la recuperación de información como: “colección de documentos o bases de datos, representación de la información, usuarios, consultas, frases para búsquedas y estrategias de búsqueda, intermediarios de búsqueda, proceso de búsqueda y evaluación de la recuperación”[2].

A partir de lo aportado por estos autores se puede afirmar que: el fundamento de la recuperación de la información consiste en proporciónale información relevante al usuario de tal manera que satisface sus necesidades de información mediante: la representación, almacenamiento y búsqueda. De ahí, el interés de diversas disciplinas e investigadores por hacer accesibles su producción científica y académica, el de vincular tecnologías de información y de aportar a la sociedad de la información medios y tecnologías que permitan dar respuesta a las necesidades de todo individuo, comunidad o grupos académicos.

En base a estos avances la recuperación de información se va relacionado con algunas áreas del conocimiento y de la información reflejada en:

Con la aparición de la informática hacia 1940 se refleja la influencia de: la teoría de algoritmos, lógica matemática y la iniciativa de ordenadores electrónicos, esto aplicado al área de sistemas de información y bases de datos se ocupa principalmente de la organización de datos, modelos de representación, almacenamiento, recuperación, interacción con el usuario, diseño de arquitecturas para recuperaciones eficientes, inteligencia artificial, interacción hombre maquina y bibliotecas digitales.

Por otra lado, aparece la relación entre la ciencia de la información y recuperación de información. Entendida como el área donde mayor numero de autores y trabajos están implicados es decir que tiene en cuenta el análisis de citas, recuperación en línea, comunicación científica, teoría y estudio de usuarios, teoría de indización, de citas y comunicación.

En otro sentido la ciencia de la documentación y la recuperación de la información, entendido el termino documentación como: “conjunto de las disciplinas documentarias que estudian y ejecutan los diversos aspectos del proceso documental”[3]. Esta relación de la ciencia de la documentación y la recuperación de información tienen como objeto por un lado: estudiar el proceso informativo en la que se recuperan mensajes emitidos en procesos anteriores y el análisis de la información para la obtención de nuevo conocimiento y por otro lado que es vista como una disciplina comprometida con el proceso documental.

El mismo desarrollo de la recuperación de la información va relacionando con el proceso documental, donde se requiere que existan unas etapas en el proceso documental tales como la selección y adquisición, análisis, almacenamiento, búsqueda o recuperación y difusión de la información. Esto con el fin de transformar la información contenida en documentos con el fin de posibilitar su control y recuperación.

Pudiendo así definir la recuperación de la información como un campo donde se involucran la utilización de habilidades, métodos y actividades que tienen como fin la búsqueda, localización y recuperación de la información de documentos, registros, imágenes, sonidos en los diferentes sistemas de recuperación de información y que estos conllevan a la satisfacción de las necesidades de información en los usuarios.

[1] SALVADOR OLIVAN, José Antonio y Rosario ARQUERO AVILES. [En línea]. [Consultado 2010-11-5]. Disponible en: http://uvirtual.lasalle.edu.co/course/view.php?id=389

[2] SALVADOR OLIVAN, José Antonio y Rosario ARQUERO AVILES. [En línea]. [Consultado 2010-11-5]. Disponible en: http://uvirtual.lasalle.edu.co/course/view.php?id=389

[3] SALVADOR OLIVAN, José Antonio y Rosario ARQUERO AVILES. [En línea]. [Consultado 2010-11-5]. Disponible en: http://uvirtual.lasalle.edu.co/course/view.php?id=389

UNA APROXIMACIÓN AL CONCEPTO DE RECUPERACIÓN DE INFORMACIÓN EN EL MARCO DE LA CIENCIA DE LA DOCUMENTACIÓN POR JOSÉ ANTONIO SALVADOR OLIVAN Y ROSARIO ARQUERO AVILÉS

Video realizado con base a la lectura:

http://www.youtube.com/watch?v=CciBVSlmKOM

Buscar este blog

CONTADOR DE VISITAS