Información

Información

domingo, 17 de marzo de 2013

Indización y Representación de Distintos Formatos Documentales

 
·        Indización libre: la identificación se realiza a través de una lista o conjunto abierto de términos.
·       Indización controlada: la identificación se realiza por medio de una lista o conjunto cerrado de términos.
 
Si elegimos una indización controlada, hay que destacar las siguientes herramientas:
  • Vocabulario controlado: es una lista de vocablos que tienen asignado un significado concreto.
  • Taxonomía: es una lista organizada en forma de árbol, de manera jerárquica partiendo de lo general a lo específico.
  • Tesauro: es una taxonomía con algunos datos añadidos como términos relacionados, términos no preferentes y preferentes.
  • Mapas temáticos: es una manera formal para declarar un conjunto de temas y proveer enlaces a documentos o nodos de subdocumentos.
  • Ontología: se trata de tesauros más avanzados que representan la conceptualización de un determinado dominio del conocimiento por medio de estructuras semánticas.

Modelos de Representación y Recuperacón de Imágenes




Situación actual de la recuperación de imágenes es el internet, como medio generalizado de acceso a la información gráfica.






 
Implicaciones desde la perspectiva de nuevos diseños de sistemas:
  1. Mayor desarrollo de prototipos avanzados de recuperación.
  2. Amplia tipología de usuarios.
  3. Usuario activo.
  4. Sistemas que conjuguen facilidad de uso y potencia en la recuperación.
  5. Entorno de descubrimiento.
  6. Distintos niveles de descripción de las imágenes y distintas posibilidades de búsqueda.
SARI(Sistema automatizado de recuperación de imágenes) esta combinado por herramientas, documentos y procedimientos de consulta, que hacen posible la búsqueda de imágenes fotográficas incorporadas en un fondo documental; este es el más utilizado, ya que se basa en la fusion de un programa de gestión de bases de datos documentales y de un sistema de gestión de imágenes digitales.
Consta de dos módulos:
  • Módulo de entrada de información. Se suele almacenar distintos tamaños de una misma imagen.
  • Módulo de consulta y recuperación de información.
Fruto de estas dos formas de representación y recuperación tenemos las siguientes variantes en modelos de SARI:
  • LL (representación y recuperación conceptuales)  Emplean sistemas de gestión documental con soporte de imágenes digitales -un ejemplo sería Inmagic. Son los más ampliamente conocidos y utilizado
  • VV (representación y recuperación visuales) Permiten la representación automática de los atributos visuales de la imagen y la recuperación a partir de esos criterios
  • LV (representación conceptual y recuperación visual) Representaciones textuales de las imágenes, pero con posibilidad de recuperar a partir de las propias imágenes (por ejemplo, mediante un tesauro visual)
  • VL (representación visual y recuperación conceptual) Intentan superar dos limitaciones importantes de los modelos descritos hasta ahora: La restricción de las posibilidades expresivas del usuario al realizar la consulta, por parte de los sistemas visuales. La dificultad para expresar una parte importante de la significación de la imagen durante el proceso de representación, por parte de los sistemas lingüísticos.
  • sistemas mixtos. Integran varios de los modelos de recuperación descritos. Su tecnología es la más adecuada para las necesidades de recuperación de un fondo gráfico voluminoso digitalizado.



 

sábado, 16 de marzo de 2013

Análisis Documental de Distintos Formatos Documentales

 

Catalogación y Citas Bibliográfica de Páginas Web






 

Hoy en dia la informacion ha crecido en el espacio del internet, de manera que se hace frecuente que la mayoria de los trabajo se realicen en base de la informacion que reposa en ella. es por eso que existe un modelo del como se debe realizar.








  • existe un responsable o ente corporativo
  • titulo
  • editor
  • URL
  • fecha de consulta

Morillo Aponte, Rosa Virginia
Introducción a los casos clínicos de la beneficencia.- La Costa; Ortiso [2010] (http://Otiso.com/Talleres/casoclinico,asp?idCaso=88guiasClinicas=si) Concultado el 10/03/2013


Normalización del Contenido en Metadatos










la normalizacion de los metadatos, no son las normas sino los estandares que utilizan los usuarios, pero para esto no se tiene un modelo; una de las normas mas utilizadas son las internacionales por la ISO, esta cuenta con un grupo el DATA management, este se ocupa de organizar todos los componentes para favorecer el intercambio de informacion.
 
uno de los modelos mas utilizados son:
  • Dublin Core : este formato esta diseñado a partir del 95, ya que es facil y sencillo, su indizacion se desarrolla con un conjunto de 15 elementos, y estos tiene que ver con la informaicon y su contenido.
 


 
  • Text Encoding Initiative: es un consorcio que desarrolla y mantiene un estándar para la representación de textos en formato digital. Su principal entregable es un conjunto de directrices que especifican métodos de codificación de textos legibles por máquina, sobre todo en las humanidades, las ciencias sociales y la lingüística. Desde 1994, las Normas del TEI han sido ampliamente utilizados por las bibliotecas, los museos, editores y especialistas individuales para presentar textos para la investigación en línea, enseñanza y conservación.
 
 
  • El Marco de Descripción de Recursos (Resource Description Framework): este es un modelo que se ha sido desarrollado por W3C, este modleo trabaja segun tres trazas, modelo de datos, sintaxis y el esquema. estos también se ofrecen para realzar  recomendaciones y especificaciones a definiciónes y desarrollo de vocabularios.
 
 
 

Tipologías de Páginas Web


Según su
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Tecnología/ construcción
 
Páginas web estáticas: Estas son las más comunes y simples que existen, ya que esta hechas en HTML donde muestran la información. El hecho que se llamen estáticas no es porque no se pueda visualizar imágenes gif, fotos o animaciones flash o videos.
 
Páginas web dinámicas: es un documento en HTML que el usuario abre, acá el documento se genera de forma automático es decir, cuando escribes un mensaje en un foro y aparece de una vez
 
 
Páginas web animadas: Son las páginas hechas totalmente en FLASH. Este es un programa que se usa para hacer animaciones, un ejemplo YouTube, las páginas de juegos online.
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Objetivo/
función
 
Sitios web personales rápidos: son las páginas más fáciles de hacer, solo es de colocar un par de fotos, biografía de tu vida, currículo personal.
 
 

Sitios web profesionales o para PYMES: Estos sitios no contienen mucha información, hay empresas que ofrecen muy buenas plantillas en sus constructores web, La ventaja de usar éstas plantillas sobre usar constructores web es que te dan más flexibilidad y tienes más control sobre el sitio web.
 
 

Sitios web para hacer dinero: para estos sitios se debe  contratar una compañía de alojamiento web convencional que te ofrezca scripts para ese tipo de comercio electrónico y adaptarlos a tu contenido.
 
 

Indización y Resumen de Páginas Web

 
Se encuentran distintas denominaciones que hacen referencia a un mismo concepto, sistemas o lenguajes terminológicos, controlados, documentales de recuperación.
Cada una de los adjetivos que acompañan a sistema o a lenguajes aportan una características: sirven para indicar el contenido de los documentos. Todas estas denominaciones remiten a un conjunto de palabras o términos que tienen como misión sintetizar y representar el contenido de los documentos por parte del profesional de la documentación para recuperarlos de este modo por el usuario.
 
 
 
 
 
Etapas que tienden a solaparse en la práctica:
  • Examen del documento para determinar su contenido. Implica prestar atención al título, resumen, conclusión, párrafos iniciales de los capítulos y ser analizado cuidadosamente por el documentalista.
  • Identificación y selección de los conceptos principales. Se extraen mediante un proceso de análisis intelectual.
  • Selección de los términos de indización. Los conceptos de los documentos pueden ser expresados mediante términos que aparezcan en ellos o mediante otros.
 

Herramientas Lingüísticas en la Documentación

 
LIBRO DE ESTILO



 
Es un libro compuesto por un grupo de criterios, aquí se especifican las normas y la redacción de los documentos, es de uso general o puede ser utilizado por redactores y otras organizaciones. Este instrumento es muy útil ya que permite la uniformidad de los manuales, ya que está compuesto por normas lingüísticas, establecen reglas tales como el uso de la tipografía y la ortografía

Su principal objetivo es dotar a la publicación de unos criterios homogéneos y consistentes a lo largo de las diferentes partes de la publicación y del tiempo y estas son normas para los redactores de la publicación.




La gramática de casos como paradigma de interrogación de los diferentes textos documentales

Lenguaje de Interrogación
 
 
 

Es una herramienta que nos permite buscar y recuperar información empleando los términos o palabras que figuran en los documentos.La recuperación de información es esencialmente una operación de comparación.
 
 
  • Los Operadores Booleanos: Estos operadores trabajan con aritmética de conjuntos: es decir con conjuntos de documentos.

 
  1. O (unión). Nos devuelve aquellos documentos en los que figura al menos uno de los documentos en los que figura al menos uno de los términos u operandos que figuran en la búsqueda.
  2. Y (exclusión). Nos devuelve aquellos documentos que contengan ambos términos de la búsqueda.
  3. NO (exclusión). Nos devuelve aquellos documentos que tengan el primer término de búsqueda, pero no el 2º.

Estos tres operadores son siempre binarios. Deben llevar términos de búsqueda a ambos lados.En el caso de O e Y; el orden en el que escribamos los términos es indiferente. Pero con el operador NO el orden sí influye en el resultado de la búsqueda.El operador XOR nos devolvería los documentos que contienen un término u otro, pero no los que contengan los dos.
 
  • Calificación de campos: son los lenguajes de interrogación que nos ofrecen la posibilidad de delimitar la búsqueda a determinados campos.
 
  • Operadores numéricos: Son los que nos permiten hacer operaciones con valores numéricos y fechas, pero tienen unas posibilidades muy limitadas en una base de datos documental.
  • a) Operadores de comparación: Son muy útiles para manejar fechas en una base de datos. estos son > << = >= <>=
    b) Operadores de subrango: Son operadores que permiten buscar valores comprendidos en un rango y buscar intervalos de fechas.
     
  • Truncamientos: estos nos permiten buscar términos que tengan una misma raíz o una misma terminación, es decir, una cadena de caracteres comunes.
 
 
           Existen dos clases de truncamientos:

           * sirve para cualquier nº de caracteres         ? solo permite un carácter en la sustitución.
 
  • Operadores sintácticos o posicionales:estos nos permiten hacer búsquedas según la posición relativa que ocupen los términos de búsqueda dentro del texto de los documentos
 
 
     
               Dentro de estos operadores están:
          - Operadores de adyacencia (buscan aquellos documentos en los que los términos ocupan posiciones contiguas en el texto.)
         - Operador de distancia (funciona de forma similar solo que nos permite un nº de palabras entre cada término de la búsqueda.)