Información
domingo, 4 de agosto de 2013
domingo, 17 de marzo de 2013
Indización y Representación de Distintos Formatos Documentales
·
Indización libre: la identificación se
realiza a través de una lista o conjunto abierto de términos.
· Indización controlada: la identificación se
realiza por medio de una lista o conjunto cerrado de términos.
Si elegimos una indización controlada, hay que
destacar las siguientes herramientas:
- Vocabulario controlado: es una lista de vocablos que tienen asignado un significado concreto.
- Taxonomía: es una lista organizada en forma de árbol, de manera jerárquica partiendo de lo general a lo específico.
- Tesauro: es una taxonomía con algunos datos añadidos como términos relacionados, términos no preferentes y preferentes.
- Mapas temáticos: es una manera formal para declarar un conjunto de temas y proveer enlaces a documentos o nodos de subdocumentos.
- Ontología: se trata de tesauros más avanzados que representan la conceptualización de un determinado dominio del conocimiento por medio de estructuras semánticas.
Modelos de Representación y Recuperacón de Imágenes
Situación actual de la recuperación de imágenes es el internet, como medio generalizado de acceso a la información gráfica.
Implicaciones desde la perspectiva de nuevos diseños de sistemas:
- Mayor desarrollo de prototipos avanzados de recuperación.
- Amplia tipología de usuarios.
- Usuario activo.
- Sistemas que conjuguen facilidad de uso y potencia en la recuperación.
- Entorno de descubrimiento.
- Distintos niveles de descripción de las imágenes y distintas posibilidades de búsqueda.
SARI(Sistema automatizado de recuperación de imágenes) esta combinado por herramientas, documentos y procedimientos
de consulta, que hacen posible la búsqueda de imágenes
fotográficas incorporadas en un fondo documental; este es el más utilizado, ya que se basa en la fusion
de un programa de gestión de bases de datos documentales y de un sistema de
gestión de imágenes digitales.
Consta de dos módulos:
- Módulo de entrada de información. Se suele almacenar distintos tamaños de una misma imagen.
- Módulo de consulta y recuperación de información.
Fruto de estas dos formas de representación y recuperación tenemos las
siguientes variantes en modelos de SARI:
- LL (representación y recuperación conceptuales) Emplean sistemas de gestión documental con soporte de imágenes digitales -un ejemplo sería Inmagic. Son los más ampliamente conocidos y utilizado
- VV (representación y recuperación visuales) Permiten la representación automática de los atributos visuales de la imagen y la recuperación a partir de esos criterios
- LV (representación conceptual y recuperación visual) Representaciones
textuales de las imágenes, pero con posibilidad de recuperar a partir de
las propias imágenes (por ejemplo, mediante un tesauro visual)
- VL (representación visual y recuperación conceptual) Intentan superar dos limitaciones importantes de los modelos descritos hasta ahora: La restricción de las posibilidades expresivas del usuario al realizar la consulta, por parte de los sistemas visuales. La dificultad para expresar una parte importante de la significación de la imagen durante el proceso de representación, por parte de los sistemas lingüísticos.
- sistemas mixtos. Integran varios de los modelos de recuperación
descritos. Su tecnología es la más adecuada para las necesidades de
recuperación de un fondo gráfico voluminoso digitalizado.
sábado, 16 de marzo de 2013
Catalogación y Citas Bibliográfica de Páginas Web
Hoy en dia la informacion ha crecido en el espacio del internet, de manera que se hace frecuente que la mayoria de los trabajo se realicen en base de la informacion que reposa en ella. es por eso que existe un modelo del como se debe realizar.
- existe un responsable o ente corporativo
- titulo
- editor
- URL
- fecha de consulta
Morillo Aponte, Rosa Virginia
Introducción a los casos clínicos de la beneficencia.- La Costa;
Ortiso [2010] (http://Otiso.com/Talleres/casoclinico,asp?idCaso=88guiasClinicas=si)
Concultado el 10/03/2013
|
Normalización del Contenido en Metadatos
la normalizacion de los metadatos, no son las normas sino los estandares que utilizan los usuarios, pero para esto no se tiene un modelo; una de las normas mas utilizadas son las internacionales por la ISO, esta cuenta con un grupo el DATA management, este se ocupa de organizar todos los componentes para favorecer el intercambio de informacion.
uno de los modelos mas utilizados son:
- Text Encoding Initiative: es un consorcio que desarrolla y mantiene un estándar para la representación de textos en formato digital. Su principal entregable es un conjunto de directrices que especifican métodos de codificación de textos legibles por máquina, sobre todo en las humanidades, las ciencias sociales y la lingüística. Desde 1994, las Normas del TEI han sido ampliamente utilizados por las bibliotecas, los museos, editores y especialistas individuales para presentar textos para la investigación en línea, enseñanza y conservación.
- El Marco de Descripción de Recursos (Resource Description Framework): este es un modelo que se ha sido desarrollado por W3C, este modleo trabaja segun tres trazas, modelo de datos, sintaxis y el esquema. estos también se ofrecen para realzar recomendaciones y especificaciones a definiciónes y desarrollo de vocabularios.
Tipologías de Páginas Web
Indización y Resumen de Páginas Web
Se encuentran
distintas denominaciones que hacen referencia a un mismo concepto, sistemas o
lenguajes terminológicos, controlados, documentales de recuperación.
Cada una
de los adjetivos que acompañan a sistema o a lenguajes aportan una
características: sirven para indicar el contenido de los documentos. Todas
estas denominaciones remiten a un conjunto de palabras o términos que tienen
como misión sintetizar y representar el contenido de los documentos por parte
del profesional de la documentación para recuperarlos de este modo por el
usuario.
Etapas que
tienden a solaparse en la práctica:
- Examen del documento para determinar su contenido. Implica prestar atención al título, resumen, conclusión, párrafos iniciales de los capítulos y ser analizado cuidadosamente por el documentalista.
- Identificación y selección de los conceptos principales. Se extraen mediante un proceso de análisis intelectual.
- Selección de los términos de indización. Los conceptos de los documentos pueden ser expresados mediante términos que aparezcan en ellos o mediante otros.
Herramientas Lingüísticas en la Documentación
LIBRO DE ESTILO
Es un libro compuesto por un grupo de criterios,
aquí se especifican las normas y la redacción de los documentos, es de uso
general o puede ser utilizado por redactores y otras organizaciones. Este
instrumento es muy útil ya que permite la uniformidad de los manuales, ya que está
compuesto por normas lingüísticas, establecen reglas tales como el uso de la
tipografía y la ortografía
Su
principal objetivo es dotar a la publicación de unos criterios homogéneos y
consistentes a lo largo de las diferentes partes de la publicación y del tiempo
y estas son normas para los redactores de la publicación.
La gramática de casos como paradigma de interrogación de los diferentes textos documentales
Lenguaje de Interrogación
- Los Operadores Booleanos: Estos operadores trabajan con aritmética de conjuntos: es decir con conjuntos de documentos.
- O (unión). Nos devuelve aquellos documentos en los que figura al menos uno de los documentos en los que figura al menos uno de los términos u operandos que figuran en la búsqueda.
- Y (exclusión). Nos devuelve aquellos documentos que contengan ambos términos de la búsqueda.
- NO (exclusión). Nos devuelve aquellos documentos que tengan el primer término de búsqueda, pero no el 2º.
Estos tres
operadores son siempre binarios. Deben llevar términos de búsqueda a ambos
lados.En el caso de O e
Y; el orden en el que escribamos los términos es indiferente. Pero con el
operador NO el orden sí influye en el resultado de la búsqueda.El operador XOR
nos devolvería los documentos que contienen un término u otro, pero no los que
contengan los dos.
- Calificación de campos: son los lenguajes de interrogación que nos ofrecen la posibilidad de delimitar la búsqueda a determinados campos.
- Operadores numéricos: Son los que nos permiten hacer operaciones con valores numéricos y fechas, pero tienen unas posibilidades muy limitadas en una base de datos documental.
a) Operadores de
comparación: Son muy útiles para
manejar fechas en una base de datos. estos son > << = >= <>=
b) Operadores de
subrango: Son operadores
que permiten buscar valores comprendidos en un rango y buscar intervalos de
fechas.
- Truncamientos: estos nos permiten buscar términos que tengan una misma raíz o una misma terminación, es decir, una cadena de caracteres comunes.
Existen dos clases de truncamientos:
* sirve para
cualquier nº de caracteres ? solo permite un
carácter en la sustitución.
- Operadores sintácticos o posicionales:estos nos permiten hacer búsquedas según la posición relativa que ocupen los términos de búsqueda dentro del texto de los documentos
Dentro de estos
operadores están:
- Operadores de
adyacencia (buscan aquellos documentos en los que los términos ocupan
posiciones contiguas en el texto.)
- Operador de
distancia (funciona de forma similar solo que nos permite un nº de palabras
entre cada término de la búsqueda.)
Suscribirse a:
Entradas (Atom)