Metadatos+y+análisis+documental


 * METADATOS Y ANÁLISIS DOCUMENTAL **


 * Por Enrique Juárez Sánchez **

=**Resumen **=

toc Se presenta una perspectiva general e introductoria de los metadatos. El concepto Metadatos es difícil de definir con claridad. El prefijo "meta" significa "sobre", "junto a", "después", lo que sugiere que los metadatos son compañeros de viaje de los datos, sean estos un artículo científico, una fotografía o un sitio web. Los metadatos describen un recurso de información o facilitan el acceso a un recurso de información y es inherente a los metadatos el hecho de hay una asociación de algún tipo entre los elementos de metadatos y el recurso de información al que se refieren. En principio es el mismo tipo de relación que existe entre una ficha catalográfica de una biblioteca y el libro correspondiente. Se hace un breve recorrido por los esquemas e iniciativas conocidas y desarrolladas en distintos ámbitos. Por último se plantea la posible coexistencia de los metadatos con la catalogación debido a que cada una crea un registro de datos que el usuario puede emplear para navegar en un sistema de información con fines de buscar, identificar, seleccionar y obtener la entidad de información que necesita.

**Palabras clave **
Análisis documental, metadatos, recursos de información electrónicos, objeto digital, recuperación de información.

=**Introducción **=

La definición básica y etimológica sobre metadatos es la de considerarlos “datos sobre los datos” o “lo que está más allá de los datos”, desde el punto de vista de la bibliotecología y ciencias de la información, se considera que metadato es toda aquella información descriptiva sobre el contexto, calidad, condición o características de un recurso que tiene la finalidad de facilitar su recuperación, autentificación, evaluación, preservación o interoperabilidad (Senso y De la Rosa, 2003). Asimismo, la //National Informatión Standards Organization// (2004) menciona que los metadatos son información estructurada que describe, explica, localiza, o de lo contrario, hace que sea más fácil de recuperar, utilizar o administrar un recurso de información.

Los metadatos se utilizan de diversas maneras y por diferentes comunidades. Está claro que la comunidad bibliotecaria ha sido la creadora de registros de metadatos en forma de las entradas del catálogo desde el nacimiento mismo de las bibliotecas. Los metadatos se refieren a mucho más que de los registros del catálogo de la biblioteca y la comunidad involucrada en su creación es mucho más amplia que incluye no solo a la comunidad bibliotecaria (Robertson, 2005).

=**Tipos de metadatos **=

Existen tres tipos de metadatos principales: Los metadatos pueden describir los recursos en cualquier nivel de agrupación. Se puede describir una colección, un solo recurso, o una parte componente de un recurso mayor (por ejemplo, una fotografía en un artículo). Los metadatos pueden ser incorporados en un objeto digital o se pueden almacenar por separado. Los metadatos son a menudo incrustados en los documentos HTML y en las cabeceras de los archivos de imagen. El almacenamiento de los metadatos con el objeto que describe asegura que los metadatos no se pierdan, evita los problemas de vinculación entre los datos y metadatos, y ayuda a garantizar que los metadatos y el objeto se actualizarán en conjunto. Sin embargo, no es posible integrar metadatos en algunos tipos de objetos (por ejemplo, artefactos). Además, el almacenamiento de metadatos por separado puede simplificar la gestión de los metadatos mismos y facilitar la búsqueda y recuperación de datos. Por lo tanto, los metadatos normalmente se almacenan en un sistema de base de datos y vinculados a los objetos que describe.
 * Metadatos descriptivos: describen un recurso para fines tales como descripción e identificación. Pueden incluir elementos tales como título, resumen, autor, y palabras clave. Permite a los usuarios la búsqueda y recuperación de información
 * Metadatos estructurales: indican cómo los objetos compuestos se conjuntan, por ejemplo, cómo las páginas están ordenadas en forma de capítulos. Facilitan la navegación y la presentación de los recursos. Proporcionan información sobre la estructura interna de los documentos, así como la relación entre ellos.
 * Metadatos administrativos: establecen información para ayudar a administrar un recurso, como cuándo y cómo fue creado, el archivo tipo y otra información técnica, y quién pueden acceder a este. Facilitan la gestión de conjuntos de recursos. Incluye la gestión de derechos y sobre control de acceso y uso. Hay varios subconjuntos de datos administrativos, dos que a veces aparecen como separados son los siguientes:
 * <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Metadatos de gestión de derechos, que se ocupan de los derechos de propiedad intelectual, y
 * <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Metadatos de preservación, que contienen la información necesaria para almacenar y conservar un recurso.

=**<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Funciones de los metadatos **=

<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Los metadatos tienen como objetivo describir un documento en una colección, proveer de múltiples vías para obtenerlo y poner su contenido en contexto con otra información, tanto en el entorno bibliotecológico, donde se almacenan en catálogos y describen documentos físicos para ayudar a su búsqueda, como en el contexto digital. <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Una razón importante para crear metadatos descriptivos es facilitar la localización y recuperación de información relevante. Los metadatos pueden ayudar a organizar recursos electrónicos, facilitar la interoperabilidad e integración de recursos heredados, ofrecer identificación digital y apoyar su archivo y preservación.

<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">**//Localización de recursos//**
<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Los metadatos tienen las mismas funciones en la localización de recursos, al igual que una buena catalogación hace: <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">• permitiendo que los recursos se encuentren por los criterios pertinentes; <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">• identificando los recursos; <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">• recuperando recursos similares juntos; <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">• distinguiendo los recursos distintos; y  <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">• dando información sobre su ubicación.

<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">**//Organización de recursos electrónicos//**
<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Como el número de recursos basados en Web crece de forma exponencial, los sitios agregadores o portales son cada vez más útil en la organización de enlaces a recursos basados en públicos o temas. Dichas listas pueden construirse como páginas Web estáticas, con los nombres y ubicaciones de los recursos "codificados" en el HTML. Sin embargo, es más eficiente y cada vez más común, la construcción de estas páginas de forma dinámica a partir de metadatos almacenados en bases de datos. Varias herramientas de software se pueden utilizar para extraer de forma automática y formatear la información para las aplicaciones Web.

<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">**//Interoperabilidad//**
<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Describir un recurso con metadatos permite que se entienda, tanto por seres humanos y máquinas en formas que promueven la interoperabilidad. La interoperabilidad es la capacidad de múltiples sistemas con diferentes plataformas de hardware y software, estructuras de datos, e interfaces para el intercambio de datos con una mínima pérdida de contenido y funcionalidad. El uso de esquemas definidos de metadatos, el compartir protocolos de transferencia, y el cruce entre los esquemas, permiten que los recursos de información pueden ser buscado más exhaustivamente a través de la red.

**//<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Identificación digital //**
<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">La mayoría de los esquemas de metadatos incluyen elementos tales como el número estándar para identificar unívocamente la obra u objeto al que los metadatos se refieren. La ubicación de un objeto digital también se puede administrar utilizando un nombre de archivo, URL (//Localizador Uniforme de Recursos//), o algunos identificadores persistentes como un PURL (//URL Persistente//) o DOI (//Identificador Digital de Objetos//). Los identificadores persistentes son preferidos porque los objetos cambian a menudo de lugares, haciendo la URL estándar (y por lo tanto, el registro de metadatos) válido. Además de los elementos actuales que apuntan al objeto, los metadatos se pueden combinar para actuar como un conjunto de datos de identificación o diferenciar un objeto de otros para fines de validación.

<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">**//Archivo y preservación//**
<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">La mayoría de los esfuerzos actuales de metadatos se centran en la localización de recursos de reciente creación. Sin embargo, existe una creciente preocupación de que los recursos digitales no sobrevivan de forma utilizable en un futuro. Información digital es frágil; puede ser dañado o alterada, intencionalmente o no. Puede quedar inutilizable por el cambio de los medios de almacenamiento y la tecnología de hardware y software. El comportamiento de los formatos de migración y tal vez la emulación de hardware y software en el futuro son las estrategias para la superación de estos desafíos.

= **<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Importancia de los metadatos ** =

<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Se pueden destacar varias razones que resaltan la importancia de los sistemas de metadatos: <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">• Incrementan la accesibilidad: la existencia de un conjunto de metadatos que describa correctamente uno o varios objetos aumenta la posibilidad de acceder a ellos. Por otro lado, los metadatos hacen posible la búsqueda de información en múltiples colecciones a la vez. Por medio del mapeo entre sistemas heterogéneos es posible consultar, con una única ecuación de búsqueda, bases de datos que utilicen diferentes sistemas de metadatos para describir sus objetos. <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">• Disminución del tráfico en la Red: al indizar la representación del objeto, y no el objeto en sí, no requiere demasiado ancho de banda para hacer las búsquedas o generar los índices. <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">• Expandir el uso de la información: ya que facilitan la difusión de versiones digitales de un único objeto. <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">• Control de versiones: no sólo en lo que se refiere a gestionar la vida de un objeto, sino también en lo que tiene que ver con su difusión, es decir: generar diferentes metadatos con distintas cantidades de información sobre un mismo objeto con el fin de distribuirla a un público heterogéneo. <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">• Aspectos legales: los metadatos permiten establecer claramente las restricciones de explotación, informar sobre los derechos de autor, control del uso de todo, o una parte, del objeto, método de pago por su disfrute, controlar el acceso a información restringida. <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">• Preservación del objeto original. <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Tal y como afirman Milstead y Feldman (1999), las búsquedas a través del Web son, en la actualidad, un proceso de equiparación (//matching//) entre los términos de la consulta y los del documento. Si esa equiparación no se produce (bien sea por un problema en la forma de definir la petición, bien porque esa información sí se encuentra pero bajo otro concepto que lo describe), el documento no se recuperará. Para estas autoras la utilización de metadatos junto al uso de lenguajes controlados permitiría aumentar la precisión en la mayoría de búsquedas en Internet.

= **<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Estructura de los metadatos ** =

<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Los esquemas de metadatos son conjuntos de elementos de metadatos diseñados para un determinado propósito, tales como la descripción de un determinado tipo de información de los recursos. La definición o significado de los propios elementos se conoce como la semántica del esquema. Los valores dados a los elementos de metadatos son los contenidos. Los esquemas de metadatos en general especifican los nombres de los elementos y su semántica. También se puede optar por especificar las reglas de contenido de cómo debe ser formulado ese contenido (por ejemplo, cómo identificar el título principal), reglas de representación de contenido (por ejemplo, las reglas de capitalización), y los valores permitidos de contenido (por ejemplo, los términos deben ser utilizados de una vocabulario controlada especifico). <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Taylor sostiene que un sistema de metadatos puede clasificarse en tres niveles:
 * 1) <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">El //primero de ellos es determinado por un formato simple, en el cual el metadato// es solamente un dato desestructurado porque se trata del recurso en sí mismo.
 * 2) <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">El //segundo nivel es un formato estructurado,// que incluye un conjunto de elementos formales de metadatos que son creados para darle representatividad y descripción al recurso; es decir, para determinar el nivel de complejidad que deberá ser analizado por la estructura que utilice el metadato;
 * 3) <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">El //tercer nivel// consiste en un formato enriquecido empleado por cualquier sistema de categoría que use la comunidad que utiliza esas descripciones.

**//<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Esquemas e iniciativas de metadatos //**
<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Hay casi tantos esquemas, modelos o estándares de metadatos, como proyectos de creación de sistemas y servicios de información digital en la Web. <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Los estándares de metadatos estandarizan uno o más de los tres principales aspectos de los metadatos: <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">1.-Estructura (como se estructura el metadato – a veces en elementos de información o “propiedades” consistente con un modelo de datos explícito o ontología) <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">2.-Semánticos (que significan los elementos de metadatos o sus propiedades); y  <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">3.- Sintaxis (como los metadatos están escritos/expresados/codificados empleando lenguajes de marcado tales como HTML y XML y valores de datos consistentes con vocabularios designados controlados y esquemas codificados). <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">A continuación se hace una breve descripción de algunas iniciativas o esquemas de metadatos, no es exhaustiva ya que hay muchas, en distintas áreas y contextos. = **<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Bibliotecología y metadatos ** =
 * <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Metadatos de propósito general: aquellos formatos dirigidos a cualquier tipo de información, es decir, destinados a describir cualquier DLO (objetos de información). El ejemplo por excelencia es el Dublin Core, pero también otros formatos como METS (//Metadata Encoding and Transmission Standard//), dirigido a describir cualquier DLO en el seno de una biblioteca digital.
 * <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Metadatos de propósito específico: vinculados a un tipo de información digital o a un dominio temático o comunidad informativa, en particular, como por ejemplo:
 * <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Formatos de meta información para información geográfica: //U.S. Federal Geographic Data Committee// (FGDC). //Content Standards for Digital Geospatial Metadata//, o la norma ISO 19115-2003.
 * <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Formatos para describir información de archivo, como EAD, //Encoded Archival Description.//
 * <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Modelos de metadatos para la información textual de contenido literario y humanístico, como el TEI-Header en la //Text Encoding Initiative.//
 * <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Esquemas de metadatos para imágenes, como VRA-Core de la //Visual Resources Association.//
 * <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Además de todos estos esquemas de metadatos el W3C ha desarrollado RDF, //Resource Description Framework,// una infraestructura para la descripción de recursos en la Web que más que un mero formato de meta información es un "meta modelo de metadatos" que permite codificar distintos esquemas de metadatos y además crear otros vocabularios específicos a través del Lenguaje para la Descripción de Vocabularios RDF o //RDF Schema// (RDFS).

<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">En este apartado se mencionan importantes descubrimientos y aportaciones de Rodríguez-García (2008, 2010), al final este autor concluye sobre la coexistencia de la catalogación bibliográfica y la actividad de los metadatos. <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Por último se presenta esta representación del contraste de la catalogación y los metadatos.
 * <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Referirse a metadatos no se refiere a un contexto completamente nuevo, debido a que el término fue acuñado en la década de los años 60 por Myers con el propósito de nombrar la descripción de un conjunto de datos.
 * <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Hablar de metadatos se propone significar algo muy sencillo, pero a la vez muy complejo, y lo cual está relacionado con esa estructura de la información que describe, explica, identifica, usa y recupera los datos contenidos en un recurso.
 * <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Los bibliotecólogos comúnmente se refieren a ellos como metadatos, un esquema formal de información acerca de un recurso que se aplica a cualquier tipo de objeto digital o no digital, con la finalidad de facilitar su recuperación, autentificación, evaluación, preservación e interoperatividad.
 * <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Ejemplos de metadatos en la bibliotecología hay varios, como es el caso de las ISBD (Normas Internacionales de Descripción Bibliográfica), las RCAA2 y MARC.
 * <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">También se encuentra el Dublin Core, que es un metadato simplificador de elementos descriptivos, es decir, es una propuesta que permite describir cualquier recurso electrónico que por sus características difícilmente puede ser catalogado por las RCAA2.
 * <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">La catalogación está destinada a describir a la entidad que por tradición ha imperado en las bibliotecas, el impreso; en tanto que los metadatos se orientan a la representación de entidades de información digital y recursos electrónicos.

<span style="font-family: 'Times New Roman',serif; font-size: 12pt;"> Fuente: Rodríguez-García AA. (2010). Los contrastes entre las reglas de catalogación y los metadatos. p. 73 <span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Asimismo plantea la coexistencia de la catalogación y la actividad de los metadatos afirmando que desde su punto de vista pueden ser utilizadas al mismo tiempo, siempre y cuando se identifiquen los propósitos que persiguen cada una para organizar la información. No son excluyentes ni independientes una de la otra. Es importante recordar que el propósito final de la catalogación y los metadatos es crear un registro por medio del cual el usuario pueda navegar en un sistema de información para buscar, identificar, seleccionar y obtener la entidad de información que necesita. = **<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Conclusiones ** =

<span style="font-family: 'Times New Roman',serif; font-size: 12pt; text-align: justify;">En el entorno de la biblioteca, los metadatos se utilizan comúnmente para cualquier esquema formal de descripción de recursos, aplicables a cualquier tipo de objeto digital o no-digital. <span style="font-family: 'Times New Roman',serif; font-size: 12pt; text-align: justify;"> Los metadatos son una parte clave de la infraestructura de la información, son necesarios para ayudar a crear orden en el caos de la organización documental, a través de facilitar la descripción, clasificación y organización para ayudar a un almacenamientos más útil de la información. Las fuentes de metadatos, como las propias fuentes de recursos, será de diferente calidad y organización en torno a los distintos propósitos para reflejar los diferentes objetivos y modelos de negocio de los proveedores de información. Las políticas sociales, las prioridades de la organización, y las fuerzas del mercado que dan forma a los espacios de recursos de información, sin duda, crearán oportunidades imprevistas y distintos nichos. <span style="font-family: 'Times New Roman',serif; font-size: 12pt; text-align: justify;"> Los metadatos son fundamentales para garantizar que los recursos sobrevivan y continúen siendo accesibles en el futuro. <span style="font-family: 'Times New Roman',serif; font-size: 12pt; text-align: justify;"> Como concepto y solución para organizar las nuevas entidades de información, los metadatos aportan más cosas que el término catalogación. Esto se debe a que la mayoría de las funciones de los metadatos permiten: resumir el significado de los datos y la búsqueda; determinar cuál es el dato que se necesita; permitir ciertos usos particulares; recuperar y usar una copia del dato; mostrar instrucciones de cómo interpretar un dato; obtener información sobre las condiciones de uso; aportar información acerca de la vida del dato; ofrecer información relativa al propietario/creador, e indicar relaciones con otros recursos y controlar su gestión. <span style="font-family: 'Times New Roman',serif; font-size: 12pt; text-align: justify;"> Es de vital importancia el avance de los profesionales de la información en la adopción de estándares internacionales y aplicables globalmente para la descripción y organización de recursos, tanto impresos como digitales. Asimismo se debe trabajar interdisciplinariamente en la adopción de estos estándares, ya que no sabemos a qué nuevos formatos nos enfrentaremos en un futuro cercano. <span style="font-family: 'Times New Roman',serif; font-size: 12pt; text-align: justify;"> Considero que debemos de dejar atrás los modelos dictatoriales que empleamos los bibliotecólogos para catalogar y clasificar los recursos (entidades) de información, que a veces dificulta la localización de los materiales por parte de los usuarios. Quizá sea la oportunidad de voltear a ver las necesidades y comportamiento de los usuarios mismos en la búsqueda, localización y recuperación de la información que necesita.

= **<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Referencias ** =

<span style="font-family: 'Times New Roman',serif; font-size: 12pt; text-align: justify;">Milstead J, Feldman S. [|Metadata: cataloguing by any other name.] //Online,// 1999, 1:25-31.

<span style="font-family: 'Times New Roman',serif; font-size: 12pt; text-align: justify;">NISO. [|Understanding Metadata]. Bethesda, MD: NISO Press, 2004. <span style="font-family: 'Times New Roman',serif; font-size: 12pt;"> Robertson RJ. [|Metadata quality: implications for library and information science professionals.] //<span style="font-family: 'Times New Roman',serif; font-size: 12pt;">Library Review, //<span style="font-family: 'Times New Roman',serif; font-size: 12pt;"> 2005, 54(4):295-300. <span style="font-family: 'Times New Roman',serif; font-size: 12pt; text-align: justify;">Rodríguez-García AA. [|Las nuevas entidades de información analizadas desde la perspectiva de la organización de la información.] México: UNAM, Centro Universitario de Investigaciones Bibliotecológicas, 2010 <span style="font-family: 'Times New Roman',serif; font-size: 12pt; text-align: justify;">Rodríguez-García AA. [|Sobre la catalogación y la actividad de los metadatos: Aproximaciones a su coexistencia en la era del acceso.] //Biblioteca Universitaria,// 2008, 11(1):31-39 <span style="font-family: 'Times New Roman',serif; font-size: 12pt; text-align: justify;"> Senso JA, de la Rosa Piñero A. [|El concepto de metadato. Algo más que descripción de recursos electrónicos]. //Ci. Inf., Brasília,// 2003, 32(2):95-106.

=**Presentación ppt:**=

[|metadatos ad-juarez 2011pptx.pdf]