Buscador SIB (Form. Inicial)

Guía para publicación de datos primarios sobre biodiversidad

¿CÓMO PUBLICAR A TRAVÉS DEL SIB COLOMBIA EN POCOS PASOS?

Esta guía indica cómo publicar datos de biodiversidad y cómo hacerlos visibles al mundo en la web, a través de redes de información sobre biodiversidad como el  SiB Colombia y la Infraestructura Mundial de Información en Biodiversidad (GBIF por sus siglas en inglés).

El esquema de publicación del SiB Colombia es un servicio gratuito, soportado por la herramienta IPT (Integrated Publishing Toolkit, por sus siglas en Inglés), una aplicación web de código abierto desarrollada por GBIF y que ha sido adoptada por el SiB Colombia para publicar y registrar recursos (conjuntos de datos con sus metadatos asociados).

Para tener en cuenta

Para que usted pueda publicar sus recursos a través del SiB Colombia, debe cumplir con los siguientes criterios:

  • Publicar un conjunto de datos de registros de especies, listados y catálogos taxonómicos, junto con el metadato respectivo (es decir, alguno de los tipos de conjuntos de datos soportados por el IPT).
  • Poseer los derechos para publicar los datos.
  • Estar dispuesto a mantener el conjunto de datos y mejorar su calidad, cuando aplique.
  • Estar dispuesto a proporcionar los metadatos necesarios, para que los usuarios tengan conocimiento del contenido y el contexto del conjunto de datos.

Crear y administrar recursos en el IPT del SiB Colombia

El IPT del SiB Colombia es una herramienta administrada por el Equipo Coordinador del SiB Colombia (EC-SiB), en donde los recursos se publican a nombre la entidad u organización propietaria de los datos. La publicación de datos a través del IPT del SiB Colombia le permitirá subir, estandarizar, publicar y registrar sus datos en 7 pasos, sin las complicaciones de tener que instalar o administrar una aplicación informática (figura 1).

¡Publicar su información a través del IPT del SiB Colombia es fácil!

1Cree su propio recurso en el IPT del SiB Colombia

Para poder crear y administrar su propio recurso usted necesitará una cuenta de usuario (figura 2), la cual puede solicitar al Equipo Coordinador del SiB Colombia (EC-SiB) en sib+ipt@humboldt.org.co.

Figura 2. Vista de la página de entrada al IPT para registro de usuario

Una vez se haya registrado como usuario, ingrese a la parte superior de esta página y haga clic en la pestaña Administrar recursos para acceder a su panel de control (en donde aparecerán todos los conjuntos de datos que usted administrará y publicará). En la parte inferior de esta página usted encontrará la función para crear un nuevo recurso (para instrucciones más detalladas siga el manual del IPT).

Por favor utilice el siguiente formato en minúsculas para dar un nombre corto único para su recurso, de al menos 3 caracteres,sin tíldes, espacios ni puntuación (excepto guiones): sucodigodecoleccion-tipodeconjuntodedatos (por ejemplo, especímenes-acad ó avistamientos-observaciones-vidasilvestre). Este nombre será de utilidad al momento de identificar y acceder a su recurso (a través de internet) y NO podrá ser modificado posteriormente.
Antes de subir su recurso usted puede hacer una prueba: prueba-sucodigodecoleccion (por ejemplo, prueba-fmb). Una vez haya creado su recurso, verá una página de visualización de recursos:

Figura 3. Vista del IPT del SiB Colombia sin recursos publicados

2 Exporte la información

La forma más fácil de publicar sus datos a través del IPT del SiB Colombia, es exportar su base de datos como un archivo de texto delimitado por tabulaciones (por ejemplo: .txt, .tab, .csv). La mayoría de las bases de datos cuentan con una función para la conversión a este tipo de formatos. Si tiene la opción, incluya una fila de encabezado en el archivo que exportará (una primera línea con los nombres de los elementos) pues ésta será de utilidad más adelante. Se recomienda utilizar la codificación de caracteres UTF-8 para su exportación (no utilice ASCII, Macintosh o Windows ANSI) con el fin de evitar malas interpretaciones de los caracteres acentuados (por ejemplo, é, ü).

3 Cargue la información

Diríjase a su página de Vista general de recursos > Datos de origen y haga clic en Seleccionar archivo. Es preferible comprimir el archivo de origen, en formato .zip para mejorar la velocidad de carga de archivos de gran tamaño. Una vez sea cargado el archivo, el IPT hará la descompresión de manera automática. Siga el manual del IPT para obtener instrucciones más detalladas (incluida la opción de utilizar varios archivos de origen o para realizar la carga utilizando una conexión directa a la base de datos).

Una vez la fuente de datos (archivo de origen) ha sido cargada correctamente, se mostrará una página de visualización de los detalles del archivo de origen (véase la pantalla de ejemplo en el manual del IPT), que muestra cómo el IPT ha interpretado su archivo (número de columnas, filas, fila de encabezado, codificación de caracteres, delimitadores, etc.). Haga clic en el botón de vista previa para verificar que todo esté correcto y luego haga clic en guardar.

4 Realice el mapeo con el estándar Darwin Core

Los datos de biodiversidad se publican siguiendo el estándar Darwin Core (DwC), el cual incluye una lista de elementos y definiciones y permite que sus datos sean comprendidos y utilizados por cualquier persona. También permite que facilitadores como GBIF y SiB Colombia integren los datos que usted publica con otros datos, como se hace en el portal de datos de GBIF.

El mapeo de los elementos del estándar DwC es el proceso que usted como administrador de sus recursos debe realizar manualmente y consiste en vincular los elementos de su archivo original con los elementos correspondientes de DwC. Es el paso de mayor complejidad en la publicación de sus datos por dos razones:

  1. la lista de elementos del Darwin Core puede ser abrumadora, de manera que podría resultar difícil seleccionar aquellos que se ajustan a su conjunto de datos, y
  2. en la actualidad, el IPT sólo permite el mapeo de los elementos uno por uno, por lo que la facilidad de vinculación dependerá de la estructura de su base de datos y sobre la viabilidad de exportar en el formato que más se asemeje al estándar DwC.

Contáctenos para asesorarlo y guiarlo a través de los pasos que debe seguir, revisar su mapeo, sugerir elementos y ayudarle a repetir los pasos 2 al 4 hasta que el mapeo sea correcto (sib+ipt@humboldt.org.co).

Puede encontrar mayor información sobre el mapeo del Darwin Core en el manual del IPT. Para más información consulte la guía de referencia del Darwin Core.

5 Ingrese los metadatos

Los metadatos contienen información sobre aspectos como el “quién, qué, dónde, cuándo, por qué y cómo” de un conjunto de datos. Estos permiten a los usuarios encontrar el conjunto de datos publicado por usted y evaluar su relevancia para necesidades particulares de los usuarios, por lo que vale la pena invertir algo de tiempo en elaborarlos.

Vaya a la página de Visualización de recursos > Metadatos y haga clic en Editar para abrir el editor de metadatos. Cualquier información que usted documente aquí, será visible en la página principal y se visualizará junto con los datos que usted publique. Los metadatos se ingresan en el Perfil de Metadatos de GBIF (GMP por sus siglas en Inglés), un perfil basado en el estándar de Lenguaje de Metadatos Ecológicos (EML por sus siglas en Inglés), y también pueden ser descargados como un archivo con formato de texto enriquecido (RTF). Este archivo puede servir como un manuscrito borrador  de un “artículo de datos” (o Data Paper) y puede ser sometido en alguna revista de libre acceso como algunas de las publicaciones del grupo Pensoft (i.e. Phytokeys, Zookeys, Biorisk, Neobiota, Mycokeys o Nature Conservation).

Encuentre en el manual del IPT, instrucciones más detalladas sobre la edición de metadatos y utilice a manera de ejemplo uno de los conjuntos de datos actualmente publicados (IPT del SiB Colombia).

6 Publique su información

En esta etapa, usted está listo para publicar. Diríjase a la página de Visualización de recursos > Versión publicada y haga clic en Publicar. Ahora, el IPT generará sus datos bajo el estándar DwC, los vinculará con el metadato y los presentará como un archivo comprimido llamado "Archivo Darwin Core". Consulte el manual del IPT para mayor información.

Al regresar a la página de visualización de recursos > Versión publicada, usted podrá ver los detalles de su primer conjunto de datos publicado, incluyendo la fecha de publicación y el número de la versión. Dado que el conjunto de datos se publica como privado, lo único que resta es hacer clic en Visibilidad > Público para que los datos queden disponibles para todo público. Por favor no haga esta operación con el conjunto de datos de prueba.

Si ha llegado a este punto con éxito, significa que usted acaba de publicar su conjunto de datos a través del IPT SiB Colombia. Su recurso figurará ahora en el portal de datos del SiB Colombia, donde podrá compartirlo y vincularse con él a través del hipervínculo: http://ipt.sibcolombia.net/sib/ En este momento, el EC-SiB mencionará su participación como nuevo publicador de datos a través de la página del SiB Colombia; este también sería un buen momento para que notifique a las redes regionales o temáticas con las que usted está involucrado.

Recuerde que su conjunto de datos publicados es una fotografía estática de los datos y no será modificada hasta que usted cargue una nueva versión del archivo y nuevamente haga clic en Publicar. Este procedimiento tiene la ventaja de hacer que su conjunto de datos esté permanentemente disponible (pues no requiere una conexión a internet directa con su base de datos) y de poder compartir fácilmente sus datos (por ejemplo, enviando por correo electrónico el Archivo Darwin Core a un colega). Adicionalmente, le permitirá controlar el proceso de publicación con mayor precisión: versión 1, versión 2, etc. y los usuarios serán informados acerca de qué tan recientes son sus datos (de acuerdo a la fecha de última publicación).

7 Regístrese en GBIF

Aún cuando en este punto el conjunto de datos ya está disponible para su consulta en internet, recomendamos registrar los recursos en GBIF para darles una mayor visibilidad. Esto permitirá que sus datos estén disponibles para una audiencia internacional a través del portal de datos de GBIF y garantizará la plena atribución de derechos a su institución. Registrarse implica que usted está de acuerdo con el Acuerdo de Intercambio de Datos de GBIF.

Contáctenos al correo sib+ipt@humboldt.org.co para registrar su institución (si aún no lo ha hecho) y su conjunto de datos, y para que podamos informarle cuando su conjunto de datos aparezca en el portal de datos de GBIF.

Este no es el único mecanismo que ofrecemos para publicar sus recursos, pero consideramos que es el más conveniente por ser el que ofrece el mejor balance costo-beneficio en términos de ahorro de tiempo y personal.

Para mayor información sobre esquema de gestión del SiB Colombia, visite la sección ¿Cómo funcionamos? en nuestro portal Web.
Recuerde que su conjunto de datos publicados, es una fotografía estática de los datos y no será modificada hasta que usted cargue una nueva versión del archivo y nuevamente haga clic en Publicar. Este procedimiento tiene la ventaja de hacer que su conjunto de datos esté permanentemente disponible (pues no requiere una conexión a internet directa con su base de datos) y de poder compartir fácilmente sus datos (por ejemplo, enviando por correo electrónico el Archivo Darwin Core a un colega). Adicionalmente, le permitirá controlar el proceso de publicación con mayor precisión: versión 1, versión 2, etc. y los usuarios serán informados acerca de qué tan recientes son sus datos (de acuerdo a la fecha de última publicación).

Adaptado de 7-step guide to data publication de Canadensys

OTROS ESQUEMAS DE PUBLICACIÓN

Crear y administrar su propio IPT en la infraestructura del SiB Colombia

1 Cree su propio IPT

Para poder crear y administrar una instancia IPT que estará alojada en la infraestructura informática del SiB Colombia, usted deberá solicitar la creación del IPT, junto con la información de contacto de su institución: nombre, descripción, página web, dirección, ciudad, correo electrónico, teléfono, datos del contacto primario administrativo y datos del contacto primario técnico. Si alguna otra institución (o instituciones) va a publicar datos sobre esta misma instancia IPT, es necesario que nos proporcione la información de contacto correspondiente. Adicionalmente, usted necesitará una cuenta de administrador (figura 4), la cual puede solicitar al EC-SiB (sib+ipt@humboldt.org.co).

Figura 4. Vista de la página de entrada a un IPT regional para registro de usuario

Su IPT figurará ahora en el portal de datos del SiB Colombia, desde donde podrá compartirlo y vincularse con él a través de un hipervínculo (URL de su IPT institucional). Adicionalmente usted podrá personalizar su IPT con el logo y/o colores de su institución.

2 Publique sus recursos en su propio IPT

El administrador del IPT institucional, será el encargado de asignar y crear los usuarios para los diferentes recursos (cada institución es libre de asignar tantos usuarios como recursos sea necesario, con al menos un usuario por recurso). Recuerde que en su IPT institucional usted puede alojar recursos de otras entidades, solo es necesario que el administrador del IPT cree el usuario correspondiente para el recurso de la(s) entidad(es) alojada(s).

A continuación, usted puede proceder con los pasos 2 a 7 planteados en la sección A.

Crear su propio IPT en su propia infraestructura informática

Para tener una instalación del IPT en su propia infraestructura, se requieren ciertos recursos informáticos para su instalación y un profesional en sistemas con la capacidad de instalar aplicaciones Web, ya que es necesario configurar un servidor con las siguientes características:

1 Conexión a internet

El IPT está diseñado bajo el supuesto de que el servidor desde el cual se ejecuta, cuenta con una conexión constante a internet. Aunque muchas de las funciones del IPT trabajan incluso cuando no hay conexión, algunos aspectos del IPT (registro en GBIF, instalación de una extensión, vocabularios controlados, y bases de datos externas para datos de origen), requieren de comunicación con recursos externos en internet. Desde la perspectiva de la administración del IPT, la velocidad de la conexión a internet sólo afecta a este tipo de comunicaciones. El acceso a la aplicación web del IPT y sus servicios por fuera de una intranet local también requiere conectividad constante, y una conexión lenta puede tener efectos adversos sobre estos aspectos, sobre todo cuando se transfieran conjuntos de datos de gran tamaño.

2 URL estable

A pesar de que puede ser utilizado simplemente como una herramienta para generar archivos Darwin Core Archive (ver http://rs.tdwg.org/dwc/terms/guides/text/), el IPT fue diseñado como una aplicación y un servicio web de descubrimiento y acceso. Para apoyar esta funcionalidad, el servidor en el que está instalado el IPT debe facilitar el acceso a las aplicaciones y servicios a través de una URL estable.

3 Memoria

El servidor que aloja la instalación del IPT debe tener como mínimo, 256 MB de memoria RAM disponibles para la aplicación.

4 Espacio en disco

El espacio requerido por el IPT es menor a 20 MB y el contenido del directorio de datos del IPT después de la instalación, requiere menos de 1 MB de almacenamiento en disco. No obstante, el contenido de este directorio crecerá a medida que se creen recursos, y requerirá un espacio equivalente al tamaño de los archivos o tablas que contienen los conjuntos de datos importados. Una estimación razonable para el tamaño de un conjunto de datos relativamente nutrido, es de 1 KB por registro. El uso normal del IPT anexa información a los archivos de registro, que crecerán con el tiempo, pero que generalmente requieren un mínimo espacio en disco.

5 Java

El servidor que aloja el IPT debe tener una versión de Java 5 o más reciente, instalada y en funcionamiento antes de la instalación del IPT.

6 Contenedor de Servlets

La aplicación IPT viene empaquetada con Jetty y por lo tanto no requiere un contenedor de servlets adicional. No obstante, el IPT puede ser desplegado en otro contenedor de servlets (por ejemplo Tomcat) que ya esté en uso. Información acerca de cómo utilizar diferentes contenedores de servlets con el IPT se puede encontrar en http://code.google.com/p/gbif-providertoolkit/wiki/IPTServerPreparation.

En el caso de que su institución no cumpla con estos requerimientos lo invitamos a que cree su IPT en la infraestructura informática del SiB Colombia o que aloje sus recursos en el IPT del SiB Colombia.

7 Publique sus recursos en su propio IPT

Si su institución cumple con los requerimientos mencionados usted puede crear y administrar una instancia IPT que estará alojado en su propia infraestructura informática. Contáctenos para asesorarlo y guiarlo a través de los pasos que debe seguir para la creación de su IPT (sib+ipt@humboldt.org.co), y para revisar su mapeo y ayudarle con los 7 pasos de la primera sección de este documento.