NOAA ERDDAP
Acceso más fácil a los datos científicos
acceso | ?    
Traído a usted por NOAA NMFS SWFSC ERD    

ERDDAP > Información

ERDDAP es un servidor de datos que le brinda una forma sencilla y consistente de descargar subconjuntos de conjuntos de datos científicos en formatos de archivo comunes y crear gráficos y mapas.

Tabla de contenido

Los problemas que ERDDAP intenta resolver

Sin ERDDAP, cuando una persona (o un programa de computadora) busca en Internet un tipo específico de datos científicos (por ejemplo, datos satelitales de temperatura de la superficie del mar), surgen problemas...

Soluciones de ERDDAP

DAP ? ¿ OPeNDAP ? DODS ? ERDDAP ? ¿Cual es la diferencia? Mi entendimiento (el de Bob) es:

DODS (Sistema de Datos Oceanográficos Distribuidos) se creó en la década de 1990, antes de que existiera http: (!). El sistema DODS creó y utilizó el protocolo DODS: en Internet. Cuando apareció HTTP y tuvo tanto éxito, cambiaron de dods: a http:.

En algún momento, se dieron cuenta de que el sistema era útil para algo más que datos oceanográficos. Entonces abandonaron ese nombre DODS (aunque sigue vivo en algún código) y formaron una pequeña organización llamada OPeNDAP  (external link) y escribió la especificación DAP (Protocolo de acceso a datos)  (external link), que estandariza el formato de las solicitudes de metadatos y/o datos, y las respuestas con los metadatos y/o datos. OPeNDAP (la organización) todavía administra DAP (la especificación) y es el autor de Hyrax (el servidor de datos al que a menudo se hace referencia erróneamente como OPeNDAP ).

Hyrax, THREDDS, GRADS, ERDDAP y otros son servidores de datos (software) que implementan DAP . Cada uno de ellos implementa un subconjunto de DAP pero hace otras cosas de manera muy diferente.

ERDDAP utiliza código (en el directorio "dods") (en realidad escrito por Jake Hamby en NASA JPL) para algunas funciones de lectura de datos de servidores DAP externos. ERDDAP utiliza su propio código para escribir respuestas DAP .
 

¿Es ERDDAP una solución a los problemas de distribución y acceso a datos de todos?
No. ERDDAP intenta encontrar un punto óptimo que sea una solución realmente buena para la mayoría de los problemas de distribución de datos que enfrentamos. ERDDAP adopta un enfoque de middleware: puede obtener datos de muchos tipos diferentes de servidores de datos remotos y puede proporcionarlos a los clientes en muchos formatos de archivos diferentes. Está diseñado para ser una solución agnóstica que busca hacer interoperables otros servidores de datos (OPeNDAP, SOS, OBIS, WMS, ...). ¿Existe un servidor de datos perfecto que satisfaga perfectamente las necesidades de todos? No lo creemos. E incluso si cree que lo hay o lo habrá, pasará mucho tiempo antes de que todos cambien a él, si es que alguna vez lo hacen. Hasta entonces, ERDDAP está disponible ahora mismo para hacer que otros servidores de datos sean interoperables y para servir datos ahora mismo.

ERDDAP puede manejar muchos o la mayoría de los conjuntos de datos tal como están, pero no todos. No es que los conjuntos de datos restantes (por ejemplo, los datos del modelo que utilizan una proyección de esfera cúbica) no sean importantes. Es sólo que el objetivo de ERDDAP de devolver datos en formatos de archivo comunes (algunos de los cuales son bastante simples) excluye una estructura de datos interna más compleja. Los grupos de investigadores que trabajan con estructuras de datos más complejas a menudo ya cuentan con servidores de datos especializados y software de cliente especializado que se adaptan a las necesidades de su comunidad. ERDDAP, como servidor de datos de propósito general, no intenta competir con estos servidores de datos especializados. Están personalizados según las necesidades de su comunidad y hacen un gran trabajo. Sin embargo, esos conjuntos de datos a menudo sólo son "comprendidos" por el software especializado de esa comunidad.

Una solución alternativa para conjuntos de datos complejos: ERDDAP tiene una manera de manejar conjuntos de datos complejos que no puede manejar directamente. Como una base de datos relacional  (external link) puede almacenar un conjunto de datos complejo utilizando solo una estructura de datos simple (una tabla), ERDDAP puede servir los datos de conjuntos de datos más complejos dividiendo el conjunto de datos de origen en unos pocos conjuntos de datos ERDDAP, cada uno con estructuras de datos simples y similares. Por ejemplo, algunos conjuntos de datos de modelos ambientales cuadriculados se pueden almacenar en ERDDAP colocando las variables de la superficie del mar ([tiempo][latitud][longitud]) en un conjunto de datos ERDDAP y colocando las variables con altitud ([tiempo][altitud][ latitud][longitud]) en otro conjunto de datos ERDDAP . Sabemos que esto no es ideal, pero es necesario permitir que ERDDAP devuelva datos en formatos de archivo comunes (algunos de los cuales son bastante simples).

Otro enfoque para tratar con conjuntos de datos complejos (por ejemplo, para datos de modelos que utilizan una proyección de esfera cúbica) es ofrecer también una versión reproyectada del conjunto de datos ([tiempo][altitud][latitud][longitud]) con la que ERDDAP pueda trabajar fácilmente. Estas estructuras de datos más simples no están destinadas a reemplazar las estructuras de datos originales, pero pueden ser una forma útil de distribuir los datos a una audiencia más amplia.
 

¿Qué tan sostenible es el proyecto ERDDAP ?
ERDDAP es muy sostenible.
Algunas personas se sorprenden y decepcionan al saber que ERDDAP es desarrollado principalmente por una sola persona (era Bob Simons, ahora Chris John). [Por cierto, las opiniones en esta página web son mis opiniones personales y no reflejan necesariamente ninguna posición del Gobierno o de la National Oceanic and Atmospheric Administration .] Temen que si me pasa algo, será el fin de ERDDAP . Eso simplemente no es cierto. El posicionamiento de ERDDAP para la sostenibilidad a largo plazo es excelente y cercano a lo mejor que podría ser.

Sí, soy el desarrollador principal de ERDDAP . Soy un empleado federal totalmente financiado. Mi financiación no es dinero "blando", por lo que no recibo ni dependo de subvenciones. Dedico más de la mitad de mi tiempo a desarrollar ERDDAP . El resto de mi tiempo lo dedico a gestionar conjuntos de datos. Ese trabajo es útil para ERDDAP porque necesito trabajar con conjuntos de datos reales para saber en detalle qué debe hacer ERDDAP . Mis jefes apoyan plenamente mi trabajo en ERDDAP porque hace aquello para lo que me contrataron: facilitar que los científicos pesqueros (principalmente, pero en realidad todos) obtengan datos científicos de diversas fuentes.

Lo milagroso del software es que duplicarlo no cuesta nada. Entonces, para hacer mi trabajo, escribo ERDDAP para usarlo en ERD . Creo que es la mejor manera posible de hacer mi trabajo. Esa sola razón justifica el gasto de desarrollar ERDDAP . (Creo que se podría demostrar que ERDDAP ha ahorrado más tiempo a los científicos NOAA que el que yo he dedicado a desarrollar ERDDAP . Tiempo = Dinero). Pero el beneficio adicional es que cualquier otra organización puede descargar, instalar y usar ERDDAP de forma gratuita para distribuir sus Datos científicos.

Más de 90 organizaciones en al menos 14 países utilizan ERDDAP . Quizás exista algo llamado un almuerzo gratis.

ERDDAP es un programa Java . El código fuente de cada versión está en GitHub.  (external link), el sistema más utilizado para proyectos de software colaborativo. Créditos Los créditos ERDDAP ahora están disponibles en una página separada . Espero que otros contribuyan con código en el futuro. Si me pasa algo, mis jefes contratarán un reemplazo con el objetivo específico de que continúe con el desarrollo de ERDDAP . Además, intento escribir código muy limpio. Escribo comentarios Java Doc. Escribo comentarios en el código. Elegí los nombres de las variables con cuidado. Sigo las pautas de formato Java . Todo esto es un esfuerzo por hacer el código más legible, para otros programadores que quieran entenderlo y/o cambiarlo, y para mí, porque, en uno o dos años, habré olvidado los detalles de cómo y por qué se creó el código. fue escrito como estaba. Un código limpio con buenos comentarios facilita mi trabajo continuo en ERDDAP, por lo que tengo un gran incentivo para escribir código limpio con buenos comentarios.

Pero todas mis respuestas hasta ahora no son muy importantes. Sólo una cosa es realmente importante. Sólo una cosa garantiza la sostenibilidad de ERDDAP o de cualquier proyecto de software: que ERDDAP sea Software Libre y de Código Abierto (FOSS)  (external link) . Específicamente, ERDDAP utiliza licencias de software compatibles con Apache.  (external link), para que cualquiera pueda hacer lo que quiera con el código.

¿Por qué es eso importante? Se podría pensar que el software estará disponible de forma fiable en el futuro porque lo respalda una gran empresa. Pero Google, por ejemplo, ha interrumpido numerosos proyectos (aquí hay una lista  (external link)). No quiero elegir a Google porque realmente me gusta y ellos financian una gran cantidad de excelentes proyectos de código abierto. Microsoft ha descontinuado proyectos. Apple ha descontinuado proyectos. ... La cuestión es que el simple hecho de contar con el respaldo de una gran empresa no garantiza que el proyecto continúe. Los usuarios de ese software no tienen suerte, a menos que el software sea (y por lo tanto siempre sea) software gratuito y de código abierto (FOSS). Luego, siempre que haya interés por parte de un solo desarrollador, el proyecto puede y seguirá evolucionando. FOSS es una póliza de seguro. De hecho, FOSS es la única póliza de seguro, la única garantía que importa. FOSS garantiza que siempre haya un camino a seguir para el software. Ese es un derecho que nadie podrá quitarnos jamás.

También se podría pensar que el software que cuenta con un gran equipo de desarrolladores será más sostenible que el software con un desarrollador principal. Pero muchos desarrolladores suelen necesitar mucha financiación. Conozco un proyecto famoso, razonablemente grande, con 10 desarrolladores (no los avergonzaré nombrándolos) que está en constante peligro de detener el proyecto porque no tienen suficiente financiación. Dependen de subvenciones. Siempre tienen déficit. Su patrón siempre los ha rescatado en el último momento, pero se está cansando mucho de rescatarlos. Entonces, si no pueden recaudar un millón de dólares al año en subvenciones (o el patrocinador se cansa demasiado de rescatarlos), dejarán de hacerlo. Y el grupo no concibe tener menos de 10 desarrolladores. Cada desarrollador tiene un papel que desempeñar en su grupo. A la luz de esto, me parece que es una gran señal de que ERDDAP puede ser, y es, desarrollado activamente por un solo desarrollador principal (que está totalmente financiado) con la asistencia no oficial de algunos otros. De hecho, sería una mala señal si ERDDAP requiriera varios desarrolladores. El hecho de que ERDDAP tenga un solo desarrollador principal significa que no es una tarea enorme que requiera una financiación masiva y continua; es una tarea relativamente pequeña que requiere mínimo esfuerzo y financiación. Eso es más sostenible, no menos.

Se podría pensar que contratar una empresa contratista para escribir software es una buena idea. Por una tarifa, proporcionarán desarrolladores y prometerán continuidad (lo cual es bueno a menos o hasta que cierren el negocio). Pero también te tienen en un aprieto: debes pagarles lo que te piden o no habrá más desarrollo, a menos que el software sea FOSS y sólo les pagues por trabajar en el código. Con FOSS, siempre tienes opciones sobre cómo seguir adelante. Debido a que ERDDAP es FOSS, los contratistas siempre son una buena opción para usted o cualquier persona con respecto a ERDDAP : si algo me sucede a mí (el único desarrollador principal), o si no tengo tiempo para hacer algún cambio que usted desee, o yo te jubilas y no te gusta el trabajo de mi sustituto, siempre puedes contratar una empresa contratista para que haga los cambios que quieras (o hacerlos tú mismo).

En resumen, ERDDAP tiene las dos características de sostenibilidad que más importan:

  1. ERDDAP es un proyecto pequeño (lo suficientemente pequeño como para ser manejado por un desarrollador principal con la asistencia no oficial de algunos otros), por lo que no requiere recursos masivos.
  2. ERDDAP es un software gratuito y de código abierto, por lo que nadie podrá impedirle a usted ni a nadie trabajar en ERDDAP .
No puedo pensar en una situación mejor. Espero que eso alivie cualquier temor que usted (o cualquier otra persona) haya tenido sobre la sostenibilidad del ERDDAP . Si escucha a personas cuestionar o desalentar el uso de ERDDAP porque solo hay un desarrollador principal, aclaréelos señalándoles la discusión anterior en esta URL: https://coastwatch.pfeg.noaa.gov/erddap/information. html#sostenible .
 

Cómo citar un conjunto de datos en un artículo
Es importante que los lectores sepan cómo obtuvo los datos que utilizó en su artículo. Para cada conjunto de datos que utilizó, consulte los metadatos del conjunto de datos en la sección Estructura de atributos del conjunto de datos en la parte inferior de la página .html del conjunto de datos, por ejemplo,
https://coastwatch.pfeg.noaa.gov/erddap/griddap/jplMU RSS T41.html . Los metadatos a veces incluyen un formato de cita requerido o sugerido para el conjunto de datos. Los metadatos de la "licencia" a veces enumeran restricciones sobre el uso de los datos.

Para generar una cita para un conjunto de datos:
Si piensa en el conjunto de datos como un artículo científico, puede generar una cita basada en el autor (consulte los metadatos "nombre_creador" o "institution" ), la fecha en que descargó los datos, el título (consulte los metadatos "title" ) y el editor (consulte los metadatos "nombre_editor"). Si es posible, incluya las URL específicas utilizadas para descargar los datos. Si los metadatos del conjunto de datos incluyen un Identificador de objeto digital (DOI )  (external link), inclúyalo en la cita que cree.
 

Cómo citar ERDDAP en un artículo
Si desea citar el propio ERDDAP en un artículo científico, utilice algo como
Simons, RA y Chris John. 2022. ERDDAP . https://coastwatch.pfeg.noaa.gov/erddap. Monterey, CA: NOAA / NMFS / SWFSC / ERD .

¿Qué significan las siglas "ERDDAP"?
"ERDDAP" solía ser un acrónimo, pero superó esa descripción original. Ahora, piense en ello como un nombre, no como un acrónimo.
 

Directrices para sistemas de distribución de datos
Las opiniones de Bob sobre el diseño y evaluación de sistemas de distribución de datos se pueden encontrar aquí .
 

Puede configurar su propio servidor ERDDAP y servir sus propios datos.

Contáctenos

Si tiene preguntas, sugerencias o comentarios sobre ERDDAP en general (no sobre esta instalación ERDDAP específica), envíe un correo electrónico a erd dot data at noaa dot gov e incluya la URL ERDDAP directamente relacionada con su pregunta o comentario.
O puede unirse al grupo/lista de correo de Google ERDDAP visitando https://groups.google.com/forum/#!forum/erddap  (external link) y haciendo clic en "Solicitar membresía". Una vez que sea miembro, puede publicar su pregunta allí o buscar para ver si la pregunta ya ha sido formulada y respondida.

DESCARGO DE RESPONSABILIDAD: Las opiniones contenidas en esta página web son opiniones personales de Bob Simons y no reflejan necesariamente ninguna posición del Gobierno o de la National Oceanic and Atmospheric Administration .


 
Translated by Google ?
ERDDAP, Versión 2.30.0
Descargos de responsabilidad | Política de privacidad | Contacto