Como funciona

Bionomía es desarrollada y mantenida por David P. Shorthouse utilizando datos de especímenes descargados periódicamente de la Global Biodiversity Information Facility (GBIF) y autenticación proporcionada por ORCID. Fue lanzada en agosto de 2018 como una postulación al Ebbe Nielsen Challenge. Desde entonces, se han integrado identificadores de Wikidata para capturar los nombres y las fechas de nacimiento y de muerte de biólogos fallecidos para ayudar a maximizar la integración de datos posteriores, el envolvimiento y como un medio para descubrir errores o inconsistencias en los datos de los especímenes de historia natural.

Trabajo interno

Los nombres de los recolectores e identificadores se analizan y limpian utilizando el método de prueba dwc_agent gema de ruby disponible gratis para su integración en otros proyectos. La similitud de los nombres de las personas se califica utilizando un método de teoría de grafos descrito por R.D.M. Page e incorporado como método en la gema dwc_agent. Estos puntajes se utilizan para ayudar a expandir la búsqueda de especímenes candidatos, presentados en orden de mayor a menor probabilidad. Si usted declaró nombres alternativos en su cuenta de ORCID, como un apellido de soltera o si se mencionan alias en los perfiles de Wikidata, estos se utilizan para buscar registros de especímenes candidatos. El procesamiento de esta gran cantidad de registros de especímenes es un proceso intensivo, aunque repetible, que utiliza código fuente abierto con licencia del MIT.

Integración con GBIF

GBIF logo

Approximadamente 170M registros de especímenes se descargan de GBIF como formato personalizado basado en Apache Avro. Se seleccionan registros con baseOfRecord PRESERVED_SPECIMEN, FOSSIL_SPECIMEN, MATERIAL_SAMPLE o LIVING_SPECIMEN, así como el contenido en recordedBy o identifiedBy y entonces son procesados.

  • todos los datos de ocurrencias se actualizan por completo cada 2 semanas
  • encuesta diaria para paquetes de descarga de datos citados (menos de 100MB comprimidos), extraídos y vinculados a registros de especímenes atribuidos

Integración con Wikidata

Wikidata logo

La sincronización con Wikidata se mantiene de varias formas. Con la excepción del último elemento de la lista a continuación, todos los métodos automatizados se ejecutan a través de trabajos cron programados utilizando una gema ruby requieren que las páginas de personas en Wikidata tengan fechas de muerte, así como un valor para cualquiera de estas propiedades: IPNI, Harvard Index of Botanists, Entomologists of the World, ZooBank Author ID, BHL Creator ID, Stuttgart Database of Scientific Illustrators ID.

  • encuesta diaria para nuevas páginas ( SPARQL )
  • actualización diaria para las entradas que se modificaron en las 24 horas anteriores ( SPARQL, usando 2020-01-01 como fecha de ejemplo )
  • consulta semanal para eventos de combinación ( SPARQL, usando 2020-01-01 como fecha de ejemplo )
  • un anotador puede actualizar a solicitud en cualquier momento

Las consultas SPARQL de ejemplo anteriores están limitadas a Entomólogos del mundo (P5370) pero todas las propiedades observadas se utilizan en producción

Integración con ORCID

ORCID logo

La sincronización con ORCID se mantiene de varias maneras.

  • autenticación de paso OAuth2
  • encuesta diaria para nuevas cuentas consultando la API para cualquiera de las palabras clave: taxonomy, taxonomist, mycology, zoology, entomology, botany, systematics, phylogenetics, biodiversity
  • almacenar en caché el nombre completo, los alias, las palabras clave, el empleo y la educación junto con las fechas de inicio y finalización
  • incorporar datos de empleo y educación provistas en identificadores de ORCID Ringgold o GRID para organizaciones
  • resolución de identificadores de Ringgold o GRID contra números Q de Wikidata
  • actualización periódica completa de los perfiles de ORCID
  • el usuario o un anotador puede actualizar a solicitud en cualquier momento

Integración con Zenodo

Zenodo logo

Desde el panel de configuración de su cuenta, usted puede conectarse con Zenodo en dos clicks usando sus credenciales de ORCID. Una vez se establece esta conexión set-it-and-forget-it , Bionomía inserta los datos de sus especímenes en este repositorio que es estable, reconocido por la industria y a largo plazo, y crea un nuevo DataCite DOI. Su token de Zenodo se almacena en caché en Bionomía y, cada semana, en su nombre, se envía una nueva versión de los datos de sus especímenes al archivo cuando hace reclamos nuevos. También recibirá una insignia de DataCite DOI en su página de perfil de Bionomía y una cita formateada para su currículum profesional. Los paquetes de datos versionados almacenados en Zenodo consisten en un archivo csv y un documento JSON-LD, preparando el camino para futuras integraciones de Linked Data. Si acepta DataCite como una organización confiable en su cuenta ORCID, recibirá una nueva entrada de trabajo formateada allí para su conjunto de datos de especímenes.