Para manejadores de datos

Antecedentes

Los anotadores de Bionomía atribuyen registros de especímenes a los recolectores y determinadores representados en su (s) conjunto (s) de datos al vincular los registros de especímenes de historia natural que usted publica en GBIF a su número Q de Wikidata o a su identificdor de ORCID. Las personas con identificador de ORCID también pueden reclamar registros de los especímenes que ellos mismos recolectaron o identificaron. Los identificadores de Wikidata y ORCID tienen recursos y servicios asociados que son indudablemente útiles para colecciones que van desde eliminar la ambigüedad de nombres de personas hasta medir el impacto que su colección tiene en la comunidad académica.

Involucrándose con su comunidad

Los anotadores de Bionomía son un grupo internacional y acogedor de entusiastas que están motivados para ayudar a atribuir registros de especímenes a los recolectores e identificadores representados en conjuntos de datos. Trabajan incansablemente para mejorar las entradas en Wikidata agregando enlaces y atributos como fechas de nacimiento y muerte de historiadores naturales fallecidos. También son defensores de ORCID y pueden ayudarle a hacer campaña para su adopción en su institución. La forma más fácil de buscar ayuda, orientación o de apreciar el alcance de nuestras actividades es seguir @BionomiaTrack en Twitter. Venga a agradecer a los anotadores por sus esfuerzos y a participar en conversaciones que conducirán a nuevas conexiones gratificantes.

Data round trip

Incorporando mejoras

Cada pocas semanas, Bionomía actualiza un subconjunto de los datos de Darwin Core que usted publica en GBIF. Ver como funciona para más detalles.

Frictionless Data

Busque su(s) conjunto(s) de datos y encuentre un enlace al paquete Frictionless Data. Estos archivos relacionales comprimidos, codificados UTF-8 son similares a los archivos de Darwin Core que usted produjo para GBIF. Se diferencian en que representan de manera más eficiente relaciones many:many. También hay una variedad amplia de bibliotecas de software abierto en muchos lenguajes de programación que leen, validan y procesan datos sin fricción. También puede extraer el paquete comprimido e importar los archivos csv codificados en UTF-8 en cualquier programa de hojas de cálculo, siempre que los archivos no sean excesivamente grandes.

Los paquetes contienen un archivo datapackage.json de metadatos estándar y tres archivos csv: users.csv.zip, occurrences.csv.zip, problem_collector_dates.csv.zip, y attributions.csv.zip. El archivo de metadatos datapackage.json contiene una marca de tiempo "created" de cuando el paquete se produjo por última vez. La regeneración de estos paquetes suele ocurrir una vez cada pocas semanas, pero si desea una versión más actualizada, por favor cree un tiquete. El archivo users.csv.zip contiene una lista de usuarios únicos a los que se les atribuyeron, o que reclamaron como propios registros de especímenes en el conjunto de datos que usted ha compartido. También contiene los nombres completos, alias, identificadores de ORCID o números Q de Wikidata (más fechas de nacimiento y muerte para éstos últimos). El archivo occurrences.csv.zip contiene el subconjunto de campos de Darwin Core de los registros de especímenes para los que se han realizado atribuciones. El archivo problem_collector_dates.csv.zip file contains a list of occurrence records whose eventDate is earlier than a collector's birthDate or later than their deathDate. Por último, el archivo attributions.csv.zip es una tabla combinada de los otros dos archivos csv y también contiene columnas para quién realizó la atribución, su identificador de ORCID y una marca de tiempo para cuando se realizó la atribución.

Estimando la calidad de los datos

En el conjunto de páginas "Ayudar a otros" donde los registros de especímenes se atribuyen a recolectores e identificadores, hay pestañas para corregir y visualizar registros. Aquí, las fechas de nacimiento y muerte de un recolector se comparan con las de sus registros de especímenes. También se puede hacer clic en países en mapas y rangos de fechas en gráficos para ejecutar filtros dinámicos. Con el tiempo y a medida que se realizan más atribuciones, los informes de calidad de datos como estos en los registros de especímenes de las personas pueden acumularse en informes a nivel de conjunto de datos.

Reconciliar

OpenRefine logo
punto final de reconciliación de OpenRefine:
https://api.bionomia.net/reconcile
Uso recomendado

El punto final funciona mejor cuando hay un solo nombre en una columna de persona. Otras columnas, como Familia recolectada o identificada y / o fecha de recolección o identificación, pueden usarse opcionalmente para ayudar a ajustar la puntuación de los resultados devueltos. Las fechas de nacimiento y muerte (cuando se conocen) se cotejan con la columna de fecha que usted usa. Pruebe el punto final de identificación de Bionomía entre otros en el Banco de pruebas del servicio de reconciliación.