TNT el mejor programa de parsimonia

TNT el mejor programa de parsimonia
TNT el mejor programa de parsimonia

Páginas

5 de agosto de 2020

Tengo muchos datos de biodiversidad y no se como procesar y limpiar toda esta información

La cantidad de información (registros) disponibles en Biodiversidad se ha incrementado en las últmas decadas, y la proyección es que seguirá aumentando:

Figura tomada de:

Soberón, J. & Peterson, A. (2009). Monitoring Biodiversity Loss with Primary Species-occurrence Data: Toward National-level Indicators for the 2010 Target of the Convention on Biological Diversity. Ambio. 38. 29-34. 10.1579/0044-7447-38.1.29.

Repositorios como GBIF, NHM, SpeciesLink, entre otros, nos permiten tener acceso a millones de datos de Biodiversidad. Sólo el GBIF posee 1.582.205.031 registros biológicos (agosto 2020):

Existen mchos progrmas que nos permiten lidiar y manipular tal magnitud de datos, sin embargo, uno de lo más interesantes que he utilizado es OpenRefine:

Por suerte hay varios tutoriales y guías con algunas funcionalidades de OpenRefine para datos de Biodiversidad. Acá les coloco un video, y las guías desarrolladas por el Sistema de información en Biodiversidad - Colombia (SiB-Colombia) y el propio GBIF.


Funciones básicas de OpenRefine para limpieza de datos de biodiversidad.




Tomado de:

SiB Colombia (2019). OpenRefine - Guía básica, Limpieza de datos sobre biodiversidad.Sistema de Información sobre Biodiversidad de Colombia, Bogotá D.C., Colombia, 22 pp

Esta es la guía desarrollada por el GBIF:




No hay comentarios:

Publicar un comentario