TNT el mejor programa de parsimonia

TNT el mejor programa de parsimonia
TNT el mejor programa de parsimonia

Páginas

9 de agosto de 2022

Bigdata e identificación de áreas de endemismo

Actualmente existen distintas bases de datos sobre biodiversidad (BDB), las cuales ofrecen infinidad de aplicaciones en estudios sobre biogeografía y conservación. El número de datos disponibles y que incluyen el componente espacial (coordenadas) se ha incrementado exponencialmente.

Imagen tomada y modificada de: 

Wüest, R.O., Zimmermann, N.E., Zurell, D, et al. 2020. Macroecology in the age of Big Data – Where to go from here? J Biogeogr. 47: 1– 12. https://doi.org/10.1111/jbi.13633

https://journalofbiogeographynews.org/2020/01/28/biogeography-in-the-age-of-big-data/

Liria, J., Szumik, C. y Goloboff, P. A. (2021). Analysis of endemism of world arthropod distribution data supports
biogeographic regions and many established subdivisions.
Cladistics, 37, 559–570. https://doi.org/10.1111/cla.12448
 

En esta entrada me centraré en un ejemplo reciente publicado en la Revista Mexicana de Biodiversidad, donde se muestra como a partir de cuatro BDB (una de ellas Nacional) se compiló toda la información disponible con el fin de identificar áreas de endemismo en  Ecuador:

Liria, J. (2022). Áreas de endemismo de Ecuador: un análisis a partir de datos de distribución de especies de plantas, animales y hongos. Revista Mexicana de Biodiversidad, 93(mayo-): e934031

 

 

Al revisar estas bases de datos, lo primero que surgió fue la incompatibilidad taxonómica en algunos casos; especies con categorias supra especificas distintas en dos bases de datos. Este tipo de aspectos fue recientemente abordado por:

Feng, X., Enquist, B.J., Park, D.S., et al. (2022) A review of the heterogeneous landscape of biodiversity databases: Opportunities and challenges for a synthesized biodiversity knowledge base. Global Ecology and Biogeography. 31(7): 1242-1260. Disponible en: https://onlinelibrary.wiley.com/doi/full/10.1111/geb.13497

"Information in a biodiversity database is generally indexed by species’ scientific names. However, the dynamic nature of taxonomic research presents challenges to such indexing. With the exception of a few well-established groups such as birds (whose taxonomy is relatively stable and subject to regular external review and standardization; Chesser et al., 2021), conflicting taxonomic concepts, homonyms, outdated synonyms, and ambiguous alternative spellings are prevalent across the tree of life (Boyle et al., 2013; Franz et al., 2008). Furthermore, in addition to the roughly 18,000 new species discovered each year, the taxonomy of the > 2 million species currently described (Mora et al., 2011) is in a state of constant flux, as old species definitions are re-examined and relationships are updated to reflect new insights. Finally, no single, universally agreed-upon taxonomy exists for the tree of life. Therefore, biodiversity databases have implemented different strategies (here termed taxonomic systems) to handle this taxonomic churn..."

De esta forma al integrar multiples BDB se pueden utilizar herramientas como OpenRefine para normalizar la información taxonómica:

Imagen tomada de: https://docs.gbif.org/openrefine-guide/3.0/es/guia-para-la-limpieza-de-datos-sobre-biodiversidad-con-openrefine.es.pdf

 

A partir de esta figura les presento la metodología utilizada para procesar cuatro BDB y poder identificar areas de endemismo en Ecuador: