TNT el mejor programa de parsimonia

TNT el mejor programa de parsimonia
TNT el mejor programa de parsimonia

Páginas

Docentes Innovadores

miércoles, 30 de noviembre de 2011

Revista de Biología (Brasil), especial sobre Biogeografía

Revista da Biologia - Volume 7 - Especial Biogeografia
La Revista da Biologia publica textos en todas las áreas de la Biologia, abordando aspectos generales (ensayos y revisiones) y específicas (artículos experimentales originales, descripción de técnicas y resumenes expandidos). ISSN 1984-5154 (La Revista da Biologia es gratuita y exclusivamente on-line).



















Silvio Shigueo Nihei

Jéssica Paula Gillung

Charles Morphy D. Santos

Márcio Bernardino DaSilva

Renato Recoder

Felipe de Mello Martins e Marcus Vinícius Domingues

Henrique Batalha Filho e Cristina Yumi Miyaki

Kirstern Lica Follmann Haseyama e Claudio José Barros de Carvalho

Thaís Pires Miranda e Antonio Carlos Marques

George M. T. Mattox

lunes, 19 de septiembre de 2011

Matrices para docencia en Biología Animal

La siguiente entrada esta dedicada a los Docentes en Biología Animal y Zoología. En la asignatura Biología Animal de la Carrera Licenciatura en Biología en la Universidad de Carabobo, tenemos un tema que se titula “Recapitulación de la filogenia de Metazoa”. La idea es que los participantes vean varias hipótesis filogenéticas en Metazoa (desde las clásicas hasta las más recientes). En este sentido, años atrás recopilé algunas matrices morfológicas y moleculares para realizar filogenias utilizando programas ad hoc.

Acá les coloco algunas matrices morfológicas “clásicas”, basadas en las siguientes referencias:

Brusca, R.C., Brusca, G.J. 2005. Invertebrados. McGraw-Hill/Interamericana de España, S.A.U., Madrid. 1005 p.

Eernisse, D.J., Albert, J.S., Anderson, F.E. 1992. Annelida and Arthropoda are not sister taxa: A phylogenetic analysis of spiralian metazoan morphology. Systematic Biology, 41, 305-330.

Nielsen, C. 2001. Animal Evolution, Interrelationships of the Living Phyla Second Edition, Oxford University Press, Oxford, 563 p.

La matrices tienen la extensión “.ss” (de Hennig86), no obstante pueden abrirlas en programas como NoNa (y Piwe), WinClada, y TNT.

Brusca-Brusca2005.ss (Taxa = 35 ; caracteres = 96)
Eernisse_et_al1992.ss (Taxa = 26 ; caracteres = 141)
Nielsen2001.ss (Taxa = 32; caracteres = 64)

Las figuras a continuación son los consensos estrictos de corridas en TNT (con búsquedas tradicionales). Sin embargo, como se darán cuenta cuando vean cada archivo, las matrices no incluyen la lista de caracteres, así que deben tener las referencias para saber que carácter corresponde con cada número. Por cierto si alguien ya tiene estas matrices, y ademas poseen los caracteres, o tiene tiempo de hacerlo, sería excelente si las mandan para sustituirlas.




viernes, 16 de septiembre de 2011

Importando modelos de MaxEnt a un programa SIG

En esta entrada les daré unos trucos para ver los mapas predictivos obtenidos en MaxEnt y llevarlos a un programa SIG. Para ello necesitaremos tres programas: MaxEnt, DIVA-GIS y GVSIG.

...y con esta presentación les muestro en 8 diapositivas como hacerlo (es muy sencillo):


Como vieron podemos resumirlo en tres pasos:

1) En MaxEnt cambiamos el archivo de salida de asc (defecto) a grd.
2) En DIVA-GIS abrimos la capa grid. Y manipulamos las categorías y colores a nuestro gusto.
3) En GVSIG insertamos la capa raster (archivo bmp).


Para los que tienen ArcView, no hay tanto problema. Solo deben importar el archivo asc y convertirlo a un GRID.

lunes, 12 de septiembre de 2011

Nueva versión de NDM

Hola, en esta entrada les comento un poco sobre la versión 3.0 de NDM.

Si no conocen el vínculo de descarga, aca se los coloco: www.zmuc.dk/public/phylogeny/endemism/

Una vez que descarguen y descompriman el zip "VNDM-NDM August 2011.zip" en su directorio de elección, deberian tener estos archivos:





















Los archivos CulicidaeVenezuela1.xyd y CulicidaeVenezuela2.xyd, los utilizaré en esta entrada para indicarles como ejecutar NDM 3.0. El programa ahora debe abrir tres tipos de archivos, siguiendo este orden:

1) DAT file: contiene una matrix de "n" columnas x "m" filas con las presencias de las especies.
2) XYD file: contiene el archivo "clasico" de coordenadas (latitud y longitud) para cada especie.
3) NDM file: contiene las áreas.

¿Qué pasa entonces si tratamos de ejecutar NDM 3.0, y solo tenemos el archivo XYD?




















El programa da este error, porque ha solicitado el archivo DAT y no lo encuentra. Los archivos DAT y NDM son creados en las versiones anteriores de NDM una vez que se lee el archivo XYD. Sin embargo, en la nueva versión son requeridos al principio. Entonces ¿cómo hacemos para que lea nuestros datos XYD?

Hay dos formas, pero en ambos casos debemos usar la línea de comandos en MS-DOS (es muy sencillo!)




















En esta doble ventana se aprecian a la izquierda el archivo CulicidaeVenezuela1.xyd y a la derecha el archivo CulicidaeVenezuela2.xyd. Solo difieren en que el primero no tiene separada las coordenadas por comas (por ello el nuevo comando nocommas). Tambien se aprecian en ambos archivos los siguientes comandos:

autogrid: Crea una cuadricula de tamaño dependiente de la densidad de puntos 
automatrix: Una vez que lee los datos XYD, crea automaticamente la matrix DAT  
fill x y: Llena celdas alrededor de los puntos, con cierto porcentaje de ancho y alto
assume x y: Llena celdas alrededor de los puntos, pero asumiendo los registros  


El programa viene con un manual (en PDF) donde se explican estos y otros comandos.

Siguiente paso, vamos a la línea de comando del MS-DOS:




















...y si el archivo XYD no tiene errores, podemos ver nuestros datos
























jueves, 8 de septiembre de 2011

Libro SIG gratis

Encontré este libro en PDF en el Archivo Digital de la Universidad Politécnica de Madrid:

Mancebo Quintana, Santiago y Ortega Pérez, Emilio y Martín Fernández, Luis y Valentín Criado, Ana Cristina (2009) LibroSIG: aprendiendo a manejar los SIG en la gestión ambiental: Ejercicios. Los autores, Madrid. ISBN 978-84-692-8534-3





















Aquí les coloco el resumen (de los autores):

Es resultado de la recopilación de los ejercicios prácticos asociados a las clases impartidas durante más de 10 años en los cursos de SIG del Departamento de Construcción y Vías Rurales de la Escuela de Montes de la Universidad Politécnica de Madrid. Estos cursos de postgrado comparten el objetivo de ofrecer unos conocimientos teórico-prácticos suficientes para poder realizar adecuadamente la cartografía ambiental presente en multitud de proyectos relacionados con la gestión ambiental. Aunque los cursos difieren en duración y perfil del alumno: estudiantes del último año de carrera, recién licenciados, desempleados y profesionales. Hemos recopilado buena parte de los ejercicios, especialmente los de dificultad baja y media. Estos ejercicios son, básicamente, el resultado de adaptar y simplificar experiencias reales de los autores, proyectos fin de carrera, asesorías técnicas, etc., si bien alguno de los más básicos son invenciones de principio a fin. Con el objetivo de acercar el mundo real a los estudiantes, también la información suministrada es real y, la mayor parte, es una copia fidedigna de la información que distintas administraciones ofrecen. Por tanto, hay que tener presente que toda la información está sujeta a derechos de autor. Buena parte de esta información es de acceso libre, pudiéndose usar y distribuir libremente. Otra parte es libre sólo en el ámbito de la docencia y la investigación. En consecuencia, hay que tener muy presente que, por defecto, toda la información que se aporta en los ejercicios es para su uso exclusivo en la realización de estos ejercicios, quedando prohibido su uso, venta o distribución para cualquier otro fin, estando estos términos sujetos a los derechos de autor originales de cada unidad de información aportada. Cada capítulo es un ejercicio que consta de planteamiento y resolución paso a paso. La solución planteada en todos los casos es con el SIG ArcGis 9.2, si bien todos son susceptibles de ser realizados con cualquier otro SIG. Los capítulos están ordenados siguiendo el mismo orden y numeración que en el libro de teoría, en parte por dificultad de aprendizaje y en parte por orden natural, y en su conjunto cubren todas las fases típicas de un proyecto SIG de gestión ambiental del territorio. El orden natural aparece en el gráfico. Varios temas que aparecen en el esquema de proyecto cartográfico no están tratados en el libro de teoría ni en este de ejercicios: revisión bibliográfica, escaneado y tratamiento de imágenes. Tampoco hemos incluído ningún ejercicio específico de cambios de formato, si bien, sí se practica este punto como parte de otros ejercicios. Tampoco se trata la digitalización con GPS-PDA por requerir trabajo de campo. 

Capítulo 1: Los SIG y ArcGIS
Capítulo 2: Visualización
Capítulo 3: Diseño de mapas
Capítulo 4: Análisis alfanumérico
Capítulo 5: Gestión de datos
Capítulo 6: Cambios de formato
Capítulo 7: Sistemas de referencia
Capítulo 8: Georreferenciación
Capítulo 9: Digitalización y edición
Capítulo 10: Digitalización con GPS-PDA
Capítulo 11: Análisis vectorial
Capítulo 12: Análisis ráster
Capítulo 13: Análisis de redes
Capítulo 14: Topología
Capítulo 15: Fuentes de información.

Descarga el PDF (aprox. 10 MB)
Descarga los ejercicios

lunes, 5 de septiembre de 2011

domingo, 4 de septiembre de 2011

Mapas base para NDM (5)

Preparé otros mapas base para NDM; como siempre en formato XYdata, y al final les coloco los archivos ZIP del shapefile de ESRI:

Francia
















Inglaterra

















Italia

















Shapefiles: Francia, Inglaterra e Italia.

miércoles, 31 de agosto de 2011

Conceptos en Sistemática Filogenética

Otro sobre conceptos básicos en sistemática filogenética... pero usando como ejemplo a los Deuterostomados.

Tomado de:

Contreras-Ramos, A., C. Cuevas Cardona, I. Goyenechea y U. Iturbe (Eds.). 2007. La sistemática, base del conocimiento de la biodiversidad. Universidad Autónoma del Estado de Hidalgo, Pachuca. 158 pp.
14. Conceptos básicos en sistemática filogenética: los deuterostomados como ejemplo.    **  Índice del libro

miércoles, 24 de agosto de 2011

Historia de la sistemática...

Encontre este articulo y quiero compartirlo con Ustedes. Nos da un breve resumen sobre la historia de la sistemática, con enfasis en la sistemática filogenética. Finalmente explica de forma sencilla su aplicación en un grupo de serpientes.




Goyenechea I. 2007. Sistemática: su historia, sus métodos y sus aplicaciones en las serpientes del género Conopis. Ciencia Ergo Sum. 14(001):54-62.

Resumen. La sistemática es una disciplina de la biología que a lo largo de su historia ha pasado por cambios fundamentales en sus conceptos y métodos. Este trabajo resume brevemente su historia, además de mostrar algunos de los conceptos fundamentales para realizar sistemática filogenética. Se presenta un estudio de caso realizado con las culebras del género Conopis para ilustrar las ventajas y desventajas de usar caracteres morfológicos y moleculares, así como de analizar los conjuntos de caracteres por separado y combinándolos.

martes, 23 de agosto de 2011

¿Qué tanto hacemos y publicamos?

Este articulo me parece interesante. Se los coloco para que vean que tanto hacemos sobre Sistemática y Biogeografía.

MICHAN, Layla, RUSSELL, Jane M, SANCHEZ PEREYRA, Antonio et al. Análisis de la sistemática actual en Latinoamérica. INCI. [online]. oct. 2008, vol.33, no.10 [citado 23 Agosto 2011], p.754-761. ISSN 0378-1844.

Resumen: Para tener una visión regional del estado de desarrollo de la sistemática en América Latina durante las últimas tres décadas, se presentan los resultados del análisis cienciométrico de 11185 documentos publicados entre 1976 y 2006 en 411 revistas de la región, obtenidos de la base de datos Periódica. Se describe el estado actual de la disciplina en el área, se exponen análisis detallados sobre los artículos, países, principales líneas de estudios, grupos taxonómicos, temas, formato, tipo de documento, contenido, idioma y se contextualiza la información. La producción especializada sobre sistemática publicada en las revistas locales fue notable y se mantuvo estable a partir de los 80, centrándose principalmente en México, Brasil y Argentina. Los contenidos fueron publicados en español primariamente y en forma de artículos. Versaron especialmente sobre taxonomía descriptiva y se relacionaron con la ecología, anatomía, histología y biología acuática. Los grupos más representados fueron los insectos y las angiospermas. Se concluye haciendo una llamada a la necesidad urgente de sistematizar la literatura de sistemática sobre taxones latinoamericanos.








domingo, 14 de agosto de 2011

Capítulos 3 y 6 del libro de Kitching et al. 1998

Aca les dejo estos Capítulos del libro de Ian Kitching y colaboradores (1998):

Este el 3... que trata sobre construcción de arboles


y el 6... sobre medidas de apoyo


sábado, 13 de agosto de 2011

Filosofia del cladismo

Tenia un mes o más sin colocar nuevas entradas. Entre el XXII Congreso Venezolano de Entomología, y la docencia en la Universidad... pues no tuve tiempo para actualizar el blog. En fin aca les coloco un articulo de J. Farris.

Farris JS. 2008. Parsimony and explanatory power. Cladistics, 24: 1–23.



Espero lo disfruten!

sábado, 18 de junio de 2011

Feliz cumple León Croizat!

León Croizat Chaley (Léon Camille Marius Croizat) nació el 16 de Julio de 1894 en Turín, Italia, donde cursó estudios de derecho a pesar de su gran vocación por las ciencias naturales.
Luego de obtener su título se orientó hacia estas ciencias, especializándose en botánica y en zoología, logrando profundizar y dominar aspectos importantes de la distribución y evolución de las especies. De hecho, generó una corriente de pensamiento nueva, opuesta en algunos criterios a la teoría de Darwin de la evolución y dispersión de la biota.

Al final de la primera guerra mundial se radicó en EE.UU., donde estuvo encargado del Arnold Arboretum de la Universidad de Harvard, entre 1941 y 1946.
En 1947 llegó a Venezuela, llamado por el ilustre botánico Henri Pittier, para trabajar en esta disciplina, la Botánica. Dictó clases en la Facultad de Agronomía de la Universidad Central de Venezuela.
En 1951 fue nombrado profesor ordinario de Botánica y Ecología en la Universidad de Los Andes. Entre 1951-1952 participó como botánico en la expedición franco-venezolana para descubrir las fuentes del Orinoco, junto al Prof. José María Cruxent. Por su labor en esta expedición le fue otorgada la Orden Libertador en grado de Caballero. Croizat también fue honrado por Venezuela al serle otorgada la Orden Henri Pittier de Mérito a la Conservación, y por el gobierno de Italia con la Orden al Mérito.
Fue nombrado profesor honorario de la Universidad Nacional Experimental Francisco de Miranda, de Coro, en 1981.

Caricatura de L. Croizat tomada de Grehan (2007).


Croizat publicó, gracias a sus esfuerzos personales, cerca de 15.000 páginas. Entre sus obras científicas se incluyen varios volúmenes, destacando:
  • Panbiogeografía
  • Principia botánica
  • Espacio, Tiempo y Forma: la Síntesis Biológica; biogeografía de las tierras del Este de Suez y Madagascar
  • Biogeographie raisonné de l’ Afrique

Este material fue tomado de Wikipedia. Sin embargo, les recuerdo tambien que en pasadas entradas del blog les coloque unos documentales de L. Croizat. 

Para complementar les recomiendo que consulten estas referencias para adentrarse en la vida y obra de este Biogeografo:


Craw R. 1984. Never a serious scientist: the life of Leon Croizat. TUATARA 27: 5-7. 

Craw R. 1984. León Croizat's biogeography work: a personal appreciation. TUATARA 27:  8-13.

Diaz M, Gómez R. 2000. León Croizat y su aporte a las ciencias Biológicas. CROIZATIA 1(1): 1-5.

Grehan JR. 2007. Journey to Coro. BIOGEOGRAFIA 1: 10-14. 
 
Morrone JJ. 2000. Entre el escarnio y el encomio: Leon Croizat y la panbiogeografia. INTERCIENCIA 25: (1) 41-47.

lunes, 6 de junio de 2011

Principios de Cladismo

INTRODUCCION

En la actualidad, el método más utilizado en sistemática es el cladístico. La formulación original de este método suele atribuirse al entomólogo (Dipterologo) alemán Willi Hennig, pero muchas de las ideas básicas del método fueron desarrolladas independientemente por varios investigadores (algunos mucho antes que Hennig). Hennig desarrollo sus ideas entre los años 50's y 60's, y su metodología empezó a hacerse conocida en la década de los 70's. Sostenía que las clasificaciones deben estar basadas en la filogenia, y propuso un método que permitiera hacer hipótesis de filogenia a partir de las observaciones de las características actuales de los organismos. Fue uno de los científicos que más se mostraron en contra de la idea de que la sistemática era una especie de "arte"; la idea de que el sistemático simplemente mete las cosas en casilleros, sin necesidad ni posibilidad de justificar cómo son elejidos los casilleros.
Hennig insistió, en cambio, en que la sistemática debe verse como una ciencia, y que sus principios y fundamentos por lo tanto deben ser justificados y discutidos en una forma lógica y racional. El difundir este punto de vista fue probablemente una de las contribuciones más importantes de Hennig.

Hasta mediados de la década de los 70's, se consideró que el principio fundamental de la cladística era que las clasificaciones debían basarse exclusivamente en las relaciones filogenéticas (sin importar tanto cómo han llegado a descubrirse/deducirse esas relaciones). En esta época fue común que se presentara a la cladística como un "rompimiento epistemológico" con el pasado, representando un enfoque completamente nuevo de cómo hacer clasificaciones. Esto implicaba que los trabajos de sistemático "pre-hennigianos" podían ser ignorados, ya que trataban de problemas ahora considerados irrelevantes. Sólo al tomar las relaciones filogenéticas en lugar de tan sólo las similitudes y diferencias podía lograrse, supuestamente, una clasificación más "científica" en lugar de tan sólo "deductiva".

El mismo Hennig, en sus trabajos, parecía desdeñar a menudo el aspecto descriptivo de la sistemática. Sin embargo, se fue haciendo evidente a mediados de los 70's que el método cladístico puede verse tambien como una forma especial de "describir". Si el método fue originalmente diseñado con el propósito de reconstruir filogenias, su idea fundamental era que el estudio de la filogenia era una ciencia empírica y las conclusiones debían basarse en evidencia (caracteres). Por lo tanto, el método cladístico puede verse tambien como un estudio de caracteres, es decir, una forma de relacionar clasificaciones y caracteres... y por lo tanto, como una forma especial de usar las clasificaciones para describir los caracteres.

Este punto de vista fue sostenido por autores como James Farris, Gareth Nelson y Norman Platnick. Según estos, el modo en que los caracteres se relacionan con la clasificación final en el método cladístico es el mejor, en lo que se refiere a eficiencia descriptiva. Desde este punto de vista la cladística no representa ningun "rompimiento epistemológico" con el pasado, sino tan sólo una manera más explícita y lógica de llevar a cabo el mismo propósito que han buscado todos los sistemáticos desde Linneo: Organizar a la diversidad en un sistema coherente. Los trabajos de sistemáticos "pre-hennigianos" tambien pueden (y deben) ser considerados, analizados y discutidos (Goloboff 1998).

CARACTERES

El análisis cladístico consiste en tres procesos: (1) el descubrimiento y selección de carácteres y taxa, (2) la codificación de los carácteres, y (3) determinación de los cladogramas que mejor explican la distribución de los caracteres sobre los taxa.
Las operaciones de los análsis cladísticos son fuertemente influenciados por la selección y resolución de los taxa y caracteres. Los tipos de carácteres disponibles (esqueletos, partes blandas, ADN, etc) inevitablemente afectan la selección del método cladístico.
Actualmente, las matrices de datos están formados por carácteres con códigos discretos dispuestos en columnas y los taxa en las filas:


CLADOGRAMAS

DEFINICIONES

Un un árbol filogenético (cladograma), es una representación gráfica de las relaciones genealógicas entre taxa que están siendo determinadas por un investigador. En otras palabras, un árbol filogenético es una hipótesis de las relaciones genealógicas sobre un taxon. Veamos la siguiente figura:




Se observan cuatro taxa: A...C, llamados Taxa terminales. Luego el taxon A es el Grupo Externo: Aquel taxon o grupo utilizado en el análisis que no esta incluido en el grupo de estudio. Se utiliza con propósitos comparativos. El grupo externo más importante es el Grupo Hermano, el cual puede llevar de muchos estudios filogenéticos para su determinación. Por lo general se utilizan varios grupos externos en los análisis cladísticos.

Seguidamente se aprecian líneas que conectan a los taxa terminales, a estas se les conoce como ramas. La union entre dos ramas forma un nodo, y representa un evento de especiación. Un internodo es una línea que conecta dos eventos de especiación y representa al menos a una especie ancestral (hipotética). Un internodo localizado en la parte más basal del cladograma se conoce como raíz.

Otra forma de representar las relaciones entre A, B, C y D es mediante un diagrama de Venn:


Una representación de las relaciones entre taxa usando círculos y/o elipses interconectadas. Las elipses toman el lugar de las conexiones internodales.
Por último, la formas más sencillas para representar las relaciones entre los taxa A, B, C y D, es con teoría de conjuntos (A u B u C u D) o bien por notación parentética (A (B (CD))).

GRUPOS MONOFILETICOS, PARAFILETICOS Y POLIFILETICOS

Monofilético: Es un grupo que incluye a todos los ancestros y a sus descendientes. Los miembros de un grupo monofilético tienen un conjunto de relaciones de ancestría no compartidas con ninguna otra especie colocada fuera del grupo. En otras palabras, es una unidad histórico-evolutiva. (ver figura)



Parafilético: Es un grupo que se "origina" una sola vez pero excluye a uno o más de sus descendientes. (ver figura)


Polifilético: Es un grupo que se "origina" varias veces, o dicho de otra forma posee varios ancestros. (ver figura)
 
La diferencia fundamental entre grupos monofiléticos y los no-monofiléticos, es que los segundos forman clasificaciones no naturales o artificiales, es decir, no forman parte de un proceso evolutivo o con una historia evolutiva común. En algunos casos es díficil distinguir claramente el estatus de un grupo como parafilético o polifilético.

Un cladograma puede realizarse manualmente o mediante un programa de computación (software)
Además los caracteres de un cladograma deben ser optimizados

CLADOGRAMAS OBTENIDOS MANUALMENTE

Los cladogramas se construyen encontrando los grupos hermanos dentro de un grupo monofilético. Esto se hace por medio de la búsqueda de las sinapomorfías más inclusivas.

CLADOGRAMAS OBTENIDOS CON PROGRAMAS

Existen programas que permiten obtener los cladogramas por computación. Si bien los mismos no solucionan ningún problema que no se pudiera resolver por métodos manuales, resuelven cladogramas muy complejos y lo hacen rápidamente; esta rapidez permite que puedan, además, probarse distintas opciones de búsqueda y tratamiento de los caracteres. También brindan una lista de los cambios que sufren los caracteres a lo largo del cladograma y de las homplasias y apomorfías. Aunado a esto los cambios pueden graficarse en cada árbol y los cladogramas exportarse como imagenes a programas tan comunes para nosotros como MS-POWER POINT y MS-WORD.

La mayoría de los programas funcionan utilizando la técnica de los árboles de Wagner, la que utiliza el concepto de parsimonia para conseguir el árbol filogenético con menor número de cambios evolutivos. Esto se logra mediante una optimización de los caracteres, es decir, "mapeando" los caracteres sobre un cladograma para obtener el árbol que necesita el menor número de pasos.

OPTIMIZACIÓN GENERALIZADA 
 
La optimizacion de cualquier tipo de carácter toma dos pasadas: la primera hacia abajo y la segunda hacia arriba. En la pasada hacia abajo se calcula para cada nodo un conjunto preliminar de estados. Estos conjuntos se encuentran en forma tal que produzcan longitud minima dados los descendientes del nodo. La pasada hacia abajo permite calcular la longitud del árbol; cada vez que no es posible asignar a un nodo un estado tal que no produzca nigun cambio a lo largo de las ramas descendientes, se incrementa la longitud del arbol en el número correspondiente de pasos. Este número de pasos es independiente del "peso" del caracter; si se le da al carácter mayor peso, el número de pasos debe ser multiplicado por el peso (cada paso del carácter "vale" por varios). Dado que la optimización se lleva a cabo sin tomar en cuenta el peso, el hecho de pesar caracteres no afecta los estados que se asignen a los nodos, ni en que ramas del árbol ocurrir n cambios. La pasada hacia abajo toma en cuenta solo la información "por arriba" del nodo; si los grupos hermanos del nodo en cuestión tienen otros estados, sin embargo, puede ser necesario cambiar las asignaciones. Como el nodo raiz del arbol no tiene grupos hermanos, los estados calculados en la primer pasada para ese nodo son finales. Se empieza entonces la pasada hacia arriba, asignando a cada nodo estados finales, tomando en cuenta los estados (finales) del ancestro del nodo y los estados (preliminares) de los descendientes). Para cada estado final del ancestro, aquellas asignaciones al nodo que produzcan la longitud mínima (ancestro-nodo + nodo-descendientes) ocurriran en al menos una reconstrucción de máxima parsimonia (Goloboff 1998). Como ejemplo veamos...

Los seis taxa A...F, poseen c/u los estados de carácter A(1), B(0), C(1), D(1), E(0) y F(0), como se puede ver en la figura:

Empecemos la pasada hacia abajo...primero con el nodo que compromete a los taxa A y B. Entre los estados "1" y "0", solo se puede escoger como asignación más parsimoniosa a ambos "01". Debido a que si se coloca cualquiera de los dos el número de pasos será el mismo. Esto es una ambiguedad:


Sigamos con el nodo de (A, B) y el taxon C. Entre el nodo "01" y el taxon C con el estado "1", la asigación más adecauda es "1":


Entre el nodo (A, B, C) y el taxon D, con el estado de carácter "1", la asignación más adecuada es, de nuevo "1":


Luego entre el nodo (A, B, C, D) y el taxon E, con el estado de carácter "0", la mejor opción es una ambiguedad "01":


Finalmente, entre el nodo (A, B, C, D, E) y el taxon F, con el estado "0", la asignación adecuada es "0":

Tenemos entonces estados parciales de los nodos, veamos ahora como se realiza la pasada hacia arriba
Se empieza desde el nodo sigiente a la raiz y se "ve" la información que está por arriba y abajo. ¿Qué estado de carácter se debe colocar para que se tenga el menor número de pasos?
Con "1": Se registran dos cambios, de 0->1 y luego de 1->0.
Con "0": Se registra un solo cambio, de 0->1.

Conclusión: Debo preferir "0" sobre la otra asignación, porque es la más parsimoniosa.

En el siguiente nodo si coloco "1" tengo un paso (de 0->1). En cambio asignando "0" son dos pasos (de 0->1 y luego 0->1). Me quedo con "1"...
A continuación se presenta una caso interesante ¿que pasará con la ambiguedad?.
Si coloco "1", se cuentan cero pasos. Asumiendo que la ambiguedad ha tomado solo el estado "1", porque si fuera "0", debemos contar un paso (de 1->0).
Si coloco "0", y en la ambiguedad se asume el estado "0", se obtiene tres pasos (de 1->0 y luego 0->1). Por el contrario si en la ambiguedad se elije "1" debemos contar tres pasos de 1->0 y luego 0->1 * dos veces).
Conclusión, debo asignar el estado "1"... 

Finalmente nos queda ver que se le asigna al nodo que tiene la ambiguedad. Con "1",... solo se cuenta un paso.Y con "0",... dos. Se le asigna el estado "1".

Este es el resultado final de la optimización, un árbol con las asinaciones de sus nodos representadas por la mínima longitud o menor número de cambios.
Solo nos queda calcular el largo del árbol:
De 0->1 un paso, y luego de 1->0 un paso, total 2 pasos.

Si esto le parece sencillo, imagine calcular la optimización para 50 taxa y 60 o más caracteres. Recuerde que aquí Ud. acaba de optimizar 1 solo caracter, que para nuestra suerte era binario (0 1).
Tranquilo no se asuste, para resolver estos y otros inconvenientes tenemos los programas de computación.

Existen otros tipos de optimización:
Fitch

Este método de optimización se usa solamente para carácteres no aditivos ("no ordenados"), es decir, cuando se considera que una transformación entre dos estados culaesquiera requiere el mismo número de pasos. Ejemplo: Para un carácter binario, pasa de 0->1 implica lo mismo que de 1->0.
Farris

Este algoritmo se utiliza para caracteres aditivos ("ordenados lineales"). En este caso, el costo de transformarse de un estado a otro es su difrencia númerica. Por ejemplo: Un caracter "X" con los estados "0", "1", y "2". El costo de pasar de 0->2, es la suma de pasar de 0->1 y luego de 1->2.

Dollo

Se utiliza cuando en ciertos casos no se permite la reversión de algun estado, debido a que las transformaciones son consideradas poco problables o imposibles. La optimización de Dollo fue creada debido a necesidad de mostrar escenarios a priori en los cuales los estados apomórficos solo se adquieran una vez, y que los homoplásicos sean considerados como una pérdida secundaria. Por ejemplo, en estudios morfológicos estructuras complejas como el ojo de los vertebrados, pudo solo presentarse una vez. De igual forma en el campo molecular, estudios empíricos sugieren que en el analsis de restricción de corte de la endonucleasa, para ADN, muestra una marcada asimetría entre la baja probabilidad de ganar un nuevo lugar y la alta de perderlo.

Carmin-Sokal

Al igual que la optimización de Dollo, es muy poco usada. Asume la baja probabilidadad de que una adquisición pueda perderse. La evolución de carácteres es irreversible.



GLOSARIO DE TÉRMINOS

A
ACCTRAN
Transformación acelerada (o "accelerated transformation"), un procedimiento para resolver optimizaciones ambiguas donde los caracteres con transformaciones de avance ("forward") son colocadas hacia la raiz del cladograma. En ACCTRAN la cantidad de homoplasia es realizada en términos de reversiones hacia la condición plesiomórfica.

ambiguedad
El resultado de la optimización de un carácter sobre un cladograma donde el largo de la rama es cero y por lo tanto un colapsamiento.

analogía
Son carácteres que se presentan funcionalmente similares pero su desarrollo (ontogenia-origen) y su estructura morfológica es diferente.

apomorfía
Un carácter derivado o estado de carácter.

árbol filogenético
Es una representación gráfica e histórica del curso de la especiación. En el sistema filogenético esto es cierto, aunque esten representados arboles de taxa supraespecíficos, debido a que cada uno de estos taxa es hipotetizado de tener un origen en una simple especie ancestral.

atributos
Son las diferentes representaciones que el carácter posee. Por ejemplo: al carácter "color de ojos" se le puede atribuir numerosas condiciones como "color rojo", "color verde", etc. Es un sinónimo de estados de carácter (o "Character state")

autapomorfía
Un carácter derivado o estado de carácter (apomorfía) que esta restringido a un simple taxon terminal. Una autapomorfía en ciertos casos puede ser una sinapomorfía a un nivel menos sensitivo. Una forma de carácter no informativo.


B
bootstrap
un procedimiento estadístico para estimar la varianza paramétrica de los datos observados, por medio del promedio de las varianzas de pseudoréplicas (muestras iguales o mayores). Los datos originales son muestreados con reemplazamiento para producir pseudomatrices que luego serán analizadas con algun método de búsqueda (arboles de Wagner), y finalmente se realiza un consenso estricto para ver la proporción (porcentaje) de grupos monofiléticos.


C
carácter
Es una hipótesis de homología primaria en dos o más taxa terminales, basados en observaciones originales de los organismos. Es un atributo observable de un organismo usado para distinguirlo de los otros

carácter binario
Cuando un carácter esta representado por solo dos atributos o estados de cáracter. Por ejemplo: El carácter "seta maxilar número uno (1-Mx)" posee dos estados "presente" o "ausente".

carácter continuo
Un carácter en donde los valores potenciales son infinitamente cerrados, por ejemplo: Largo del ala.

carácter multiestado
Cuando un carácter esta representado por más de un par de atributos.

cladogénesis
Es la evolución siguiendo un patrón ramificado divergente. Esto significa la evolución o generación de pares de especies a partir de especies ancestrales únicas.

cladograma
Un diagrama de entidades (taxon) que ilustra una forma ramificada, la cual esta basada en conexiones históricas entre ellas como es evidenciada por el compartimiento de caracteres derivados o sinapomorfías. Es decir, son una representación filogenética o un dendrograma histórico.

cladograma mínimo
El árbol más parsimonioso. Usando los métodos tradicionales, un cladogramá mínimo tiene mínima longitud. Se conoce también como cladograma óptimo.

clasificación
Es la serie de palabras usadas para representar un arreglo particular de organismos de acuerdo a algún principio o relación que se supone exite entre ellos.

clasificación filogenética
Es el arreglo de los organismos basados en sus relaciones genealógicas (histórica-filogenética) hipotéticas.

codificación
La conversión de obsercaciones originales en un formato discreto alfanumérico utilizado en el análsis 
cladístico.

codificación aditiva
Un método para representar carácteres multiestado ordenados como, series unidas de carácteres binarios.

consenso
Un método para combinar un grupo de información contenida en varios cladogramas de los mismos taxa, en una sola topología, el árbol de consenso.

criterio de optimalidad
La suma total de todos los requerimientos a ser aplicados en un carácter durante la optimización, en términos de: orden, polaridad y dirección.


D
 


E
especie
Como taxón esta definido como linages que están separados de otros linajes en el sentido de que ellos evolucionan independientemente. Las especies comprenden el nivel más superior de la organización taxonómica sobre los cuales la evolución puede trabajar.

evolución reticular
Comprende el origen o formación de nuevas especies a partir de la hibridización (unión) de dos especies ancestrales preexistentes. Este patrón es bastante raro en animales, pero muy común en los procesos evolutivos de las plantas.


F
fenograma
Diagrama ramificado que ilustra una relación entre entidades (taxa) estimada por una similaridad total como única evidencia para su construcción. Este último término ha sido muy criticado por los "cladístas" ya que el uso de la totalidad de carácteres en forma redundante hace que: 1) los nodos son definidos por una mezcla de caracteres de avance (apomórficos) y primitivos (plesiomórficos), 2) no hay discriminación entre similaridad sinapomórfica (proveniente del compartimiento de un ancestro común) y similaridad producto de paralelismos y convergencias, y finalmente, 3) el sistema producido es sumamente inestable cuando son añadidos nuevos datos.


G
 


H
homología
Dos carácteres son homólogos, si uno procede directamente del otro. En este caso, tenemos una novedad evolutiva y su preexistente homólogo. Este par de homólogos se denominan serie de transformación evolutiva. El carácter original o preexistente es llamado plesimórfico (primitivo) y la novedad evolutiva es denominada carácter apomórfico (derivado).

homoplasia
Son carácteres que muestran similaridades estructurales (y entonces ontogenéticas) pero que se suponen han sido originadas independientemente uno del otro, ya sea de dos caracteres preexistentes o de un único carácter preexistente en dos épocas diferentes o en dos especies diferentes. Una homoplasia existe si los dos taxa que muestran el carácter tienen un acestro común que no posee dicho carácter.


I
índice de consistencia
Una medida de la cantidad de homoplasia de un carácter relativa, a un cladograma.
índice de consistencia re-escalado
Es el producto del índice de consistencia y el de retención, de un carácter.

índice de retención
Una medida de la cantidad de similaridad en un carácter que puede ser interpretado como una sinapomorfía de un cladograma. Es el grado de "sinapomorfía aparente".


J
jackknife
un procedimiento estadístico para estimar la varianza paramétrica de los datos observados, por medio del promedio de las varianzas de pseudoréplicas (muestras más pequeñas). Los datos originales son muestreados sin reemplazamiento para producir pseudomatrices que luego serán analizadas con algun método de búsqueda (arboles de Wagner), y finalmente se realiza un consenso estricto para ver la proporción (porcentaje) de grupos monofiléticos.


K
 


L
largo
El mínimo número de cambios de carácter (pasos) requeridos en un cladograma. La suma total del ajuste ("fit") de todos los carácteres en un cladograma.


M
 


N
 


O
optimización
Un procedimiento para reconstruir la secuencia de estados de carácteres más parsimoniosos sobre un cladograma, minimizando el criterio de optimalidad.


P
parsimonia
Este principio ha sido propuesto para ser utilizado cuando dos o más hipótesis competitivas resultan de un análisis de datos. Este principio establece que deberá escogerse aquella hipotésis que explique la distribución de caracteres de la forma más simple o económica. En otras palabras, la hipotésis preferible es aquella que exhibe la mayor congruencia en el patrón de carácteres sinapomórficos.

paso
Una ganancia o pérdida de un carácter o una transformación de un carácter multiestado sobre un cladograma.

pesado sucesivo
Un método iterativo para el pesado de carácteres "a posteriori" de acuerdo con su consistencia cladística, la cual es medida usualmente por el índice de consistencia o el índice de consistencia re-escalado.

pesos implicados
Un procedimiento de pesado de carácteres de acuerdo con su ajuste ("fit") en un cladograma, a partir del número de pasos extra implicados. La función de ajuste, es generalmente concava, dando más peso a aquellos carácteres con menos homoplasia. También es un método "a posteriori".

polaridad
Se dice que un carácter o serie de transformación están polarizados cuando la dirección de cambio del carácter o evolución ha sido especificada, por lo tanto se determina las plesiomorfías y apomorfías de los carácteres o estados de carácteres.

pseudoréplica
Una matriz de datos artificial producida por permutación de, o re-muestreo de, observaciones reales.
o

Q
 


R
 


S
serie de transformación
Una serie de tres o más carácteres o estados de carácteres apomórficos, incrementándose.

sistemática
Aquella rama de las Ciencias Biológicas encargada de clasificar (dar un orden) a la naturaleza. En otras palabras, trata sobre la teoría y práctica relacionada con la captura del ordenamiento en la naturaleza que es el resultado de patrones ancestros filogenéticos y descendientes.

subtree pruning and regrafting (SPR)
Un método de permutación de ramas ("Branch-swapping") que corta los subcladogramas del árbol entero y luego los coloca en nuevas posiciones del árbol.

stepwise addition
Secuencia por la cual los taxa son agregados en la construcción inicial del cladograma.


T
taxón (pl. taxa)
Es el agrupamiento de organismos al cual se le ha dado un nombre propio, o podría darse un nombre propio, pero este nombre no es decidido por pura conveniencia.

taxón natural
Una especie o grupo de especies (taxón supraespecífico) que existe en la naturaleza como resultado de una historia única de descendencia con modificación (= evolución).

tree bisection and reconnection (TBR)
Un método de permutación de ramas ("Branch-swapping") que corta los subcladogramas del árbol entero y lo re-enraiza para colocarlo en nuevas posiciones de las áreas remanentes del árbol.


U
 


V
 


W



X
 


Y
 


Z

BIBLIOGRAFÍA (TEXTOS EN ESPAÑOL)


Contreras-Ramos A, Goyenechea I. 2007. La sistemática, base del conocimiento de la biodiversidad. Colección Ciencia al Día. UAEH, Pachuca. 158p

De Luna E, Mishler BD. 1996. El concepto de homología filogenética y la selección de caracteres taxonómicos. Boletín de la Sociedad Botánica de México. 59: 131-146.


De Luna E, Guerrero JA, Chew-Taracena T. 2005. Sistemática biológica: avances y direcciones en la teoría y los métodos de la reconstrucción filogenética. Hidrobiológica. 15(3): 351-370.


Feliner GN. 1999. Tres décadas de Cladismo. Boletin de la Sociedad Entomológica Aragonesa. 26: 85-93.


Goloboff P. 1998. Principios Básicos de Cladística. Ed. Sociedad Argentina de Botánica. Buenos Aires, Argentina.


Hennig W. 1966. Elementos de una sistemática filogenética. Ed. Universitaria de Buenos Aires. Buenos Aires, Argentina.


Morrone JJ, Llorente-Bousquets J. 2002. Cuatro mitos acerca de la Cladistica. Dugesiana. 9(1): 47-51.


Morrone JJ. 2005. Sistemática, Biogeografía, Evolución: los patrones de la biodiversidad en tiempo-espacio. Ed. Las Prensas de Ciencias. Facultad de Ciencias UNAM, Mexico.


Scrocchi G, Dominguez E. 1992. Introducción a las Escuelas de Sistemática y Biogeografía. No. 40. Opera Lilloana. Fundación Miguel Lillo, Tucumán, Argentina.

Mapas base para NDM (4)

Aquí les dejo un mapa para NDM de las Antillas Mayores: Cuba, Jamaica, Rep. Dominicana, Haiti y Puerto Rico. Y como siempre, aca les coloco la descarga en formato Shapefile.

miércoles, 18 de mayo de 2011

Tutoriales sobre VIP

Hace unos días les comente sobre "Vicariance Inference Program" o VIP, realizado por Salvador Arias. Pues bien, estoy recien trabajando con el y me gustaría compartir con ustedes algunos aspectos sobre la instalación y el tipo de datos que se utilizan, así como unas imagenes de las ventanas del programa.

1) El programa utiliza las librerías de GTK+ para la interfaz gráfica. Esto puede traerles inconvenientes cuando deseamos instalar VIP en sistemas operativos de Windows. Hace unos dias baje la última versión de VIP, para instalarla en tres maquinas: Una con WindowsXP, otra con Windows2000, y la portatil que aun tiene Vista!. Cuando descargué la versión 2.22 de GTK+, me di cuenta que VIP solo funcionó en XP; los otros sistemas dieron errores relacionados con la falta de archivos dll (del GTK). Me puse a buscar los posilbes problemas de GTK en Windows2000 y Vista, hasta que encontré la versión 2.16.6. Al instalarla en las dos maquinas, el programa corrió debidamente (de hecho la 2.16.6 es la última versión estable para Windows2000). Aqui les muestro una imagen de VIP en Windows Vista:    



En la izquierda, encontramos la ventana principal donde se abren datos (árboles y registros georreferenciados), y se realizan las búsquedas heurísticas de los eventos vicariantes; la ventana del medio es el visor de árboles y selección de nodos; finalmente en la ventana de la derecha encontramos el visor de mapas, con los registros. 

2) Como les dije tambien, esta disponible el manual de VIP. No obstante para darles una ayuda, les indico los "tips" más relevantes, para preparar los datos:


2.1) Hace falta una filogenia del grupo en estudio. Para ello utilizamos TNT y el macro toxml. Este script nos permite pasar un archivo de árboles en notación parentética [(A (((BC) D)(E(F(GH))))) (A (((BC) D) (E (F (GH )))))] al formato XML. Lo importante es que el archivo de árboles debe contener SOLO los terminales que poseen registros georreferenciados, es decir, debemos quitar los grupos externos de nuestro(s) cladogramas. Para ello, utilizamos el block de notas (o Notepad) y abrimos el archivo *.tre para eliminar los terminales que deseamos. Luego abrimos el archivo de árboles en TNT para asegurarnos que quedó bien. Luego ejecutamos el macro toxml, teniendo en cuenta que por defecto, exportará el primer árbol de nuestro archivo (si deseamos que sea otro, debemos indicarle el número del árbol).  

2.2) Necesitamos datos georreferenciados. En este caso pueden utilizarse varios formatos; en mi caso resultaron faciles los de NDM (archivos *,xyd) y texto separados por tabulaciones (*.txt). Vamos a mostrarles este último:

Scientific name    Latitude    Longitude
Ps_albigenu    -24.4333    -54.9333
Ps_albigenu    9.3617    -71.7311
Ps_albigenu    -22.7333    -50.6167
Ps_albigenu    -28.1333    -64.9667

La primera fila solo tiene tres etiquetas: Scientific name, Latitude y Longitude. Este formato de etiquetas es similar al de GBIF. Luego se coloca cada terminal seguido de tabulación, la coordenada en latitud, tabulación, y la coordenada de longitud. Lo importante aca es que los nombres de las especies DEBEN COINCIDIR con la de los terminales del árbol.

Bueno, eso es todo por ahora. Les dejo otras imagenes de VIP:


Se aprecia la misma disposición de las ventanas, pero mostrando el número de nodos vicariantes y la cuadrícula (en este caso de 1,5 x 1,5) para realizar la búsqueda heurística. 


Este es resultado de la búsqueda de eventos vicariantes, y se aprecia un nodo y la distribución de taxa (azul y rojo) y la barrera (alopatría) hipotética (en verde). Notese que la especie en azul ocupa el área del arco de las Antillas.