La inferencia bayesiana de la filogenia combina la información de la probabilidad previa y de los datos para crear la denominada probabilidad posterior de los árboles, que es la probabilidad de que el árbol sea correcto dados los datos, la probabilidad previa y el modelo de probabilidad. La inferencia bayesiana fue introducida en la filogenética molecular en la década de 1990 por tres grupos independientes: Bruce Rannala y Ziheng Yang en Berkeley, [1] [2] Bob Mau en Madison, [3] y Shuying Li en la Universidad de Iowa, [4] los dos últimos siendo estudiantes de doctorado en ese momento. El enfoque se ha vuelto muy popular desde el lanzamiento del software MrBayes en 2001, [5] y ahora es uno de los métodos más populares en filogenética molecular.
Inferencia bayesiana de antecedentes y bases filogenéticas
La inferencia bayesiana se refiere a un método probabilístico desarrollado por el reverendo Thomas Bayes basado en el teorema de Bayes . Publicado póstumamente en 1763, fue la primera expresión de probabilidad inversa y la base de la inferencia bayesiana. De forma independiente, sin conocer el trabajo de Bayes, Pierre-Simon Laplace desarrolló el teorema de Bayes en 1774. [6]
La inferencia bayesiana o el método de probabilidad inversa fue el enfoque estándar en el pensamiento estadístico hasta principios del siglo XX, antes de que RA Fisher desarrollara lo que ahora se conoce como inferencia clásica/frecuentista/fisheriana. Las dificultades computacionales y las objeciones filosóficas habían impedido la adopción generalizada del enfoque bayesiano hasta la década de 1990, cuando los algoritmos de Monte Carlo con cadenas de Markov (MCMC) revolucionaron el cálculo bayesiano.
El enfoque bayesiano para la reconstrucción filogenética combina la probabilidad previa de un árbol P(A) con la probabilidad de los datos (B) para producir una distribución de probabilidad posterior en árboles P(A|B). [7] La probabilidad posterior de un árbol será la probabilidad de que el árbol sea correcto, dada la probabilidad previa, los datos y la exactitud del modelo de probabilidad.
Los métodos MCMC se pueden describir en tres pasos: primero, utilizando un mecanismo estocástico, se propone un nuevo estado para la cadena de Markov . En segundo lugar, se calcula la probabilidad de que este nuevo estado sea correcto. En tercer lugar, se propone una nueva variable aleatoria (0,1). Si este nuevo valor es menor que la probabilidad de aceptación, se acepta el nuevo estado y se actualiza el estado de la cadena. Este proceso se ejecuta miles o millones de veces. El número de veces que se visita un solo árbol durante el curso de la cadena es una aproximación de su probabilidad posterior. Algunos de los algoritmos más comunes utilizados en los métodos MCMC incluyen los algoritmos Metropolis-Hastings, el MCMC Metropolis-Coupling (MC³) y el algoritmo LOCAL de Larget y Simon.
Algoritmo Metropolis-Hastings
Uno de los métodos MCMC más utilizados es el algoritmo Metropolis-Hastings , [8] una versión modificada del algoritmo Metropolis original. [9] Es un método ampliamente utilizado para muestrear aleatoriamente probabilidades de distribuciones complejas y multidimensionales. El algoritmo Metropolis se describe en los siguientes pasos: [10] [11]
Se selecciona aleatoriamente un árbol inicial, T i .
Se selecciona un árbol vecino, T j , de la colección de árboles.
La relación, R, de las probabilidades (o funciones de densidad de probabilidad) de T j y T i se calcula de la siguiente manera: R = f(T j )/f(T i )
Si R ≥ 1, T j se acepta como el árbol actual.
Si R < 1, se acepta T j como el árbol actual con probabilidad R, de lo contrario se mantiene T i .
En este punto el proceso se repite desde el paso 2 N veces.
El algoritmo sigue funcionando hasta que alcanza una distribución de equilibrio. También supone que la probabilidad de proponer un nuevo árbol T j cuando estamos en el estado del árbol antiguo T i es la misma probabilidad de proponer T i cuando estamos en T j . Cuando este no es el caso, se aplican correcciones de Hastings. El objetivo del algoritmo Metropolis-Hastings es producir una colección de estados con una distribución determinada hasta que el proceso de Markov alcance una distribución estacionaria. El algoritmo tiene dos componentes:
Una transición potencial de un estado a otro (i → j) utilizando una función de probabilidad de transición q i,j
Movimiento de la cadena al estado j con probabilidad α i,j y permanece en i con probabilidad 1 – α i,j . [2]
MCMC acoplado a metrópolis
El algoritmo MCMC acoplado a Metropolis (MC³) [12] se ha propuesto para resolver un problema práctico de la cadena de Markov que se mueve a través de picos cuando se sabe que la distribución objetivo tiene múltiples picos locales, separados por valles bajos, en el espacio del árbol. Este es el caso durante la búsqueda de árbol heurístico bajo criterios de máxima parsimonia (MP), máxima verosimilitud (ML) y mínima evolución (ME), y se puede esperar lo mismo para la búsqueda de árbol estocástico utilizando MCMC. Este problema dará como resultado que las muestras no se aproximen correctamente a la densidad posterior. El (MC³) mejora la mezcla de cadenas de Markov en presencia de múltiples picos locales en la densidad posterior. Ejecuta múltiples cadenas (m) en paralelo, cada una durante n iteraciones y con diferentes distribuciones estacionarias , , donde la primera, es la densidad objetivo, mientras que , se eligen para mejorar la mezcla. Por ejemplo, se puede elegir un calentamiento incremental de la forma:
de modo que la primera cadena es la cadena fría con la densidad objetivo correcta, mientras que las cadenas son cadenas calentadas. Nótese que elevar la densidad a la potencia con tiene el efecto de aplanar la distribución, similar a calentar un metal. En una distribución de este tipo, es más fácil atravesar picos (separados por valles) que en la distribución original. Después de cada iteración, se propone un intercambio de estados entre dos cadenas elegidas aleatoriamente a través de un paso de tipo Metropolis. Sea el estado actual en la cadena , . Se acepta con probabilidad un intercambio entre los estados de las cadenas y :
Al final de la ejecución, se utiliza únicamente la salida de la cadena fría, mientras que se descartan las de las cadenas calientes. Heurísticamente, las cadenas calientes visitarán los picos locales con bastante facilidad, y el intercambio de estados entre cadenas permitirá que la cadena fría ocasionalmente salte valles, lo que conduce a una mejor mezcla. Sin embargo, si es inestable, rara vez se aceptarán los intercambios propuestos. Esta es la razón por la que se utilizan varias cadenas que difieren solo de manera incremental.
Una desventaja obvia del algoritmo es que se ejecutan cadenas y solo se utiliza una cadena para la inferencia. Por este motivo, es ideal para su implementación en máquinas paralelas, ya que cada cadena requerirá en general la misma cantidad de cálculos por iteración.
Algoritmo LOCAL de Larget y Simon
Los algoritmos LOCAL [13] ofrecen una ventaja computacional sobre los métodos anteriores y demuestran que un enfoque bayesiano puede evaluar la incertidumbre de manera computacionalmente práctica en árboles más grandes. El algoritmo LOCAL es una mejora del algoritmo GLOBAL presentado en Mau, Newton y Larget (1999) [14] en el que se cambian todas las longitudes de las ramas en cada ciclo. Los algoritmos LOCAL modifican el árbol seleccionando una rama interna del árbol al azar. Los nodos en los extremos de esta rama están conectados cada uno a otras dos ramas. Uno de cada par se elige al azar. Imagine tomar estos tres bordes seleccionados y tenderlos como un tendedero de izquierda a derecha, donde la dirección (izquierda/derecha) también se selecciona al azar. Los dos puntos finales de la primera rama seleccionada tendrán un subárbol colgando como una prenda de vestir atada al tendedero. El algoritmo procede multiplicando las tres ramas seleccionadas por una cantidad aleatoria común, similar a estirar o encoger el tendedero. Finalmente, el subárbol que se encuentra más a la izquierda de los dos que cuelgan se desconecta y se vuelve a conectar al tendedero en una ubicación seleccionada de manera uniforme y aleatoria. Este sería el árbol candidato.
Supongamos que empezamos seleccionando la rama interna con longitud que separa los taxones y del resto. Supongamos también que hemos seleccionado (al azar) ramas con longitudes y de cada lado, y que orientamos estas ramas. Sea , la longitud actual del tendedero. Seleccionamos la nueva longitud como , donde es una variable aleatoria uniforme en . Entonces, para el algoritmo LOCAL, la probabilidad de aceptación se puede calcular como:
Evaluación de la convergencia
Para estimar la longitud de una rama de un árbol de 2 taxones bajo JC, en el que los sitios no varían y son variables, suponga una distribución a priori exponencial con una tasa . La densidad es . Las probabilidades de los posibles patrones de sitios son:
para sitios invariados, y
Por lo tanto, la distribución posterior no normalizada es:
o, alternativamente,
Actualice la longitud de la rama eligiendo un nuevo valor de manera uniforme y aleatoria desde una ventana de medio ancho centrada en el valor actual:
donde se distribuye uniformemente entre y . La probabilidad de aceptación es:
Ejemplo: , . Compararemos los resultados de dos valores de , y . En cada caso, comenzaremos con una longitud inicial de y actualizaremos la longitud veces.
Máxima parsimonia y máxima verosimilitud
Existen muchos enfoques para reconstruir árboles filogenéticos, cada uno con sus ventajas y desventajas, y no hay una respuesta sencilla a la pregunta “¿cuál es el mejor método?”. La máxima parsimonia (MP) y la máxima verosimilitud (ML) son métodos tradicionales ampliamente utilizados para la estimación de filogenias y ambos utilizan información de caracteres directamente, como lo hacen los métodos bayesianos.
La máxima parsimonia recupera uno o más árboles óptimos basados en una matriz de caracteres discretos para un cierto grupo de taxones y no requiere un modelo de cambio evolutivo. La MP da la explicación más simple para un conjunto dado de datos, reconstruyendo un árbol filogenético que incluye la menor cantidad posible de cambios a través de las secuencias. El soporte de las ramas del árbol está representado por el porcentaje de bootstrap . Por la misma razón por la que ha sido ampliamente utilizado, su simplicidad, la MP también ha recibido críticas y ha sido relegada a un segundo plano por los métodos ML y bayesianos. La MP presenta varios problemas y limitaciones. Como lo mostró Felsenstein (1978), la MP puede ser estadísticamente inconsistente, [15] lo que significa que a medida que se acumulan más y más datos (por ejemplo, longitud de secuencia), los resultados pueden converger en un árbol incorrecto y conducir a una atracción de ramas largas , un fenómeno filogenético donde los taxones con ramas largas (numerosos cambios de estado de carácter) tienden a aparecer más estrechamente relacionados en la filogenia de lo que realmente están. En el caso de los datos morfológicos, estudios de simulación recientes sugieren que la parsimonia puede ser menos precisa que los árboles construidos utilizando enfoques bayesianos, [16] posiblemente debido a la sobreprecisión, [17] aunque esto ha sido discutido. [18] Estudios que utilizan nuevos métodos de simulación han demostrado que las diferencias entre los métodos de inferencia resultan de la estrategia de búsqueda y el método de consenso empleados, en lugar de la optimización utilizada. [19]
Al igual que en la máxima parsimonia, la máxima verosimilitud evaluará árboles alternativos. Sin embargo, considera la probabilidad de que cada árbol explique los datos dados en función de un modelo de evolución. En este caso, se elige el árbol con la mayor probabilidad de explicar los datos sobre los demás. [20] En otras palabras, compara cómo los diferentes árboles predicen los datos observados. La introducción de un modelo de evolución en los análisis ML presenta una ventaja sobre MP, ya que se tienen en cuenta la probabilidad de sustituciones de nucleótidos y las tasas de estas sustituciones, lo que explica las relaciones filogenéticas de los taxones de una manera más realista. Una consideración importante de este método es la longitud de la rama, que la parsimonia ignora, y es más probable que los cambios ocurran a lo largo de las ramas largas que en las cortas. Este enfoque podría eliminar la atracción por las ramas largas y explicar la mayor consistencia de ML sobre MP. Aunque muchos lo consideran el mejor enfoque para inferir filogenias desde un punto de vista teórico, ML es computacionalmente intensivo y es casi imposible explorar todos los árboles, ya que hay demasiados. La inferencia bayesiana también incorpora un modelo de evolución y las principales ventajas sobre MP y ML son que es computacionalmente más eficiente que los métodos tradicionales, cuantifica y aborda la fuente de incertidumbre y es capaz de incorporar modelos complejos de evolución.
Trampas y controversias
Valores bootstrap vs probabilidades posteriores. Se ha observado que los valores de soporte bootstrap, calculados bajo parsimonia o máxima verosimilitud, tienden a ser menores que las probabilidades posteriores obtenidas por inferencia bayesiana. [21] [22] [23] [24] [25] Esto lleva a una serie de preguntas como: ¿Las probabilidades posteriores conducen a un exceso de confianza en los resultados? [26] ¿Son los valores bootstrap más robustos que las probabilidades posteriores? Un hecho subyacente a esta controversia es que todos los datos se utilizan durante el análisis bayesiano y el cálculo de probabilidades posteriores, mientras que la naturaleza del bootstrapping significa que la mayoría de las réplicas bootstrap carecerán de algunos de los datos originales. Como resultado, las biparticiones (ramas) soportadas por relativamente pocos caracteres en el conjunto de datos pueden recibir probabilidades posteriores muy altas pero un soporte bootstrap moderado o incluso bajo, ya que muchas de las réplicas bootstrap no contienen suficientes caracteres críticos para recuperar la bipartición.
Polémica sobre el uso de probabilidades previas. Muchos consideran que el uso de probabilidades previas para el análisis bayesiano es una ventaja, ya que proporciona una forma de incorporar información de fuentes distintas a los datos que se analizan. Sin embargo, cuando falta dicha información externa, uno se ve obligado a utilizar una probabilidad previa, incluso si es imposible utilizar una distribución estadística para representar la ignorancia total. También es preocupante que las probabilidades posteriores bayesianas puedan reflejar opiniones subjetivas cuando la probabilidad previa es arbitraria y subjetiva.
Elección del modelo. Los resultados del análisis bayesiano de una filogenia están directamente relacionados con el modelo de evolución elegido, por lo que es importante elegir un modelo que se ajuste a los datos observados; de lo contrario, las inferencias en la filogenia serán erróneas. Muchos científicos han planteado preguntas sobre la interpretación de la inferencia bayesiana cuando el modelo es desconocido o incorrecto. Por ejemplo, un modelo demasiado simplificado podría dar probabilidades posteriores más altas. [21] [27]
Programa informático MrBayes
MrBayes es una herramienta de software libre que realiza inferencias bayesianas de filogenia. Fue escrita originalmente por John P. Huelsenbeck y Frederik Ronquist en 2001. [28] A medida que los métodos bayesianos aumentaron en popularidad, MrBayes se convirtió en uno de los programas de elección para muchos filogenéticos moleculares. Se ofrece para sistemas operativos Macintosh, Windows y UNIX y tiene una interfaz de línea de comandos. El programa utiliza el algoritmo MCMC estándar, así como la variante MCMC acoplada a Metropolis. MrBayes lee matrices alineadas de secuencias (ADN o aminoácidos) en el formato estándar NEXUS . [29]
MrBayes utiliza MCMC para aproximar las probabilidades posteriores de los árboles. [9] El usuario puede cambiar los supuestos del modelo de sustitución, los valores anteriores y los detalles del análisis MC³. También permite al usuario eliminar y agregar taxones y caracteres al análisis. El programa incluye, entre varios modelos de nucleótidos, el modelo más estándar de sustitución de ADN, el 4x4 también llamado JC69, que supone que los cambios a través de los nucleótidos ocurren con la misma probabilidad. [30] También implementa una serie de modelos 20x20 de sustitución de aminoácidos y modelos de codones de sustitución de ADN. Ofrece diferentes métodos para relajar el supuesto de tasas de sustitución iguales en los sitios de nucleótidos. [31] MrBayes también puede inferir estados ancestrales acomodando la incertidumbre al árbol filogenético y los parámetros del modelo.
MrBayes 3 [32] fue una versión completamente reorganizada y reestructurada del MrBayes original. La principal novedad fue la capacidad del software para adaptarse a la heterogeneidad de los conjuntos de datos. Este nuevo marco permite al usuario mezclar modelos y aprovechar la eficiencia del análisis MCMC bayesiano al tratar con diferentes tipos de datos (por ejemplo, proteínas, nucleótidos y morfológicos). Utiliza el MCMC Metropolis-Coupling por defecto.
MrBayes 3.2 se lanzó en 2012 [33] . La nueva versión permite a los usuarios ejecutar múltiples análisis en paralelo. También proporciona cálculos de probabilidad más rápidos y permite delegar estos cálculos a unidades de procesamiento gráfico (GPU). La versión 3.2 ofrece opciones de salida más amplias compatibles con FigTree y otros visualizadores de árboles.
Lista de programas de filogenética
Esta tabla incluye algunos de los programas filogenéticos más comunes que se utilizan para inferir filogenias en un marco bayesiano. Algunos de ellos no utilizan exclusivamente métodos bayesianos.
Nombre
Descripción
Método
Autor
Enlace del sitio web
Señor Bayes
Inferencia filogenética
Un programa para la inferencia bayesiana y la elección de modelos en una amplia gama de modelos filogenéticos y evolutivos.
Zangh, Huelsenbeck, Der Mark, Ronquist y Teslenko
https://nbisweden.github.io/MrBayes/
BESTIA
Árboles de muestreo para análisis evolutivo bayesiano
Inferencia bayesiana, reloj molecular relajado, historia demográfica
Inferencia bayesiana de árboles utilizando métodos de Monte Carlo de cadenas de Markov
Inferencia bayesiana, modelos múltiples, modelo de mezcla (partición automática)
M. Pagel, A. Meade [40]
http://www.evolution.rdg.ac.uk/BayesPhy.html Archivado el 19 de febrero de 2020 en Wayback Machine.
Plataforma de flujo de trabajo Armadillo
Plataforma de flujo de trabajo dedicada al análisis filogenético y bioinformático general
Envoltorio de interfaz gráfica de usuario alrededor de MrBayes
E. Lord, M. Leclercq, A. Boc, AB Diallo y V. Makarenkov [41]
https://github.com/armadilloUQAM/armadillo2/
Geneious (complemento de MrBayes)
Geneious proporciona herramientas de investigación del genoma y del proteoma
Envoltorio de interfaz gráfica de usuario alrededor de MrBayes
AJ Drummond, M. Suchard, V. Lefort et al.
http://www.geneious.com
TOPALí
Inferencia filogenética
Envoltorio de interfaz gráfica de usuario alrededor de MrBayes
I. Milne, D. Lindner y otros [42]
http://www.topali.org
Aplicaciones
La inferencia bayesiana ha sido ampliamente utilizada por los filogenéticos moleculares para una amplia variedad de aplicaciones. Algunas de ellas incluyen:
Inferencia de filogenias. [43] [44]
Inferencia y evaluación de la incertidumbre de las filogenias. [45]
Inferencia de la evolución del estado de carácter ancestral. [46] [47]
Inferencia de áreas ancestrales. [48]
Análisis de datación molecular. [49] [50]
Dinámica de modelos de diversificación y extinción de especies [51]
Dilucidar los patrones de dispersión de patógenos. [52]
Inferencia de la evolución de rasgos fenotípicos. [53] [54]
Referencias
^ Rannala, Bruce; Yang, Ziheng (septiembre de 1996). "Distribución de probabilidad de árboles evolutivos moleculares: un nuevo método de inferencia filogenética". Journal of Molecular Evolution . 43 (3): 304–311. Bibcode :1996JMolE..43..304R. doi :10.1007/BF02338839. PMID 8703097. S2CID 8269826.
^ ab Yang, Z.; Rannala, B. (1 de julio de 1997). "Inferencia filogenética bayesiana utilizando secuencias de ADN: un método de Monte Carlo de cadena de Markov". Biología molecular y evolución . 14 (7): 717–724. doi : 10.1093/oxfordjournals.molbev.a025811 . PMID 9214744.
^ Mau, Bob; Newton, Michael A.; Larget, Bret (marzo de 1999). "Inferencia filogenética bayesiana mediante métodos de Monte Carlo de cadenas de Markov". Biometrics . 55 (1): 1–12. doi : 10.1111/j.0006-341x.1999.00001.x . JSTOR 2533889. PMID 11318142. S2CID 932887.
^ Li, Shuying; Pearl, Dennis K.; Doss, Hani (junio de 2000). "Construcción de árboles filogenéticos mediante el método Monte Carlo de cadenas de Markov". Revista de la Asociación Estadounidense de Estadística . 95 (450): 493–508. doi :10.1080/01621459.2000.10474227. JSTOR 2669394. S2CID 122459537.
^ Huelsenbeck, JP; Ronquist, F. (1 de agosto de 2001). "MRBAYES: Inferencia bayesiana de árboles filogenéticos". Bioinformática . 17 (8): 754–755. doi : 10.1093/bioinformatics/17.8.754 . PMID 11524383.
^ Laplace P (1774). "Memoire sur la Probabilité des Causes par les Evenements". L'Académie Royale des Sciences . 6 : 621–656. NAID 10010866843.Traducción al inglés de Stigler SM (1986). "Memoria sobre la probabilidad de las causas de los acontecimientos". Ciencia estadística . 1 (3): 359–378. doi : 10.1214/ss/1177013620 .
^ Nascimento, Fabricia F.; Reis, Mario dos; Yang, Ziheng (octubre de 2017). "Una guía para biólogos para el análisis filogenético bayesiano". Ecología y evolución de la naturaleza . 1 (10): 1446-1454. Código Bib : 2017NatEE...1.1446N. doi :10.1038/s41559-017-0280-x. PMC 5624502 . PMID 28983516.
^ Hastings WK (abril de 1970). "Métodos de muestreo de Monte Carlo utilizando cadenas de Markov y sus aplicaciones". Biometrika . 57 (1): 97–109. Bibcode :1970Bimka..57...97H. doi :10.1093/biomet/57.1.97.
^ ab Metropolis N, Rosenbluth AW, Rosenbluth MN, Teller AH, Teller E (junio de 1953). "Cálculos de ecuaciones de estado mediante máquinas de computación rápida". The Journal of Chemical Physics . 21 (6): 1087–92. Bibcode :1953JChPh..21.1087M. doi :10.1063/1.1699114. OSTI 4390578. S2CID 1046577.
^ Yang Z (2014). Evolución molecular: un enfoque estadístico . Oxford, Inglaterra: Oxford University Press.
^ Geyer CJ (1991). "Máxima verosimilitud de Monte Carlo en cadena de Markov". En Keramidas EM, Kaufman SM (eds.). Ciencias de la computación y estadística: actas del 23.º simposio sobre la interfaz . Fairfax Station: Interface Foundation. págs. 156-163. OCLC 26603816.
^ Larget B, Simon DL (junio de 1999). "Algoritmos de Monte Carlo de cadena de Markov para el análisis bayesiano de árboles filogenéticos". Biología molecular y evolución . 16 (6): 750–9. doi : 10.1093/oxfordjournals.molbev.a026160 .
^ Mau B, Newton MA, Larget B (marzo de 1999). "Inferencia filogenética bayesiana mediante métodos de Monte Carlo de cadena de Markov". Biometrics . 55 (1): 1–12. doi : 10.1111/j.0006-341x.1999.00001.x . PMID 11318142. S2CID 932887.
^ Felsenstein J (diciembre de 1978). "Casos en los que los métodos de parsimonia o compatibilidad serán claramente engañosos". Zoología Sistemática . 27 (4): 401–10. doi :10.1093/sysbio/27.4.401.
^ Castorani MC, Reed DC, Raimondi PT, Alberto F, Bell TW, Cavanaugh KC, et al. (enero de 2017). "Las fluctuaciones en la fecundidad de la población impulsan la variación en la conectividad demográfica y la dinámica de la metapoblación". Actas. Ciencias biológicas . 284 (1847): 20162086. doi :10.1098/rspb.2016.2086. PMC 5310032. PMID 28123088 .
^ O'Reilly JE, Puttick MN, Parry L, Tanner AR, Tarver JE, Fleming J, Pisani D, Donoghue PC (abril de 2016). "Los métodos bayesianos superan a la parsimonia, pero a expensas de la precisión en la estimación de la filogenia a partir de datos morfológicos discretos". Biology Letters . 12 (4): 20160081. doi :10.1098/rsbl.2016.0081. PMC 4881353 . PMID 27095266.
^ Goloboff PA, Torres A, Arias JS (2018). "La parsimonia ponderada supera a otros métodos de inferencia filogenética bajo modelos apropiados para la morfología". Cladistics . 34 (4): 407–437. doi : 10.1111/cla.12205 . hdl : 11336/57822 . ISSN 0748-3007. PMID 34649370.
^ ab Suzuki Y, Glazko GV, Nei M (diciembre de 2002). "Sobrecredibilidad de las filogenias moleculares obtenidas mediante filogenética bayesiana". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 99 (25): 16138–43. Bibcode :2002PNAS...9916138S. doi : 10.1073/pnas.212646199 . PMC 138578 . PMID 12451182.
^ Alfaro ME, Zoller S, Lutzoni F (febrero de 2003). "¿Bayes o bootstrap? Un estudio de simulación que compara el rendimiento del muestreo de Monte Carlo de cadena de Markov bayesiana y el bootstrap en la evaluación de la confianza filogenética". Biología molecular y evolución . 20 (2): 255–66. doi : 10.1093/molbev/msg028 . PMID 12598693.
^ Douady CJ, Delsuc F, Boucher Y, Doolittle WF, Douzery EJ (febrero de 2003). "Comparación de medidas de fiabilidad filogenética bayesianas y de máxima verosimilitud". Biología molecular y evolución . 20 (2): 248–54. doi : 10.1093/molbev/msg042 . PMID 12598692.
^ García-Sandoval R (enero de 2014). "Por qué algunos clados tienen bajas frecuencias bootstrap y altas probabilidades posteriores bayesianas". Revista israelí de ecología y evolución . 60 (1): 41–4. doi :10.1080/15659801.2014.937900.
^ Yang, Z. (18 de abril de 2007). "Paradoja del equilibrio justo, paradoja del árbol estrella y filogenética bayesiana". Biología molecular y evolución . 24 (8): 1639–1655. doi : 10.1093/molbev/msm081 . PMID 17488737.
^ Yang, Ziheng; Zhu, Tianqi (20 de febrero de 2018). "La selección bayesiana de modelos mal especificados es demasiado confiada y puede causar probabilidades posteriores espurias para los árboles filogenéticos". Actas de la Academia Nacional de Ciencias . 115 (8): 1854–1859. Bibcode :2018PNAS..115.1854Y. doi : 10.1073/pnas.1712673115 . PMC 5828583 . PMID 29432193.
^ Erixon P, Svennblad B, Britton T, Oxelman B (octubre de 2003). "Fiabilidad de las probabilidades posteriores bayesianas y frecuencias bootstrap en filogenética". Biología sistemática . 52 (5): 665–73. doi : 10.1080/10635150390235485 . PMID 14530133.
^ Huelsenbeck JP, Ronquist F (agosto de 2001). "MRBAYES: Inferencia bayesiana de árboles filogenéticos". Bioinformática . 17 (8). Oxford, Inglaterra: 754–5. doi : 10.1093/bioinformatics/17.8.754 . PMID 11524383.
^ Maddison DR, Swofford DL, Maddison WP (diciembre de 1997). "NEXUS: un formato de archivo extensible para información sistemática". Biología sistemática . 46 (4): 590–621. doi : 10.1093/sysbio/46.4.590 . PMID 11975335.
^ Jukes TH, Cantor CR (1969). Evolución de las moléculas de proteínas . Nueva York: Academic Press. pp. 21–132.
^ Yang Z (noviembre de 1993). "Estimación de máxima verosimilitud de la filogenia a partir de secuencias de ADN cuando las tasas de sustitución difieren según los sitios". Biología molecular y evolución . 10 (6): 1396–401. doi : 10.1093/oxfordjournals.molbev.a040082 . PMID 8277861.
^ Ronquist F, Huelsenbeck JP (agosto de 2003). "MrBayes 3: Inferencia filogenética bayesiana bajo modelos mixtos". Bioinformática . 19 (12). Oxford, Inglaterra: 1572–4. doi : 10.1093/bioinformatics/btg180 . PMID 12912839.
^ Ronquist F, Teslenko M, van der Mark P, Ayres DL, Darling A, Höhna S, Larget B, Liu L, Suchard MA, Huelsenbeck JP (mayo de 2012). "MrBayes 3.2: inferencia filogenética bayesiana eficiente y elección de modelo en un gran espacio de modelos". Biología sistemática . 61 (3): 539–42. doi :10.1093/sysbio/sys029. PMC 3329765 . PMID 22357727.
^ Drummond AJ, Suchard MA, Xie D, Rambaut A (agosto de 2012). "Filogenética bayesiana con BEAUti y BEAST 1.7". Biología molecular y evolución . 29 (8): 1969–73. doi :10.1093/molbev/mss075. PMC 3408070 . PMID 22367748.
^ Bouckaert R, Heled J, Kühnert D, Vaughan T, Wu CH, Xie D, Suchard MA, Rambaut A, Drummond AJ (abril de 2014). "BEAST 2: una plataforma de software para el análisis evolutivo bayesiano". PLOS Computational Biology . 10 (4): e1003537. Bibcode :2014PLSCB..10E3537B. doi : 10.1371/journal.pcbi.1003537 . PMC 3985171 . PMID 24722319.
^ Lartillot N, Philippe H (junio de 2004). "Un modelo de mezcla bayesiano para heterogeneidades entre sitios en el proceso de reemplazo de aminoácidos". Biología molecular y evolución . 21 (6): 1095–109. doi : 10.1093/molbev/msh112 . PMID 15014145.
^ Suchard MA, Redelings BD (agosto de 2006). "BAli-Phy: inferencia bayesiana simultánea de alineamiento y filogenia". Bioinformática . 22 (16): 2047–8. doi : 10.1093/bioinformatics/btl175 . PMID 16679334.
^ Ané C , Larget B, Baum DA, Smith SD, Rokas A (febrero de 2007). "Estimación bayesiana de concordancia entre árboles genéticos". Biología molecular y evolución . 24 (2): 412–26. doi : 10.1093/molbev/msl170 . PMID: 17095535.
^ Wilson IJ, Weale ME, Balding DJ (junio de 2003). "Inferencias a partir de datos de ADN: historias de población, procesos evolutivos y probabilidades de coincidencia forense". Journal of the Royal Statistical Society, Serie A (Estadísticas en la sociedad) . 166 (2): 155–88. doi : 10.1111/1467-985X.00264 .
^ Pagel M, Meade A (junio de 2006). "Análisis bayesiano de la evolución correlacionada de caracteres discretos mediante el método Monte Carlo de cadena de Markov con salto reversible". The American Naturalist . 167 (6): 808–25. doi :10.1086/503444. PMID 16685633. S2CID 205984494.
^ Lord E, Leclercq M, Boc A, Diallo AB, Makarenkov V (2012). "Armadillo 1.1: una plataforma de flujo de trabajo original para diseñar y realizar análisis y simulaciones filogenéticas". PLOS ONE . 7 (1): e29903. Bibcode :2012PLoSO...729903L. doi : 10.1371/journal.pone.0029903 . PMC 3256230 . PMID 22253821.
^ Milne I, Lindner D, Bayer M, Husmeier D, McGuire G, Marshall DF, Wright F (enero de 2009). "TOPALi v2: una interfaz gráfica enriquecida para análisis evolutivos de alineaciones múltiples en clústeres HPC y escritorios multinúcleo". Bioinformática . 25 (1): 126–7. doi :10.1093/bioinformatics/btn575. PMC 2638937 . PMID 18984599.
^ Alonso R, Crawford AJ, Bermingham E (marzo de 2012). "Filogenia molecular de una radiación endémica de sapos cubanos (Bufonidae: Peltophryne) basada en genes mitocondriales y nucleares". Revista de biogeografía . 39 (3): 434–51. Código Bibliográfico :2012JBiog..39..434A. doi :10.1111/j.1365-2699.2011.02594.x. S2CID 4152245.
^ Antonelli A, Sanmartín I (octubre de 2011). "¿Extinción masiva, enfriamiento gradual o radiación rápida? Reconstrucción de la evolución espaciotemporal del antiguo género de angiospermas Hedyosmum (Chloranthaceae) utilizando enfoques empíricos y simulados". Biología Sistemática . 60 (5): 596–615. doi : 10.1093/sysbio/syr062 . hdl : 10261/34829 . PMID 21856636.
^ de Villemereuil P, Wells JA, Edwards RD, Blomberg SP (junio de 2012). "Modelos bayesianos para el análisis comparativo que integran la incertidumbre filogenética". BMC Evolutionary Biology . 12 (1): 102. Bibcode :2012BMCEE..12..102V. doi : 10.1186/1471-2148-12-102 . PMC 3582467 . PMID 22741602.
^ Ronquist F (septiembre de 2004). "Inferencia bayesiana de la evolución de caracteres". Tendencias en ecología y evolución . 19 (9): 475–81. doi :10.1016/j.tree.2004.07.002. PMID 16701310.
^ Schäffer S, Koblmüller S, Pfingstl T, Sturmbauer C, Krisper G (agosto de 2010). "La reconstrucción del estado ancestral revela una evolución independiente múltiple de caracteres morfológicos diagnósticos en los "Oribatida superiores" (Acari), en conflicto con los esquemas de clasificación actuales". BMC Evolutionary Biology . 10 (1): 246. Bibcode :2010BMCEE..10..246S. doi : 10.1186/1471-2148-10-246 . PMC 2930640 . PMID 20701742.
^ Filipowicz N, Renner SS (julio de 2012). "Brunfelsia (Solanaceae): un género dividido equitativamente entre América del Sur y las radiaciones en Cuba y otras islas de las Antillas". Filogenética molecular y evolución . 64 (1): 1–11. Código Bib : 2012MolPE..64....1F. doi :10.1016/j.ympev.2012.02.026. PMID 22425729.
^ Bacon CD, Baker WJ, Simmons MP (mayo de 2012). "La dispersión del Mioceno impulsa las radiaciones insulares en la tribu de palmeras Trachycarpeae (Arecaceae)". Biología sistemática . 61 (3): 426–42. doi : 10.1093/sysbio/syr123 . PMID 22223444.
^ Särkinen T, Bohs L, Olmstead RG, Knapp S (septiembre de 2013). "Un marco filogenético para el estudio evolutivo de las solanáceas (Solanaceae): un árbol de 1000 puntas fechado". BMC Evolutionary Biology . 13 (1): 214. Bibcode :2013BMCEE..13..214S. doi : 10.1186/1471-2148-13-214 . PMC 3850475 . PMID 24283922.
^ Silvestro D, Schnitzler J, Liow LH, Antonelli A, Salamin N (mayo de 2014). "Estimación bayesiana de especiación y extinción a partir de datos incompletos de ocurrencia de fósiles". Biología sistemática . 63 (3): 349–67. doi :10.1093/sysbio/syu006. PMC 4361715 . PMID 24510972.
^ Lemey P, Rambaut A, Drummond AJ, Suchard MA (septiembre de 2009). "La filogeografía bayesiana encuentra sus raíces". PLOS Computational Biology . 5 (9): e1000520. Bibcode :2009PLSCB...5E0520L. doi : 10.1371/journal.pcbi.1000520 . PMC 2740835 . PMID 19779555.
^ Cybis G, Sinsheimer J, Bedford T, Mather A, Lemey P, Suchard MA (2015). "Evaluación de la correlación fenotípica a través del modelo de responsabilidad latente filogenética multivariante". Anales de estadística aplicada . 9 (2): 969–991. doi :10.1214/15-AOAS821. ISSN 1932-6157. PMC 4820077. PMID 27053974 .
^ Tolkoff M, Alfaro M, Baele G, Lemey P, Suchard MA (2018). "Análisis factorial filogenético". Biología sistemática . 67 (3): 384–399. doi :10.1093/sysbio/syx066. ISSN 1063-5157. PMC 5920329 . PMID 28950376.