SEARCH SEARCH

Article Search

A simulation-based examination of residual diversity estimates as a method of correcting for sampling bias

Neil Brocklehurst

Plain Language Abstract

The residual diversity estimate is a method used to remove biases from the fossil record, such as availability of fossil-bearing rocks from different time periods or workers studying certain time periods more thoroughly, so that one may more accurately assess the changes in species numbers through time. The method has proven popular in recent years, but its performance has never been thoroughly tested. This paper presents a simulation-based analysis testing the performance of different methods of implementing the residual diversity estimate and comparing it to other methods of correcting for sampling biases. The paper supports specific practices when using the residual diversity estimate and identifies instances where it performs poorly.

Resumen en Español

Un examen basado en la simulación de las estimaciones de la diversidad residual como un método para corregir el sesgo de muestreo

La influencia de los sesgos de muestreo en las estimaciones de la riqueza de especies a través del tiempo geológico es una gran preocupación, por lo que se han desarrollado múltiples métodos para corregirlos. Un método es la estimación de la diversidad residual, una modelización que elimina la señal de la variable proxy de muestreo elegida. A pesar de haber sido ampliamente aplicada a los estudios de paleodiversidad, la estimación de la diversidad residual aún no se ha probado en un entorno de simulación. Una de las dificultades de una prueba de este tipo es que la simulación debe modelizar el muestreo de tal manera que una variable proxy de muestreo pueda ser extraída a partir del modelo con el fin de calcular la diversidad residual. Aquí, se usa un enfoque novedoso para examinar la eficacia de este método. Fueron simulados los taxones y una filogenia asociada utilizando un modelo nacimiento-muerte, y se añadió un parámetro para representar la dispersión de los taxones entre las áreas en el espacio simulado. El espacio simulado en cada unidad de tiempo se dividió en formaciones y localidades, que se eliminaron al azar para representar un muestreo incompleto, lo cual también proporcionaba variables proxy de muestreo utilizadas para calcular la estimación de diversidad residual. Se obtiene la estimación de la diversidad residual para conseguir un mejor rendimiento cuando la variable proxy más amplia representando regiones enteras, e.g., formaciones, se utiliza en su cálculo, en lugar de las localidades más restrictivas. Una reciente actualización de la estimación de la diversidad residual, incorporando relaciones polinómicas entre la diversidad y las variables proxy, se mostró deficiente, a veces mostrando una peor correlación con la verdadera diversidad de los datos brutos. La estimación de la diversidad residual es mejorada consistentemente por la estimación de la diversidad filogenética, incluso cuando se han introducido errores en la filogenia.

Palabras clave: riqueza de especies; diversidad; simulación; estimación de la diversidad residual; estimación de la diversidad filogenética; corrección de muestreo

Traducción: Enrique Peñalver

Résumé en Français

Une méthode de correction du biais d'échantillonnage utilisant un examen des estimations de diversité résiduelle basé sur une simulation

L'influence des biais d'échantillonnage sur les estimations de richesse spécifique au cours des temps géologiques est d'un intérêt primordial, et de nombreuses méthodes ont été développées pour corriger ces biais. Une de ces méthodes est l'estimation de diversité résiduelle, une approche de modélisation qui élimine le signal d'un « proxy » d'échantillonnage choisi. Bien qu'elle ait été largement appliquée aux études de paléodiversité, l'estimation de diversité résiduelle n'a pas encore été testée dans un environnement simulé. Une des difficultés d'un tel test provient du fait que la simulation doit modéliser l'échantillonnage de telle manière que le « proxy » d'échantillonnage puisse être extrait du modèle afin de calculer la diversité résiduelle. Dans cet article, une approche novatrice est utilisée pour examiner l'efficacité de cette méthode. Des taxons et une phylogénie associée ont été simulés par un modèle de naissances-décès, et un paramètre représentant la dispersion des taxons entre les zones de l'espace simulé a été ajouté. L'espace simulé de chaque fenêtre temporelle a été divisé en formations et en localités qui ont été supprimées de manière aléatoire pour représenter un échantillonnage incomplet, fournissant par la même occasion des « proxies » d'échantillonnage utilisés pour calculer une estimation de diversité résiduelle. Il est montré que l'estimation de diversité résiduelle est la plus performante quand un « proxy » plus large, représentant des régions entières, e.g., des formations, est utilisé dans ses calculs, plutôt que des localités plus restreintes. Une mise à jour récente des estimations de diversité résiduelle, incorporant des relations polynomiales entre la diversité et les « proxies », est peu efficace, montrant parfois une corrélation encore plus faible avec la diversité réelle par rapport aux données brutes. L'estimation de diversité résiduelle fait moins bien que l'estimation de diversité phylogénique, même quand des erreurs sont introduites dans la phylogénie.

Mots-clés : richesse spécifique ; diversité ; simulation ; estimations de diversité résiduelle ; estimations de diversité phylogénétique ; correction d'échantillonnage

Translator: Antoine Souron

Deutsche Zusammenfassung

Eine Simulation-basierte Untersuchung residualer Diversitäts-Schätzungen als eine Methode Probenverzerrung zu korrigieren

Die Einflussnahme von Probenverzerrungen auf den geschätzten Artenreichtum durch die geologische Zeit bereitet große Sorgen und verschiedene Methoden wurden entwickelt sie zu korrigieren. Eine Methode ist die residuale Diversitäts-Schätzung, ein Modellierungsansatz der das Signal einer gewählten Proben-Proxy entfernt. Obwohl sie in paläontologischen Untersuchungen weit verbreitet ist, muss die residuale Diversitäts-Schätzung erst noch in einer Simulationsumgebung getestet werden. Eine Schwierigkeit mit einem solchen Test besteht darin, dass die Simulation eine Probe derartig abbilden muss, dass die Proben-Proxy aus dem Modell entnommen werden kann um die residuale Diversität zu berechnen. Hier wird eine neue Herangehensweise benutzt, um die Effizienz dieser Methode zu untersuchen. Taxa und eine dazugehörige Phylogenie wurden mit dem Geburten/Sterbemodell simuliert und es wurde ein Parameter hinzugefügt der die Dispersion der Taxa zwischen den Gebieten der simulierten Fläche repräsentierte. Die simulierte Fläche in jedem Time-bin wurde in Formationen und Lokalitäten unterteilt, die per Zufall entfernt wurden um unvollständige Proben zu simulieren und die auch Proben-Proxies lieferten, die zur Berechnung der residualen Diversitäts-Schätzung genutzt wurden. Es wurde herausgefunden, dass die residuale Diversitäts-Schätzung am besten gelingt, wenn die weitere Proxy, die gesamte Regionen und besonders Formationen repräsentiert für die Berechnung benutzte wird als eine geringere Anzahl an Lokalitäten. Ein aktuelles Update zur residualen Diversitäts-Schätzung welches polynomische Beziehungen zwischen Diversität und Proxies beinhaltet, funktioniert schlecht, da es zuweilen eine falsche Korrelation mit der echten Diversität anzeigt als mit den Rohdaten. Die residuale Diversitäts-Schätzung wird durchweg von der phylogenetischen Diversitäts-Schätzung übertroffen, auch wenn Fehler in die Phylogenie eingebracht wurden.

Schlüsselwörter: Artenreichtum; Diversität; Simulation; residuale Diversitäts-Schätzung; phylogenetische Diversitäts-Schätzung; Probenkorrektur

Translator: Eva Gebauer

Arabic

584 arab

Translator: Ashraf M.T. Elewa