Une nouvelle étude, publiée aujourd’hui dans la revue La nature, a fourni la chronologie la plus détaillée de l’évolution des mammifères à ce jour.
La recherche décrit une nouvelle approche informatique rapide pour obtenir des arbres évolutifs datés avec précision, appelés « arbres temporels ». Les auteurs ont utilisé la nouvelle méthode pour analyser un ensemble de données génomiques de mammifères et répondre à une question de longue date quant à savoir si les groupes de mammifères placentaires modernes sont apparus avant ou après l’extinction massive du Crétacé-Paléogène (K-Pg), qui a anéanti plus de 70 % de tous les espèces, y compris tous les dinosaures.
Les découvertes confirment les ancêtres des groupes de mammifères placentaires modernes après l’extinction de K-Pg qui s’est produite il y a 66 millions d’années, réglant une controverse sur les origines des mammifères modernes. Les mammifères placentaires constituent le groupe de mammifères vivants le plus diversifié et comprennent des groupes tels que les primates, les rongeurs, les cétacés, les carnivores, les chiroptères (chauves-souris) ainsi que les humains.
L’équipe de recherche était dirigée par le Dr Mario dos Reis (Université Queen Mary de Londres) et le professeur Phil Donoghue (Université de Bristol), et comprenait des scientifiques de Queen Mary, de l’Université de Bristol, de l’UCL, de l’Imperial College de Londres et de l’Université de Cambridge.
Le Dr Sandra Álvarez-Carretero, auteur principal de l’article de l’UCL (alors à Queen Mary), déclare : « En intégrant des génomes complets dans l’analyse et les informations fossiles nécessaires, nous avons pu réduire les incertitudes et obtenir une chronologie évolutive précise. les groupes de mammifères modernes coexistent avec les dinosaures, ou sont-ils apparus après l’extinction de masse ? Nous avons maintenant une réponse définitive. »
« La chronologie de l’évolution des mammifères est peut-être l’un des sujets les plus controversés de la biologie évolutive. Les premières études ont fourni des estimations d’origine pour les groupes placentaires modernes au plus profond du Crétacé, à l’époque des dinosaures. – et des scénarios de diversification pré-K-Pg. Notre échéancier précis règle le problème. » ajoute le professeur Donoghue, co-auteur principal de l’article.
Avec des projets de séquençage mondiaux produisant désormais des centaines à des milliers de séquences de génomes, et avec des plans imminents de séquençage de plus d’un million d’espèces, les biologistes de l’évolution auront bientôt une mine d’informations à leur disposition. Cependant, les méthodes actuelles pour analyser les vastes ensembles de données génomiques disponibles et créer des chronologies évolutives sont inefficaces et coûteuses en calculs.
« Déduire des chronologies évolutives est un objectif fondamental de la biologie. Cependant, les méthodes de pointe reposent sur l’utilisation d’ordinateurs pour simuler des chronologies évolutives et évaluer les plus plausibles. Dans notre cas, cela était difficile en raison du gigantesque ensemble de données analysé, impliquant des données génétiques de près de 5 000 espèces de mammifères et 72 génomes complets », explique le Dr dos Reis.
Dans cette étude, les chercheurs ont développé une nouvelle approche bayésienne rapide pour analyser un grand nombre de séquences génomiques, tout en tenant compte des incertitudes dans les données. « Nous avons résolu les obstacles informatiques en divisant l’analyse en sous-étapes : d’abord en simulant des chronologies à l’aide des 72 génomes, puis en utilisant les résultats pour guider les simulations sur les espèces restantes. L’utilisation de génomes réduit l’incertitude car elle permet de rejeter les chronologies non plausibles des simulations. « , explique le Dr dos Reis.
« Notre pipeline de traitement des données a fourni autant de données génomiques que possible pour autant d’espèces de mammifères. C’était un défi car les bases de données génétiques contiennent des inexactitudes et nous avons dû développer une stratégie pour identifier les échantillons de mauvaise qualité ou les données mal étiquetées qui ont dû être supprimées », ajoute le Dr. Asif Tamuri, co-auteur principal de l’article de l’UCL, qui était responsable de l’assemblage de l’ensemble de données génomiques des mammifères.
Grâce à leur nouvelle approche, l’équipe a pu réduire le temps de calcul de cette analyse complexe de plusieurs décennies à plusieurs mois. « Si nous avions essayé d’analyser cet ensemble de données sur les grands mammifères dans un superordinateur sans utiliser la méthode bayésienne que nous avons développée, nous aurions dû attendre des décennies pour en déduire l’arbre temporel des mammifères. Imaginez combien de temps cette analyse pourrait prendre si nous utilisions notre propres PC », explique le Dr Álvarez-Carretero. « De plus, nous avons réussi à réduire le temps de calcul d’un facteur 100. Cette nouvelle approche permet non seulement l’analyse de jeux de données génomiques, mais aussi, en étant plus efficace, réduit considérablement le CO2 émissions dues à l’informatique », poursuit le Dr Álvarez-Carretero.
La méthode développée dans l’étude pourrait être utilisée pour s’attaquer à d’autres chronologies évolutives controversées qui nécessitent l’analyse de grands ensembles de données. En intégrant la nouvelle approche bayésienne aux futurs génomes des projets Darwin Tree of Life et Earth BioGenome, l’idée d’estimer une échelle de temps évolutive fiable pour l’Arbre de Vie semble désormais à portée de main.
La recherche a été financée par le Conseil de recherche en biotechnologie et sciences biologiques.
.