Il est certain que certaines bactéries et certains virus peuvent causer des maladies, mais les vrais coupables sont les séquences préoccupantes qui se trouvent dans les génomes de ces microbes.
Les appeler est sur le point de devenir plus facile.
Des années de travail des informaticiens de l’Université Rice et de leurs collègues ont conduit à une plate-forme améliorée pour le dépistage de l’ADN et la caractérisation des séquences pathogènes, qu’elles soient naturelles ou synthétiques, avant qu’elles n’aient la possibilité d’avoir un impact sur la santé publique.
L’informaticien Todd Treangen de la George R. Brown School of Engineering de Rice et la spécialiste de la génomique Krista Ternus de Signature Science LLC ont dirigé l’étude qui a produit SeqScreen, un programme permettant de caractériser avec précision de courtes séquences d’ADN, souvent appelées oligonucléotides.
Treangen a déclaré que SeqScreen est destiné à améliorer la détection et le suivi d’un large éventail de séquences pathogènes.
« SeqScreen est la première boîte à outils logicielle open source disponible pour le criblage d’ADN synthétique », a déclaré Treangen. « Notre programme améliore l’état de l’art antérieur pour les entreprises, les particuliers et les agences gouvernementales pour leurs pratiques de dépistage ADN. »
L’étude, qui a commencé comme une recherche à haut risque et à haut rendement financée par le programme IARPA de la National Intelligence Agency en 2017, apparaît dans la revue Biologie du génome.
SeqScreen profite du travail de partenaires de la société Signature Science, basée à Austin, au Texas, pour organiser une base de données de milliers de séquences de gènes représentant 32 types de fonctions de virulence. « Cette base de données organisée a nécessité des années de biocuration et d’examen pour se développer, et est au cœur des données de formation de l’algorithme d’apprentissage automatique de SeqScreen », a déclaré Treangen.
La société a collaboré avec Treangen l’année dernière pour trouver des mutations du SRAS-CoV-2 qui auraient pu rendre l’omicronvariant plus résistant aux anticorps, y compris ceux des vaccinations. « SeqScreen est venu en premier, et certaines de ses idées ont été transférées au projet COVID », a-t-il déclaré. « Mais SeqScreen a une portée beaucoup plus large.
« Nous nous concentrons sur l’identification des fonctions des séquences préoccupantes – que nous appelons FunSoC – alors que les approches de dépistage précédentes visaient davantage à déterminer » êtes-vous cette bactérie ? ou ‘êtes-vous ce virus?’ « , A déclaré Treangen. « SeqScreen ne se concentre pas sur les noms des bactéries ou des virus qui se trouvent dans votre échantillon. Nous voulons plutôt savoir s’il y a des séquences dans cet échantillon qui pourraient être nocives, comme des toxines qui peuvent détruire les cellules humaines. »
Il est important de se concentrer sur les fonctions préoccupantes, a-t-il déclaré, car les bactéries échangent facilement de l’ADN par transfert horizontal de gènes.
« Nous avons mis en évidence des exemples dans la publication de bactéries dont les génomes sont essentiellement identiques, sauf que l’un a une séquence préoccupante, telle qu’une toxine, que l’autre n’a pas », a déclaré Treangen. « SeqScreen se concentre vraiment sur la présence ou l’absence de fonctions qui représentent des facteurs de virulence. »
Il a déclaré que SeqScreen contribuera également à la détection de nouveaux agents pathogènes ou émergents dans l’environnement.
Advait Balaji et Bryce Kille, étudiants diplômés de Rice, sont co-auteurs principaux de l’article. Les co-auteurs sont Leo Elworth, boursier postdoctoral de Rice, les anciens élèves Zhigin Qian et Dreycey Albin, et Santiago Segarra, professeur adjoint d’informatique; Anthony Kapell et Gene Goldbold de Signature Science ; Madeline Diep de Fraunhofer USA Center Mid-Atlantic, Riverdale, Maryland; et Daniel Nasko, Nidhi Shah et Mihai Pop de l’Université du Maryland.
La recherche a été soutenue par The Intelligence Advanced Research Projects Activity (IARPA) via le Army Research Office (W911NF-17-2-0089).
Source de l’histoire :
Matériaux fourni par Université du riz. Original écrit par Mike Williams. Remarque : Le contenu peut être modifié pour le style et la longueur.
.