Une base de données alimentée par l’IA, disponible gratuitement et contenant quasiment toutes les protéines du corps humain, promet de grandement contribuer à la science.
Les protéines sont présentes dans l’ensemble des organismes vivants et comprennent de nombreux composés biologiques clés tels que les enzymes, les hormones et les anticorps. Pour faire progresser la médecine, il est crucial de comprendre le fonctionnement des structures protéiques. À ce jour, seul un petit pourcentage d’entre elles a été élucidé.
Des chercheurs de la société londonienne DeepMind ont utilisé une technologie d’IA dénommée AlphaFold pour prédire les structures de presque toutes les protéines fabriquées par notre corps. En collaboration avec le Laboratoire européen de biologie moléculaire (LEBM), ils ont présenté leur réalisation dans la revue «Nature».«À ce jour, nous pensons qu’il s’agit de l’image la plus complète et la plus précise du protéome humain. Nous pensons que ce travail représente la contribution la plus significative de l’IA à l’avancement des connaissances scientifiques à ce jour», a déclaré le Dr Demis Hassabis, cofondateur et PDG de DeepMind à la «BBC». «Et je pense que c’est une excellente illustration et un exemple du type d’avantages que l’IA peut apporter à la société. Nous sommes tellement impatients de voir comment la communauté va en tirer profit.» Le professeur Edith Heard, directeur général du LEBM, a déclaré: «Cela va révolutionner notre compréhension du fonctionnement de la vie.»
L’équipe de recherche a publié en ligne la base de données la plus exhaustive et la plus précise, contenant 20 000 protéines exprimées par le génome humain. Elle comprend également plus de 350 000 protéines appartenant à l’homme et à d’autres organismes, des bactéries et levures aux souris. Ce nombre s’étendra à des millions de protéines dans un avenir proche. AlphaFold a prédit avec précision la forme 3D des protéines sur la base de leurs séquences d’acides aminés. Les acides aminés sont des composés organiques qui se combinent pour former des protéines.Au fil des ans, l’analyse de la quasi-totalité des protéines codées dans le génome humain et la prédiction de leur structure 3D probable se sont avérées à la fois longues et coûteuses. De plus, les logiciels ont manqué de précision. Jusqu’à présent, nous ne possédions des informations structurelles que pour 17 % de l’ensemble des protéines humaines. AlphaFold a prédit les positions structurelles de 58 % des acides aminés du protéome. Les positions de près de 36 % d’entre eux ont été prédites avec une grande certitude.
La structure 3D peut fournir des informations importantes sur la protéine, comme la façon dont elle interagit avec d’autres protéines et substances chimiques. Grâce à cette structure, la communauté scientifique apprend comment des mutations spécifiques modifient la fonction de la protéine.
Des neurosciences à la médecine, les scientifiques pourront accélérer leurs travaux grâce à ce système d’IA sophistiqué. «Rendre les prédictions d’AlphaFold accessibles à la communauté scientifique internationale ouvre tellement de nouvelles voies de recherche, des maladies négligées aux nouvelles enzymes pour la biotechnologie et tout ce qui se trouve entre les deux», a commenté Ewan Birney, directeur général adjoint du LEBM et directeur de l’EMBL‑EBI, dans un communiqué de presse. «Il s’agit d’un nouvel outil scientifique formidable, qui complète les technologies existantes, et qui nous permettra de repousser les limites de notre compréhension du monde.»
«Les applications ne sont en fait limitées que par notre imagination… la base de données AlphaFold permettra d’accroître notre compréhension du fonctionnement des protéines et de leur rôle dans les processus fondamentaux de la vie», a déclaré Edith Heard à «The Guardian». «Ainsi, nous serons mieux équipés pour démêler les mécanismes moléculaires de la vie et accélérer nos efforts pour protéger et traiter la santé humaine, ainsi que la santé de notre planète…»