Un nouveau système d’intelligence artificielle (IA) permet de résoudre un problème scientifique pérenne et très complexe concernant la structure et le comportement des protéines.
Il existe des centaines de millions de protéines connues. De l’insuline qui régule notre taux de glycémie aux anticorps qui nous aident à combattre les infections, les protéines sont essentielles dans presque toutes les fonctions de notre corps et de tous les organismes. Leur fonctionnement est déterminé par leur forme tridimensionnelle. Pendant un demi-siècle, les scientifiques se sont efforcés de déterminer comment une protéine se plie en cette forme 3D unique. Cette procédure est essentielle pour appréhender la machinerie biologique de la vie.La société DeepMind, basée à Londres et appartenant à Google, a trouvé une réponse grâce à AlphaFold, un moteur d’IA pionnier qui détermine les formes 3D des protéines. Il peut déterminer les structures avec une précision sans précédent en quelques jours seulement. En temps normal, cela prendrait des années en laboratoire. AlphaFold a déterminé la forme d’à peu près deux tiers d’un ensemble d’environ 100 protéines avec des niveaux de précision comparables à ceux des expériences en laboratoire. La précision de l’autre tiers était également élevée.
Pour trouver la solution, DeepMind s’est associée à la 14e Expérience communautaire sur l’évaluation critique des techniques de prédiction de la structure des protéines (CASP14), où des groupes de scientifiques ont relevé le défi des protéines connu sous le nom d’Évaluation critique de la prédiction de la structure (CASP pour «Critical Assessment of Structure Prediction»). Créée en 1994 sous le nom de CASP1, la CASP14 est l’une des nombreuses expériences dans laquelle des équipes de plus de 20 pays du monde ont présenté leur proposition de modèle de la structure des protéines.
L’organisateur de la CASP14, le Dr Andriy Kryshtafovych de l’Université de Californie, à Davis, a qualifié cette réalisation de «vraiment remarquable» dans un communiqué de presse. «Pouvoir étudier la forme des protéines avec rapidité et précision pourrait révolutionner les sciences de la vie. Maintenant que le problème a été largement résolu pour les protéines individuelles, la voie est ouverte au développement de nouvelles méthodes visant à déterminer la forme des complexes protéiques — des ensembles de protéines qui travaillent ensemble pour former une grande partie de la machinerie de la vie, et pour d’autres applications.»La professeure Dame Janet Thornton, directrice émérite de l’Institut européen de bio-informatique du Laboratoire européen de biologie moléculaire, qui n’est associée ni à la CASP ni à DeepMind, a commenté: «C’est formidable d’assister au triomphe de la curiosité, de l’effort et de l’intelligence de l’homme dans la résolution de ce problème. Une meilleure compréhension des structures des protéines et la capacité de les prédire par ordinateur permettent de mieux comprendre la vie, l’évolution et, bien entendu, la santé et les maladies humaines.»
«Cela représente un moment passionnant pour le domaine», a déclaré Demis Hassabis, cofondateur de DeepMind, à «The Guardian». «Ces algorithmes deviennent maintenant suffisamment matures et puissants pour pouvoir être appliqués à des problèmes scientifiques vraiment complexes.»
Le défi scientifique a été résolu des décennies plus tôt que ce que la communauté scientifique avait escompté. «Il s’agit d’un problème pour lequel je commençais à penser qu’il ne serait pas résolu de mon vivant», a ajouté la professeure Thornton. «La connaissance de ces structures nous aidera vraiment à comprendre comment les êtres humains agissent et fonctionnent.»
«Cela change complètement la donne», a déclaré à la revue «Nature» Andrei Lupas, biologiste évolutionniste à l’Institut Max Planck de biologie du développement en Allemagne, qui a évalué les performances de différentes équipes de la CASP. «Cela va changer la médecine. Cela va changer la recherche. Cela va changer la bio-ingénierie. Cela va tout changer.»
DeepMind soumettra un article avec ses conclusions à une revue scientifique à comité de lecture.