Une IA a analysé des données médicales complexes aussi bien que des équipes d'experts humains. En six mois, contre plusieurs années.

Aux États-Unis, environ 1 000 bébés naissent prématurément chaque jour. La prématurité est la première cause de mortalité néonatale et un facteur majeur de séquelles neurologiques et motrices à long terme. Malgré des décennies de recherche, les mécanismes qui déclenchent un accouchement avant terme restent largement incompris.

Une piste sérieuse existe depuis plusieurs années : le microbiome vaginal, c’est-à-dire la composition des bactéries présentes dans le vagin pendant la grossesse, semble corrélé au risque d’accouchement prématuré. Mais étudier ce lien pose un problème technique massif. Les données issues de plusieurs études utilisent des méthodes d’analyse génétique différentes, ce qui les rend difficiles à comparer directement. Et même une fois harmonisées, ces données forment un dataset d’une complexité qui dépasse la capacité d’une équipe de recherche standard à traiter dans un délai raisonnable.

Le challenge DREAM

Pour contourner ça, l’équipe de Marina Sirota, professeure à l’UCSF, avait organisé en amont une compétition mondiale de data science appelée DREAM, dans laquelle plus de 300 équipes avaient développé des modèles de machine learning pour prédire la prématurité à partir de données microbiome de 1 268 femmes enceintes. Ces équipes avaient travaillé pendant plusieurs mois, et il avait fallu encore près de deux ans pour consolider et publier les résultats.

L’étude publiée en février 2026 dans Cell Reports Medicine pose une question différente : est-ce qu’un outil d’IA générative aurait pu faire le même travail, plus vite ?

La réponse est oui, dans des conditions précises.

Ce qui s’est passé

Les chercheurs ont assigné les mêmes tâches à plusieurs groupes : certains entièrement humains, d’autres composés de scientifiques travaillant avec des outils d’IA. L’exercice le plus frappant implique un binôme composé d’un étudiant en master et d’un lycéen. Avec l’aide de l’IA, ils ont généré du code d’analyse fonctionnel en quelques minutes, là où des programmeurs expérimentés auraient eu besoin de plusieurs heures, voire de plusieurs jours.

Quatre des huit outils d’IA testés ont produit des modèles prédictifs au niveau des meilleures soumissions humaines du challenge DREAM. Dans certains cas, ils les ont dépassées. L’ensemble du projet, de la conception à la soumission du paper, a pris six mois.

Ce que ça veut vraiment dire

Ce résultat est à lire avec le contexte technique qui va avec. L’IA ne “comprend” pas la biologie de la prématurité. Ce qu’elle fait, c’est écrire du code d’analyse à partir de prompts très spécialisés, et le faire vite. La qualité du résultat dépend directement de la précision du prompt et de la supervision humaine en aval : quatre des huit outils testés n’ont pas produit de code utilisable. Les chercheurs sont explicites là-dessus. Les résultats trompeurs restent un problème persistant, et l’expertise humaine reste nécessaire pour détecter les sorties aberrantes.

Ce qui est nouveau, c’est l’échelle du gain de temps. Marina Sirota le formule directement : le vrai goulot d’étranglement en data science biomédicale, c’est la construction des pipelines d’analyse. C’est précisément là que l’IA comprime le temps de façon dramatique. Un chercheur avec une question biologique pertinente mais sans formation poussée en programmation peut maintenant entrer dans ce processus sans dépendre d’une grande collaboration ou de semaines de débogage.

L’implication structurelle est là : les études qui nécessitaient autrefois des consortiums internationaux, des compétitions mondiales et plusieurs années de consolidation pourraient être conduites par des équipes beaucoup plus petites dans des délais beaucoup plus courts. Pour la recherche en santé reproductive, où les données existent mais peinent à se transformer en résultats cliniques, c’est potentiellement un changement de rythme significatif.

Source : Sarwal R, Tarca V, Dubin CA et al., “Benchmarking large language models for predictive modeling in biomedical research with a focus on reproductive health”, Cell Reports Medicine, 17 février 2026. DOI : 10.1016/j.xcrm.2026.102594

Le challenge DREAM

Ce qui s’est passé

Ce que ça veut vraiment dire

Une question ? Un projet ?