S’il existe un tas d’intelligences artificielles (IA) aujourd’hui qui agissent dans différents secteurs, leur application dans le domaine de la biologie, se fait encore plus rare et reste un domaine où le potentiel est encore largement inexploité.
Alors que des algorithmes sont devenus monnaie courante pour optimiser les chaînes d’approvisionnement ou personnaliser les relations clients, le monde complexe et hautement réglementé de la biologie, a été plus lent à intégrer pleinement la puissance du machine learning et de l’deep learning.
Cette rareté s’explique par la complexité des données biologiques, le besoin d’experts pour développer ces modèles, et les questions éthiques et légales liées à la santé. Néanmoins, il y en a qui croient dur comme fer que l’intelligence artificielle promet de révolutionner le secteur de la santé et se jettent à l’eau !
C’est là qu’intervient Owkin, une entreprise franco-américaine lancée à Paris en 2016, valorisée aujourd’hui à plus d’un milliard de dollars, spécialisée dans l’application de l’intelligence artificielle au domaine de la biologie. L’objectif final de cette licorne est d’instaurer une superintelligence artificielle biologique capable de formuler et de valider des hypothèses scientifiques en toute autonomie
La première étape majeure de cette mission a été le développement d’Owkin 0, (le socle technologique de l’IA biologique), un modèle de langage (LLM) dévoilé en août dernier et spécifiquement entraîné pour raisonner en biologie. Ce modèle a pour mission d’aider les chercheurs à identifier de nouvelles cibles thérapeutiques, c’est-à-dire les gènes ou les protéines sur lesquels un futur médicament pourrait agir.
Pour atteindre ce niveau d’expertise, Owkin a eu recours à l’apprentissage par renforcement (reinforcement learning) et s’est appuyé sur une mine d’or médicale : le consortium Mosaïc.
Fondé par Owkin, ce consortium regroupe dix hôpitaux à travers la France, l’Allemagne, la Suisse et les États-Unis. Eric Durand, VP Data Sciences chez Owkin, souligne qu’il s’agit d’un ensemble de données unique au monde contenant des informations cliniques, génomiques, transcriptomiques et d’imagerie médicale très approfondies..
On parle déjà d’une grande réussite car sur des tests d’identification de cibles thérapeutiques, Owkin 0 parvient à surpasser des modèles généralistes tels que Gemini de Google ou GPT d’OpenAI. Cependant, le modèle se heurte au problème du “catastrophic forgetting”. Mais qu’est ce que c’est? Ce phénomène fait qu’une IA devient moins performante sur d’autres tâches lorsqu’elle se spécialise trop fortement sur une tâche ou un point précis.
Pour faire face à cette difficulté, Owkin a fait le choix de développer toute une famille de modèles dérivés D’Owkin, chacun étant expert dans une tâche biologique bien précise.
Le premier est l’agent Owkin K surnommé le chef d’orchestre! Un peu comme une IA classique, cet agent va jouer le rôle d’interface pour les laboratoires et les chercheurs en gérant le flux de travail intelligemment de façon à “orchestrer ” les données. En fonction des requêtes posées par les chercheurs, cet agent sélectionne de manière autonome le modèle approprié, les bases de données pertinentes et les bons outils d’analyse.
Cette technologie présente deux atouts majeurs. Premièrement, elle permet à des profils non techniques de réaliser des analyses extrêmement poussées sur des données complexes.
Deuxièmement, grâce au protocole MCP (Model Context Protocol), elle offre un nouveau niveau d’interopérabilité, permettant aux flux de travail des laboratoires pharmaceutiques de se connecter directement à ceux d’Owkin et de travailler de manière autonome.
Owkin K repose sur un modèle économique ciblant deux publics distincts :
-Le monde académique a qui elle fournit l’outil gratuitement à des chercheurs, comme à travers son partenariat avec l’université Paris-Saclay, ce qui permet à l’entreprise d’améliorer son IA en identifiant les cas d’usage optimaux et les limites du système.
-Les laboratoires pharmaceutiques où les grands groupes paient une licence annuelle pour utiliser Owkin K comme véritable copilote de recherche de nouveaux médicaments,
Grâce à l’agent Owkin K, les chercheurs peuvent désormais orchestrer des analyses complexes et collaborer avec des laboratoires mondiaux de manière simplifiée
Pour accélérer son déploiement, Owkin s’est allié à deux géants du secteur; D’une part, avec Nvidia, le fabricant de puces, qui apporte non seulement sa puissance de calcul, mais surtout son expertise technique pour optimiser l’entraînement des modèles d’Owkin 0. D’autre part, avec Anthropic, ce qui a permis d’intégrer une fonctionnalité appelée « Pathology Explorer » directement dans le modèle Claude : un chercheur peut désormais analyser le grade d’une tumeur sur une image médicale simplement par le biais d’une simple conversation avec l’IA.
L’ambition d’Owkin ne s’arrête pas au statut de copilote mais d’arriver à une recherche totalement autonome.
À terme, l’objectif est d’atteindre la « superintelligence artificielle biologique », un système où un chercheur n’aura plus qu’à donner un objectif global pour que l’agent mène et valide sa propre recherche de manière itérative et indépendante.
Si Owkin s’impose comme un acteur majeur de la révolution médicale actuelle, le frein principal actuel n’est malheureusement plus seulement informatique mais biologique car la validation physique en laboratoire prend encore du temps.
À titre d’exemple, valider une hypothèse générée en quelques secondes par l’IA peut prendre des jours en laboratoire, car les cellules cancéreuses mettent 48 heures à se répliquer.
Pour résoudre ce problème, Owkin investit massivement dans le développement de la simulation biologique.
Alors que la santé s’impose comme le premier secteur d’application de l’IA en France, l’année 2026 s’annonce décisive.
Comme le prédit Eric Durand, d’importantes découvertes biologiques réalisées directement par une intelligence artificielle sont attendues d’ici la fin de l’année.
