Peut-on faire de l’IA sans OpenAI ? Retour d’expérience avec LEGIBUS
Retour d’expérience sur la construction d’une IA juridique souveraine sans dépendance à OpenAI, à travers le projet LEGIBUS.
Une question qui revient de plus en plus
Depuis l’explosion des modèles de langage, une question revient régulièrement dans les projets que je mène :
Peut-on faire de l’intelligence artificielle sans OpenAI ?
Derrière cette question se cache en réalité une autre interrogation :
Peut-on construire des systèmes IA performants sans dépendance à une API externe ?
Avec le projet LEGIBUS, c’est précisément la question que nous avons dû traiter dès le départ.
Le réflexe naturel : utiliser OpenAI
Dans la majorité des projets IA, le chemin est aujourd’hui très standard :
- choix d’un modèle via API ;
- intégration rapide ;
- résultats immédiats ;
- impression de simplicité.
Des solutions comme OpenAI permettent effectivement de démarrer très vite.
Pour beaucoup de cas d’usage, c’est même la meilleure option au départ.
Mais dès qu’on parle de données sensibles, de souveraineté ou de contraintes réglementaires, la question change complètement de nature.
LEGIBUS : un cas d’usage sensible par nature
Dans LEGIBUS, nous travaillons sur un assistant IA destiné aux professionnels du droit français.
Cela implique plusieurs contraintes fortes :
- confidentialité des données clients ;
- exigence de souveraineté ;
- traçabilité des réponses ;
- maîtrise de l’infrastructure ;
- conformité RGPD.
Dans ce contexte, envoyer des données juridiques à une API externe n’est pas une option neutre.
Ce n’est pas uniquement une question technique.
C’est une question de responsabilité.
Construire sans OpenAI : ce que cela signifie réellement
Faire de l’IA sans OpenAI ne signifie pas “ne pas utiliser de LLM”.
Cela signifie plutôt :
- ne pas dépendre d’un fournisseur unique ;
- maîtriser les modèles utilisés ;
- contrôler l’hébergement ;
- garder la main sur les données ;
- accepter une complexité plus importante.
Concrètement, cela implique souvent une architecture basée sur :
- des modèles open source ;
- du déploiement local ou privé ;
- des pipelines de RAG ;
- une infrastructure maîtrisée.
Les briques techniques alternatives
Dans le cas de LEGIBUS, nous avons exploré et intégré plusieurs briques open source et auto-hébergées :
- modèles open source (selon les cas d’usage) ;
- systèmes de recherche documentaire (RAG) ;
- vectorisation et embeddings ;
- bases de connaissances internes ;
- orchestration via API internes ;
- infrastructure containerisée.
L’objectif n’est pas de “réinventer OpenAI”.
L’objectif est de reconstruire une chaîne complète, maîtrisée de bout en bout.
Le vrai coût de la souveraineté
Sortir d’une dépendance à une API comme OpenAI a un coût réel.
Ce coût n’est pas uniquement financier.
Il est surtout organisationnel et technique :
- gestion de l’infrastructure ;
- mise à jour des modèles ;
- optimisation des performances ;
- surveillance et observabilité ;
- complexité de déploiement ;
- maintenance continue.
L’illusion classique consiste à penser que “open source = gratuit”.
En réalité, le coût est simplement déplacé.
Ce que l’on gagne en retour
En contrepartie, plusieurs avantages deviennent décisifs dans certains contextes :
- maîtrise totale des données ;
- indépendance vis-à-vis d’un fournisseur ;
- possibilité d’adapter les modèles ;
- contrôle de la latence et de l’hébergement ;
- alignement avec des contraintes réglementaires fortes.
Dans des projets comme LEGIBUS, ces éléments ne sont pas des options.
Ils sont structurants.
OpenAI n’est pas l’ennemi
Il serait faux d’opposer frontalement OpenAI et les solutions souveraines.
Dans la réalité :
- OpenAI est souvent imbattable pour prototyper ;
- les modèles fermés sont souvent très performants ;
- l’écosystème API est mature et rapide à intégrer.
La vraie question n’est donc pas “pour ou contre OpenAI”.
La vraie question est :
À quel moment la dépendance devient-elle un problème ?
Architecture hybride : la solution la plus réaliste
Dans la plupart des projets sérieux, la réponse n’est pas binaire.
On se dirige plutôt vers des architectures hybrides :
- certains traitements via API externes ;
- d’autres en local ;
- segmentation des données sensibles ;
- choix du modèle selon le niveau de criticité.
C’est souvent dans ce compromis que se trouve la solution la plus pragmatique.
Conclusion
Construire de l’intelligence artificielle sans OpenAI est possible.
Mais ce n’est pas un simple choix technique.
C’est un choix d’architecture, de gouvernance et de responsabilité.
Avec LEGIBUS, nous avons fait le choix de la maîtrise et de la souveraineté, au prix d’une complexité plus élevée, mais avec un contrôle total sur les données et les usages.
Et au fond, la vraie question n’est peut-être pas :
“Peut-on faire de l’IA sans OpenAI ?”
Mais plutôt :
“Dans quel cas accepte-t-on de ne pas maîtriser ce que fait réellement notre intelligence artificielle ?”