Godefroy de Compreignac
CEO @ Lonestone
2 juin 2025
Godefroy de Compreignac
Co-fondateur CEO @ Lonestone
Entrepreneur et développeur depuis 20 ans.
Early adopter enthousiaste de l’IA générative.
Agence de développement
de solutions web et IA
Île de Nantes
30+ experts salariés
Fournis par les créateurs de modèles.
Ils intègrent les plus gros modèles et fournissent des fonctionnalités supplémentaires.
✅ Dernières versions des modèles
❌ Limité aux modèles du fournisseur
❌ Pas ou peu extensible/personnalisable
✅ Nombreux modèles disponibles
✅ Style et prompts personnalisables
✅ Base de connaissance (RAG)
✅ Intégration d'outils tiers
⚠️ Double dépendance (SaaS + fournisseur de modèle)
Tout est possible, dans la limite de l'état de l'art.
Avec des outils open-source comme :
Framework : Vercel AI SDK, LangGraph, Mastra
Base de données : Postgres, Pinecone, Chroma
Évaluation : Langfuse, LangSmith
Interface graphique : React, Assistant-UI
✅ Branding / personnalisation totale
✅ Liberté de choix de modèles
✅ Maîtrise de la donnée
✅ Intégration d'outils internes
✅ Base de connaissance (RAG)
💰 Plus coûteux au lancement
🤔 Plus complexe
Intégration de n'importe quelle API ou logiciel avec le protocole MCP.
SDK disponible dans de nombreux langages :
Intégrations de milliers d'outils répandus :
Pour connecter son assistant à tous ses outils (dits "tools").
À installer soi-même en local ou sur un serveur.
Liste de MCP servers :
Pour coder plus vite et mieux.
Pour retrouver ou consolider des informations, enregistrer des données, dicter, etc.
Solution intégrée au produit ou par un assistant externe.
Pour créer des workflows figés à exécuter régulièrement ou par déclencheurs.
n8n a l'avantage d'être open source et
de proposer un module Agent puissant :
Ils exécutent des actions complexes grâce à une planification
et à une délégation de tâches à des sous-agents.
⚠️ Demande des connaissances avancées en prompt engineering et souvent en code.
AutoGen
Pour prendre des notes à l'oral et éventuellement les retraiter avec un assistant IA.
SuperWhisper
Pour enregistrer les réunions (visio et physique), les retranscrire, les résumer et les analyser.
ℹ️ La plupart utilisent l'API de transcription d'OpenAI et des appels LLM (OpenAI ou autre).
Pour plus de confidentialité/souveraineté, privilégiez des solutions qui tournent en local (Whisper en mode local) ou en France (Gladia).
Il est relativement facile d'intégrer des fonctionnalités de transcription dans une app avec les APIs de Gladia ou OpenAI par exemple.
Pour le support, la prise de commande, la prospection, etc.
Interview par une IA pour récolter des informations.
Exemples : CV, prise de brief, feedbacks, cas client…
OpenAI Realtime API
https://platform.openai.com/docs/guides/realtime
Google Gemini Live
Micdrop (open source) pour intégrer dans une webapp
https://github.com/lonestone/micdrop
Nouveaux modèles de Kyutai, bientôt open source
Client
Serveur
API OpenAI Realtime
Client
Serveur
STT
LLM
TTS
Transcription
Génération de réponse texte
Génération
de la voix
Exemples de biais :
Les géants (OpenAI, Meta…) dépensent beaucoup dans la "safety",
mais aucun ne fournit ses données d'entraînement.
La "safety" est dépendante de choix moraux et donc de ces organisations et de leurs pays d'origine.
On peut distinguer en général :
Cas général
Client
Serveur
LLM (API)
Base de données
Services tiers (tools, eval)
➡️ Il existe plusieurs degrés de confidentialité.
Même en utilisant une API de LLM comme OpenAI, on peut garantir la confidentialité des données personnelles et éviter de faire sortir toute la base données de l'infrastructure de l'entreprise.
➡️ Utiliser au maximum des outils open source.
➡️ Tout héberger sur serveur ou cloud privé.
👎 Moins performant que OpenAI et Claude
Llama 3.3 70B
Postgres
Ragflow
Langfuse
(voir slide MCP serveurs)
👍 Très classique
👍 Assez accessible, mais les technos évoluent vite
👍 Facile et suffisant pour la plupart des usages
🤔 Dépendant des solutions à connecter
Traitements textuels :
Répondre à une question
Planifier
Appeler un outil
Générer du code
Retranscrire de l'audio en texte.
Générer de la voix, avec clonage, émotion, etc.
Générer des images
Analyser des images
Plusieurs capacités simultanées : texte, images, audio…
… et bien d'autres : Text-to-Video, Image-to-Video, Image-to-3D, Voice Activity Detection, etc.
📝 → 📝
🗣️ → 📝
📝 → 🗣️
📝 → 🖼️
Plusieurs capacités simultanées : texte, images, audio…
🖼️ → 📝
📝 🖼️ 🗣️
✅ Code source
✅ Poids du modèle
🤔 Données d'entraînement (parfois)
✅ Documentation complète
Accès
✅ Entrainement
✅ Fine-tuning
✅ Analyse
✅ Poids du modèle
❌ Code source, données
❌ Code, poids, données…
Ajustement
✅ Local (petits modèles)
✅ Auto-hébergement (compliqué)
✅ Offres cloud
Hébergement
✅ Fine-tuning
🤔 Fine-tuning (parfois)
✅ Local (petits modèles)
✅ Auto-hébergement (compliqué)
✅ Offres cloud
✅ Offres cloud
❌ Local, auto-hébergement
⚠️ Dépendance au fournisseur
➡️ Idéal pour un usage ultra confidentiel et pas trop exigeant.
⚠️ Possible uniquement avec des petits modèles et un hardware suffisant.
➡️ Idéal pour une confidentialité maximale, un contrôle total, et une très forte consommation.
⚠️ Très compliqué et très coûteux.
➡️ Idéal pour des modèles faits maison.
⚠️ La plupart sont aux USA.
➡️ Idéal pour héberger en France avec capacité de scaling.
⚠️ Seulement quelques modèles disponibles
Propriétaire
Type
Open weight
Open weight
Précision
🇺🇸
Origine
⭐ ⭐ ⭐ ⭐ ⭐
Rapidité
⭐ ⭐ ⭐ ⭐
⭐ ⭐ ⭐ ⭐
⭐ ⭐ ⭐ ⭐ ⭐
⭐ ⭐ ⭐
⭐ ⭐ ⭐ ⭐
🇺🇸 🇨🇳
🇫🇷
Cloud français
❌
✅ Scaleway, OVH
✅ Mistral, Scaleway, OVH
Coût
💰 💰 💰 💰
💰 💰
💰 💰
Idéal pour
Performances, scaling
Confidentialité, performance
Confidentialité, souveraineté 🇫🇷
(Et suivez-moi sur Linkedin)
CEO @ Lonestone