6 mois de MCP en production : ce que j'ai appris
Depuis janvier 2025, j'utilise des serveurs MCP en production dans deux contextes distincts : la gestion du projet EQUANS Site Factory et des missions de conseil pour des PMEs suisses. Voici un retour d'expérience sans filtre.
Ce qui a fonctionné au-delà de mes attentes
La réduction du contexte manuel
Avant MCP, chaque session de travail avec Claude nécessitait de copier-coller le contexte du projet (backlog, décisions récentes, contraintes techniques). Avec le serveur MCP Jira connecté, Claude accède directement aux données en temps réel. Plus besoin de mettre le contexte à jour manuellement.
La génération de documentation contextuelle
La commande "génère la documentation de mise en production pour le ticket EQUANS-347" produit maintenant un document complet en 30 secondes, basé sur le contenu réel du ticket, les commentaires, et l'historique des changements liés.
Les pièges que je n'avais pas anticipés
Piège 1 — La verbosité des réponses MCP
Certains serveurs MCP retournent des payloads JSON très volumineux. Si Claude reçoit l'intégralité d'un projet Jira avec 500 tickets pour répondre à une question sur 3 tickets spécifiques, vous gaspillez des tokens et dégradez les performances. Solution : concevez vos serveurs MCP avec des filtres et des limites de pagination intégrés.
Piège 2 — La gestion des tokens d'API expirés
Les erreurs d'authentification MCP en session sont peu lisibles. Prévoyez une gestion d'erreur explicite dans votre serveur qui retourne un message clair : "Token d'API Jira expiré — veuillez renouveler vos credentials."
Piège 3 — Les permissions trop larges
En phase de test, j'avais accordé à Claude un accès en écriture à Confluence. Lors d'une mauvaise manipulation, il a modifié une page de documentation partagée avec le client. La leçon : commencez toujours en lecture seule. Ajoutez les permissions d'écriture progressivement, avec des garde-fous.
Piège 4 — La latence des appels MCP
Chaque appel MCP ajoute de la latence : réseau + traitement serveur + parsing. Sur un workflow complexe avec 8-10 appels MCP en séquence, la latence cumulée peut dépasser 15-20 secondes. Optimisez en parallélisant les appels indépendants.
Recommandations pour vos déploiements
- Commencez en lecture seule, évaluez pendant 2 semaines avant d'activer l'écriture
- Loggez tout : chaque appel MCP, avec timestamp, outil appelé, paramètres, résultat
- Définissez des rate limits : protégez vos APIs source contre les appels excessifs
- Documentez les outils exposés en langage naturel clair — c'est ce que Claude "voit"
- Testez les cas d'erreur autant que les cas nominaux
