Portfolio Details
Présentation du projet
Email Classifier est un flux d'automatisation qui analyse chaque email entrant, le classifie automatiquement par département — secrétariat, service technique, facturation ou relation client — et le transfère au bon destinataire via SMTP, sans aucune intervention manuelle.
L'originalité du projet : la classification repose sur un modèle de machine learning léger (DistilBERT) entraîné sur vos propres emails, hébergé sur votre serveur. Pas d'IA générative, pas de coût par requête, pas de données qui transitent chez un tiers. Un modèle qui apprend votre activité et classe en moins de 10 millisecondes.
Pourquoi pas l'IA générative ?
| Critère | IA générative (GPT, Claude…) | Modèle ML sur mesure (ce projet) |
|---|---|---|
| Coût | ~0,002 € / requête — facture qui monte avec le volume | 0 € / requête — modèle hébergé sur votre serveur |
| Latence | 500 ms – 3 s selon le modèle et la charge API | < 10 ms en inférence locale |
| Confidentialité | Vos emails transitent chez un prestataire tiers | 100 % sur votre infrastructure — RGPD natif |
| Précision | Généraliste — ne connaît pas votre vocabulaire métier | > 95 % après fine-tuning sur vos données réelles |
| Dépendance | Dépend d'une API externe — panne = arrêt du flux | Autonome — fonctionne sans connexion internet |
Le flux automatisé
1. IMAP Trigger
Détection de chaque nouvel email entrant en temps réel
2. Modèle ML — classification
DistilBERT fine-tuné · POST /classify · votre serveur · <10ms
3. Switch n8n — dispatch par label
Route selon : Secrétariat · Technique · Facturation · Client
4a. Secrétariat
Forward SMTP
4b. Technique
Forward SMTP
4c. Facturation
Forward SMTP
4d. Client
Forward SMTP
Résultats
Un flux entièrement automatisé qui élimine le tri manuel des emails. Chaque message est analysé, classifié et transmis au bon département en moins d'une seconde — sans intervention humaine, sans abonnement externe, avec un score de confiance inclus dans chaque transfert pour auditer la précision.
Technologies utilisées
Fonctionnalités clés
Un pipeline de classification entraîné sur vos données réelles, intégré directement dans n8n — sans dépendance externe, sans coût récurrent.
Entraînement sur vos emails réels
Le modèle apprend de votre vocabulaire, vos clients, vos typologies de demandes. Une précision qu'aucun modèle généraliste n'atteindra sur votre activité spécifique.
100% sur votre infrastructure
Le modèle tourne sur votre propre serveur. Aucun email ne sort de votre périmètre. Conformité RGPD native, sans configuration supplémentaire.
Score de confiance intégré
Chaque email transféré contient le label prédit et le score de confiance du modèle. Si le modèle hésite, vous le savez — et vous pouvez corriger pour réentraîner progressivement.
Réentraînement continu possible
Chaque correction manuelle devient une nouvelle donnée d'entraînement. Le modèle s'améliore avec l'usage et s'adapte à l'évolution de votre activité.