1. Fuite de données (Data Leakage) au prétraitement
Appliquer des transformations (comme le scaling ou l'imputation) sur tout le dataset avant la séparation train/test fait fuiter des informations de test dans l'entraînement.
2. Utiliser l'Accuracy sur des données déséquilibrées
Si 99% de vos données sont négatives, un modèle naïf prédisant toujours négatif aura 99% de précision mais sera inutile. Utilisez le Precision, Recall, ou F1-score.
3. Ignorer les modèles de base (Baselines)
Avant de lancer des réseaux de neurones complexes, créez toujours un modèle de base simple (comme une régression logistique).