Retour au Blog
Machine Learning 29 juin 2026 12 min de lecture

Optimisation de CNN-BiLSTM par algorithme génétique pour la prévision du PIB marocain

Une approche hybride combinant CNN et BiLSTM, optimisée par algorithme génétique, pour prévoir le PIB trimestriel réel du Maroc sous stratégie de fenêtre extensible.

Auteurs : Sana Hamiane, Youssef Ghanou, Hamid Khalifi, Aziz Boujeddaine

Introduction et défi de prévision macroéconomique

La prévision précise du Produit Intérieur Brut (PIB) est un pilier fondamental de la modélisation économétrique et de la prise de décision macroéconomique. Elle offre aux décideurs publics, aux banques centrales et aux acteurs du marché des informations cruciales sur la trajectoire de la croissance économique. Cependant, les séries chronologiques macroéconomiques sont notoirement complexes, non linéaires et soumises à des chocs structurels majeurs (crise de 2008, pandémie de COVID-19).

Historiquement, les prévisions économiques reposaient sur des modèles statistiques linéaires :

  • ARIMA (Autoregressive Integrated Moving Average)
  • VAR (Vector Autoregression)

Bien que simples et interprétables, ces approches classiques supposent la linéarité et la stationnarité des séries, échouant ainsi à capturer les interactions dynamiques non linéaires des indicateurs économiques modernes. Les algorithmes d'apprentissage automatique (Random Forest, XGBoost, SVR) apportent une plus grande flexibilité mais peinent à modéliser les dépendances temporelles à long terme.

Cette étude propose un modèle hybride combinant les réseaux de neurones convolutifs (CNN) et les réseaux de neurones récurrents bidirectionnels (BiLSTM), optimisé par un algorithme génétique (GA), pour prévoir le PIB trimestriel réel du Maroc.


Méthodologie générale de l'étude

Figure : Schéma méthodologique du framework GA-CNN-BiLSTM

GA-CNN-BiLSTM Flowchart

Le framework proposé (GA-CNN-BiLSTM) s'articule autour de quatre grandes phases :

  1. Sélection de caractéristiques : Identification des variables sectorielles clés par corrélation de Spearman et Information Mutuelle (MI), puis classement via XGBoost et interprétabilité globale par SHAP.
  2. Réseau Hybride CNN-BiLSTM : La couche CNN extrait les motifs locaux et les fluctuations cycliques à court terme, tandis que la couche BiLSTM modélise les dépendances temporelles de long terme dans les deux directions.
  3. Algorithme Génétique : Optimisation jointe de neuf hyperparamètres, dont la taille des décalages temporels (lag window), les filtres, les noyaux de convolution, les neurones LSTM, les taux de dropout, le taux d'apprentissage et la taille de lot.
  4. Quantification d'incertitude : Utilisation du Monte Carlo Dropout pour générer des intervalles de prédiction robustes à 95 %.

Sélection de caractéristiques et explicabilité SHAP

Pour éviter le surapprentissage et réduire la redondance, nous appliquons un processus de sélection robuste en deux étapes sur 15 indicateurs macroéconomiques du Haut-Commissariat au Plan (HCP) (T1 1980 à T3 2025) :

  1. Étape 1 (Pré-filtrage) : La corrélation de Spearman filtre les tendances linéaires, tandis que l'Information Mutuelle (MI) capture les relations non linéaires.
  2. Étape 2 (XGBoost et SHAP) : XGBoost classe les variables dans le cadre d'une stratégie de fenêtre extensible, et SHAP (SHapley Additive exPlanations) fournit une interprétation économique rigoureuse.

Importance globale des variables via SHAP

L'analyse SHAP permet de classer et de quantifier l'impact des 7 variables sectorielles retenues :

VariableSHAP Absolu MoyenContribution %Rationale Économique dans le Contexte Marocain
Administration publique & Sécurité sociale40 951,7353,29%Rôle prédominant des dépenses publiques, des salaires de la fonction publique et des mécanismes de soutien.
Éducation, Santé & Action Sociale13 494,7917,56%Importance croissante des secteurs sociaux hors marché dans la création de valeur et le capital humain.
Impôts nets de subventions7 263,549,45%Composante fiscale directe de l'approche par la production pour le calcul du PIB aux prix du marché.
Immobilier & Services aux entreprises6 530,588,50%Moteurs clés du secteur des services marchands et de la formation de capital fixe.
Électricité, Gaz & Eau3 932,185,12%Services d'infrastructure critiques qui soutiennent directement les industries manufacturières.
Industries manufacturières2 698,183,51%Cœur industriel du pays, exposé à la fois à la demande intérieure et aux exportations.
Agriculture, Sylviculture & Pêche1 975,882,57%Secteur traditionnellement volatil en raison des chocs climatiques, mais structurant pour la croissance.

Architecture Hybride GA-CNN-BiLSTM

Le cœur de notre méthodologie réside dans l'intégration complémentaire de deux architectures :

  • Couche CNN : Extrait les motifs cycliques à court terme et les variations d'activité sectorielle.
  • Couche BiLSTM : Analyse les séquences temporelles dans les directions avant et arrière pour capter les dépendances macroéconomiques à long terme et les effets retardés.

Optimisation par Algorithme Génétique

Les modèles de Deep Learning dépendent fortement du réglage de leurs hyperparamètres. Nous utilisons un Algorithme Génétique (GA) pour optimiser simultanément 9 hyperparamètres. Une recherche sur grille préalable a permis d'identifier les meilleurs paramètres de contrôle pour le GA :

  • Probabilité de croisement ($cxpb = 0,7$)
  • Probabilité de mutation ($mutpb = 0,2$)
  • Taille de tournoi ($tournsize = 3$)
  • Population = 20, Générations = 30

Les hyperparamètres optimaux identifiés par le GA sont :

HyperparamètreEspace de RechercheValeur Optimale (GA)
Fenêtre de Décalage (Lags)[4, 6, 8, 10, 12, 14, 16]12 trimestres
Filtres CNN[10 - 150]83
Taille de Noyau CNN[3 - 7]5
Taille du Max Pooling[1 - 3]1
Taux de Dropout CNN[0,0 - 0,6]0,15
Unités BiLSTM[10 - 150]137
Taux de Dropout BiLSTM[0,0 - 0,6]0,15
Unités de la Couche Dense[10 - 150]34
Taux d'Apprentissage[1e-5 - 1e-2]0,0068 (Adamax)

Résultats Expérimentaux & Comparaisons

Le modèle final a été évalué sous une stratégie de fenêtre extensible (T4 2018 à T3 2025). Le modèle GA-CNN-BiLSTM surpasse largement tous les autres modèles de référence :

Métriques Générales de Performance

Modèle$R^2$MSEMAEMAPE (%)
GA-CNN-BiLSTM0,98510,01490,00880,89%
BiLSTM0,97450,02550,00840,84%
CNN0,97300,02700,01191,25%
AdaBoost0,91810,08190,02162,18%
Lasso0,80620,19380,03153,09%
XGBoost0,72080,27920,04013,99%
VAR0,70550,29450,02912,92%
GRU0,70020,29980,02412,50%
Random Forest0,57800,42200,05245,20%

Résilience et Analyse de Chocs

Pour évaluer la robustesse face aux retournements conjoncturels, nous comparons le GA-CNN-BiLSTM au modèle VAR linéaire traditionnel lors de périodes normales et de chocs (ex: crise du COVID-19) :

PériodeModèleMAPE (%)MAEMSE
Période de ChocGA-CNN-BiLSTM1,63%0,03140,0040
VAR4,93%0,15220,0422
Période NormaleGA-CNN-BiLSTM0,68%0,01240,0002
VAR2,61%0,09280,0126

De plus, l'incertitude a été quantifiée via Monte Carlo Dropout (50 passes stochastiques à l'inférence), fournissant des intervalles de prédiction à 95% très fiables :

  • PICP (Probabilité de Couverture) : 98,59%
  • MPIW (Largeur Moyenne de l'Intervalle) : 34 794,27
  • PINAW (Largeur Normalisée Moyenne) : 0,2488

Conclusion et Perspectives

Cette recherche démontre qu'associer les caractéristiques de convolution CNN (fluctuations sectorielles locales) et les dépendances temporelles séquentielles BiLSTM (tendances à long terme), le tout optimisé par algorithme génétique, constitue un framework de pointe pour la prévision du PIB marocain.

L'apport de SHAP permet de relier les résultats complexes à l'approche de production réelle du HCP, instaurant une relation de confiance pour les politiques publiques. Les futurs travaux pourraient intégrer des indicateurs à haute fréquence (consommation électrique, flux touristiques) pour mettre en place un système de nowcasting en temps réel.

Deep LearningGenetic AlgorithmGDP ForecastingCNN-BiLSTMSHAP
Z

Zakaria Kassemi

Data Scientist & Ingénieur IA — Maroc