Identifier les grappes au Québec grâce à l'apprentissage automatique

Cet article présente les résultats préliminaires de l'application de la méthodologie basée sur l'apprentissage automatique précédemment décrite pour définir les grappes industrielles au Québec. L'approche novatrice introduite par Lucien Chaffa et Thierry Warin utilise des données géospatiales sur les industries provenant du Registre des Entreprises du Québec (REQ) pour définir et identifier quantitativement les grappes.

Les auteurs calculent d'abord les taux de croissance des industries pour les regrouper sur la base de leur co-mouvement dans le temps. Le taux de croissance est défini comme le taux auquel les entreprises entrent (et sortent) d'une industrie entre 1990 et 2022. Sur un total de 328 industries classées à l'aide des codes CAE à trois chiffres, 190 industries sont sélectionnées pour leur taille variable. Dans ce contexte, la taille de l'industrie se réfère au nombre d'entreprises qui la composent, avec un seuil fixé à 50 entreprises.

La force des corrélations intersectorielles est évaluée à l'aide de la matrice de corrélation présentée ci-dessous. Les similitudes dans les trajectoires de croissance révèlent les effets partagés des forces économiques, qui peuvent s'expliquer par des chaînes d'approvisionnement communes, des demandes de marché complémentaires ou l'utilisation de technologies similaires.

Des algorithmes d'apprentissage automatique non supervisés sont appliqués aux groupements naturels d'industries dérivés de la matrice de corrélation afin de regrouper les industries présentant les modèles de croissance les plus similaires. Le périmètre de chaque groupe est défini par la force des liens interindustriels, telle qu'elle ressort de la corrélation des taux de croissance entre les industries au sein de chaque groupe.

Pour illustrer cela, l'exemple suivant filtre les industries pour n'inclure que celles qui ont une corrélation supérieure à 0,95 avec au moins une autre industrie. On obtient ainsi 15 secteurs d'activité, le diagramme de réseau ci-dessous illustrant le schéma des liens entre les secteurs d'activité au sein de ce groupe. Bien que ces industries soient susceptibles de subir des impacts similaires des chocs économiques et des réglementations politiques, elles peuvent ne pas appartenir à la même grappe en termes d'activités.

L'analyse de détection des communautés est effectuée sur le graphique de réseau ci-dessus à l'aide de la méthode de Louvain pour identifier les grappes d'industries les plus étroitement liées au sein du groupe général. Pour ce faire, l'algorithme mesure de manière hiérarchique la différence entre la corrélation moyenne des industries au sein d'une grappe et celles qui en sont exclues, ce qui permet une attribution des nœuds au sein de chaque grappe.

Il en résulte cinq grappes distinctes, comme le montre le graphique de réseau ci-dessous. La taille de chaque nœud est proportionnelle à l'industrie qu'il représente. D'une manière générale, ces grappes peuvent être classées comme suit : agriculture et élevage, alimentation et commerce de détail, services et formation, services professionnels et autres services. L'algorithme de clustering regroupe principalement des industries liées, bien que quelques industries apparemment sans rapport soient également incluses. Bien que cela puisse sembler contre-intuitif à première vue, des liens cachés qui ne sont pas immédiatement apparents peuvent également être identifiés.

Ensuite, la distribution géographique des grappes identifiées est déterminée au niveau de la division de recensement (MRC au Québec). On considère qu'une grappe est présente dans une MRC si le nombre de ses employés dépasse le 90e percentile de la distribution de l'emploi. La carte interactive suivante montre la présence de ces grappes. La taille de chaque grappe est proportionnelle à la taille moyenne des industries qui la composent. Une concentration de grappes au sein d'une MRC particulière suggère que les entreprises d'une grappe bénéficient également d'économies d'agglomération avec celles qui ne font pas partie de leur propre grappe.

L'aspect temporel des données du REQ permet d'analyser l'évolution des grappes au fil du temps. Cette évolution est calculée en suivant les entrées et sorties annuelles des entreprises dans chaque grappe. Les clusters semblent présenter des schémas de croissance, de stagnation et de déclin généralement similaires. Toutefois, la grappe « Alimentation et commerce de détail » croît à un rythme plus rapide que les autres. En revanche, la grappe « agriculture et élevage » présente une trajectoire plus plate, probablement en raison de la nature réglementée du secteur et de l'inélasticité de sa production.

Si l'on se concentre sur les entrées d'entreprises, on constate que le nombre d'entrées a atteint son maximum dans les grappes d'entreprises identifiées au milieu des années 1990. Depuis lors, le nombre annuel d'entreprises entrant sur le marché est resté relativement stable. Le cluster de l'alimentation et du commerce de détail présente une plus grande variation par rapport aux autres, avec entre 2 000 et 2 500 entrées annuelles depuis le début des années 2000. En revanche, la grappe « Autres services » a enregistré moins d'entrées depuis 2011. La diminution brutale en 2022 peut être attribuée à la rupture dans les données compilées à partir du REQ.

D'autre part, les sorties d'entreprises semblent avoir fortement augmenté peu après le pic des entrées d'entreprises au milieu des années 1990. Alors que 2017 a vu le plus grand nombre de fermetures dans l'ensemble des grappes, il y a également eu un pic plus court en 2010. Depuis, les chiffres tendent à revenir à leurs niveaux habituels.

En résumé, les résultats préliminaires révèlent la présence de grappes émergentes qui fournissent des informations précieuses sur la distribution industrielle et la dynamique interindustrielle. Le co-mouvement des industries individuelles au sein des grappes identifiées souligne leur importance pour l'économie régionale et met en évidence la nécessité d'un soutien spécifique au contexte pour assurer leur croissance continue. La suite de l'étude se concentrera sur la validation de ces résultats et l'exploration des interventions politiques potentielles qui pourraient renforcer ces grappes identifiées de manière dynamique et promouvoir une croissance durable.


EN