
Entretien avec Sarah Schaumann, chercheuse en chef au MIT CTL
« Nos systèmes aideront les entreprises à faire face à l’avenir »
Le projet de recherche
L’optimisation de la distribution des commandes par l’entraînement des modèles d’IA autoapprenants est l’une des vocations de la collaboration scientifique lancée en 2024 par le Massachusetts Institute of Technology et Mecalux. Sarah Schaumann, membre du Center for Transportation & Logistics du MIT, est la chercheuse en chef de ce projet de l’Intelligent Logistics Systems Lab axé sur l’intelligence prescriptive, dont le but est d’aider les entreprises à sélectionner les points d’expédition les plus appropriés pour leurs marchandises.
Mecalux s’est entretenu avec Sarah Schaumann, chercheuse en chef au MIT CTL, au sujet du projet d’intelligence prescriptive qu’elle dirige dans le cadre de la collaboration scientifique entre le MIT et Mecalux.
-
Vous participez à un projet de recherche collectif mené par le MIT et Mecalux. Quelles sont vos attentes à l’égard de cette collaboration ?
L’objectif de ce projet de recherche est de développer un modèle d’orchestration, basé sur l’apprentissage automatique, destiné aux systèmes de gestion distribuée des commandes. Il s’agit donc de remplacer la stratégie fondée sur des règles par une stratégie d’orchestration intelligente, reposant sur l’IA autoapprenante, pour attribuer les commandes aux installations et aux transporteurs. Nous visons à mettre en place un système capable non seulement d’améliorer l’efficacité opérationnelle, mais aussi de s’adapter aux environnements changeants de demain grâce au machine learning.
Notre but est de développer un modèle d’orchestration basé sur l’apprentissage automatique et destiné aux systèmes de gestion distribuée des commandes
-
Quel potentiel cette initiative a-t-elle pour construire la prochaine génération de systèmes de gestion distribuée des commandes ?
Nous comptons créer de nouvelles générations de stratégies d’orchestration des commandes, intelligentes et adaptables. Cela veut dire remplacer les stratégies statiques, basées sur des règles, par des stratégies intelligentes et dynamiques, capables de s’adapter aux demandes changeantes des clients, aux contraintes ou même aux conditions du marché. Dans l’ensemble, nous voulons poser les bases du développement de systèmes de gestion des commandes autonomes et autoapprenants, de plus en plus nécessaires dans des environnements dynamiques.
L’avantage du modèle d’apprentissage par renforcement est son évolutivité -
Comment prévoyez-vous d’utiliser l’apprentissage par renforcement pour concevoir des stratégies d’orchestration optimales ?
Nous avons l’intention d’appliquer l’apprentissage par renforcement pour élaborer ces stratégies. Cela signifie que le modèle apprend et perfectionne ses processus d’orchestration en interagissant avec un environnement. Le modèle crée différentes stratégies d’orchestration, puis reçoit une récompense ou une pénalité de l’environnement en fonction du résultat de la décision. Ensuite, il fait des ajustements par un processus itératif. Il s’agit donc d’une sorte d’apprentissage continu où les récompenses dépendent du modèle économique de l’entreprise. Par exemple, une entreprise pourrait privilégier les coûts, tandis qu’une autre privilégierait les délais de livraison.
Nous voulons créer des stratégies intelligentes et dynamiques, capables de s’adapter aux demandes changeantes des clients, aux contraintes, voire aux conditions du marché
-
Comment les simulations sont-elles utilisées à l’Intelligent Logistics Systems Lab dans le cadre de ce type de recherche ?
Les simulations nous permettent de reproduire des scénarios réels dans un environnement sécurisé et contrôlé. Ainsi, le modèle n’interagit pas avec le système réel, mais avec un environnement simulé. Cela se traduit par une réduction des coûts et des risques liés aux tests et à l’entraînement de ces modèles, tout en simplifiant l’évaluation de leur robustesse et évolutivité.
-
Quel sera l’impact de ce projet dans le secteur de la logistique ?
Les environnements dans lequel les entreprises opèrent deviennent de plus en plus dynamiques et complexes, mais le grand avantage des modèles basés sur l’apprentissage par renforcement est qu’ils s’adaptent avec le temps. Cela signifie que nos systèmes aideront les entreprises à se préparer pour l’avenir.