Tous les articles
Leadership2026-04-28

Guide du DAF : le ROI de l'IA retail, quelle ligne de P&L et quand

La plupart des decks ROI sur l'IA retail ne survivent pas à une revue financière. Comment distinguer l'IA d'économies de l'IA génératrice de marge.

Kevin Didelot13 min de lecture

Un deck ROI sur l'IA retail arrive sur le bureau d'un DAF environ une fois par trimestre. Il ouvre sur une slide de taille de marché, puis enchaîne sur un pourcentage « transformationnel » en gros caractères. Il se clôt par une courbe de payback qui remonte en année deux. Le DAF connaît cette forme. Il sait qu'un chiffre de ROI mélangé, sans ligne de P&L nommée derrière, n'est pas un business case — c'est un objet marketing déguisé en objet financier.

La position raisonnable d'un DAF n'est pas anti-IA. Elle est anti-flou. « Montrez-moi exactement quelle ligne du compte de résultat cela bouge, de combien, et quand cela apparaît — puis dites-moi ce que vous ne savez pas attribuer proprement. » Cette demande n'est pas du scepticisme gratuit. C'est le seul cadre dans lequel un investissement IA peut être comparé à tout ce qui se dispute le même capital.

Cet article répond à cette demande en termes financiers. Il pose la distinction qui décide de tout le business case — IA d'économies contre IA génératrice de marge. Il cartographie les lignes de P&L que l'IA de décision bouge réellement et donne un modèle par le bas défendable en revue budgétaire. Il reste explicite sur ce qui demeure difficile à attribuer.

Pas de pourcentage en gros caractères. Le chiffre doit tomber de vos propres chiffres.

IA d'économies contre IA génératrice de marge

Presque tout pitch d'IA retail relève de l'une de deux catégories, et ces catégories se comportent de façon radicalement différente au P&L. Les confondre est la raison la plus fréquente pour laquelle un investissement IA sous-délivre par rapport à son business case.

L'IA d'économies rend un processus existant moins cher ou plus rapide. Elle rédige l'email fournisseur, résume le rapport de sell-through, taggue les visuels produits, traite le ticket support de niveau un. La valeur est réelle mais elle est molle : des heures libérées, pas des euros encaissés. Les heures libérées ne se convertissent en impact P&L que sous deux conditions — soit vous supprimez le poste, soit vous le redéployez sur un travail démontrablement générateur de revenu. Les organisations retail font rarement l'un ou l'autre proprement.

L'analyste dont le rapport du lundi matin est désormais automatisé n'est pas supprimé ; il absorbe le mou. Le gain est réel au chronomètre et invisible au compte de résultat.

L'IA génératrice de marge change une décision — ce qui est acheté, où le stock est alloué, quand une démarque est passée, quel SKU est réapprovisionné. Le livrable n'est pas un processus plus rapide ; c'est une action différente. La meilleure action porte un écart de marge brute mesurable face à l'action qui aurait été prise sinon. C'est la seule catégorie qui atterrit directement sur la ligne de marge brute, parce qu'elle change l'économie de la transaction sous-jacente, pas seulement le coût de main-d'œuvre pour l'organiser.

La distinction compte pour un DAF pour une raison précise : les deux catégories exigent des charges de preuve différentes et se convertissent à des taux différents. L'IA d'économies a besoin d'un argument honnête de suppression ou de redéploiement de poste avant même de toucher le P&L — et la plupart n'en ont pas. L'IA génératrice de marge se rattache à une décision datée, à un contrefactuel et à un écart de marge brute. L'une est une histoire d'efficacité qu'il faut se battre pour encaisser. L'autre est une histoire de marge mesurable par unité d'action.

Un filtre utile pour toute proposition IA : est-ce que ceci prend une décision, ou rend-il une tâche plus rapide ? Si la réponse est « tâche plus rapide », exigez la ligne d'effectif avant de créditer le moindre ROI. Si la réponse est « décision différente », demandez quelles décisions, combien, et quelle est la marge sur chacune — ce qui est précisément le reste de cet article.

Les lignes de P&L que l'IA de décision retail bouge réellement

L'IA de décision retail n'est pas diffuse. Elle bouge quatre lignes nommées, chacune rattachée à une catégorie de décision opérationnelle qu'un retailer prend déjà des milliers de fois par saison. Ces décisions sont simplement plus lentes, plus tardives, et prises avec moins d'information que la version optimale. La valeur, c'est l'écart entre la décision prise et celle qui aurait dû l'être.

Profondeur de démarque

La ligne démarque est la plus directe et la plus mal instrumentée. Un produit signalé pour démarque avec quatre à six semaines de retard n'est pas seulement démarqué. Il est démarqué plus profondément, parce que la fenêtre pour l'écouler à faible remise s'est refermée. Dans les catégories saisonnières, ce retard fait routinièrement passer la remise nécessaire de -20 % à -50 %, avec un levier brutal sur la marge brute.

La couche de décision bouge cette ligne en faisant remonter les bons couples SKU/magasin au bon moment, tant qu'une démarque légère écoule encore le stock. L'effet bancable, c'est l'écart entre la remise prise tôt et celle qu'on est contraint de prendre tard — directement sur la marge brute. Nous en détaillons la mécanique dans pourquoi 70 % des démarques retail sont encore manuelles.

Coût de portage du surstock

Le stock en excès coûte 20 à 30 % de sa valeur par an à porter, avant la moindre démarque. La valeur comptable affichée par un ERP n'est qu'une fraction de la facture réelle. La couche de décision bouge cette ligne en empêchant le surstock de se former et de s'accumuler. Elle réalloue avant que le déséquilibre ne se fige, retourne au fournisseur tant que la fenêtre contractuelle est ouverte, et transfère entre magasins plutôt que porter. Chaque semaine de portage évitée est un coût directement récupérable.

L'anatomie complète de cette facture cachée est dans le vrai coût du surstock — les sept couches de coût qu'aucun ERP ne consolide.

Ventes perdues sur rupture

La plus sous-comptée des quatre, parce qu'elle n'apparaît jamais comme un coût — elle apparaît comme un revenu qui n'a simplement jamais eu lieu. Les retailers perdent jusqu'à 4 % de leurs ventes sur des ruptures alors même que leurs entrepôts débordent du même produit ailleurs. La couche de décision bouge cette ligne en re-localisant le stock là où la demande est réellement. Elle agit à temps pour capter la vente, plutôt qu'après que le client a substitué ou est parti.

La marge brute récupérée sur ces ventes captées est la valeur. Les coûts de second et troisième ordre (substitution, fidélité perdue) s'empilent par-dessus, comme exposé dans le vrai coût des ruptures de stock.

Rotation des stocks et BFR

La ligne la plus lente à bouger mais la plus stratégique. Chaque euro gelé dans un stock qui ne devrait pas être là est un euro qui ne finance pas le réassort d'un best-seller ou une nouvelle collection. La couche de décision augmente la rotation en gardant le bon stock au bon endroit, ce qui libère du BFR et améliore le cycle de conversion en cash. C'est la ligne qu'un DAF ressent le plus directement, parce qu'elle touche le bilan, pas seulement le compte de résultat. C'est le fil conducteur de du stock au cash : ce qui drive la performance retail.

Remarquez ce que ces quatre lignes partagent : aucune n'est une ligne de coût de main-d'œuvre. Ce sont toutes des lignes d'économie de la transaction, bougées en changeant la décision plutôt qu'en accélérant le processus autour. C'est la raison structurelle pour laquelle l'IA de décision est une histoire de marge, pas d'efficacité.

Comment construire le business case

L'instinct de l'éditeur est de vous tendre un pourcentage de ROI mélangé. Refusez-le. Un business case d'IA retail défendable se construit par le bas, à partir de vos propres volumes opérationnels, et il a la même forme pour chacune des quatre lignes ci-dessus.

Le modèle a trois termes :

Valeur = volume de décisions adressables × gain de qualité de décision × marge par décision

Prenons chaque terme tour à tour, car chacun est un chiffre que vous possédez déjà ou que vous pouvez défendre.

Volume de décisions adressables. Combien de décisions de ce type le réseau prend-il par saison ? Décisions de démarque par SKU/magasin, appels de réassort par semaine, arbitrages d'allocation en début de saison. C'est dénombrable depuis vos propres systèmes — ce n'est pas une estimation fournie par l'éditeur. Cela borne aussi honnêtement l'opportunité : l'IA ne peut pas bouger des décisions que vous ne prenez pas.

Gain de qualité de décision. Parmi ces décisions, quelle fraction est aujourd'hui sous-optimale, et de combien un meilleur timing ou une meilleure information les améliore-t-il ? C'est le terme sur lequel être conservateur. Ne supposez pas que chaque décision s'améliore — supposez un taux d'adoption réaliste (la part des recommandations effectivement exécutées) et une amélioration par décision réaliste. Un business case qui suppose 100 % d'adoption et un gain parfait est exactement le deck éditeur que vous cherchiez à éviter.

Marge par décision. Quelle est la valeur en marge brute de bien prendre une décision plutôt que de rester au statu quo ? Une démarque prise à -20 % au lieu de -45 % sur une valeur de stock donnée. Une réallocation qui capte une vente à plein prix au lieu d'une rupture. C'est ici qu'entrent vos marges par catégorie, votre panier moyen, vos paliers de démarque — vos chiffres, pas des benchmarks.

Multipliez les trois, sommez sur les quatre lignes de P&L, et soustrayez le coût complet de la plateforme plus l'effort interne de conduite du changement. Le résultat est une fourchette, pas un point, et il doit s'exprimer en fraction de l'EBIT pour se comparer aux autres usages du capital. Sur un retailer de plusieurs centaines de millions de chiffre d'affaires, les benchmarks publics convergent autour de 1 à 3 points d'EBIT. Mais le seul chiffre digne d'engagement est celui que ce modèle produit sur vos volumes, avec votre hypothèse d'adoption et vos marges.

Deux disciplines gardent l'exercice honnête. D'abord, calculez-le par ligne et ne les nettez jamais en un seul chiffre. La valeur démarque et la valeur BFR n'ont pas la même signature temporelle ni la même confiance d'attribution. Ensuite, écrivez la baseline avant de commencer, car un business case sans contrefactuel enregistré ne peut pas être soldé en fin de saison.

Time-to-value : pourquoi cela atterrit dans la saison

La courbe de payback-en-année-deux est la partie du deck éditeur qu'un DAF devrait interroger le plus. Pour l'IA de décision, elle se trompe en général du côté prudent. L'unité de valeur est une décision datée unique, donc la valeur s'accumule la première fois qu'une meilleure décision est exécutée, pas après une maturation pluriannuelle de la plateforme.

La logique est structurelle. Une démarque prise trois semaines plus tôt encaisse son écart de marge cette saison. Une réallocation qui capte une vente la capte cette semaine. Il n'y a pas de période de maturation du modèle pendant laquelle la valeur reste théorique — la première décision correctement chronométrée vaut déjà son écart de marge.

C'est l'inverse d'une plateforme analytique dont la valeur est différée jusqu'à ce qu'assez de dashboards soient construits et crus. Une décision qui s'exécute vaut son écart à l'instant où elle s'exécute.

Ce qu'il faut mesurer, pour que la valeur soit bancable plutôt qu'affirmée :

  • Taux d'adoption des décisions — la part des recommandations effectivement exécutées sur le terrain sans retraitement manuel. C'est l'indicateur avancé ; la valeur ne peut pas le dépasser.
  • Écart de marge par ligne contre une baseline enregistrée — profondeur de démarque face à la courbe de la saison précédente, coût de portage face aux semaines de couverture antérieures, ventes captées contre perdues sur le stock re-localisé.
  • Libération de BFR — rotation et jours de stock au niveau réseau, lus sur le bilan trimestre après trimestre.

Et la part honnête, qui a sa place explicite dans le business case : l'attribution propre est difficile. Prétendre le contraire est ce qui discrédite les annonces de ROI sur l'IA. Une saison a une météo, la promotion d'un concurrent, un mouvement macro — tous bougeant les mêmes lignes que l'IA de décision.

La réponse défendable n'est pas un contrefactuel fabriqué ; c'est un groupe témoin. Faites tourner un ensemble comparable de magasins ou de catégories sans la nouvelle couche de décision, puis mesurez l'écart contre lui. Acceptez que le chiffre attribuable soit la différence contrôlée, pas le mouvement brut. Un DAF fera bien plus confiance à un chiffre plus modeste qui survit à un groupe témoin qu'à un gros qui n'y survit pas.

Cet arbitrage est précisément celui qu'une direction financière devrait vouloir. Un chiffre plus modeste, attribué de façon défendable, atterrissant dans la saison vaut mieux qu'un gros chiffre promis sur trois ans. C'est aussi celui que la plupart des decks éditeurs refusent de faire.

La question à trancher avant de signer

Avant qu'une proposition d'IA retail n'atteigne un comité de pilotage, passez-la par un seul filtre. Est-ce de l'IA d'économies ou de l'IA génératrice de marge, et quelle ligne de P&L prétend-elle bouger ? Si la réponse est un processus rendu plus rapide sans ligne d'effectif derrière, le ROI est mou et il faut le traiter comme tel. Si la réponse est une décision changée (démarque, allocation, réassort, retour), vous pouvez la modéliser par le bas sur vos propres volumes. Vous la mesurez ensuite contre un groupe témoin, et vous encaissez ce qui survit.

Les retailers qui tirent un vrai retour de l'IA ne sont pas ceux qui ont acheté le deck le plus ambitieux. Ce sont ceux qui ont exigé une ligne de P&L nommée, une marge par décision défendable et un plan de mesure dans la saison. Ils ont écarté tout ce qui ne pouvait pas produire les trois.

Pour les questions que vos pairs DAF posent en premier — fourchettes TCO, payback, libération de BFR, framing board — voir la FAQ DAF.


Un business case bâti sur votre P&L, pas sur celui d'un éditeur ?

Chez Solya, nous menons un diagnostic de 30 minutes avec les directions financières et opérationnelles. Nous modélisons le volume de décisions adressables, la marge par décision et le time-to-value réaliste sur vos propres chiffres, pas un pourcentage de ROI mélangé.

Vous repartez avec :

  • Une vue par ligne de l'endroit où l'IA de décision bouge votre P&L (démarque, portage, ventes perdues, BFR)
  • Un squelette de business case par le bas, bâti sur vos volumes de décisions et vos marges
  • Un plan d'attribution honnête, y compris ce qu'un groupe témoin peut et ne peut pas prouver
Kevin DidelotCo-founder & CTO, Solya

Co-fondateur et CTO de Solya.

Articles similaires