La data science oltre i modelli tradizionali

L’emergere di nuove variabili nelle dinamiche di acquisto richiama un raffinamento continuo nelle strategie nell’analisi dei dati. L’esperienza di Dunnhumby

Il tema della data science è sempre di più di primo piano perché impatta tangibilmente sugli economics di un’impresa retail. Sono disponibili tools molto performanti a partire dagli analytics predittivi per arrivare ai Dss (decision support system) alimentati dall’intelligenza artificiale. Tuttavia, la data science non è semplicemente analisi dei dati ma si occupa dello sviluppo di strategie per l’analisi degli stessi, per la loro preparazione, esplorazione, analisi e visualizzazione. Il tutto finalizzato dalla creazione di modelli matematici in grado di simulare la complessa fenomenologia del retail. La crescita della data science è legata anche al cambiamento continuo di tutto l’ecosistema correlato al retailing, un cambiamento che impatta sulle variabili più significative e che richiede un aggiornamento e raffinamento non tanto dell’analisi dei dati, ma del modo in cui considerano e dei modelli che li utilizzano.

Modelli matematici

Uno degli ambiti della data science è la definizione di modelli matematici per simulare e comprendere dei fenomeni. Concettualmente un modello matematico è un insieme di formule, anche aggregate in un algoritmo in grado di riprodurre l’andamento di un fenomeno partendo dai dati iniziali. Scienza e tecnologia fanno ampio uso di modelli matematici e le persone ne traggono vantaggio in continuazione anche per ottenere informazioni nel quotidiano. Un esempio su tutti: le app per la meteorologia prevedono i fenomeni grazie all’utilizzo di sofisticati modelli matematici che a partire dalle rilevazioni prodotte dai sensori, sono in grado di predire come evolve il meteo. In questo caso i modelli matematici offrono dei risultati “probabili”, non certi ma caratterizzati da una probabilità che si avverino. I modelli probabilistici sono caratteristici dei sistemi complessi e si adattano a ogni divenire incerto dove incide il comportamento delle persone. Per ideare un modello matematico bisogna partire dall’osservazione del fenomeno, individuare le variabili significative e definire le relazioni matematiche che fanno evolvere le variabili in funzione dei dati di partenza coerentemente alla realtà. In alcuni casi osservando un fenomeno si scorgono delle analogie con altri fenomeni di cui è conosciuto il modello matematico e questo consente di non partire da zero.

Oltre il modello gravitazionale

Un esempio di analogia sui modelli matematici è citato in un articolo pubblicato dai ricercatori di Dunnhumby (azienda di data science) che, fa riferimento a un testo di fine 1800 di Ernst Georg Ravenstein e William J. Reilly i quali introducono il concetto di modellazione gravitazionale per il retail. Come ogni corpo dotato di massa possiede un suo campo gravitazionale con una sfera di influenza, l’analogia è immaginare che ogni città (o luogo aggregato) abbia una sfera commerciale di influenza. Se si apre un punto di vendita ai confini delle sfere di influenza commerciale, di fatto ci si posiziona in una zona che può catturare indifferentemente clienti di aree diverse. Entrando maggiormente nel tecnico, come riportano i ricercatori di Dunnhumby, “il flusso di merci tra due luoghi è proporzionale a una misura della dimensione dell’origine e della destinazione e inversamente proporzionale alla distanza tra loro”. Oggi, dopo diverse evoluzioni, il modello gravitazionale della vendita al dettaglio deriva da quello di AG Wilson denominato “modello vincolato all’origine”. Non è interessante in questa sede entrare nel merito di come il modello è definito ma è utile valutare il data set, l’insieme di dati utili. Per calibrare questo modello, si possono utilizzare i dati delle carte fedeltà in forma anonima che riportano l’importo totale speso per ciascuna destinazione entro un determinato periodo di tempo. Il modello può quindi essere utilizzato per prevedere le entrate totali del negozio in base alle entrate stimate disponibili da ciascuna origine. Ma perché è importante? I motivi sono molteplici ma sicuramente il tema dello sviluppo delle reti di vendita è centrale. La scelta di una location per un nuovo punto di vendita è rilevante per il giro di affari che verrà sviluppato. In questo caso i modelli matematici permettono di simulare l’attività del pdv in una location specifica e valutare il successo della scelta. In questi casi il modello gravitazionale ha una specifica applicazione.

Esperienze sul campo

Il modello gravitazionale sommariamente descritto è stato raffinato nel tempo tenendo sempre al centro un concetto di fondo: il flusso delle merci tra due location è proporzionale alla dimensione del punto di origine e destinazione e inversamente proporzionale alla distanza. Dunnhumby ha applicato i modelli gravitazionali nel Regno Unito ottenendo alcuni risultati importanti ma non universalmente validi. Nel grocery le variabili sono individuate dalla capacità di spesa disponibile per ogni punto di origine, sull’attrattività del punto di vendita e sul tempo di viaggio per raggiungerlo. Su un’area di piccole dimensioni, glie economics simulati sono sostanzialmente in accordo con quanto simulato dal modello gravitazionale, in altre parole è possibile prevedere con uno scarto del 10% le entrate del punto di vendita. Su scala più ampia il modello gravitazionale ha mostrato dei limiti fornendo risultati non soddisfacenti. Qui entra in gioco la data science e la sua capacità di definire le strategie di analisi: dopo aver valutato i risultati si è scoperto che oggi, il comportamento dei consumatori e le condizioni del singolo punto di vendita condizionano eccessivamente i risultati effettivi e che il modello non riesce a predire con accuratezza i possibili ricavi in quanto elabora altri tipi di variabili. Probabilmente occorre tenere in considerazione anche l’età del punto di vendita come misura dell’attrattività, degli spostamenti pilotati da dinamiche più sofisticate e dall’influenza dei competitor. Oggi, il modello gravitazionale è probabilmente superato e la sua utilità per scegliere la location per uno o più punti di vendita è limitata. Ma l’esperienza effettuata rimane concettualmente valida e soprattutto sottolinea ancora una volta l’importanza di un approccio non solo “algoritmico” ma maggiormente strategico circa l’analisi dei dati.

Retail in Italia e data science

Un ambito in forte sviluppo quello della data science. Ma quanto è presente nel retail italiano? Lo abbiamo chiesto a Marco Metti di Dunnhumby

Marco Metti - business development manager di Dunnhumby

Quanto la data science è penetrata nel retail in Italia?
Difficile dare una risposta precisa in quanto si tratta di un ambito strategico. La data science deve essere pervasiva, tutte le funzioni ne devono godere. È necessario un forte impegno dei leader aziendali e un programma di formazione adeguato per rendere tutti gli operatori consapevoli. Su questi temi oggi vi è molta più sensibilità oggi che qualche anno fa.

Cosa si intende per approccio strategico all’analisi dei dati?
L’analisi dei dati permette non solo di trovare degli spunti interessanti per rendere più efficaci ed efficienti le tipiche leve del retail marketing come la personalizzazione della relazioni con i clienti, le politiche di pricing, l’organizzazione delle promozioni e le performance dell’assortimento ma, soprattutto, consente di sviluppare nuove iniziative di business.

Su quali indici nel retail, la data science impatta?
La data science impatta su tutti gli indici aziendali e sulla razionalizzazione dei costi con più efficienza, permette di migliorare l’efficacia delle iniziative commerciali. Da qualche hanno permette la generazione di nuovi business come il retail media che a genera ricavi e profitti extra.

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome