Stats Under the Stars 3 - RELOAD
Omino Questa è la sfida proposta da Findomestic per l'evento SUS3.
Riuscirete a fare meglio dei vincito...
2017
31/12
 
  Partecipanti 8 Sottomissioni 16  
 

Questa è la sfida proposta da Findomestic per l’evento SUS3.

Riuscirete a fare meglio dei vincitori di quella bollente notte a Firenze?
Se volete maggiori informazioni sull’evento organizzato dal Dipartimento di Statistica, Informatica, Applicazioni “Giuseppe Parenti” dell’Università degli Studi di Firenze :
Sito Ufficiale dell’evento,
Link alla competizione
__________________________________________________________________________

DESCRIZIONE DEL CASE STUDY

Findomestic è una banca che opera nel Credito al Consumo delle famiglie.
La società commercializza i suoi prodotti attraverso un canale lungo ed un canale corto:
Il canale lungo (B2B2C) è rappresentata da tutti i piccoli e grandi partner della Distribuzione Retail
Il canale corto (B2C) è rappresentato dalle 200 agenzie sparse su tutto il territorio italiano.
Attraverso il canale lungo, la Findomestic colloca i suoi prodotti di Credito Classico finalizzati all’acquisto di un prodotto di consumo (elettronica ed arredamento in particolare).
Attraverso il canale corto colloca invece i suoi prodotti di Prestito Personale.

Case history

Nel mese di gennaio la società decide di testare la proposta del proprio Prestito Personale attraverso il canale telefonico outbound.

Considerato che il costo di ogni telefonata è di 2,50€, ed avendo stabilito un budget mensile per le attività di Direct di 100.000 €, la proposta può essere fatta solamente a 40.000 nominativi.
La Direzione Marketing decide di estrarre casualmente i clienti a cui fare la proposta telefonica (40.000 su 200.000).
Il mese successivo vengono osservati i risultati delle vendite ottenute attraverso la proposta telefonica e la Direzione chiede, al proprio ufficio CRM, di elaborare un algoritmo di scoring per poter ripetere l’operazione non in modo aleatorio ma bensì mirato ad ottimizzare l’investimento.

L’ufficio di Analytics utilizza dunque i 40.000 clienti oggetto del test (rappresentativi dell’intero portafoglio clienti) per creare un modello di correlazione con la variabile target “accetta la proposta di finanziamento”.
Per modellizzare tale fenomeno, l’ufficio ha a disposizione diverse variabili che caratterizzano ogni cliente e che possono essere ricondotte a 3 macro categorie:
- variabili sociodemografiche
- variabili di equipaggiamento
- variabili storico-comportamentali

Il CRM finalizza uno Score predittivo e viene dunque deciso di fare una nuova campagna outbound.
Per questo, vengono stanziati 25.000 € per questa nuova attività.

Viene dunque chiesto al CRM di selezionare 10.000 clienti, tra i 160.000 clienti che non sono stati chiamati la volta precedente, in modo da ottimizzare l’investimento.

I prodotti del canale lungo sono pubblicizzata e proposti direttamente negli Store, mentre i prodotti del canale corto (Prestito Personale) vengono proposti con un’accurata attività di Direct Marketing, prevalentemente mailing ed email.

Ogni mese la società scrive a tutti i clienti del proprio portafoglio, costituito da 200.000 nominativi, per offrirgli i propri prodotti.

Considerato un costo per singolo mailing di 0,50€, la società ha dunque stanziato un budget mensile di 100.000€ per la propria attività di Direct.

Il candidato rappresenta lo specialista Analytics del CRM e dovrà:

Creare uno score di propensione sul campione dei 40.000 clienti trattati (vedi file “dataset_stima.csv”) nel mese di gennaio.

Applicare lo score alla restante parte dei 160.000 clienti (vedi file “dataset_previsione.csv”) al fine di selezionare i 10.000 clienti che hanno la più alta probabilità di accettare la proposta telefonica

Vince la squadra che estrarrà i 10.000 nominativi che mostrano il più alto numero di risposte positive alla proposta commerciale.

Il punteggio (Score) è la proporzione di risposte positive nel dataset di previsione (verifica). Più alta la proporzione, meglio è.

• Le classifiche sono fatte per squadra, con ’ultima submission’ si intende l’ultima di un qualsiasi membro della squadra.
• Non c’è un limite al numero di submission che è ogni membro può fare.
• È fatto espresso divieto di inviare previsioni con Codici_Cliente replicati.
• Al termine della competizione, solo l’ultima submission sarà considerata per il calcolo del punteggio finale (sottometete quindi quella che reputate migliore!).
• Il punteggio finale è calcolato come nella pagina Valutazione usando solo le predizioni che NON sono state usate nel calcolo del punteggio parziale.

Inoltre, è necessario che il capitano della squadra invii entro le ore 7.00 l’elaborato che descrive il metodo usato nella (ultima, definitiva) previsione presentata. L’elaborato deve rispattare le norme descritte nel regolamento ed inviato via mail all’indirizzo sus3@disia.unifi.it
Limite massimo numero di pagine: 3

Sottoponete al sistema un file di testo con una sola colonna e 10mila righe. Ogni riga contenga un Codice_Cliente (si veda la colonna presente nei dataset di stima e di previsione).

Il file sarà quindi del tipo:
120404
102910
124548
37730
20682
174785
87116
58034
17007

Si veda anche il file EsempioSubmission.txt alla pagina Datasets

ATTENZIONE: per ragioni di riservatezza i file ZIP sono protetti da password. Potete contattare il dott. Riccardo Grazzini (r.grazzini@findomestic.com) dichiarando la vostra intenzione di partecipare alla competizione SUS3 a solo scopo didattico ed ottenere così la password.


La descrizione delle variabili presenti nel dataset è contenuta nel file Decodifica_Variabili_SUS3.html scaricabile in fondo a questa pagina.

Gli altri file sono
• il dataset di stima (40mila utenti) dataset_stima.csv.zip e
• il dataset previsione (160mila utenti) dataset_previsione.csv.zip

Quest’ultimo ha le stesse variabili (colonne) del primo, tranne la colonna TARG_TOT

Trovate infine anche un file di esempio per la submission in cui i 10mila valori di Codice_Cliente riportati sono estratti a caso dalla corrispettiva colonna del file dataset_previsione.csv.




Descrizione Variabili nel dataset Descrizione Variabili SUS3.html
7 KB
file esempio submission EsempioSubmission.txt
60 KB
Dataset Stima dataset_stima.csv.zip
900 KB
Dataset Previsione dataset_previsione.csv.zip
3 MB
Per partecipare bisogna prima autenticarsi
# Nome Punteggio Prove Ultima prova
1 benchmark PARZIALE 51.15% 10 12.09.2017
06:23