Stats Under the Stars 3
Omino Risultati della competizione
Le squadre vincitrici della sfida Stats under the Stars 3 (e report ...
2017
28/06
 
  Partecipanti 118 Sottomissioni 959  
 

Risultati della competizione

Le squadre vincitrici della sfida Stats under the Stars 3 (e report presentati) sono:
Call of data (Università di PD) Migliore progetto che unisce ottima previsione oggettiva e miglior valutazione dei giudici. Premio: 1.000€ offerti da Findomestic.
Just can’t fit enough (Università la Sapienza, Roma) Migliore previsione oggettiva. Premio: corso gratuito offerto da SAS.
Rosti ma robusti (Università di PD) Migliore report che si distingue per la qualità della stesura e della presentazione dei risultati. Premio: libri offerti da Pearson.
Sample Minds (atenei vari) Migliore comunicazione, ovvero il report con la migliore capacità di rendere fruibili i risultati anche ad un pubblico di non addetti ai lavori. Premio: un tablet offerto da Aruba.

Sito Ufficiale della competizione


Findomestic è una banca che opera nel Credito al Consumo delle famiglie.
La società commercializza i suoi prodotti attraverso un canale lungo ed un canale corto:
Il canale lungo (B2B2C) è rappresentata da tutti i piccoli e grandi partner della Distribuzione Retail
Il canale corto (B2C) è rappresentato dalle 200 agenzie sparse su tutto il territorio italiano.
Attraverso il canale lungo, la Findomestic colloca i suoi prodotti di Credito Classico finalizzati all’acquisto di un prodotto di consumo (elettronica ed arredamento in particolare).
Attraverso il canale corto colloca invece i suoi prodotti di Prestito Personale.

Case history

Nel mese di gennaio la società decide di testare la proposta del proprio Prestito Personale attraverso il canale telefonico outbound.

Considerato che il costo di ogni telefonata è di 2,50€, ed avendo stabilito un budget mensile per le attività di Direct di 100.000 €, la proposta può essere fatta solamente a 40.000 nominativi.
La Direzione Marketing decide di estrarre casualmente i clienti a cui fare la proposta telefonica (40.000 su 200.000).
Il mese successivo vengono osservati i risultati delle vendite ottenute attraverso la proposta telefonica e la Direzione chiede, al proprio ufficio CRM, di elaborare un algoritmo di scoring per poter ripetere l’operazione non in modo aleatorio ma bensì mirato ad ottimizzare l’investimento.

L’ufficio di Analytics utilizza dunque i 40.000 clienti oggetto del test (rappresentativi dell’intero portafoglio clienti) per creare un modello di correlazione con la variabile target “accetta la proposta di finanziamento”.
Per modellizzare tale fenomeno, l’ufficio ha a disposizione diverse variabili che caratterizzano ogni cliente e che possono essere ricondotte a 3 macro categorie:
- variabili sociodemografiche
- variabili di equipaggiamento
- variabili storico-comportamentali

Il CRM finalizza uno Score predittivo e viene dunque deciso di fare una nuova campagna outbound.
Per questo, vengono stanziati 25.000 € per questa nuova attività.

Viene dunque chiesto al CRM di selezionare 10.000 clienti, tra i 160.000 clienti che non sono stati chiamati la volta precedente, in modo da ottimizzare l’investimento.

I prodotti del canale lungo sono pubblicizzata e proposti direttamente negli Store, mentre i prodotti del canale corto (Prestito Personale) vengono proposti con un’accurata attività di Direct Marketing, prevalentemente mailing ed email.

Ogni mese la società scrive a tutti i clienti del proprio portafoglio, costituito da 200.000 nominativi, per offrirgli i propri prodotti.

Considerato un costo per singolo mailing di 0,50€, la società ha dunque stanziato un budget mensile di 100.000€ per la propria attività di Direct.

Il candidato rappresenta lo specialista Analytics del CRM e dovrà:

Creare uno score di propensione sul campione dei 40.000 clienti trattati (vedi file “dataset_stima.csv”) nel mese di gennaio.

Applicare lo score alla restante parte dei 160.000 clienti (vedi file “dataset_previsione.csv”) al fine di selezionare i 10.000 clienti che hanno la più alta probabilità di accettare la proposta telefonica

Vince la squadra che estrarrà i 10.000 nominativi che mostrano il più alto numero di risposte positive alla proposta commerciale.

Il punteggio (Score) è la proporzione di risposte positive nel dataset di previsione (verifica). Più alta la proporzione, meglio è.

• Le classifiche sono fatte per squadra, con ’ultima submission’ si intende l’ultima di un qualsiasi membro della squadra.
• Non c’è un limite al numero di submission che è ogni membro può fare.
• È fatto espresso divieto di inviare previsioni con Codici_Cliente replicati.
• Al termine della competizione, solo l’ultima submission sarà considerata per il calcolo del punteggio finale (sottometete quindi quella che reputate migliore!).
• Il punteggio finale è calcolato come nella pagina Valutazione usando solo le predizioni che NON sono state usate nel calcolo del punteggio parziale.

Inoltre, è necessario che il capitano della squadra invii entro le ore 7.00 l’elaborato che descrive il metodo usato nella (ultima, definitiva) previsione presentata. L’elaborato deve rispattare le norme descritte nel regolamento ed inviato via mail all’indirizzo sus3@disia.unifi.it
Limite massimo numero di pagine: 3

Sottoponete al sistema un file di testo con una sola colonna e 10mila righe. Ogni riga contenga un Codice_Cliente (si veda la colonna presente nei dataset di stima e di previsione).

Il file sarà quindi del tipo:
120404
102910
124548
37730
20682
174785
87116
58034
17007

Si veda anche il file EsempioSubmission.txt alla pagina Datasets

La descrizione delle variabili presenti nel dataset è contenuta nel file Decodifica_Variabili_SUS3.html scaricabile in fondo a questa pagina.

Gli altri file sono (ATTENZIONE: file rimossi dopo la competizione. Si veda però: SUS3 reload per partecipare alla competizione.)
• il dataset di stima (40mila utenti) dataset_stima.csv.zip e
• il dataset previsione (160mila utenti) dataset_previsione.csv.zip

Quest’ultimo ha le stesse variabili (colonne) del primo, tranne la colonna TARG_TOT

Trovate infine anche un file di esempio per la submission in cui i 10mila valori di Codice_Cliente riportati sono estratti a caso dalla corrispettiva colonna del file dataset_previsione.csv.




Descrizione Variabili nel dataset Decodifica_Variabili_SUS3.html
30 KB
file esempio submission EsempioSubmission.txt
60 KB
Dataset Stima dataset_stima.csv.zip
900 KB
Dataset Previsione dataset_previsione.csv.zip
3 MB
Per partecipare bisogna prima autenticarsi
# Nome Punteggio Prove Ultima prova
1 Team: Just Can't Fit Enough FINALE 52.36% 129 28.06.2017
05:42
2 Team: La compagnia del modello FINALE 52.05% 18 28.06.2017
05:43
3 Team: Who let the DAGs out FINALE 52.03% 25 28.06.2017
05:57
4 Team: Call of Data FINALE 52.03% 13 28.06.2017
05:26
5 Team: Fit me one more time FINALE 51.86% 64 31.07.2017
10:33
6 Team: Random Forest Gump FINALE 51.81% 44 25.07.2017
14:00
7 Team: ColLASSO FINALE 51.64% 43 28.06.2017
05:16
8 Team: Magic Team FINALE 51.64% 17 28.06.2017
05:59
9 Team: I Discreti FINALE 51.60% 39 28.06.2017
05:57
10 Team: The Royal Celtic FINALE 51.52% 63 28.06.2017
05:46
11 Team: Unsupervised FINALE 51.51% 30 28.06.2017
05:49
12 Team: Rosti ma robusti FINALE 51.49% 10 28.06.2017
04:53
13 Team: DROP THE BAYES FINALE 51.45% 62 28.06.2017
05:46
14 Team: Shrink 'Em All !!! FINALE 51.35% 42 28.06.2017
05:41
15 Team: S.Wilk Potato Fries FINALE 51.30% 16 28.06.2017
05:30
16 Team: Brutti's Army FINALE 51.18% 80 28.06.2017
05:46
17 Team: Gli AgGREGati FINALE 51.11% 65 28.06.2017
05:49
18 Team: Markov Unchained FINALE 50.72% 39 28.06.2017
05:18
19 Team: Frequent improper Gaussian assumptions FINALE 50.64% 37 28.06.2017
05:50
20 Team: sum42 FINALE 50.00% 72 28.06.2017
05:52
21 Team: THESTATISTICI FINALE 49.35% 12 28.06.2017
05:30
22 Team: Sample Minds FINALE 49.09% 8 28.06.2017
05:28
23 Team: Data Travelers FINALE 46.97% 28 21.07.2017
10:11
24 Team: This Platypus FINALE 29.39% 3 28.06.2017
05:20
Team Membri
Magic Team Magic Team (Cap. Claudio Semeraro) 5
Call of Data Call of Data (Cap. Igor Artico) 4
Fit me one more time Fit me one more time (Cap. Michela Bragagnolo) 4
Markov Unchained Markov Unchained (Cap. Andrea Gilardi) 5
Who let the DAGs out Who let the DAGs out (Cap. manuela lautizi) 5
La compagnia del modello La compagnia del modello (Cap. davide bossoli) 2
Frequent improper Gaussian assumptions Frequent improper Gaussian assumptions (Cap. Emanuele Aliverti) 4
Data Travelers Data Travelers (Cap. Francesca Crescenzi) 5
I Discreti I Discreti (Cap. Carlo Ventura) 5
DROP THE BAYES DROP THE BAYES (Cap. Elena Pesce) 5
Rosti ma robusti Rosti ma robusti (Cap. Cristian Castiglione) 5
ColLASSO ColLASSO (Cap. Mauricio Fadel Argerich) 4
Gli AgGREGati Gli AgGREGati (Cap. Federica Licari) 5
Just Can't Fit Enough Just Can't Fit Enough (Cap. Riccardo Giubilei) 5
Random Forest Gump Random Forest Gump (Cap. Elena Troccoli) 5
Sample Minds Sample Minds (Cap. Andrea Cappozzo) 4
Shrink 'Em All !!! Shrink 'Em All !!! (Cap. Giorgio Giannone) 5
sum42 sum42 (Cap. Alex Saja) 5
S.Wilk Potato Fries S.Wilk Potato Fries (Cap. Michele Peruzzi) 3
The Royal Celtic The Royal Celtic (Cap. Anna Calissano) 5
THESTATISTICI THESTATISTICI (Cap. Matteo Santarelli) 5
This Platypus This Platypus (Cap. Carlo Foschi) 2
Unsupervised Unsupervised (Cap. Edoardo Carchia) 3
Brutti's Army Brutti's Army (Cap. Giovanni Trappolini) 5