Business Game 2016
Telephone Business game Organizzato assieme all'Università di Padova
Competizione + selezione per colloqui ...
2016
01/05
 
  Partecipanti 55 Sottomissioni 322  
 

Business game Organizzato assieme all’Università di Padova

Competizione + selezione per colloqui con le aziende

Link alla pagina dell’evento

Classifica finale del Business Game (19/04/2916, ore 13.00).

Abbiamo deciso di RIAPRIRE la competizione a solo scopo di approfondimento. Su “Learning” (vedi linguetta a destra) abbiamo attivato un punto di discussione sulla competizione.
_______________________________________________________________________________

Lo scenario proposto è quello di una compagnia che opera nel settore delle telecomunicazioni.

La Direzione intende promuovere una campagna volta a incrementare l’upsell, l’acquisto di prodotti di maggior valore rispetto a quelli inizialmente acquistati dai suoi clienti.

L’estensione della garanzia, l’acquisto di un prodotto di gamma superiore o la sostituzione del prodotto con uno dal margine più alto, sono tutti esempi positivi di upsell.

Nella fase di pianificazione della campagna promozionale viene chiesto al data scientist di identificare il target di clienti verso cui rivolgersi.

Il business problem proposto è tipico di un sistema Customer Relationship Management (CRM). Una strategia per gestire e personalizzare il rapporto con il cliente è quella di produrre degli scores che ne caratterizzano il profilo. Sulla base di questi scores la compagnia può quindi decidere quali siano le iniziative più opportune da intraprendere.

• Non c’è un limite al numero di submission che ogni partecipante può fare.
• Al termine della competizione, solo l’ultima submission sarà considerata per il calcolo del punteggio finale (sottomettete quindi per ultima quella che reputate migliore!).
• Il punteggio finale è calcolato usando solo le predizioni che NON sono state usate nel calcolo del punteggio parziale.

Utilizzando il vostro modello stimato sul dataset ctrainset.csv, dovrete prevedere la propensione all’upsell redemption (punteggi bassi per propensione bassa, punteggi alti per propensione positiva) per ciascuno dei 20000 nuovi clienti del daset cscoreset.csv. La bontà della vostra classificazione verrà valutata secondo la vostra capacità di massimizzare l’AUC (Area Under the ROC):

https://en.wikipedia.org/wiki/Receiver_operating_characteristic

Durante il game avrete anche la possibilità di valutare la performance del vostro modello attraverso un Punteggio Parziale: si tratta dell’errore di previsione precedentemente descritto, calcolato solo su una parte – a voi non nota – delle 6000 righe del dataset di predizione. Ad ogni nuova submission otterrete un nuovo punteggio parziale (calcolato sullo stesso dataset parziale). Non c’è limite al numero submissions che potete effettuare.

Dopo la chiusura della competizione, il sistema calcolerà il Punteggio Finale sulla base dell’ultimo vettore di previsione sottomesso da ogni squadra. Questo errore è calcolato usando tutte e sole le osservazioni che non hanno partecipato al calcolo del punteggio parziale e le vostre corrispondenti previsioni.

Per il calcolo il sistema usa la funzione auc() della library(pROC) in R.

Calcolare l’AUC, esempi

- in R
http://stackoverflow.com/questions/4903092/calculate-auc-in-r

- in MATLAB
http://it.mathworks.com/help/stats/perfcurve.html

- in Python
http://stackoverflow.com/questions/31159157/different-result-with-roc-auc-score-and-auc

- in XLS
http://www.statisticshowto.com/how-to-find-the-area-under-a-curve-in-microsoft-excel/

Training set
• Profilo di 30.000 clienti (osservazioni, righe del dataset)
• 367 variabili (features, colonne del dataset)
Il significato di queste variabili è stato criptato, identificandole con un codice fittizio Var1,…,Var367
• Sono presenti solo valori quantitativi
• dati mancanti (~ 65%).
• Ogni cliente è classificato rispetto alla variabile target, che indica se questi ha acquistato o meno un prodotto di maggior valore (upsell redemption).

Score set
• 20.000 clienti
• le stesse 367 variabili del training set.
• non viene fornita la variabile target, questa è la soluzione che dovrete fornire.




Presentazione Business Game presentazione_BusinessGame.pdf
600 KB
ctrainset.zip (csv) ctrainset.csv.zip
3 MB
ctrainset.zip (csv) cscoreset.csv.zip
2 MB
Per partecipare bisogna prima autenticarsi
# Nome Punteggio Prove Ultima prova
1 Pugi Jacopo FINALE 86.40% 9 01.05.2016
19:55
2 mattiaU FINALE 86.38% 9 01.05.2016
16:07
3 GRIPPALDI ALBERTO FINALE 86.01% 21 01.05.2016
12:01
4 AVON VALENTINO FINALE 85.91% 110 01.05.2016
22:14
5 alessandro.aere FINALE 85.88% 7 23.04.2016
10:06
6 POLI FEDERICO FINALE 85.38% 23 19.04.2016
11:49
7 Andrea Sottosanti FINALE 84.73% 9 27.04.2016
10:10
8 Spiderman FINALE 84.57% 12 22.04.2016
10:04
9 Edoardo Michielon FINALE 80.80% 5 19.04.2016
11:47
10 BOSCHETTO DAVIDE FINALE 79.90% 13 19.04.2016
11:55
11 MARTINO LUCA FINALE 77.59% 8 19.04.2016
11:36
12 TREVISIOL DAVIDE FINALE 77.36% 5 19.04.2016
11:22
13 Annalisa Balata FINALE 73.91% 6 19.04.2016
11:33
14 BOSSOLI DAVIDE FINALE 73.15% 9 27.04.2016
17:46
15 deepblusky26 FINALE 70.95% 5 19.04.2016
11:50
16 riccardo.gobbo.1 FINALE 70.95% 7 19.04.2016
11:47
17 SCHIAVON LORENZO FINALE 66.26% 18 19.04.2016
11:48
18 alessandro.casa FINALE 63.60% 24 19.04.2016
12:01
19 Annapaola Mavilla FINALE 63.31% 3 19.04.2016
11:26
20 federicoferraccioli FINALE 62.20% 2 19.04.2016
11:44
21 RESIDORI DANIELE FINALE 61.16% 8 23.04.2016
00:05
22 BEE ROSANGELA FINALE 51.23% 1 19.04.2016
12:00
23 BIANCHI ALBERTO FINALE 50.10% 3 19.04.2016
09:53
24 DUAN XIAOBIN FINALE 50.05% 3 19.04.2016
11:39