Business Game 2018
Logojpeg Business game organizzato dall’Università di Padova in collaborazione con Bee Viva.
Proviamo a pr...
2020
06/04
 
  Partecipanti 99 Sottomissioni 936  
 

Business game organizzato dall’Università di Padova in collaborazione con Bee Viva.

Proviamo a prevedere il prezzo di una bottiglia di vino sulla base di una collezione di oltre cento mila review di somelier e di altre caratteristiche del prodotto.

Career Service, Università di Padova

beeviva_career_2018

L’accuratezza delle vostre previsioni verrà valutata utilizzando il Root Mean Squared Error (RMSE).

Un esempio di codice per il calcolo:

RMSE=sqrt(mean((predicted-true)^2))

• Non c’è un limite al numero di submission che ogni partecipante può effettuare, ma solo l’ultima submission verrà considerata valida per il Punteggio Finale.
• Nel corso della competizione è possibile misurare la validità dei modelli che state sviluppando consultano il punteggio parziale determinato da una parte del validation set (20000 osservazioni).
• Il punteggio finale è calcolato usando unicamente le predizioni che non vengono impiegate per il calcolo del punteggio parziale.
• In caso di parità di punteggio finale prevale l’utente che

Il file da sottomettere deve riportare una previsione per ogni riga; quindi il file avrà una sola colonna ed un numero di righe pari al numero di osservazioni del Validation Set (71564).

File:

Training Set (4832 Kb)
Validation Set (5206 Kb)
Esempio submission.csv

I file training_set.zip e validation_set.zip sono protetti da password che vi verrà comunicata al momento della apertura della competizione.

I dati sintetizzano 147459 recensioni di vini:

• 75895 costituiscono il training set, i dati su cui addestrare i vostri modelli;
• le restanti 71564 osservazioni costituiscono il validation set (o score set), ovvero i dati su cui dovete fare la stima per la submission.
Il validation set a vostra disposizione non contiene ovviamente la variabile price, prezzo della bottiglia di vino che l’obiettivo della vostra previsione.

Le variabili presenti sono:


  • country (String) The country that the wine is from

  • province (String) The province or state that the wine is from

  • region_1 (String) The wine growing area in a province or state (ie Napa)

  • region_2 (String) Sometimes there are more specific regions specified within a wine growing area (ie Rutherford inside the Napa Valley), but this value can sometimes be blank

  • winery (String) The winery that made the wine

  • variety (String) The type of grapes used to make the wine (ie Pinot Noir)

  • designation (String) The vineyard within the winery where the grapes that made the wine are from

  • review (String) A few sentences from a sommelier describing the wine’s taste, smell, look, feel, etc.

  • review_score (Numeric) The number of points WineEnthusiast rated the wine on a scale of 1-100 (though they say they only post reviews for wines that score >=80)

  • TARGET: price (Numeric) The cost for a bottle of the wine



Per partecipare bisogna prima autenticarsi
# Nome Punteggio Prove Ultima prova
1 RAGANA ANDREA FINALE 26.43 24 26.03.2019
15:56
2 dkrzhalovski FINALE 28.83 39 14.10.2020
19:48
3 cleliademichieli FINALE 30.16 7 14.10.2020
16:12
4 Giovanni Barbarani FINALE 31.39 10 06.04.2018
11:19
5 Agos95 FINALE 32.08 3 14.10.2020
16:43
6 AnnaBraghetto FINALE 32.35 21 14.10.2020
17:54
7 Michele De Vita FINALE 33.24 30 06.04.2018
11:58
8 leonardo.padovan.1 FINALE 33.57 2 06.04.2018
11:45
9 elisateresabianco FINALE 34.20 26 06.04.2018
11:53
10 davide.comerlati FINALE 34.26 16 06.04.2018
11:56
11 matteo.visona.1 FINALE 34.57 7 14.10.2020
20:35
12 davide.divincenzo10 FINALE 34.67 7 06.04.2018
12:02
13 natascia.caria FINALE 34.72 2 14.10.2020
17:12
14 BELLONI PIETRO FINALE 35.06 12 06.04.2018
11:20
15 Alberto.Toffoli FINALE 35.11 18 06.04.2018
12:02
16 Lorenzo Palloni FINALE 35.17 19 06.04.2018
11:48
17 Yuri FINALE 35.49 11 08.04.2019
23:45
18 TOMASELLO GIUSEPPA FINALE 35.50 2 08.04.2019
13:56
19 Giuliana Lo Presti FINALE 35.61 9 06.04.2018
11:38
20 studiofundi FINALE 35.73 11 14.10.2020
17:15
21 alberto gennaro FINALE 36.33 50 08.04.2019
15:29
22 fabio94.licini FINALE 36.33 15 08.04.2019
15:03
23 allzona FINALE 36.54 42 15.10.2020
06:55
24 VANZETTO MATTIA FINALE 36.68 17 06.04.2018
12:00
25 D.Padoan FINALE 36.70 8 06.04.2018
11:57
26 DESIRÒ GIANLUCA FINALE 36.71 8 06.04.2018
11:39
27 BIANCO NICOLAS FINALE 36.81 11 06.04.2018
11:56
28 s.dalessio FINALE 36.83 20 06.04.2018
11:48
29 Alexander Faehnle FINALE 37.06 38 08.04.2019
21:29
30 mattia.stival FINALE 37.38 4 06.04.2018
10:52
31 santo.picci FINALE 37.44 5 08.04.2019
21:37
32 gandolfo FINALE 37.44 1 09.04.2019
07:55
33 omar.polin FINALE 37.49 21 14.10.2020
17:46
34 alaeddine.ayadi FINALE 37.54 18 06.04.2018
11:47
35 valeria.zuccoli FINALE 37.80 9 06.04.2018
12:00
36 Lucadz FINALE 37.86 11 13.10.2020
17:55
37 Vittorio Giatti FINALE 37.97 103 08.04.2019
22:01
38 aaa FINALE 37.97 51 08.04.2019
22:41
39 ZANETTI MARCO FINALE 37.97 34 08.04.2019
22:30
40 mattia.cenedese FINALE 38.03 5 06.04.2018
11:57
41 OHABUCHE AUGUSTINE NNADOZIE FINALE 38.04 6 06.04.2018
12:01
42 Lorenzo Schiavon FINALE 39.39 7 06.04.2018
11:50
43 ainhoaelena.leger FINALE 39.39 1 04.04.2019
10:54
44 Filips FINALE 39.39 4 06.04.2018
10:01
45 lucia.rapisarda.pd FINALE 39.39 2 04.04.2019
10:56
46 Marco Petretta FINALE 39.63 2 06.04.2018
11:21
47 luca.gherardini FINALE 40.52 2 26.03.2019
20:02
48 BOSCOLO MENGOLIN ELISA FINALE 42.26 18 06.04.2018
11:55
49 luca.attanasio@studenti.unipd.it FINALE 42.39 6 30.08.2019
23:14
50 ZANATTA ALBERTO FINALE 43.39 9 06.04.2018
10:44
51 emanueledepaoli1 FINALE 44.63 55 10.04.2019
18:04
52 alfredo.petrella FINALE 46.89 2 14.10.2020
21:17
53 marco.dallaba FINALE 47.79 36 08.04.2019
19:33
54 benchmark FINALE 60.36 2 05.04.2018
21:51
55 REDO MARCO FINALE 63.73 5 06.04.2018
11:58
56 carlo FINALE 78.83 13 06.04.2019
15:49
57 LOAT FRANCESCO FINALE 458181533214.21 2 06.04.2018
11:59

I modelli usati dai partecipanti:

Michele De Vita (Punteggio Finale: 33.24)

Leonardo Padovan (Punteggio Finale: 33.57)

Elisa Teresa Bianco (Punteggio Finale: 34.20)

• Davide Comerlati (Punteggio Finale: 34.26):
[…] Ho fatto un semplice albero di regressione, sono stato pigro :) […]

• Marco Zanetti (Punteggio Finale: 37.54):
[…] non ho fatto nulla di speciale, solo un lm(price~review_score+I(review_score^2)+country-1,data=data.train)