TWsentiment
Wink Trova un buon modello per prevedere la sentiment in questo dataset di tweets
...
2017
30/11
 
  Partecipanti 18 Sottomissioni 28  
 

Trova un buon modello per prevedere la sentiment in questo dataset di tweets

calcolo dell’errore assoluto (proporzione).
vedi paragrafo Tutorial per il formato dei dati da sottomettere

è possibile fare più submission, verrà presa in considerazione l’ultima uploadata.

Spedite solo file Rdata con un vettore di nome “sentimentTestSet” con i valori previsti.
il vettore deve essere un factor con levels c(“pos”,“neutro”,“neg”,“nonit”)
oppure un vettore numerico con valori interi da 1 a 4. Verranno interpretati come “pos”,“neutro”,“neg” e “nonit” rispettivamente.

esempio:
load(“trainingSet.Rdata”)
library(rpart)
modtree=rpart(sentiment~.,data=dati,method=“class”,xval=20,minsplit=1,cp=0.001)

predetto=predict(modtree,type=“class”)

save(file=“submission1.Rdata”,predetto)

1341 righe (tweets)
predittori= 585 conteggi di parole e caratteri
variabile di classificazione= “sentiment”, 4 categorie: “pos”,“neutro”,“neg”,“nonit”

test set: 300 tw




dati trainingSet trainingSet.Rdata
30 KB
test set testSet.Rdata
10 KB
esempio di classificatori esempioClassificazioni.R
7 KB
tweetsOrig twOrig.Rdata
300 KB
codici usati per creare la matrice di predittori creaDTM.R
3 KB
Per partecipare bisogna prima autenticarsi
# Nome Punteggio Prove Ultima prova
1 benchmark PARZIALE 81.60% 5 12.05.2014
14:05