vino_qualità

  • Descrizione :

Sono stati creati due set di dati, utilizzando campioni di vino rosso e bianco. Gli input includono test oggettivi (es. valori PH) e l'output si basa su dati sensoriali (mediana di almeno 3 valutazioni fatte da esperti di vino). Ogni esperto ha valutato la qualità del vino tra 0 (pessimo) e 10 (molto eccellente). Sono stati applicati diversi metodi di data mining per modellare questi set di dati con un approccio di regressione. Il modello di macchina vettoriale di supporto ha ottenuto i migliori risultati. Sono state calcolate diverse metriche: MAD, matrice di confusione per una tolleranza di errore fissa (T), ecc. Inoltre, tracciamo l'importanza relativa delle variabili di input (misurate da una procedura di analisi della sensibilità).

I due set di dati sono relativi alle varianti rossa e bianca del vino portoghese "Vinho Verde". Per maggiori dettagli, consultare: http://www.vinhoverde.pt/en/ o il riferimento [Cortez et al., 2009]. Per questioni di privacy e logistiche, sono disponibili solo variabili fisico-chimiche (input) e sensoriali (output) (ad es. non ci sono dati sui tipi di uva, sulla marca del vino, sul prezzo di vendita del vino, ecc.).

Numero di istanze: vino rosso - 1599; vino bianco - 4898

Variabili di input (basate su test fisico-chimici):

  1. acidità fissa
  2. acidità volatile
  3. acido citrico
  4. zucchero residuo
  5. cloruri
  6. anidride solforosa libera
  7. anidride solforosa totale
  8. densità
  9. pH
  10. solfati
  11. alcool

Variabile di output (basata su dati sensoriali):

  1. qualità (punteggio compreso tra 0 e 10)
FeaturesDict({
    'features': FeaturesDict({
        'alcohol': float32,
        'chlorides': float32,
        'citric acid': float32,
        'density': float32,
        'fixed acidity': float32,
        'free sulfur dioxide': float32,
        'pH': float32,
        'residual sugar': float32,
        'sulphates': float64,
        'total sulfur dioxide': float32,
        'volatile acidity': float32,
    }),
    'quality': int32,
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
caratteristiche CaratteristicheDict
caratteristiche/alcol Tensore galleggiante32
caratteristiche/cloruri Tensore galleggiante32
caratteristiche/acido citrico Tensore galleggiante32
caratteristiche/densità Tensore galleggiante32
caratteristiche/acidità fissa Tensore galleggiante32
caratteristiche/anidride solforosa libera Tensore galleggiante32
caratteristiche/pH Tensore galleggiante32
caratteristiche/zucchero residuo Tensore galleggiante32
caratteristiche/solfati Tensore galleggiante64
caratteristiche/anidride solforosa totale Tensore galleggiante32
caratteristiche/acidità volatile Tensore galleggiante32
qualità Tensore int32
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
    author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando;  Matos, Telmo;  Reis, Jose",
    title  = "Modeling wine preferences by data mining from physicochemical properties.",
    year   = "2009",
    url    = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}

wine_quality/white (configurazione predefinita)

  • Descrizione configurazione : Vino bianco

  • Dimensione del download : 258.23 KiB

  • Dimensione del set di dati: 1.87 MiB

  • Divisioni :

Diviso Esempi
'train' 4.898

qualità_vino/rosso

  • Descrizione della configurazione : Vino rosso

  • Dimensione del download : 82.23 KiB

  • Dimensione del set di dati: 626.17 KiB

  • Divisioni :

Diviso Esempi
'train' 1.599