- Descrizione :
Sono stati creati due set di dati, utilizzando campioni di vino rosso e bianco. Gli input includono test oggettivi (es. valori PH) e l'output si basa su dati sensoriali (mediana di almeno 3 valutazioni fatte da esperti di vino). Ogni esperto ha valutato la qualità del vino tra 0 (pessimo) e 10 (molto eccellente). Sono stati applicati diversi metodi di data mining per modellare questi set di dati con un approccio di regressione. Il modello di macchina vettoriale di supporto ha ottenuto i migliori risultati. Sono state calcolate diverse metriche: MAD, matrice di confusione per una tolleranza di errore fissa (T), ecc. Inoltre, tracciamo l'importanza relativa delle variabili di input (misurate da una procedura di analisi della sensibilità).
I due set di dati sono relativi alle varianti rossa e bianca del vino portoghese "Vinho Verde". Per maggiori dettagli, consultare: http://www.vinhoverde.pt/en/ o il riferimento [Cortez et al., 2009]. Per questioni di privacy e logistiche, sono disponibili solo variabili fisico-chimiche (input) e sensoriali (output) (ad es. non ci sono dati sui tipi di uva, sulla marca del vino, sul prezzo di vendita del vino, ecc.).
Numero di istanze: vino rosso - 1599; vino bianco - 4898
Variabili di input (basate su test fisico-chimici):
- acidità fissa
- acidità volatile
- acido citrico
- zucchero residuo
- cloruri
- anidride solforosa libera
- anidride solforosa totale
- densità
- pH
- solfati
- alcool
Variabile di output (basata su dati sensoriali):
- qualità (punteggio compreso tra 0 e 10)
Homepage : https://archive.ics.uci.edu/ml/datasets/wine+quality
Codice sorgente :
tfds.structured.wine_quality.WineQuality
Versioni :
-
1.0.0
(impostazione predefinita): nessuna nota di rilascio.
-
Auto-cache ( documentazione ): Sì
Struttura delle caratteristiche :
FeaturesDict({
'features': FeaturesDict({
'alcohol': float32,
'chlorides': float32,
'citric acid': float32,
'density': float32,
'fixed acidity': float32,
'free sulfur dioxide': float32,
'pH': float32,
'residual sugar': float32,
'sulphates': float64,
'total sulfur dioxide': float32,
'volatile acidity': float32,
}),
'quality': int32,
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
caratteristiche | CaratteristicheDict | |||
caratteristiche/alcol | Tensore | galleggiante32 | ||
caratteristiche/cloruri | Tensore | galleggiante32 | ||
caratteristiche/acido citrico | Tensore | galleggiante32 | ||
caratteristiche/densità | Tensore | galleggiante32 | ||
caratteristiche/acidità fissa | Tensore | galleggiante32 | ||
caratteristiche/anidride solforosa libera | Tensore | galleggiante32 | ||
caratteristiche/pH | Tensore | galleggiante32 | ||
caratteristiche/zucchero residuo | Tensore | galleggiante32 | ||
caratteristiche/solfati | Tensore | galleggiante64 | ||
caratteristiche/anidride solforosa totale | Tensore | galleggiante32 | ||
caratteristiche/acidità volatile | Tensore | galleggiante32 | ||
qualità | Tensore | int32 |
Chiavi supervisionate (Vedi
as_supervised
doc ):('features', 'quality')
Figura ( tfds.show_examples ): non supportato.
Citazione :
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando; Matos, Telmo; Reis, Jose",
title = "Modeling wine preferences by data mining from physicochemical properties.",
year = "2009",
url = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}
wine_quality/white (configurazione predefinita)
Descrizione configurazione : Vino bianco
Dimensione del download :
258.23 KiB
Dimensione del set di dati:
1.87 MiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 4.898 |
- Esempi ( tfds.as_dataframe ):
qualità_vino/rosso
Descrizione della configurazione : Vino rosso
Dimensione del download :
82.23 KiB
Dimensione del set di dati:
626.17 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 1.599 |
- Esempi ( tfds.as_dataframe ):