- Descripción :
Se crearon dos conjuntos de datos, utilizando muestras de vino tinto y blanco. Las entradas incluyen pruebas objetivas (por ejemplo, valores de PH) y la salida se basa en datos sensoriales (mediana de al menos 3 evaluaciones realizadas por expertos en vinos). Cada experto calificó la calidad del vino entre 0 (muy mala) y 10 (muy excelente). Se aplicaron varios métodos de minería de datos para modelar estos conjuntos de datos bajo un enfoque de regresión. El modelo de máquina de vectores de soporte logró los mejores resultados. Se calcularon varias métricas: MAD, matriz de confusión para una tolerancia de error fija (T), etc. Además, trazamos las importancias relativas de las variables de entrada (medidas por un procedimiento de análisis de sensibilidad).
Los dos conjuntos de datos están relacionados con variantes rojas y blancas del vino portugués "Vinho Verde". Para más detalles, consulte: http://www.vinhoverde.pt/en/ o la referencia [Cortez et al., 2009]. Debido a cuestiones de privacidad y logística, solo están disponibles variables fisicoquímicas (entradas) y sensoriales (salida) (p. ej., no hay datos sobre tipos de uva, marca de vino, precio de venta del vino, etc.).
Número de instancias: vino tinto - 1599; vino blanco - 4898
Variables de entrada (basadas en pruebas fisicoquímicas):
- acidez fija
- acidez volátil
- ácido cítrico
- azúcar residual
- cloruros
- dióxido de azufre libre
- dióxido de azufre total
- densidad
- pH
- sulfatos
- alcohol
Variable de salida (basada en datos sensoriales):
- calidad (puntuación entre 0 y 10)
Página de inicio: https://archive.ics.uci.edu/ml/datasets/wine+quality
Código fuente :
tfds.structured.wine_quality.WineQuality
Versiones :
-
1.0.0
(predeterminado): Sin notas de la versión.
-
Almacenamiento automático en caché ( documentación ): Sí
Estructura de características :
FeaturesDict({
'features': FeaturesDict({
'alcohol': float32,
'chlorides': float32,
'citric acid': float32,
'density': float32,
'fixed acidity': float32,
'free sulfur dioxide': float32,
'pH': float32,
'residual sugar': float32,
'sulphates': float64,
'total sulfur dioxide': float32,
'volatile acidity': float32,
}),
'quality': int32,
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
caracteristicas | CaracterísticasDict | |||
rasgos/alcohol | Tensor | flotar32 | ||
características/cloruros | Tensor | flotar32 | ||
características/ácido cítrico | Tensor | flotar32 | ||
rasgos/densidad | Tensor | flotar32 | ||
características/acidez fija | Tensor | flotar32 | ||
características/dióxido de azufre libre | Tensor | flotar32 | ||
caracteristicas/pH | Tensor | flotar32 | ||
características/azúcar residual | Tensor | flotar32 | ||
caracteristicas/sulfatos | Tensor | flotar64 | ||
características/dióxido de azufre total | Tensor | flotar32 | ||
características/acidez volátil | Tensor | flotar32 | ||
calidad | Tensor | int32 |
Teclas supervisadas (Ver
as_supervised
):('features', 'quality')
Figura ( tfds.show_examples ): no compatible.
Cita :
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando; Matos, Telmo; Reis, Jose",
title = "Modeling wine preferences by data mining from physicochemical properties.",
year = "2009",
url = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}
vino_calidad/blanco (configuración predeterminada)
Descripción de la configuración : vino blanco
Tamaño de la descarga :
258.23 KiB
Tamaño del conjunto de datos :
1.87 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 4,898 |
- Ejemplos ( tfds.as_dataframe ):
vino_calidad/tinto
Descripción de la configuración : vino tinto
Tamaño de la descarga :
82.23 KiB
Tamaño del conjunto de datos :
626.17 KiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 1,599 |
- Ejemplos ( tfds.as_dataframe ):