vino_calidad

  • Descripción :

Se crearon dos conjuntos de datos, utilizando muestras de vino tinto y blanco. Las entradas incluyen pruebas objetivas (por ejemplo, valores de PH) y la salida se basa en datos sensoriales (mediana de al menos 3 evaluaciones realizadas por expertos en vinos). Cada experto calificó la calidad del vino entre 0 (muy mala) y 10 (muy excelente). Se aplicaron varios métodos de minería de datos para modelar estos conjuntos de datos bajo un enfoque de regresión. El modelo de máquina de vectores de soporte logró los mejores resultados. Se calcularon varias métricas: MAD, matriz de confusión para una tolerancia de error fija (T), etc. Además, trazamos las importancias relativas de las variables de entrada (medidas por un procedimiento de análisis de sensibilidad).

Los dos conjuntos de datos están relacionados con variantes rojas y blancas del vino portugués "Vinho Verde". Para más detalles, consulte: http://www.vinhoverde.pt/en/ o la referencia [Cortez et al., 2009]. Debido a cuestiones de privacidad y logística, solo están disponibles variables fisicoquímicas (entradas) y sensoriales (salida) (p. ej., no hay datos sobre tipos de uva, marca de vino, precio de venta del vino, etc.).

Número de instancias: vino tinto - 1599; vino blanco - 4898

Variables de entrada (basadas en pruebas fisicoquímicas):

  1. acidez fija
  2. acidez volátil
  3. ácido cítrico
  4. azúcar residual
  5. cloruros
  6. dióxido de azufre libre
  7. dióxido de azufre total
  8. densidad
  9. pH
  10. sulfatos
  11. alcohol

Variable de salida (basada en datos sensoriales):

  1. calidad (puntuación entre 0 y 10)
FeaturesDict({
    'features': FeaturesDict({
        'alcohol': float32,
        'chlorides': float32,
        'citric acid': float32,
        'density': float32,
        'fixed acidity': float32,
        'free sulfur dioxide': float32,
        'pH': float32,
        'residual sugar': float32,
        'sulphates': float64,
        'total sulfur dioxide': float32,
        'volatile acidity': float32,
    }),
    'quality': int32,
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
caracteristicas CaracterísticasDict
rasgos/alcohol Tensor flotar32
características/cloruros Tensor flotar32
características/ácido cítrico Tensor flotar32
rasgos/densidad Tensor flotar32
características/acidez fija Tensor flotar32
características/dióxido de azufre libre Tensor flotar32
caracteristicas/pH Tensor flotar32
características/azúcar residual Tensor flotar32
caracteristicas/sulfatos Tensor flotar64
características/dióxido de azufre total Tensor flotar32
características/acidez volátil Tensor flotar32
calidad Tensor int32
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
    author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando;  Matos, Telmo;  Reis, Jose",
    title  = "Modeling wine preferences by data mining from physicochemical properties.",
    year   = "2009",
    url    = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}

vino_calidad/blanco (configuración predeterminada)

  • Descripción de la configuración : vino blanco

  • Tamaño de la descarga : 258.23 KiB

  • Tamaño del conjunto de datos : 1.87 MiB

  • Divisiones :

Separar Ejemplos
'train' 4,898

vino_calidad/tinto

  • Descripción de la configuración : vino tinto

  • Tamaño de la descarga : 82.23 KiB

  • Tamaño del conjunto de datos : 626.17 KiB

  • Divisiones :

Separar Ejemplos
'train' 1,599