와인_품질

  • 설명 :

적포도주와 백포도주 샘플을 사용하여 두 개의 데이터 세트가 생성되었습니다. 입력에는 객관적인 테스트(예: PH 값)가 포함되며 출력은 감각 데이터(와인 전문가가 수행한 최소 3회 평가의 중앙값)를 기반으로 합니다. 각 전문가는 와인 품질을 0(매우 나쁨)에서 10(매우 훌륭함) 사이로 등급을 매겼습니다. 회귀 접근 방식으로 이러한 데이터 세트를 모델링하기 위해 여러 데이터 마이닝 방법이 적용되었습니다. 서포트 벡터 머신 모델이 최상의 결과를 얻었습니다. MAD, 고정 오류 허용오차(T)에 대한 혼동 행렬 등 몇 가지 메트릭이 계산되었습니다. 또한 입력 변수의 상대적 중요성(민감도 분석 절차에 의해 측정됨)을 플로팅합니다.

두 데이터 세트는 포르투갈 "Vinho Verde" 와인의 빨간색 및 흰색 변종과 관련이 있습니다. 자세한 내용은 http://www.vinhoverde.pt/en/ 또는 참조 [Cortez et al., 2009]를 참조하십시오. 프라이버시 및 물류 문제로 인해 물리화학적(입력) 및 감각(출력) 변수만 사용할 수 있습니다(예: 포도 종류, 와인 브랜드, 와인 판매 가격 등에 대한 데이터가 없음).

인스턴스 수: 적포도주 - 1599; 화이트 와인 - 4898

입력 변수(이화학적 테스트 기반):

  1. 고정 산도
  2. 휘발성 산도
  3. 구연산
  4. 잔여 설탕
  5. 염화물
  6. 무료 이산화황
  7. 총 이산화황
  8. 밀도
  9. 산도
  10. 황산염

출력 변수(감각 데이터 기반):

  1. 품질(0에서 10 사이의 점수)
FeaturesDict({
    'features': FeaturesDict({
        'alcohol': float32,
        'chlorides': float32,
        'citric acid': float32,
        'density': float32,
        'fixed acidity': float32,
        'free sulfur dioxide': float32,
        'pH': float32,
        'residual sugar': float32,
        'sulphates': float64,
        'total sulfur dioxide': float32,
        'volatile acidity': float32,
    }),
    'quality': int32,
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
특징 풍모Dict
특징/주류 텐서 float32
특징/염화물 텐서 float32
특징/구연산 텐서 float32
기능/밀도 텐서 float32
특징/고정 산도 텐서 float32
특징/무료 이산화황 텐서 float32
특징/pH 텐서 float32
특징/잔류당 텐서 float32
특징/황산염 텐서 float64
특징/총 이산화황 텐서 float32
특징/휘발성 산도 텐서 float32
품질 텐서 int32
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
    author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando;  Matos, Telmo;  Reis, Jose",
    title  = "Modeling wine preferences by data mining from physicochemical properties.",
    year   = "2009",
    url    = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}

wine_quality/white(기본 구성)

  • 구성 설명 : 화이트 와인

  • 다운로드 크기 : 258.23 KiB

  • 데이터 세트 크기 : 1.87 MiB

  • 분할 :

나뉘다
'train' 4,898

wine_quality/레드

  • 구성 설명 : 레드 와인

  • 다운로드 크기 : 82.23 KiB

  • 데이터 세트 크기 : 626.17 KiB

  • 분할 :

나뉘다
'train' 1,599