- 설명 :
적포도주와 백포도주 샘플을 사용하여 두 개의 데이터 세트가 생성되었습니다. 입력에는 객관적인 테스트(예: PH 값)가 포함되며 출력은 감각 데이터(와인 전문가가 수행한 최소 3회 평가의 중앙값)를 기반으로 합니다. 각 전문가는 와인 품질을 0(매우 나쁨)에서 10(매우 훌륭함) 사이로 등급을 매겼습니다. 회귀 접근 방식으로 이러한 데이터 세트를 모델링하기 위해 여러 데이터 마이닝 방법이 적용되었습니다. 서포트 벡터 머신 모델이 최상의 결과를 얻었습니다. MAD, 고정 오류 허용오차(T)에 대한 혼동 행렬 등 몇 가지 메트릭이 계산되었습니다. 또한 입력 변수의 상대적 중요성(민감도 분석 절차에 의해 측정됨)을 플로팅합니다.
두 데이터 세트는 포르투갈 "Vinho Verde" 와인의 빨간색 및 흰색 변종과 관련이 있습니다. 자세한 내용은 http://www.vinhoverde.pt/en/ 또는 참조 [Cortez et al., 2009]를 참조하십시오. 프라이버시 및 물류 문제로 인해 물리화학적(입력) 및 감각(출력) 변수만 사용할 수 있습니다(예: 포도 종류, 와인 브랜드, 와인 판매 가격 등에 대한 데이터가 없음).
인스턴스 수: 적포도주 - 1599; 화이트 와인 - 4898
입력 변수(이화학적 테스트 기반):
- 고정 산도
- 휘발성 산도
- 구연산
- 잔여 설탕
- 염화물
- 무료 이산화황
- 총 이산화황
- 밀도
- 산도
- 황산염
- 술
출력 변수(감각 데이터 기반):
- 품질(0에서 10 사이의 점수)
버전 :
-
1.0.0
(기본값): 릴리스 정보가 없습니다.
-
자동 캐시 ( 문서 ): 예
기능 구조 :
FeaturesDict({
'features': FeaturesDict({
'alcohol': float32,
'chlorides': float32,
'citric acid': float32,
'density': float32,
'fixed acidity': float32,
'free sulfur dioxide': float32,
'pH': float32,
'residual sugar': float32,
'sulphates': float64,
'total sulfur dioxide': float32,
'volatile acidity': float32,
}),
'quality': int32,
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
특징 | 풍모Dict | |||
특징/주류 | 텐서 | float32 | ||
특징/염화물 | 텐서 | float32 | ||
특징/구연산 | 텐서 | float32 | ||
기능/밀도 | 텐서 | float32 | ||
특징/고정 산도 | 텐서 | float32 | ||
특징/무료 이산화황 | 텐서 | float32 | ||
특징/pH | 텐서 | float32 | ||
특징/잔류당 | 텐서 | float32 | ||
특징/황산염 | 텐서 | float64 | ||
특징/총 이산화황 | 텐서 | float32 | ||
특징/휘발성 산도 | 텐서 | float32 | ||
품질 | 텐서 | int32 |
감독 키 (
as_supervised
문서 참조):('features', 'quality')
그림 ( tfds.show_examples ): 지원되지 않습니다.
인용 :
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando; Matos, Telmo; Reis, Jose",
title = "Modeling wine preferences by data mining from physicochemical properties.",
year = "2009",
url = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}
wine_quality/white(기본 구성)
구성 설명 : 화이트 와인
다운로드 크기 :
258.23 KiB
데이터 세트 크기 :
1.87 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 4,898 |
- 예 ( tfds.as_dataframe ):
wine_quality/레드
구성 설명 : 레드 와인
다운로드 크기 :
82.23 KiB
데이터 세트 크기 :
626.17 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 1,599 |
- 예 ( tfds.as_dataframe ):