- Mô tả :
Hai bộ dữ liệu đã được tạo, sử dụng các mẫu rượu vang đỏ và trắng. Đầu vào bao gồm các thử nghiệm khách quan (ví dụ: giá trị PH) và đầu ra dựa trên dữ liệu cảm quan (giá trị trung bình của ít nhất 3 đánh giá do các chuyên gia về rượu thực hiện). Mỗi chuyên gia chấm điểm chất lượng rượu từ 0 (rất tệ) đến 10 (rất xuất sắc). Một số phương pháp khai thác dữ liệu đã được áp dụng để mô hình hóa các bộ dữ liệu này theo phương pháp hồi quy. Mô hình máy vector hỗ trợ đạt kết quả tốt nhất. Một số chỉ số đã được tính toán: MAD, ma trận nhầm lẫn cho dung sai lỗi cố định (T), v.v. Ngoài ra, chúng tôi vẽ sơ đồ tầm quan trọng tương đối của các biến đầu vào (được đo bằng quy trình phân tích độ nhạy).
Hai bộ dữ liệu có liên quan đến các biến thể màu đỏ và trắng của rượu vang "Vinho Verde" của Bồ Đào Nha. Để biết thêm chi tiết, tham khảo: http://www.vinhoverde.pt/en/ hoặc tài liệu tham khảo [Cortez et al., 2009]. Do các vấn đề riêng tư và hậu cần, chỉ có các biến hóa lý (đầu vào) và cảm quan (đầu ra) (ví dụ: không có dữ liệu về loại nho, nhãn hiệu rượu, giá bán rượu, v.v.).
Số trường hợp: rượu vang đỏ - 1599; rượu trắng - 4898
Các biến đầu vào (dựa trên các thử nghiệm hóa lý):
- độ axit cố định
- axit dễ bay hơi
- axit citric
- đường dư
- clorua
- lưu huỳnh dioxit tự do
- tổng lưu huỳnh điôxít
- Tỉ trọng
- pH
- sunfat
- rượu bia
Biến đầu ra (dựa trên dữ liệu cảm quan):
- chất lượng (điểm từ 0 đến 10)
Trang chủ : https://archive.ics.uci.edu/ml/datasets/wine+quality
Mã nguồn :
tfds.structured.wine_quality.WineQuality
Phiên bản :
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Tự động lưu vào bộ đệm ( tài liệu ): Có
Cấu trúc tính năng :
FeaturesDict({
'features': FeaturesDict({
'alcohol': float32,
'chlorides': float32,
'citric acid': float32,
'density': float32,
'fixed acidity': float32,
'free sulfur dioxide': float32,
'pH': float32,
'residual sugar': float32,
'sulphates': float64,
'total sulfur dioxide': float32,
'volatile acidity': float32,
}),
'quality': int32,
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
Tính năng, đặc điểm | Tính năngDict | |||
tính năng/rượu | tenxơ | phao32 | ||
tính năng/clorua | tenxơ | phao32 | ||
tính năng/axit citric | tenxơ | phao32 | ||
tính năng/mật độ | tenxơ | phao32 | ||
tính năng/độ axit cố định | tenxơ | phao32 | ||
tính năng/sulphur dioxide miễn phí | tenxơ | phao32 | ||
tính năng/pH | tenxơ | phao32 | ||
tính năng/dư lượng đường | tenxơ | phao32 | ||
tính năng/sunfat | tenxơ | phao64 | ||
tính năng/tổng sulfur dioxide | tenxơ | phao32 | ||
tính năng/độ axit dễ bay hơi | tenxơ | phao32 | ||
phẩm chất | tenxơ | int32 |
Các khóa được giám sát (Xem
as_supervised
doc ):('features', 'quality')
Hình ( tfds.show_examples ): Không được hỗ trợ.
trích dẫn :
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando; Matos, Telmo; Reis, Jose",
title = "Modeling wine preferences by data mining from physicochemical properties.",
year = "2009",
url = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}
wine_quality/white (cấu hình mặc định)
Mô tả cấu hình : Rượu trắng
Kích thước tải xuống :
258.23 KiB
Kích thước tập dữ liệu :
1.87 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 4.898 |
- Ví dụ ( tfds.as_dataframe ):
wine_quality/đỏ
Mô tả cấu hình : Rượu vang đỏ
Kích thước tải xuống :
82.23 KiB
Kích thước tập dữ liệu :
626.17 KiB
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 1.599 |
- Ví dụ ( tfds.as_dataframe ):