- Mô tả :
Bộ dữ liệu được thu thập cho mục đích phân biệt âm nhạc/lời nói. Bộ dữ liệu bao gồm 120 rãnh, mỗi rãnh dài 30 giây. Mỗi lớp (âm nhạc/lời nói) có 60 ví dụ. Các bản nhạc đều là tệp âm thanh Mono 16-bit 22050Hz ở định dạng .wav.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : http://marsyas.info/index.html
Phiên bản :
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
283.29 MiB
Kích thước tập dữ liệu :
424.64 MiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 128 |
- Cấu trúc tính năng :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
âm thanh | âm thanh | (Không có,) | int64 | |
âm thanh/tên tệp | Chữ | sợi dây | ||
nhãn mác | LớpNhãn | int64 |
Các khóa được giám sát (Xem
as_supervised
doc ):('audio', 'label')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@ONLINE {Music Speech,
author = "Tzanetakis, George",
title = "GTZAN Music/Speech Collection",
year = "1999",
url = "http://marsyas.info/index.html"
}