gtzan_music_speech

Mô tả :

Bộ dữ liệu được thu thập cho mục đích phân biệt âm nhạc/lời nói. Bộ dữ liệu bao gồm 120 rãnh, mỗi rãnh dài 30 giây. Mỗi lớp (âm nhạc/lời nói) có 60 ví dụ. Các bản nhạc đều là tệp âm thanh Mono 16-bit 22050Hz ở định dạng .wav.

Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : http://marsyas.info/index.html
Mã nguồn : tfds.audio.gtzan_music_speech.GTZANMusicSpeech
Phiên bản :
- 1.0.0 (mặc định): Không có ghi chú phát hành.
Kích thước tải xuống : 283.29 MiB
Kích thước tập dữ liệu : 424.64 MiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :

Tách ra	ví dụ
`'train'`	128

Cấu trúc tính năng :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
})

Tài liệu tính năng :

Tính năng	Lớp	Hình dạng	Dtype
	Tính năngDict
âm thanh	âm thanh	(Không có,)	int64
âm thanh/tên tệp	Chữ		sợi dây
nhãn mác	LớpNhãn		int64

Các khóa được giám sát (Xem as_supervised doc ): ('audio', 'label')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):

trích dẫn :

@ONLINE {Music Speech,
    author = "Tzanetakis, George",
    title  = "GTZAN Music/Speech Collection",
    year   = "1999",
    url    = "http://marsyas.info/index.html"
}

gtzan_music_speech Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.

gtzan_music_speech