gtzan_music_speech

opis :

Zbiór danych został zebrany do celów dyskryminacji muzyki/mowy. Zbiór danych składa się ze 120 utworów, z których każdy trwa 30 sekund. Każda klasa (muzyka/mowa) ma 60 przykładów. Wszystkie ścieżki to 16-bitowe pliki audio 22050 Hz Mono w formacie .wav.

Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : http://marsyas.info/index.html
Kod źródłowy : tfds.audio.gtzan_music_speech.GTZANMusicSpeech
Wersje :
- 1.0.0 (domyślnie): Brak informacji o wersji.
Rozmiar pliku do pobrania : 283.29 MiB
Rozmiar zestawu danych : 424.64 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :

Rozdzielać	Przykłady
`'train'`	128

Struktura funkcji :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
audio	Audio	(Nic,)	int64
dźwięk/nazwa pliku	Tekst		strunowy
etykieta	Etykieta klasy		int64

Klucze nadzorowane (zobacz dokument as_supervised ): ('audio', 'label')
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):

Cytat :

@ONLINE {Music Speech,
    author = "Tzanetakis, George",
    title  = "GTZAN Music/Speech Collection",
    year   = "1999",
    url    = "http://marsyas.info/index.html"
}

gtzan_music_speech Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

gtzan_music_speech