- Descriptif :
Soixante enregistrements d'un individu disant oui ou non en hébreu ; chaque enregistrement compte huit mots.
L'objectif principal de l'ensemble de données est de fournir un moyen simple et rapide de tester gratuitement les scripts Kaldi.
L'archive "waves_yesno.tar.gz" contient 60 fichiers .wav, échantillonnés à 8 kHz. Tous ont été enregistrés par le même locuteur masculin, en hébreu. Dans chaque fichier, l'individu dit 8 mots ; chaque mot est soit l'hébreu pour "oui" ou "non", donc chaque fichier est une séquence aléatoire de 8 oui ou non. Il n'y a pas de transcription séparée fournie ; la séquence est encodée dans le nom du fichier, avec 1 pour oui et 0 pour non.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://www.openslr.org/1/
Code source :
tfds.audio.yesno.YesNo
Versions :
-
1.0.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
4.49 MiB
Taille du jeu de données :
16.27 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 60 |
- Structure des fonctionnalités :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
l'audio | l'audio | (Aucun,) | int64 | |
audio/nom de fichier | Texte | chaîne de caractères | ||
étiquette | Séquence(ClassLabel) | (Aucun,) | int64 |
Touches supervisées (Voir
as_supervised
doc ):('audio', 'label')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@ONLINE {YesNo,
author = "Created for the Kaldi Project",
title = "YesNo",
url = "http://www.openslr.org/1/"
}