- Descrizione :
Risorse di modellazione linguistica da utilizzare insieme al corpus LibriSpeech ASR.
Pagina iniziale : http://www.openslr.org/11
Codice sorgente :
tfds.datasets.librispeech_lm.Builder
Versioni :
-
0.1.0
(impostazione predefinita): nessuna nota di rilascio.
-
Dimensione del download :
1.40 GiB
Dimensione del set di dati :
4.62 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'train' | 40.418.260 |
- Struttura delle caratteristiche :
FeaturesDict({
'text': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
testo | Testo | corda |
Chiavi supervisionate (vedi
as_supervised
doc ):('text', 'text')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@inproceedings{panayotov2015librispeech,
title={Librispeech: an ASR corpus based on public domain audio books},
author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
pages={5206--5210},
year={2015},
organization={IEEE}
}