- Descrizione :
AccentDB è un corpus parallelo a più coppie di discorsi accentati strutturati ed etichettati. Contiene esempi di discorsi di parlanti di 4 accenti non nativi dell'inglese (8 parlanti, 4 lingue indiane); e ha anche una raccolta di 4 accenti nativi di inglese (4 paesi, 13 parlanti) e un accento indiano metropolitano (2 parlanti). Il set di dati disponibile qui corrisponde alla versione intitolata accentdb_extended su https://accentdb.github.io/#dataset
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : https://accentdb.github.io/
Codice sorgente :
tfds.datasets.accentdb.Builder
Versioni :
-
1.0.0
(impostazione predefinita): nessuna nota di rilascio.
-
Dimensione del download :
3.56 GiB
Dimensione del set di dati:
19.47 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'train' | 17.313 |
- Struttura delle caratteristiche :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=9),
'speaker_id': string,
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
Audio | Audio | (Nessuno,) | int64 | |
etichetta | ClassLabel | int64 | ||
id_altoparlante | Tensore | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):('audio', 'label')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@InProceedings{ahamad-anand-bhargava:2020:LREC,
author = {Ahamad, Afroz and Anand, Ankit and Bhargava, Pranesh},
title = {AccentDB: A Database of Non-Native English Accents to Assist Neural Speech Recognition},
booktitle = {Proceedings of The 12th Language Resources and Evaluation Conference},
month = {May},
year = {2020},
address = {Marseille, France},
publisher = {European Language Resources Association},
pages = {5353--5360},
url = {https://www.aclweb.org/anthology/2020.lrec-1.659}
}