- Açıklama :
LibriTTS, Google Speech ve Google Brain ekip üyelerinin yardımıyla Heiga Zen tarafından hazırlanan, 24 kHz örnekleme hızında yaklaşık 585 saatlik İngilizce konuşma okumasından oluşan çok konuşmacılı bir İngilizce derlemidir. LibriTTS korpusu, TTS araştırması için tasarlanmıştır. LibriSpeech külliyatının orijinal materyallerinden (LibriVox'tan mp3 ses dosyaları ve Project Gutenberg'den metin dosyaları) türetilmiştir. LibriSpeech külliyatından temel farklar aşağıda listelenmiştir:
- Ses dosyaları 24kHz örnekleme hızındadır.
- Cümle aralarında konuşma bölünür.
- Hem orijinal hem de normalleştirilmiş metinler dahildir.
- Bağlamsal bilgiler (örneğin komşu cümleler) çıkarılabilir.
- Önemli arka plan gürültüsü olan ifadeler hariç tutulmuştur.
Ana Sayfa : http://www.openslr.org/60
Kaynak kodu :
tfds.datasets.libritts.Builder
sürümler :
-
1.0.1
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
78.42 GiB
Veri kümesi boyutu :
271.41 GiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'dev_clean' | 5.736 |
'dev_other' | 4.613 |
'test_clean' | 4.837 |
'test_other' | 5.120 |
'train_clean100' | 33.236 |
'train_clean360' | 116.500 |
'train_other500' | 205.044 |
- Özellik yapısı :
FeaturesDict({
'chapter_id': int64,
'id': string,
'speaker_id': int64,
'speech': Audio(shape=(None,), dtype=int64),
'text_normalized': Text(shape=(), dtype=string),
'text_original': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
bölüm_kimliği | tensör | int64 | ||
İD | tensör | sicim | ||
hoparlör_kimliği | tensör | int64 | ||
konuşma | Ses | (Hiçbiri,) | int64 | |
metin_normalleştirilmiş | Metin | sicim | ||
metin_orijinal | Metin | sicim |
Denetlenen tuşlar (Bkz.
as_supervised
doc ):('text_normalized', 'speech')
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@inproceedings{zen2019libritts,
title = {LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech},
author = {H. Zen and V. Dang and R. Clark and Y. Zhang and R. J. Weiss and Y. Jia and Z. Chen and Y. Wu},
booktitle = {Proc. Interspeech},
month = sep,
year = {2019},
doi = {10.21437/Interspeech.2019-2441},
}