- Описание :
LibriTTS — это англоязычный корпус, содержащий около 585 часов чтения английской речи с частотой дискретизации 24 кГц, подготовленный Heiga Zen при содействии членов команды Google Speech и Google Brain. Корпус LibriTTS предназначен для исследований TTS. Он основан на исходных материалах (аудиофайлы mp3 от LibriVox и текстовые файлы от Project Gutenberg) корпуса LibriSpeech. Основные отличия от корпуса LibriSpeech перечислены ниже:
- Аудиофайлы имеют частоту дискретизации 24 кГц.
- Речь разбивается на разрывы предложений.
- Включены как оригинальные, так и нормализованные тексты.
- Контекстная информация (например, соседние предложения) может быть извлечена.
- Исключаются высказывания со значительным фоновым шумом.
Дополнительная документация : изучить документы с кодом
Домашняя страница : http://www.openslr.org/60
Исходный код :
tfds.datasets.libritts.Builder
Версии :
-
1.0.1
(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
78.42 GiB
Размер набора данных :
271.41 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'dev_clean' | 5736 |
'dev_other' | 4613 |
'test_clean' | 4837 |
'test_other' | 5120 |
'train_clean100' | 33 236 |
'train_clean360' | 116 500 |
'train_other500' | 205 044 |
- Структура функции :
FeaturesDict({
'chapter_id': int64,
'id': string,
'speaker_id': int64,
'speech': Audio(shape=(None,), dtype=int64),
'text_normalized': Text(shape=(), dtype=string),
'text_original': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
id_главы | Тензор | int64 | ||
я бы | Тензор | нить | ||
спикер_ид | Тензор | int64 | ||
речь | Аудио | (Никто,) | int64 | |
text_normalized | Текст | нить | ||
text_original | Текст | нить |
Контролируемые ключи (см. документ
as_supervised
):('text_normalized', 'speech')
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{zen2019libritts,
title = {LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech},
author = {H. Zen and V. Dang and R. Clark and Y. Zhang and R. J. Weiss and Y. Jia and Z. Chen and Y. Wu},
booktitle = {Proc. Interspeech},
month = sep,
year = {2019},
doi = {10.21437/Interspeech.2019-2441},
}