либритты

  • Описание :

LibriTTS — это англоязычный корпус, содержащий около 585 часов чтения английской речи с частотой дискретизации 24 кГц, подготовленный Heiga Zen при содействии членов команды Google Speech и Google Brain. Корпус LibriTTS предназначен для исследований TTS. Он основан на исходных материалах (аудиофайлы mp3 от LibriVox и текстовые файлы от Project Gutenberg) корпуса LibriSpeech. Основные отличия от корпуса LibriSpeech перечислены ниже:

  1. Аудиофайлы имеют частоту дискретизации 24 кГц.
  2. Речь разбивается на разрывы предложений.
  3. Включены как оригинальные, так и нормализованные тексты.
  4. Контекстная информация (например, соседние предложения) может быть извлечена.
  5. Исключаются высказывания со значительным фоновым шумом.
Расколоть Примеры
'dev_clean' 5736
'dev_other' 4613
'test_clean' 4837
'test_other' 5120
'train_clean100' 33 236
'train_clean360' 116 500
'train_other500' 205 044
  • Структура функции :
FeaturesDict({
    'chapter_id': int64,
    'id': string,
    'speaker_id': int64,
    'speech': Audio(shape=(None,), dtype=int64),
    'text_normalized': Text(shape=(), dtype=string),
    'text_original': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
id_главы Тензор int64
я бы Тензор нить
спикер_ид Тензор int64
речь Аудио (Никто,) int64
text_normalized Текст нить
text_original Текст нить
  • Цитата :
@inproceedings{zen2019libritts,
  title = {LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech},
  author = {H. Zen and V. Dang and R. Clark and Y. Zhang and R. J. Weiss and Y. Jia and Z. Chen and Y. Wu},
  booktitle = {Proc. Interspeech},
  month = sep,
  year = {2019},
  doi = {10.21437/Interspeech.2019-2441},
}