- Mô tả :
Các tài nguyên mô hình hóa ngôn ngữ sẽ được sử dụng cùng với văn bản LibriSpeech ASR.
Trang chủ : http://www.openslr.org/11
Mã nguồn :
tfds.datasets.librispeech_lm.Builder
Phiên bản :
-
0.1.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
1.40 GiB
Kích thước tập dữ liệu :
4.62 GiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 40.418.260 |
- Cấu trúc tính năng :
FeaturesDict({
'text': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
chữ | Chữ | sợi dây |
Các khóa được giám sát (Xem
as_supervised
doc ):('text', 'text')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@inproceedings{panayotov2015librispeech,
title={Librispeech: an ASR corpus based on public domain audio books},
author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
pages={5206--5210},
year={2015},
organization={IEEE}
}