- Mô tả :
AccentDB là một kho văn bản song song nhiều cặp gồm lời nói có dấu có cấu trúc và được gắn nhãn. Nó chứa các mẫu bài phát biểu của những người nói 4 giọng tiếng Anh không phải tiếng mẹ đẻ (8 người nói, 4 ngôn ngữ Ấn Độ); và cũng có tổng hợp 4 giọng bản địa của tiếng Anh (4 quốc gia, 13 người nói) và giọng Ấn Độ đô thị (2 người nói). Tập dữ liệu có sẵn ở đây tương ứng với bản phát hành có tiêu đề Accentdb_extends trên https://accentdb.github.io/#dataset
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://accentdb.github.io/
Mã nguồn :
tfds.datasets.accentdb.Builder
Phiên bản :
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
3.56 GiB
Kích thước tập dữ liệu :
19.47 GiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 17,313 |
- Cấu trúc tính năng :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=9),
'speaker_id': string,
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
âm thanh | âm thanh | (Không có,) | int64 | |
nhãn mác | LớpNhãn | int64 | ||
speaker_id | tenxơ | sợi dây |
Các khóa được giám sát (Xem
as_supervised
doc ):('audio', 'label')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@InProceedings{ahamad-anand-bhargava:2020:LREC,
author = {Ahamad, Afroz and Anand, Ankit and Bhargava, Pranesh},
title = {AccentDB: A Database of Non-Native English Accents to Assist Neural Speech Recognition},
booktitle = {Proceedings of The 12th Language Resources and Evaluation Conference},
month = {May},
year = {2020},
address = {Marseille, France},
publisher = {European Language Resources Association},
pages = {5353--5360},
url = {https://www.aclweb.org/anthology/2020.lrec-1.659}
}