giọng điệu

  • Mô tả :

AccentDB là một kho văn bản song song nhiều cặp gồm lời nói có dấu có cấu trúc và được gắn nhãn. Nó chứa các mẫu bài phát biểu của những người nói 4 giọng tiếng Anh không phải tiếng mẹ đẻ (8 người nói, 4 ngôn ngữ Ấn Độ); và cũng có tổng hợp 4 giọng bản địa của tiếng Anh (4 quốc gia, 13 người nói) và giọng Ấn Độ đô thị (2 người nói). Tập dữ liệu có sẵn ở đây tương ứng với bản phát hành có tiêu đề Accentdb_extends trên https://accentdb.github.io/#dataset

Tách ra ví dụ
'train' 17,313
  • Cấu trúc tính năng :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=9),
    'speaker_id': string,
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
âm thanh âm thanh (Không có,) int64
nhãn mác LớpNhãn int64
speaker_id tenxơ sợi dây
  • trích dẫn :
@InProceedings{ahamad-anand-bhargava:2020:LREC,
  author    = {Ahamad, Afroz  and  Anand, Ankit  and  Bhargava, Pranesh},
  title     = {AccentDB: A Database of Non-Native English Accents to Assist Neural Speech Recognition},
  booktitle      = {Proceedings of The 12th Language Resources and Evaluation Conference},
  month          = {May},
  year           = {2020},
  address        = {Marseille, France},
  publisher      = {European Language Resources Association},
  pages     = {5353--5360},
  url       = {https://www.aclweb.org/anthology/2020.lrec-1.659}
}