- คำอธิบาย :
นี่คือชุดข้อมูลคำพูดที่เป็นสาธารณสมบัติซึ่งประกอบด้วยคลิปเสียงสั้นๆ 13,100 คลิปของข้อความอ่านโดยผู้พูดคนเดียวจากหนังสือสารคดี 7 เล่ม มีการถอดความสำหรับแต่ละคลิป คลิปมีความยาวตั้งแต่ 1 ถึง 10 วินาที และมีความยาวรวมประมาณ 24 ชั่วโมง
ข้อความถูกตีพิมพ์ระหว่างปี พ.ศ. 2427 ถึง พ.ศ. 2507 และเป็นสาธารณสมบัติ เสียงถูกบันทึกในปี 2559-2560 โดยโครงการ LibriVox และเป็นสาธารณสมบัติด้วย
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
หน้าแรก : https://keithito.com/LJ-Speech-Dataset/
รหัสที่มา :
tfds.datasets.ljspeech.Builder
รุ่น :
-
1.1.1
(ค่าเริ่มต้น): แก้ไขประเภทข้อมูลคำพูดด้วย dtype=tf.int16
-
ขนาดการดาวน์โหลด :
2.56 GiB
ขนาดชุดข้อมูล :
10.73 GiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 13,100 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'id': string,
'speech': Audio(shape=(None,), dtype=int16),
'text': Text(shape=(), dtype=string),
'text_normalized': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
รหัส | เทนเซอร์ | สตริง | ||
คำพูด | เครื่องเสียง | (ไม่มี,) | int16 | |
ข้อความ | ข้อความ | สตริง | ||
text_normalized | ข้อความ | สตริง |
คีย์ควบคุม (ดู
as_supervised
doc ):('text_normalized', 'speech')
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@misc{ljspeech17,
author = {Keith Ito},
title = {The LJ Speech Dataset},
howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
year = 2017
}