- Sự miêu tả :
Bộ dữ liệu giọng nói chung của Mozilla
Tài liệu bổ sung : Khám phá trên giấy tờ có mã
Trang chủ : https://voice.mozilla.org/en/datasets
Mã nguồn :
tfds.audio.CommonVoice
Phiên bản :
-
1.0.0
: Bản phát hành đầu tiên. -
2.0.0
(mặc định): Đã cập nhật lên kho dữ liệu 6.1 từ ngày 11-12-2020.
-
Cấu trúc tính năng :
FeaturesDict({
'accent': Text(shape=(), dtype=string),
'age': Text(shape=(), dtype=string),
'client_id': Text(shape=(), dtype=string),
'downvotes': Scalar(shape=(), dtype=int32, description=Number of people who said audio does not match text),
'gender': ClassLabel(shape=(), dtype=int64, num_classes=3),
'segment': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
'upvotes': Scalar(shape=(), dtype=int32, description=Number of people who said audio matches the text),
'voice': Audio(shape=(None,), dtype=int64),
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | loại D | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
giọng | Chữ | sợi dây | Giọng của người nói, xem https://github.com/common-voice/common-voice/blob/main/web/src/stores/demographics.ts | |
tuổi | Chữ | sợi dây | Nhóm tuổi của người nói (ví dụ: thanh thiếu niên hoặc bốn mươi), xem https://github.com/common-voice/common-voice/blob/main/web/src/stores/demographics.ts | |
client_id | Chữ | sợi dây | UUID đã băm của một người dùng nhất định | |
phản đối | vô hướng | int32 | Số người cho biết âm thanh không khớp với văn bản | |
giới tính | Nhãn lớp | int64 | Giới tính của người nói | |
đoạn | Chữ | sợi dây | Nếu câu thuộc về một phân đoạn tập dữ liệu tùy chỉnh, nó sẽ được liệt kê ở đây | |
câu | Chữ | sợi dây | Phiên âm giả định của âm thanh | |
ủng hộ | vô hướng | int32 | Số người nói âm thanh khớp với văn bản | |
tiếng nói | Âm thanh | (Không có,) | int64 |
Khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Trích dẫn :
common_voice/en (cấu hình mặc định)
Mô tả cấu hình : Mã ngôn ngữ: en
Kích thước tải xuống :
56.45 GiB
Kích thước tập dữ liệu :
2.79 TiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 16.164 |
'test' | 16.164 |
'train' | 564.337 |
'validation' | 1.224.864 |
- Ví dụ ( tfds.as_dataframe ):
chung_voice/ab
Mô tả cấu hình : Mã ngôn ngữ: ab
Kích thước tải xuống :
39.14 MiB
Kích thước tập dữ liệu :
133.24 MiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 9 |
'train' | 22 |
'validation' | 31 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/ar
Mô tả cấu hình : Mã ngôn ngữ: ar
Kích thước tải xuống :
1.64 GiB
Kích thước tập dữ liệu :
67.16 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 7,517 |
'test' | 7.622 |
'train' | 14.227 |
'validation' | 43.291 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/as
Mô tả cấu hình : Mã ngôn ngữ: as
Kích thước tải xuống :
21.20 MiB
Kích thước tập dữ liệu :
1.65 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 124 |
'test' | 110 |
'train' | 270 |
'validation' | 504 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/br
Mô tả cấu hình : Mã ngôn ngữ: br
Kích thước tải xuống :
443.72 MiB
Kích thước tập dữ liệu :
13.46 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 1.997 |
'test' | 2.087 |
'train' | 2.780 |
'validation' | 8.560 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/ca
Mô tả cấu hình : Mã ngôn ngữ: ca
Kích thước tải xuống :
19.32 GiB
Kích thước tập dữ liệu :
1.19 TiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 15.724 |
'test' | 15.724 |
'train' | 285.584 |
'validation' | 416.701 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/cnh
Mô tả cấu hình : Mã ngôn ngữ: cnh
Kích thước tải xuống :
153.86 MiB
Kích thước tập dữ liệu :
5.12 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 756 |
'test' | 752 |
'train' | 807 |
'validation' | 2,432 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/cs
Mô tả cấu hình: Mã ngôn ngữ: cs
Kích thước tải xuống :
1.18 GiB
Kích thước tập dữ liệu :
56.89 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 4.118 |
'test' | 4.144 |
'train' | 5.655 |
'validation' | 30,431 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/cv
Mô tả cấu hình : Mã ngôn ngữ: cv
Kích thước tải xuống :
418.98 MiB
Kích thước tập dữ liệu :
8.10 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 818 |
'test' | 788 |
'train' | 931 |
'validation' | 3,496 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/cy
Mô tả cấu hình : Mã ngôn ngữ: cy
Kích thước tải xuống :
3.20 GiB
Kích thước tập dữ liệu :
128.68 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 4.776 |
'test' | 4.820 |
'train' | 6,839 |
'validation' | 72.984 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/de
Mô tả cấu hình : Mã ngôn ngữ: de
Kích thước tải xuống :
21.68 GiB
Kích thước tập dữ liệu :
1.29 TiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 15.588 |
'test' | 15.588 |
'train' | 246.525 |
'validation' | 565.186 |
- Ví dụ ( tfds.as_dataframe ):
chung_voice/dv
Mô tả cấu hình : Mã ngôn ngữ: dv
Kích thước tải xuống :
515.45 MiB
Kích thước tập dữ liệu :
31.59 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 2.077 |
'test' | 2.202 |
'train' | 2.680 |
'validation' | 11.866 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/el
Mô tả cấu hình : Mã ngôn ngữ: el
Kích thước tải xuống :
363.89 MiB
Kích thước tập dữ liệu :
14.62 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 1.401 |
'test' | 1.522 |
'train' | 2.316 |
'validation' | 5.996 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/eo
Mô tả cấu hình : Mã ngôn ngữ: eo
Kích thước tải xuống :
2.69 GiB
Kích thước tập dữ liệu :
167.14 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 8,987 |
'test' | 8,969 |
'train' | 19.587 |
'validation' | 58.094 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/es
Mô tả cấu hình : Mã ngôn ngữ: es
Kích thước tải xuống :
15.08 GiB
Kích thước tập dữ liệu :
684.66 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 15.089 |
'test' | 15.089 |
'train' | 161.813 |
'validation' | 236.314 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/et
Mô tả cấu hình : Mã ngôn ngữ: et
Kích thước tải xuống :
731.63 MiB
Kích thước tập dữ liệu :
37.95 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 2,507 |
'test' | 2,509 |
'train' | 2.966 |
'validation' | 10,683 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/eu
Mô tả cấu hình : Mã ngôn ngữ: eu
Kích thước tải xuống :
3.41 GiB
Kích thước tập dữ liệu :
127.60 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 5.172 |
'test' | 5.172 |
'train' | 7.505 |
'validation' | 63.009 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/fa
Mô tả cấu hình : Mã ngôn ngữ: fa
Kích thước tải xuống :
8.27 GiB
Kích thước tập dữ liệu :
328.61 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 5.213 |
'test' | 5.213 |
'train' | 7,593 |
'validation' | 251.659 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/fi
Mô tả cấu hình : Mã ngôn ngữ: fi
Kích thước tải xuống :
47.57 MiB
Kích thước tập dữ liệu :
3.41 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 415 |
'test' | 428 |
'train' | 460 |
'validation' | 1.305 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/fr
Mô tả cấu hình : Mã ngôn ngữ: fr
Kích thước tải xuống :
17.82 GiB
Kích thước tập dữ liệu :
1.17 TiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 15.763 |
'test' | 15.763 |
'train' | 298.982 |
'validation' | 461.004 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/fy-NL
Mô tả cấu hình : Mã ngôn ngữ: fy-NL
Kích thước tải xuống :
1.15 GiB
Kích thước tập dữ liệu :
29.93 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 2.790 |
'test' | 3.020 |
'train' | 3.927 |
'validation' | 10,495 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/ga-IE
Mô tả cấu hình : Mã ngôn ngữ: ga-IE
Kích thước tải xuống :
149.30 MiB
Kích thước tập dữ liệu :
5.11 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 497 |
'test' | 506 |
'train' | 541 |
'validation' | 3.352 |
- Ví dụ ( tfds.as_dataframe ):
chung_voice/xin chào
Mô tả cấu hình : Mã ngôn ngữ: xin chào
Kích thước tải xuống :
20.43 MiB
Kích thước tập dữ liệu :
1.15 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 135 |
'test' | 127 |
'train' | 157 |
'validation' | 419 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/hsb
Mô tả cấu hình : Mã ngôn ngữ: hsb
Kích thước tải xuống :
75.69 MiB
Kích thước tập dữ liệu :
5.67 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 172 |
'test' | 387 |
'train' | 808 |
'validation' | 1.367 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/hu
Mô tả cấu hình : Mã ngôn ngữ: hu
Kích thước tải xuống :
231.51 MiB
Kích thước tập dữ liệu :
17.07 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 1.434 |
'test' | 1.649 |
'train' | 3.348 |
'validation' | 6,457 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/ia
Mô tả cấu hình : Mã ngôn ngữ: ia
Kích thước tải xuống :
216.01 MiB
Kích thước tập dữ liệu :
14.99 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 1.601 |
'test' | 899 |
'train' | 3,477 |
'validation' | 5,978 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/id
Mô tả cấu hình : Mã ngôn ngữ: id
Kích thước tải xuống :
453.87 MiB
Kích thước tập dữ liệu :
17.20 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 1.835 |
'test' | 1.844 |
'train' | 2.130 |
'validation' | 8,696 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/nó
Mô tả cấu hình : Mã ngôn ngữ: it
Kích thước tải xuống :
5.20 GiB
Kích thước tập dữ liệu :
316.38 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 12.928 |
'test' | 12.928 |
'train' | 58.015 |
'validation' | 102.579 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/ja
Mô tả cấu hình : Mã ngôn ngữ: ja
Kích thước tải xuống :
145.80 MiB
Kích thước tập dữ liệu :
6.83 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 586 |
'test' | 632 |
'train' | 722 |
'validation' | 3.072 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/ka
Mô tả cấu hình : Mã ngôn ngữ: ka
Kích thước tải xuống :
99.45 MiB
Kích thước tập dữ liệu :
7.51 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 527 |
'test' | 656 |
'train' | 1.058 |
'validation' | 2.275 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/kab
Mô tả cấu hình : Mã ngôn ngữ: kab
Kích thước tải xuống :
15.99 GiB
Kích thước tập dữ liệu :
718.51 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 14.622 |
'test' | 14.622 |
'train' | 120.530 |
'validation' | 573.718 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/ky
Mô tả cấu hình : Mã ngôn ngữ: ky
Kích thước tải xuống :
552.60 MiB
Kích thước tập dữ liệu :
18.70 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 1.511 |
'test' | 1.503 |
'train' | 1.955 |
'validation' | 9.236 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/lg
Mô tả cấu hình : Mã ngôn ngữ: lg
Kích thước tải xuống :
198.55 MiB
Kích thước tập dữ liệu :
6.65 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 384 |
'test' | 584 |
'train' | 1.250 |
'validation' | 2.220 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/lt
Mô tả cấu hình : Mã ngôn ngữ: lt
Kích thước tải xuống :
129.03 MiB
Kích thước tập dữ liệu :
4.79 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 244 |
'test' | 466 |
'train' | 931 |
'validation' | 1.644 |
- Ví dụ ( tfds.as_dataframe ):
chung_voice/lv
Mô tả cấu hình : Mã ngôn ngữ: lv
Kích thước tải xuống :
198.66 MiB
Kích thước tập dữ liệu :
13.07 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 2.002 |
'test' | 1,882 |
'train' | 2,552 |
'validation' | 6,444 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/mn
Mô tả cấu hình : Mã ngôn ngữ: mn
Kích thước tải xuống :
463.84 MiB
Kích thước tập dữ liệu :
22.09 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 1,837 |
'test' | 1,862 |
'train' | 2.183 |
'validation' | 7,487 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/mt
Mô tả cấu hình : Mã ngôn ngữ: mt
Kích thước tải xuống :
405.42 MiB
Kích thước tập dữ liệu :
15.09 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 1.516 |
'test' | 1.617 |
'train' | 2.036 |
'validation' | 5,747 |
- Ví dụ ( tfds.as_dataframe ):
chung_voice/nl
Mô tả cấu hình : Mã ngôn ngữ: nl
Kích thước tải xuống :
1.62 GiB
Kích thước tập dữ liệu :
90.20 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 4.938 |
'test' | 5,708 |
'train' | 9.460 |
'validation' | 52.488 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/hoặc
Mô tả cấu hình : Mã ngôn ngữ: hoặc
Kích thước tải xuống :
189.85 MiB
Kích thước tập dữ liệu :
1.97 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 129 |
'test' | 98 |
'train' | 388 |
'validation' | 615 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/pa-IN
Mô tả cấu hình : Mã ngôn ngữ: pa-IN
Kích thước tải xuống :
66.52 MiB
Kích thước tập dữ liệu :
1.03 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 44 |
'test' | 116 |
'train' | 211 |
'validation' | 371 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/pl
Mô tả cấu hình : Mã ngôn ngữ: pl
Kích thước tải xuống :
3.29 GiB
Kích thước tập dữ liệu :
141.06 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 5.153 |
'test' | 5.153 |
'train' | 7,468 |
'validation' | 90.791 |
- Ví dụ ( tfds.as_dataframe ):
chung_voice/pt
Mô tả cấu hình : Mã ngôn ngữ: pt
Kích thước tải xuống :
1.59 GiB
Kích thước tập dữ liệu :
75.64 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 4,592 |
'test' | 4.641 |
'train' | 6,514 |
'validation' | 41.584 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/rm-sursilv
Mô tả cấu hình : Mã ngôn ngữ: rm-sursilv
Kích thước tải xuống :
263.17 MiB
Kích thước tập dữ liệu :
12.31 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 1.205 |
'test' | 1.194 |
'train' | 1.384 |
'validation' | 3,783 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/rm-vallader
Mô tả cấu hình : Mã ngôn ngữ: rm-vallader
Kích thước tải xuống :
103.11 MiB
Kích thước tập dữ liệu :
4.89 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 357 |
'test' | 378 |
'train' | 574 |
'validation' | 1.316 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/ro
Mô tả cấu hình : Mã ngôn ngữ: ro
Kích thước tải xuống :
249.84 MiB
Kích thước tập dữ liệu :
14.54 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 858 |
'test' | 1.778 |
'train' | 3.399 |
'validation' | 6.039 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/ru
Mô tả cấu hình : Mã ngôn ngữ: ru
Kích thước tải xuống :
3.40 GiB
Kích thước tập dữ liệu :
175.04 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 7.963 |
'test' | 8.007 |
'train' | 15.481 |
'validation' | 74.256 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/rw
Mô tả cấu hình : Mã ngôn ngữ: rw
Kích thước tải xuống :
39.62 GiB
Kích thước tập dữ liệu :
2.18 TiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 15.032 |
'test' | 15.724 |
'train' | 515.197 |
'validation' | 832.929 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/sah
Mô tả cấu hình : Mã ngôn ngữ: sah
Kích thước tải xuống :
172.85 MiB
Kích thước tập dữ liệu :
9.42 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 405 |
'test' | 757 |
'train' | 1.442 |
'validation' | 2.606 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/sl
Mô tả cấu hình : Mã ngôn ngữ: sl
Kích thước tải xuống :
212.43 MiB
Kích thước tập dữ liệu :
9.67 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 556 |
'test' | 881 |
'train' | 2.038 |
'validation' | 4.669 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/sv-SE
Mô tả cấu hình : Mã ngôn ngữ: sv-SE
Kích thước tải xuống :
401.91 MiB
Kích thước tập dữ liệu :
18.27 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 2.019 |
'test' | 2.027 |
'train' | 2.331 |
'validation' | 12.552 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/ta
Mô tả cấu hình : Mã ngôn ngữ: ta
Kích thước tải xuống :
648.28 MiB
Kích thước tập dữ liệu :
24.06 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 1.779 |
'test' | 1.781 |
'train' | 2.009 |
'validation' | 12.652 |
- Ví dụ ( tfds.as_dataframe ):
chung_voice/th
Mô tả cấu hình : Mã ngôn ngữ: thứ
Kích thước tải xuống :
325.49 MiB
Kích thước tập dữ liệu :
18.32 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 1.922 |
'test' | 2.188 |
'train' | 2.917 |
'validation' | 7.028 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/tr
Mô tả cấu hình : Mã ngôn ngữ: tr
Kích thước tải xuống :
592.09 MiB
Kích thước tập dữ liệu :
28.21 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 1.647 |
'test' | 1.647 |
'train' | 1,831 |
'validation' | 18.685 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/tt
Mô tả cấu hình : Mã ngôn ngữ: tt
Kích thước tải xuống :
741.15 MiB
Kích thước tập dữ liệu :
46.85 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 2.127 |
'test' | 4,485 |
'train' | 11.211 |
'validation' | 25.781 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/uk
Mô tả cấu hình : Mã ngôn ngữ: uk
Kích thước tải xuống :
1.13 GiB
Kích thước tập dữ liệu :
49.66 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 3.236 |
'test' | 3.235 |
'train' | 4.035 |
'validation' | 22.337 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/vi
Mô tả cấu hình : Mã ngôn ngữ: vi
Kích thước tải xuống :
49.52 MiB
Kích thước tập dữ liệu :
1.47 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 200 |
'test' | 198 |
'train' | 221 |
'validation' | 619 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/bỏ phiếu
Mô tả cấu hình : Mã ngôn ngữ: bình chọn
Kích thước tải xuống :
7.43 MiB
Kích thước tập dữ liệu :
11.39 MiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 3 |
'validation' | 3 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/zh-CN
Mô tả cấu hình : Mã ngôn ngữ: zh-CN
Kích thước tải xuống :
2.03 GiB
Kích thước tập dữ liệu :
122.54 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 8,743 |
'test' | 8.760 |
'train' | 18.541 |
'validation' | 36.405 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/zh-HK
Mô tả cấu hình : Mã ngôn ngữ: zh-HK
Kích thước tải xuống :
2.58 GiB
Kích thước tập dữ liệu :
78.80 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 5.172 |
'test' | 5.172 |
'train' | 7,506 |
'validation' | 41.835 |
- Ví dụ ( tfds.as_dataframe ):
common_voice/zh-TW
Mô tả cấu hình : Mã ngôn ngữ: zh-TW
Kích thước tải xuống :
2.03 GiB
Kích thước tập dữ liệu :
69.06 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'dev' | 2,895 |
'test' | 2,895 |
'train' | 3,507 |
'validation' | 61.232 |
- Ví dụ ( tfds.as_dataframe ):