- विवरण :
VoxForge एक भाषा वर्गीकरण डेटासेट है। इसमें वेबसाइट पर सबमिट की गई उपयोगकर्ता द्वारा सबमिट की गई ऑडियो क्लिप शामिल हैं। इस रिलीज़ में, 6 भाषाओं का डेटा एकत्र किया गया है - अंग्रेजी, स्पेनिश, फ्रेंच, जर्मन, रूसी और इतालवी। चूंकि वेबसाइट लगातार अपडेट की जाती है, और प्रतिलिपि प्रस्तुत करने योग्यता के लिए, इस रिलीज़ में केवल 2020-01-01 से पहले जमा की गई रिकॉर्डिंग शामिल हैं। नमूने ट्रेन, सत्यापन और परीक्षण के बीच विभाजित होते हैं ताकि प्रत्येक स्पीकर के नमूने बिल्कुल एक विभाजन से संबंधित हों।
होमपेज : http://www.voxforge.org/
स्रोत कोड :
tfds.audio.Voxforge
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड आकार :
Unknown size
डेटासेट का आकार :
Unknown size
मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से
download_config.manual_dir
(डिफ़ॉल्ट रूप से~/tensorflow_datasets/downloads/manual/
) में डाउनलोड करना होगा:
VoxForge को ऑडियो आर्काइव के मैन्युअल डाउनलोड की आवश्यकता होती है। आर्काइव की पूरी सूची https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt पर देखी जा सकती है। इसे निम्नलिखित कमांड का उपयोग करके डाउनलोड किया जा सकता है: wget -i voxforge_urls.txt -x ध्यान दें कि डाउनलोड करना और डेटासेट को स्थानीय रूप से बनाने के लिए ~ 100GB डिस्क स्थान की आवश्यकता होती है (लेकिन केवल ~ 60GB का उपयोग स्थायी रूप से किया जाएगा)।ऑटो-कैश्ड ( दस्तावेज़ीकरण ): अज्ञात
विभाजन :
विभाजित करना | उदाहरण |
---|
- फ़ीचर संरचना :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
'speaker_id': string,
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
ऑडियो | ऑडियो | (कोई भी नहीं,) | int64 | |
लेबल | क्लासलेबल | int64 | ||
स्पीकर_आईडी | टेन्सर | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('audio', 'label')
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ): गुम।
उद्धरण :
@article{maclean2018voxforge,
title={Voxforge},
author={MacLean, Ken},
journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
year={2018}
}