वोक्सफोर्ज

  • विवरण :

VoxForge एक भाषा वर्गीकरण डेटासेट है। इसमें वेबसाइट पर सबमिट की गई उपयोगकर्ता द्वारा सबमिट की गई ऑडियो क्लिप शामिल हैं। इस रिलीज़ में, 6 भाषाओं का डेटा एकत्र किया गया है - अंग्रेजी, स्पेनिश, फ्रेंच, जर्मन, रूसी और इतालवी। चूंकि वेबसाइट लगातार अपडेट की जाती है, और प्रतिलिपि प्रस्तुत करने योग्यता के लिए, इस रिलीज़ में केवल 2020-01-01 से पहले जमा की गई रिकॉर्डिंग शामिल हैं। नमूने ट्रेन, सत्यापन और परीक्षण के बीच विभाजित होते हैं ताकि प्रत्येक स्पीकर के नमूने बिल्कुल एक विभाजन से संबंधित हों।

  • अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें

  • होमपेज : http://www.voxforge.org/

  • स्रोत कोड : tfds.audio.Voxforge

  • संस्करण :

    • 1.0.0 (डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
  • डाउनलोड आकार : Unknown size

  • डेटासेट का आकार : Unknown size

  • मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से download_config.manual_dir (डिफ़ॉल्ट रूप से ~/tensorflow_datasets/downloads/manual/ ) में डाउनलोड करना होगा:
    VoxForge को ऑडियो आर्काइव के मैन्युअल डाउनलोड की आवश्यकता होती है। आर्काइव की पूरी सूची https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt पर देखी जा सकती है। इसे निम्नलिखित कमांड का उपयोग करके डाउनलोड किया जा सकता है: wget -i voxforge_urls.txt -x ध्यान दें कि डाउनलोड करना और डेटासेट को स्थानीय रूप से बनाने के लिए ~ 100GB डिस्क स्थान की आवश्यकता होती है (लेकिन केवल ~ 60GB का उपयोग स्थायी रूप से किया जाएगा)।

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): अज्ञात

  • विभाजन :

विभाजित करना उदाहरण
  • फ़ीचर संरचना :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
ऑडियो ऑडियो (कोई भी नहीं,) int64
लेबल क्लासलेबल int64
स्पीकर_आईडी टेन्सर डोरी
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}