voxceleb

বর্ণনা :

স্পিকার সনাক্তকরণের জন্য একটি বড় আকারের ডেটাসেট। মোট 150k নমুনা সহ 1,251 টিরও বেশি স্পিকার থেকে এই ডেটা সংগ্রহ করা হয়েছে। এই রিলিজে voxceleb1.1 ডেটাসেটের অডিও অংশ রয়েছে।

অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন
হোমপেজ : http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html
সোর্স কোড : tfds.audio.Voxceleb
সংস্করণ :
- 1.2.1 (ডিফল্ট): youtube_id ক্ষেত্র যোগ করুন
ডাউনলোড 4.68 MiB
ডেটাসেটের আকার : 107.98 GiB
ম্যানুয়াল ডাউনলোডের নির্দেশাবলী : এই ডেটাসেটের জন্য আপনাকে ডাউনলোড_config.manual_dir-এ ম্যানুয়ালি উৎস ডেটা download_config.manual_dir করতে হবে ( ~/tensorflow_datasets/downloads/manual/ ডিফল্ট):
manual_dir-এ vox_dev_wav.zip ফাইল থাকা উচিত। এই ফাইলটি ডাউনলোড করার জন্য নির্দেশাবলী পাওয়া যায় http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html এই ডেটাসেটের নিবন্ধন প্রয়োজন৷
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :

বিভক্ত	উদাহরণ
`'test'`	7,972
`'train'`	134,000
`'validation'`	৬,৬৭০

বৈশিষ্ট্য গঠন :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=string),
})

বৈশিষ্ট্য ডকুমেন্টেশন :

বৈশিষ্ট্য	ক্লাস	আকৃতি	ডিটাইপ
	ফিচারসডিক্ট
শ্রুতি	শ্রুতি	(কোনটিই নয়,)	int64
লেবেল	ক্লাসলেবেল		int64
youtube_id	পাঠ্য		স্ট্রিং

তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): ('audio', 'label')
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):

উদ্ধৃতি :

@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}

voxceleb সেভ করা পৃষ্ঠা গুছিয়ে রাখতে 'সংগ্রহ' ব্যবহার করুন আপনার পছন্দ অনুযায়ী কন্টেন্ট সেভ করুন ও সঠিক বিভাগে রাখুন।

voxceleb