- বর্ণনা :
কোসাইন দূরত্ব ব্যবহার করে আনুমানিক নিকটতম প্রতিবেশী অনুসন্ধানের জন্য প্রাক-প্রশিক্ষিত এম্বেডিং। এই ডেটাসেট দুটি বিভাজন নিয়ে গঠিত:
- 'ডাটাবেস': 9,990,000 ডেটা পয়েন্ট নিয়ে গঠিত, প্রতিটিতে বৈশিষ্ট্য রয়েছে: 'এম্বেডিং' (96 ফ্লোটস), 'সূচক' (int64), 'প্রতিবেশী' (খালি তালিকা)।
- 'পরীক্ষা': 10,000 ডেটা পয়েন্ট নিয়ে গঠিত, প্রতিটিতে বৈশিষ্ট্য রয়েছে: 'এম্বেডিং' (96 ফ্লোট), 'সূচী' (int64), 'প্রতিবেশী' ('সূচক' তালিকা এবং ডাটাবেসের নিকটতম প্রতিবেশীদের 'দূরত্ব'। )
উত্স কোড :
tfds.nearest_neighbors.deep1b.Deep1b
সংস্করণ :
-
1.0.0
(ডিফল্ট): প্রাথমিক প্রকাশ।
-
ডাউনলোডের আকার :
3.58 GiB
ডেটাসেটের আকার :
4.46 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'database' | 9,990,000 |
'test' | 10,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'embedding': Tensor(shape=(96,), dtype=float32),
'index': Scalar(shape=(), dtype=int64, description=Index within the split.),
'neighbors': Sequence({
'distance': Scalar(shape=(), dtype=float32, description=Neighbor distance.),
'index': Scalar(shape=(), dtype=int64, description=Neighbor index.),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
এমবেডিং | টেনসর | (96,) | float32 | |
সূচক | স্কেলার | int64 | বিভাজনের মধ্যে সূচক। | |
প্রতিবেশী | সিকোয়েন্স | গণনা করা প্রতিবেশী, যা শুধুমাত্র পরীক্ষা বিভাজনের জন্য উপলব্ধ। | ||
প্রতিবেশী/দূরত্ব | স্কেলার | float32 | প্রতিবেশীর দূরত্ব। | |
প্রতিবেশী/সূচক | স্কেলার | int64 | প্রতিবেশী সূচক। |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@inproceedings{babenko2016efficient,
title={Efficient indexing of billion-scale datasets of deep descriptors},
author={Babenko, Artem and Lempitsky, Victor},
booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
pages={2055--2063},
year={2016}
}