- وصف :
عمليات التضمين المدربة مسبقًا للبحث التقريبي عن أقرب جار باستخدام مسافة جيب التمام. تتكون مجموعة البيانات هذه من قسمين:
- "قاعدة البيانات": تتكون من 9,990,000 نقطة بيانات، لكل منها ميزات: "التضمين" (96 عائمًا)، و"الفهرس" (int64)، و"الجيران" (قائمة فارغة).
- "الاختبار": يتكون من 10000 نقطة بيانات، لكل منها ميزات: "التضمين" (96 عائمًا)، و"الفهرس" (int64)، و"الجيران" (قائمة "الفهرس" و"المسافة" لأقرب الجيران في قاعدة البيانات. )
الصفحة الرئيسية : http://sites.skoltech.ru/compvision/noimi/
كود المصدر :
tfds.nearest_neighbors.deep1b.Deep1b
الإصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
حجم التحميل :
3.58 GiB
حجم مجموعة البيانات :
4.46 GiB
التخزين المؤقت التلقائي ( الوثائق ): لا
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'database' | 9,990,000 |
'test' | 10.000 |
- هيكل الميزة :
FeaturesDict({
'embedding': Tensor(shape=(96,), dtype=float32),
'index': Scalar(shape=(), dtype=int64, description=Index within the split.),
'neighbors': Sequence({
'distance': Scalar(shape=(), dtype=float32, description=Neighbor distance.),
'index': Scalar(shape=(), dtype=int64, description=Neighbor index.),
}),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع D | وصف |
---|---|---|---|---|
المميزاتDict | ||||
التضمين | الموتر | (96،) | float32 | |
فِهرِس | العددية | int64 | مؤشر داخل الانقسام. | |
الجيران | تسلسل | الجيران المحسوبون، وهو متاح فقط لتقسيم الاختبار. | ||
الجيران / المسافة | العددية | float32 | مسافة الجيران. | |
الجيران/فهرس | العددية | int64 | مؤشر الجيران. |
المفاتيح الخاضعة للإشراف (راجع
as_supervised
doc ):None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@inproceedings{babenko2016efficient,
title={Efficient indexing of billion-scale datasets of deep descriptors},
author={Babenko, Artem and Lempitsky, Victor},
booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
pages={2055--2063},
year={2016}
}