- opis :
Wstępnie wytrenowane osadzenie do przybliżonego wyszukiwania najbliższego sąsiada przy użyciu odległości cosinusowej. Ten zestaw danych składa się z dwóch podziałów:
- „baza danych”: składa się z 9 990 000 punktów danych, z których każdy ma cechy: „osadzanie” (96 elementów zmiennoprzecinkowych), „indeks” (int64), „sąsiedzi” (pusta lista).
- „test”: składa się z 10 000 punktów danych, z których każdy ma cechy: „osadzanie” (96 pływaków), „indeks” (int64), „sąsiedzi” (lista „indeksu” i „odległości” najbliższych sąsiadów w bazie danych. )
Strona główna : http://sites.skoltech.ru/compvision/noimi/
Kod źródłowy :
tfds.nearest_neighbors.deep1b.Deep1b
Wersje :
-
1.0.0
(domyślnie): Wersja początkowa.
-
Rozmiar pliku do pobrania :
3.58 GiB
Rozmiar zestawu danych :
4.46 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'database' | 9 990 000 |
'test' | 10 000 |
- Struktura funkcji :
FeaturesDict({
'embedding': Tensor(shape=(96,), dtype=float32),
'index': Scalar(shape=(), dtype=int64),
'neighbors': Sequence({
'distance': Scalar(shape=(), dtype=float32),
'index': Scalar(shape=(), dtype=int64),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
osadzanie | Napinacz | (96,) | pływak32 | |
indeks | Skalarny | int64 | Indeks w podziale. | |
sąsiedzi | Sekwencja | Obliczeni sąsiedzi, który jest dostępny tylko dla podziału testu. | ||
sąsiedzi/odległość | Skalarny | pływak32 | Odległość sąsiedzka. | |
sąsiedzi/indeks | Skalarny | int64 | Indeks sąsiada. |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@inproceedings{babenko2016efficient,
title={Efficient indexing of billion-scale datasets of deep descriptors},
author={Babenko, Artem and Lempitsky, Victor},
booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
pages={2055--2063},
year={2016}
}