tamizar1m

Descripción :

Incrustaciones previamente entrenadas para una búsqueda aproximada del vecino más cercano utilizando la distancia euclidiana. Este conjunto de datos consta de dos divisiones:

'base de datos': consta de 1.000.000 de puntos de datos, cada uno tiene características: 'incrustación' (128 flotantes), 'índice' (int64), 'vecinos' (lista vacía).
'prueba': consta de 10,000 puntos de datos, cada uno tiene características: 'incrustación' (128 flotantes), 'índice' (int64), 'vecinos' (lista de 'índice' y 'distancia' de los vecinos más cercanos en la base de datos. )

Página de inicio : http://corpus-texmex.irisa.fr/
Código fuente : tfds.datasets.sift1m.Builder
Versiones :
- 1.0.0 (predeterminado): versión inicial.
Tamaño de descarga : 500.80 MiB
Tamaño del conjunto de datos : 589.49 MiB
Almacenamiento en caché automático ( documentación ): No
Divisiones :

Dividir	Ejemplos
`'database'`	1.000.000
`'test'`	10.000

Estructura de características :

FeaturesDict({
    'embedding': Tensor(shape=(128,), dtype=float32),
    'index': Scalar(shape=(), dtype=int64, description=Index within the split.),
    'neighbors': Sequence({
        'distance': Scalar(shape=(), dtype=float32, description=Neighbor distance.),
        'index': Scalar(shape=(), dtype=int64, description=Neighbor index.),
    }),
})

Documentación de funciones :

Característica	Clase	Forma	tipo D	Descripción
	FuncionesDict
incrustar	Tensor	(128,)	flotador32
índice	Escalar		int64	Índice dentro de la división.
vecinos	Secuencia			Los vecinos calculados, que solo están disponibles para la división de prueba.
vecinos/distancia	Escalar		flotador32	Distancia del vecino.
vecinos/índice	Escalar		int64	Índice de vecinos.

Claves supervisadas (ver documento as_supervised ): None
Figura ( tfds.show_examples ): No compatible.
Ejemplos ( tfds.as_dataframe ):

Cita :

@article{jegou2010product,
  title={Product quantization for nearest neighbor search},
  author={Jegou, Herve and Douze, Matthijs and Schmid, Cordelia},
  journal={IEEE transactions on pattern analysis and machine intelligence},
  volume={33},
  number={1},
  pages={117--128},
  year={2010},
  publisher={IEEE}
}

tamizar1m Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

tamizar1m