- Descrição :
Embeddings de vetores globais pré-treinados para representação de palavras (GloVe) para pesquisa aproximada do vizinho mais próximo. Este conjunto de dados consiste em duas divisões:
- 'banco de dados': consiste em 1.183.514 pontos de dados, cada um com recursos: 'embedding' (100 floats), 'index' (int64), 'neighbors' (lista vazia).
- 'test': consiste em 10.000 pontos de dados, cada um possui recursos: 'embedding' (100 floats), 'index' (int64), 'neighbors' (lista de 'index' e 'distance' dos vizinhos mais próximos no banco de dados. )
Página inicial : https://nlp.stanford.edu/projects/glove/
Código -fonte:
tfds.nearest_neighbors.glove_100_angular.Glove100Angular
Versões :
-
1.0.0
(padrão): versão inicial.
-
Tamanho do download :
462.93 MiB
Tamanho do conjunto de dados :
567.90 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'database' | 1.183.514 |
'test' | 10.000 |
- Estrutura de recursos :
FeaturesDict({
'embedding': Tensor(shape=(100,), dtype=float32),
'index': Scalar(shape=(), dtype=int64),
'neighbors': Sequence({
'distance': Scalar(shape=(), dtype=float32),
'index': Scalar(shape=(), dtype=int64),
}),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
incorporação | tensor | (100,) | float32 | |
índice | Escalar | int64 | Índice dentro da divisão. | |
vizinhos | Seqüência | Os vizinhos calculados, que estão disponíveis apenas para a divisão de teste. | ||
vizinhos/distância | Escalar | float32 | Distância do vizinho. | |
vizinhos/índice | Escalar | int64 | Índice vizinho. |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ): Não compatível.
Exemplos ( tfds.as_dataframe ):
- Citação :
@inproceedings{pennington2014glove,
author = {Jeffrey Pennington and Richard Socher and Christopher D. Manning},
booktitle = {Empirical Methods in Natural Language Processing (EMNLP)},
title = {GloVe: Global Vectors for Word Representation},
year = {2014},
pages = {1532--1543},
url = {http://www.aclweb.org/anthology/D14-1162},
}