- 説明:
近似最近傍検索のための事前トレーニング済みの Global Vectors for Word Representation (GloVe) 埋め込み。このデータセットは 2 つの分割で構成されています。
- 「データベース」: 1,183,514 個のデータ ポイントで構成され、それぞれに「埋め込み」(100 浮動小数点)、「インデックス」(int64)、「近傍」(空のリスト) の機能があります。
- 'test': 10,000 個のデータ ポイントで構成され、それぞれに次の機能があります: 'embedding' (100 float)、'index' (int64)、'neighbors' (データベース内の最近傍の 'index' と ' distance' のリスト)。 )
ソースコード:
tfds.nearest_neighbors.glove_100_angular.Glove100Angular
バージョン:
-
1.0.0
(デフォルト): 初期リリース。
-
ダウンロードサイズ:
462.93 MiB
データセットのサイズ:
567.90 MiB
自動キャッシュ(ドキュメント): いいえ
分割:
スプリット | 例 |
---|---|
'database' | 1,183,514 |
'test' | 10,000 |
- 機能の構造:
FeaturesDict({
'embedding': Tensor(shape=(100,), dtype=float32),
'index': Scalar(shape=(), dtype=int64, description=Index within the split.),
'neighbors': Sequence({
'distance': Scalar(shape=(), dtype=float32, description=Neighbor distance.),
'index': Scalar(shape=(), dtype=int64, description=Neighbor index.),
}),
})
- 機能ドキュメント:
特徴 | クラス | 形 | Dタイプ | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
埋め込み | テンソル | (100,) | float32 | |
索引 | スカラー | int64 | スプリット内のインデックス。 | |
隣人 | 順序 | 計算された近傍。テスト分割でのみ使用できます。 | ||
隣人/距離 | スカラー | float32 | 隣人の距離。 | |
近隣/インデックス | スカラー | int64 | 近隣インデックス。 |
監視キー(
as_supervised
docを参照):None
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用:
@inproceedings{pennington2014glove,
author = {Jeffrey Pennington and Richard Socher and Christopher D. Manning},
booktitle = {Empirical Methods in Natural Language Processing (EMNLP)},
title = {GloVe: Global Vectors for Word Representation},
year = {2014},
pages = {1532--1543},
url = {http://www.aclweb.org/anthology/D14-1162},
}