- Sự miêu tả :
Các vectơ toàn cầu được đào tạo trước để nhúng Biểu diễn từ (GloVe) để tìm kiếm hàng xóm gần nhất gần đúng. Tập dữ liệu này bao gồm hai phần:
- 'database': bao gồm 1.183.514 điểm dữ liệu, mỗi điểm có các tính năng: 'nhúng' (100 float), 'index' (int64), 'neighbors' (danh sách trống).
- “test”: bao gồm 10.000 điểm dữ liệu, mỗi điểm có các tính năng: “nhúng” (100 float), “index” (int64), “neighbors” (danh sách “chỉ mục” và “khoảng cách” của các láng giềng gần nhất trong cơ sở dữ liệu. )
Trang chủ : https://nlp.stanford.edu/projects/glove/
Mã nguồn :
tfds.nearest_neighbors.glove_100_angular.Glove100Angular
Phiên bản :
-
1.0.0
(mặc định): Bản phát hành đầu tiên.
-
Kích thước tải xuống :
462.93 MiB
Kích thước tập dữ liệu :
567.90 MiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'database' | 1.183.514 |
'test' | 10.000 |
- Cấu trúc tính năng :
FeaturesDict({
'embedding': Tensor(shape=(100,), dtype=float32),
'index': Scalar(shape=(), dtype=int64, description=Index within the split.),
'neighbors': Sequence({
'distance': Scalar(shape=(), dtype=float32, description=Neighbor distance.),
'index': Scalar(shape=(), dtype=int64, description=Neighbor index.),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | loại D | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
nhúng | Tenxơ | (100,) | phao32 | |
chỉ mục | vô hướng | int64 | Lập chỉ mục trong phần phân chia. | |
hàng xóm | Sự liên tiếp | Các lân cận được tính toán, chỉ có sẵn cho phần tách thử nghiệm. | ||
hàng xóm/khoảng cách | vô hướng | phao32 | Khoảng cách hàng xóm. | |
hàng xóm/chỉ mục | vô hướng | int64 | Chỉ số hàng xóm. |
Khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- Trích dẫn :
@inproceedings{pennington2014glove,
author = {Jeffrey Pennington and Richard Socher and Christopher D. Manning},
booktitle = {Empirical Methods in Natural Language Processing (EMNLP)},
title = {GloVe: Global Vectors for Word Representation},
year = {2014},
pages = {1532--1543},
url = {http://www.aclweb.org/anthology/D14-1162},
}