- 설명 :
WordNet은 영어의 대규모 어휘 데이터베이스입니다. 명사, 동사, 형용사 및 부사는 인지 동의어(synsets) 집합으로 그룹화되며 각각 고유한 개념을 표현합니다. Synset은 개념-의미 및 어휘 관계를 통해 상호 연결됩니다.
소스 코드 :
tfds.text.Wordnet
버전 :
-
0.1.0
(기본값): 릴리스 정보가 없습니다.
-
다운로드 크기 :
3.99 MiB
자동 캐시 ( 문서 ): 예
기능 구조 :
FeaturesDict({
'lhs': Text(shape=(), dtype=string),
'relation': Text(shape=(), dtype=string),
'rhs': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
lhs | 텍스트 | 끈 | ||
관계 | 텍스트 | 끈 | ||
rhs | 텍스트 | 끈 |
감독된 키 (
as_supervised
문서 참조):None
그림 ( tfds.show_examples ): 지원되지 않습니다.
wordnet/WN18(기본 구성)
구성 설명 : 이 WORDNET TENSOR DATA는 WordNet 3.0( http://wordnet.princeton.edu )에서 추출한 세 가지(synset, relation_type, triplet) 모음으로 구성됩니다. 이 데이터 세트는 synset 간의 삼항 관계를 나타내는 3-모드 텐서로 볼 수 있습니다. https://everest.hds.utc.fr/doku.php?id=en :transe를 참조하십시오.
데이터 세트 크기 :
11.07 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 5,000 |
'train' | 141,442 |
'validation' | 5,000 |
- 예 ( tfds.as_dataframe ):
- 인용 :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}
@incollection{NIPS2013_5071,
title = {Translating Embeddings for Modeling Multi-relational Data},
author = {Bordes, Antoine and Usunier, Nicolas and Garcia-Duran, Alberto and Weston, Jason and Yakhnenko, Oksana},
booktitle = {Advances in Neural Information Processing Systems 26},
editor = {C. J. C. Burges and L. Bottou and M. Welling and Z. Ghahramani and K. Q. Weinberger},
pages = {2787--2795},
year = {2013},
publisher = {Curran Associates, Inc.},
url = {http://papers.nips.cc/paper/5071-translating-embeddings-for-modeling-multi-relational-data.pdf}
}
워드넷/WN18RR
구성 설명 : WN18과 동일하지만 역관계를 통해 테스트 누설을 수정합니다. https://github.com/TimDettmers/ConvE 참조
데이터 세트 크기 :
7.02 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 3,134 |
'train' | 86,835 |
'validation' | 3,034 |
- 예 ( tfds.as_dataframe ):
- 인용 :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}
@inproceedings{dettmers2018conve,
Author = {Dettmers, Tim and Pasquale, Minervini and Pontus, Stenetorp and Riedel, Sebastian},
Booktitle = {Proceedings of the 32th AAAI Conference on Artificial Intelligence},
Title = {Convolutional 2D Knowledge Graph Embeddings},
Url = {https://arxiv.org/abs/1707.01476},
Year = {2018},
pages = {1811--1818},
Month = {February}
}