- विवरण :
वर्डनेट अंग्रेजी का एक बड़ा शाब्दिक डेटाबेस है। संज्ञा, क्रिया, विशेषण और क्रियाविशेषण को संज्ञानात्मक समानार्थक शब्द (synsets) के समूह में बांटा गया है, प्रत्येक एक अलग अवधारणा को व्यक्त करता है। Synsets वैचारिक-शब्दार्थ और शाब्दिक संबंधों के माध्यम से आपस में जुड़े हुए हैं।
होमपेज : https://wordnet.princeton.edu/
स्रोत कोड :
tfds.text.Wordnet
संस्करण :
-
0.1.0
(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड आकार :
3.99 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
फ़ीचर संरचना :
FeaturesDict({
'lhs': Text(shape=(), dtype=string),
'relation': Text(shape=(), dtype=string),
'rhs': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
एलएचएस | मूलपाठ | डोरी | ||
संबंध | मूलपाठ | डोरी | ||
आरएचएस | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
वर्डनेट/WN18 (डिफ़ॉल्ट कॉन्फ़िगरेशन)
विन्यास विवरण : इस वर्डनेट टेन्सर डेटा में वर्डनेट 3.0 ( http://wordnet.princeton.edu ) से निकाले गए ट्रिपलेट्स (सिनसेट, रिलेशन_टाइप, ट्रिपलेट) का संग्रह शामिल है। इस डेटा सेट को एक 3-मोड टेंसर के रूप में देखा जा सकता है जो सिंसेट्स के बीच टर्नरी रिश्तों को दर्शाता है। देखें https://everest.hds.utc.fr/doku.php?id=en :transe।
डेटासेट का आकार :
11.07 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 5,000 |
'train' | 141,442 |
'validation' | 5,000 |
- उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}
@incollection{NIPS2013_5071,
title = {Translating Embeddings for Modeling Multi-relational Data},
author = {Bordes, Antoine and Usunier, Nicolas and Garcia-Duran, Alberto and Weston, Jason and Yakhnenko, Oksana},
booktitle = {Advances in Neural Information Processing Systems 26},
editor = {C. J. C. Burges and L. Bottou and M. Welling and Z. Ghahramani and K. Q. Weinberger},
pages = {2787--2795},
year = {2013},
publisher = {Curran Associates, Inc.},
url = {http://papers.nips.cc/paper/5071-translating-embeddings-for-modeling-multi-relational-data.pdf}
}
वर्डनेट/WN18RR
विन्यास विवरण : WN18 के समान लेकिन व्युत्क्रम संबंधों के माध्यम से परीक्षण रिसाव को ठीक करता है। https://github.com/TimDettmers/ConvE देखें
डेटासेट का आकार :
7.02 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 3,134 |
'train' | 86,835 |
'validation' | 3,034 |
- उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}
@inproceedings{dettmers2018conve,
Author = {Dettmers, Tim and Pasquale, Minervini and Pontus, Stenetorp and Riedel, Sebastian},
Booktitle = {Proceedings of the 32th AAAI Conference on Artificial Intelligence},
Title = {Convolutional 2D Knowledge Graph Embeddings},
Url = {https://arxiv.org/abs/1707.01476},
Year = {2018},
pages = {1811--1818},
Month = {February}
}