- Descriptif :
WordNet est une grande base de données lexicale de l'anglais. Les noms, verbes, adjectifs et adverbes sont regroupés en ensembles de synonymes cognitifs (synsets), chacun exprimant un concept distinct. Les synsets sont interconnectés au moyen de relations conceptuelles-sémantiques et lexicales.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://wordnet.princeton.edu/
Code source :
tfds.text.Wordnet
Versions :
-
0.1.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
3.99 MiB
Mise en cache automatique ( documentation ): Oui
Structure des fonctionnalités :
FeaturesDict({
'lhs': Text(shape=(), dtype=string),
'relation': Text(shape=(), dtype=string),
'rhs': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
gauche | Texte | chaîne de caractères | ||
relation | Texte | chaîne de caractères | ||
droite | Texte | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
wordnet/WN18 (configuration par défaut)
Description de la configuration : Ce WORDNET TENSOR DATA consiste en une collection de triplets (synset, relation_type, triplet) extraits de WordNet 3.0 ( http://wordnet.princeton.edu ). Cet ensemble de données peut être vu comme un tenseur à 3 modes décrivant les relations ternaires entre les synsets. Voir https://everest.hds.utc.fr/doku.php?id=en :transe.
Taille du jeu de données :
11.07 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 5 000 |
'train' | 141 442 |
'validation' | 5 000 |
- Exemples ( tfds.as_dataframe ):
- Citation :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}
@incollection{NIPS2013_5071,
title = {Translating Embeddings for Modeling Multi-relational Data},
author = {Bordes, Antoine and Usunier, Nicolas and Garcia-Duran, Alberto and Weston, Jason and Yakhnenko, Oksana},
booktitle = {Advances in Neural Information Processing Systems 26},
editor = {C. J. C. Burges and L. Bottou and M. Welling and Z. Ghahramani and K. Q. Weinberger},
pages = {2787--2795},
year = {2013},
publisher = {Curran Associates, Inc.},
url = {http://papers.nips.cc/paper/5071-translating-embeddings-for-modeling-multi-relational-data.pdf}
}
wordnet/WN18RR
Description de la configuration : Identique à WN18 mais corrige les fuites de test via des relations inverses. Voir https://github.com/TimDettmers/ConvE
Taille du jeu de données :
7.02 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 3 134 |
'train' | 86 835 |
'validation' | 3 034 |
- Exemples ( tfds.as_dataframe ):
- Citation :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}
@inproceedings{dettmers2018conve,
Author = {Dettmers, Tim and Pasquale, Minervini and Pontus, Stenetorp and Riedel, Sebastian},
Booktitle = {Proceedings of the 32th AAAI Conference on Artificial Intelligence},
Title = {Convolutional 2D Knowledge Graph Embeddings},
Url = {https://arxiv.org/abs/1707.01476},
Year = {2018},
pages = {1811--1818},
Month = {February}
}