wordnet

  • الوصف :

WordNet هي قاعدة بيانات معجمية كبيرة للغة الإنجليزية. يتم تجميع الأسماء والأفعال والصفات والظروف في مجموعات من المرادفات المعرفية (synsets) ، كل منها يعبر عن مفهوم مميز. Synsets مترابطة عن طريق العلاقات المفاهيمية الدلالية والمعجمية.

FeaturesDict({
    'lhs': Text(shape=(), dtype=string),
    'relation': Text(shape=(), dtype=string),
    'rhs': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
lhs نص سلسلة
علاقة نص سلسلة
rhs نص سلسلة

wordnet / WN18 (التكوين الافتراضي)

  • وصف التكوين : تتكون بيانات WORDNET TENSOR DATA هذه من مجموعة من ثلاثة توائم (synset ، نوع العلاقة ، ثلاثة أضعاف) مستخرجة من WordNet 3.0 ( http://wordnet.princeton.edu ). يمكن رؤية مجموعة البيانات هذه على أنها موتر ثلاثي الأوضاع يصور العلاقات الثلاثية بين مجموعات المزامنة. راجع https://everest.hds.utc.fr/doku.php؟id=ar : transe.

  • حجم مجموعة البيانات : 11.07 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 5000
'train' 141،442
'validation' 5000
  • الاقتباس :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}

@incollection{NIPS2013_5071,
title = {Translating Embeddings for Modeling Multi-relational Data},
author = {Bordes, Antoine and Usunier, Nicolas and Garcia-Duran, Alberto and Weston, Jason and Yakhnenko, Oksana},
booktitle = {Advances in Neural Information Processing Systems 26},
editor = {C. J. C. Burges and L. Bottou and M. Welling and Z. Ghahramani and K. Q. Weinberger},
pages = {2787--2795},
year = {2013},
publisher = {Curran Associates, Inc.},
url = {http://papers.nips.cc/paper/5071-translating-embeddings-for-modeling-multi-relational-data.pdf}
}

wordnet / WN18RR

  • وصف التكوين : مماثل لـ WN18 ولكنه يعمل على إصلاح تسرب الاختبار من خلال العلاقات العكسية. راجع https://github.com/TimDettmers/ConvE

  • حجم مجموعة البيانات : 7.02 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 3،134
'train' 86835
'validation' 3،034
  • الاقتباس :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}

@inproceedings{dettmers2018conve,
    Author = {Dettmers, Tim and Pasquale, Minervini and Pontus, Stenetorp and Riedel, Sebastian},
    Booktitle = {Proceedings of the 32th AAAI Conference on Artificial Intelligence},
    Title = {Convolutional 2D Knowledge Graph Embeddings},
    Url = {https://arxiv.org/abs/1707.01476},
    Year = {2018},
        pages  = {1811--1818},
    Month = {February}
}