- বর্ণনা :
WordNet ইংরেজির একটি বড় আভিধানিক ডাটাবেস। বিশেষ্য, ক্রিয়া, বিশেষণ এবং ক্রিয়াবিশেষণগুলি জ্ঞানীয় প্রতিশব্দের (সিনসেট) সেটে বিভক্ত, প্রতিটি একটি স্বতন্ত্র ধারণা প্রকাশ করে। Synsets ধারণাগত-অর্থগত এবং আভিধানিক সম্পর্কের মাধ্যমে আন্তঃসংযুক্ত করা হয়।
হোমপেজ : https://wordnet.princeton.edu/
সোর্স কোড :
tfds.text.Wordnet
সংস্করণ :
-
0.1.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড আকার :
3.99 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বৈশিষ্ট্য গঠন :
FeaturesDict({
'lhs': Text(shape=(), dtype=string),
'relation': Text(shape=(), dtype=string),
'rhs': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
lhs | পাঠ্য | স্ট্রিং | ||
সম্পর্ক | পাঠ্য | স্ট্রিং | ||
rhs | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
wordnet/WN18 (ডিফল্ট কনফিগারেশন)
কনফিগারেশনের বিবরণ : এই WORDNET TENSOR ডেটাতে WordNet 3.0 ( http://wordnet.princeton.edu ) থেকে নেওয়া ট্রিপলেট (synset, relation_type, triplet) এর একটি সংগ্রহ রয়েছে। এই ডেটা সেটটিকে একটি 3-মোড টেনসর হিসাবে দেখা যেতে পারে যা সিনসেটের মধ্যে ত্রিমুখী সম্পর্ক চিত্রিত করে। https://everest.hds.utc.fr/doku.php?id=en :transe দেখুন।
ডেটাসেটের আকার :
11.07 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 5,000 |
'train' | 141,442 |
'validation' | 5,000 |
- উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}
@incollection{NIPS2013_5071,
title = {Translating Embeddings for Modeling Multi-relational Data},
author = {Bordes, Antoine and Usunier, Nicolas and Garcia-Duran, Alberto and Weston, Jason and Yakhnenko, Oksana},
booktitle = {Advances in Neural Information Processing Systems 26},
editor = {C. J. C. Burges and L. Bottou and M. Welling and Z. Ghahramani and K. Q. Weinberger},
pages = {2787--2795},
year = {2013},
publisher = {Curran Associates, Inc.},
url = {http://papers.nips.cc/paper/5071-translating-embeddings-for-modeling-multi-relational-data.pdf}
}
wordnet/WN18RR
কনফিগার বিবরণ : WN18 এর মতোই কিন্তু বিপরীত সম্পর্কের মাধ্যমে পরীক্ষা ফাঁস ঠিক করে। https://github.com/TimDettmers/ConvE দেখুন
ডেটাসেটের আকার :
7.02 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 3,134 |
'train' | ৮৬,৮৩৫ |
'validation' | ৩,০৩৪ |
- উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}
@inproceedings{dettmers2018conve,
Author = {Dettmers, Tim and Pasquale, Minervini and Pontus, Stenetorp and Riedel, Sebastian},
Booktitle = {Proceedings of the 32th AAAI Conference on Artificial Intelligence},
Title = {Convolutional 2D Knowledge Graph Embeddings},
Url = {https://arxiv.org/abs/1707.01476},
Year = {2018},
pages = {1811--1818},
Month = {February}
}