- বর্ণনা :
দুটি উপ ডেটাসেট আছে:
(1) RottenTomatoes: http://rottentomatoes.com/ থেকে মুভি সমালোচক এবং ঐক্যমত্য ক্রল করা হয়েছে এতে "_movie_name", "_movie_id", "_critics" এবং "_critic_consensus" এর ক্ষেত্র রয়েছে।
(2) IDebate: আর্গুমেন্টগুলি http://idebate.org/ থেকে ক্রল করা হয়েছে এতে "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences" এর ক্ষেত্র রয়েছে।
এছাড়াও https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt দেখুন
উত্স কোড :
tfds.datasets.opinion_abstracts.Builder
সংস্করণ :
-
1.0.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড সাইজ :
20.08 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@inproceedings{wang-ling-2016-neural,
title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
author = "Wang, Lu and
Ling, Wang",
booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
month = jun,
year = "2016",
address = "San Diego, California",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/N16-1007",
doi = "10.18653/v1/N16-1007",
pages = "47--57",
}
মতামত_বিমূর্ত/পচা_টমেটো (ডিফল্ট কনফিগারেশন)
কনফিগারেশনের বিবরণ : পেশাদার সমালোচক এবং 3,731টি চলচ্চিত্রের ঐক্যমত্য।
ডেটাসেটের আকার :
50.10 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 3,731 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'_critic_consensus': string,
'_critics': Sequence({
'key': string,
'value': string,
}),
'_movie_id': string,
'_movie_name': string,
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
_সমালোচক_সম্মত | টেনসর | স্ট্রিং | ||
_সমালোচক | ক্রম | |||
_সমালোচক/কী | টেনসর | স্ট্রিং | ||
_সমালোচক/মান | টেনসর | স্ট্রিং | ||
_movie_id | টেনসর | স্ট্রিং | ||
_মুভির_নাম | টেনসর | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন_তত্ত্বাবধানকৃত ডক
as_supervised
):('_critics', '_critic_consensus')
উদাহরণ ( tfds.as_dataframe ):
মতামত_বিমূর্ত/বিতর্ক
কনফিগারেশনের বিবরণ : 676টি বিতর্কের জন্য 2,259টি দাবি।
ডেটাসেটের আকার :
3.15 MiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 2,259 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'_argument_sentences': Sequence({
'key': string,
'value': string,
}),
'_claim': string,
'_claim_id': string,
'_debate_name': string,
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
_যুক্তি_বাক্য | ক্রম | |||
_আর্গুমেন্ট_বাক্য/কী | টেনসর | স্ট্রিং | ||
_আর্গুমেন্ট_বাক্য/মান | টেনসর | স্ট্রিং | ||
_দাবি | টেনসর | স্ট্রিং | ||
_claim_id | টেনসর | স্ট্রিং | ||
_বিতর্ক_নাম | টেনসর | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন_তত্ত্বাবধানকৃত ডক
as_supervised
):('_argument_sentences', '_claim')
উদাহরণ ( tfds.as_dataframe ):