মতামত_বিমূর্ত

বর্ণনা :

দুটি উপ ডেটাসেট আছে:

(1) RottenTomatoes: http://rottentomatoes.com/ থেকে মুভি সমালোচক এবং ঐক্যমত্য ক্রল করা হয়েছে এতে "_movie_name", "_movie_id", "_critics" এবং "_critic_consensus" এর ক্ষেত্র রয়েছে।

(2) IDebate: আর্গুমেন্টগুলি http://idebate.org/ থেকে ক্রল করা হয়েছে এতে "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences" এর ক্ষেত্র রয়েছে।

এছাড়াও https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt দেখুন

হোমপেজ : https://web.eecs.umich.edu/~wangluxy/data.html
উত্স কোড : tfds.datasets.opinion_abstracts.Builder
সংস্করণ :
- 1.0.0 (ডিফল্ট): কোনো রিলিজ নোট নেই।
ডাউনলোড সাইজ : 20.08 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :

@inproceedings{wang-ling-2016-neural,
    title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
    author = "Wang, Lu  and
      Ling, Wang",
    booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
    month = jun,
    year = "2016",
    address = "San Diego, California",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/N16-1007",
    doi = "10.18653/v1/N16-1007",
    pages = "47--57",
}

মতামত_বিমূর্ত/পচা_টমেটো (ডিফল্ট কনফিগারেশন)

কনফিগারেশনের বিবরণ : পেশাদার সমালোচক এবং 3,731টি চলচ্চিত্রের ঐক্যমত্য।
ডেটাসেটের আকার : 50.10 MiB
বিভাজন :

বিভক্ত	উদাহরণ
`'train'`	3,731

বৈশিষ্ট্য গঠন :

FeaturesDict({
    '_critic_consensus': string,
    '_critics': Sequence({
        'key': string,
        'value': string,
    }),
    '_movie_id': string,
    '_movie_name': string,
})

বৈশিষ্ট্য ডকুমেন্টেশন :

বৈশিষ্ট্য	ক্লাস	ডিটাইপ
	ফিচারসডিক্ট
_সমালোচক_সম্মত	টেনসর	স্ট্রিং
_সমালোচক	ক্রম
_সমালোচক/কী	টেনসর	স্ট্রিং
_সমালোচক/মান	টেনসর	স্ট্রিং
_movie_id	টেনসর	স্ট্রিং
_মুভির_নাম	টেনসর	স্ট্রিং

তত্ত্বাবধান করা কী (দেখুন_তত্ত্বাবধানকৃত ডক as_supervised ): ('_critics', '_critic_consensus')
উদাহরণ ( tfds.as_dataframe ):

মতামত_বিমূর্ত/বিতর্ক

কনফিগারেশনের বিবরণ : 676টি বিতর্কের জন্য 2,259টি দাবি।
ডেটাসেটের আকার : 3.15 MiB
বিভাজন :

বিভক্ত	উদাহরণ
`'train'`	2,259

বৈশিষ্ট্য গঠন :

FeaturesDict({
    '_argument_sentences': Sequence({
        'key': string,
        'value': string,
    }),
    '_claim': string,
    '_claim_id': string,
    '_debate_name': string,
})

বৈশিষ্ট্য ডকুমেন্টেশন :

বৈশিষ্ট্য	ক্লাস	ডিটাইপ
	ফিচারসডিক্ট
_যুক্তি_বাক্য	ক্রম
_আর্গুমেন্ট_বাক্য/কী	টেনসর	স্ট্রিং
_আর্গুমেন্ট_বাক্য/মান	টেনসর	স্ট্রিং
_দাবি	টেনসর	স্ট্রিং
_claim_id	টেনসর	স্ট্রিং
_বিতর্ক_নাম	টেনসর	স্ট্রিং

তত্ত্বাবধান করা কী (দেখুন_তত্ত্বাবধানকৃত ডক as_supervised ): ('_argument_sentences', '_claim')
উদাহরণ ( tfds.as_dataframe ):