- الوصف :
هناك مجموعتان من مجموعات البيانات الفرعية:
(1) RottenTomatoes: زحف نقاد الفيلم والإجماع من http://rottentomatoes.com/ إنه يحتوي على حقول "_movie_name" و "_movie_id" و "_critics" و "_critic_consensus".
(2) IDebate: الوسائط التي تم الزحف إليها من http://idebate.org/ تحتوي على حقول "_debate_name" ، "_debate_id" ، "_claim" ، "_claim_id" ، "_argument_sentences".
راجع أيضًا https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt
الصفحة الرئيسية : https://web.eecs.umich.edu/~wangluxy/data.html
كود المصدر :
tfds.datasets.opinion_abstracts.Builder
إصدارات :
-
1.0.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
20.08 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :
@inproceedings{wang-ling-2016-neural,
title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
author = "Wang, Lu and
Ling, Wang",
booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
month = jun,
year = "2016",
address = "San Diego, California",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/N16-1007",
doi = "10.18653/v1/N16-1007",
pages = "47--57",
}
feedback_abstracts / rotten_tomatoes (التكوين الافتراضي)
وصف التكوين : نقاد محترفون وإجماع 3731 فيلمًا.
حجم مجموعة البيانات :
50.10 MiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 3،731 |
- هيكل الميزة :
FeaturesDict({
'_critic_consensus': string,
'_critics': Sequence({
'key': string,
'value': string,
}),
'_movie_id': string,
'_movie_name': string,
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
_critic_consensus | موتر | خيط | ||
_ النقاد | تسلسل | |||
_critics / مفتاح | موتر | خيط | ||
_critics / القيمة | موتر | خيط | ||
_movie_id | موتر | خيط | ||
_اسم الفيلم | موتر | خيط |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):('_critics', '_critic_consensus')
أمثلة ( tfds.as_dataframe ):
رأي_ملخصات / إيديباتي
وصف التكوين : 2259 مطالبة لـ 676 مناقشة.
حجم مجموعة البيانات :
3.15 MiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 2،259 |
- هيكل الميزة :
FeaturesDict({
'_argument_sentences': Sequence({
'key': string,
'value': string,
}),
'_claim': string,
'_claim_id': string,
'_debate_name': string,
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
_argument_sentences | تسلسل | |||
_argument_sentences / مفتاح | موتر | خيط | ||
_argument_sentences / القيمة | موتر | خيط | ||
_مطالبة | موتر | خيط | ||
_claim_id | موتر | خيط | ||
_debate_name | موتر | خيط |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):('_argument_sentences', '_claim')
أمثلة ( tfds.as_dataframe ):