- คำอธิบาย :
มีสองชุดข้อมูลย่อย:
(1) RottenTomatoes: นักวิจารณ์ภาพยนตร์และฉันทามติรวบรวมข้อมูลจาก http://rottentomatoes.com/ โดยมีฟิลด์ "_movie_name", "_movie_id", "_critics" และ "_critic_consensus"
(2) IDebate: อาร์กิวเมนต์ที่รวบรวมข้อมูลจาก http://idebate.org/ มีฟิลด์ "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences"
ดูเพิ่มเติมที่ https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt
รหัสแหล่งที่มา :
tfds.datasets.opinion_abstracts.Builder
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
ขนาดการดาวน์โหลด :
20.08 MiB
แคชอัตโนมัติ ( เอกสาร ): ใช่
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
การอ้างอิง :
@inproceedings{wang-ling-2016-neural,
title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
author = "Wang, Lu and
Ling, Wang",
booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
month = jun,
year = "2016",
address = "San Diego, California",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/N16-1007",
doi = "10.18653/v1/N16-1007",
pages = "47--57",
}
comment_abstracts/rotten_tomatoes (การกำหนดค่าเริ่มต้น)
คำอธิบายการกำหนดค่า : นักวิจารณ์มืออาชีพและความเห็นพ้องต้องกันของภาพยนตร์ 3,731 เรื่อง
ขนาดชุดข้อมูล :
50.10 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 3,731 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'_critic_consensus': string,
'_critics': Sequence({
'key': string,
'value': string,
}),
'_movie_id': string,
'_movie_name': string,
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
_วิจารณ์_ฉันทามติ | เทนเซอร์ | สตริง | ||
_นักวิจารณ์ | ลำดับ | |||
_วิจารณ์/คีย์ | เทนเซอร์ | สตริง | ||
_วิจารณ์/ค่า | เทนเซอร์ | สตริง | ||
_movie_id | เทนเซอร์ | สตริง | ||
_movie_name | เทนเซอร์ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('_critics', '_critic_consensus')
ตัวอย่าง ( tfds.as_dataframe ):
ความคิดเห็น_นามธรรม/แนวคิด
คำอธิบายการกำหนดค่า : 2,259 การอ้างสิทธิ์สำหรับการโต้วาที 676 ครั้ง
ขนาดชุดข้อมูล :
3.15 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 2,259 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'_argument_sentences': Sequence({
'key': string,
'value': string,
}),
'_claim': string,
'_claim_id': string,
'_debate_name': string,
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
_argument_sentences | ลำดับ | |||
_argument_sentences/คีย์ | เทนเซอร์ | สตริง | ||
_argument_sentences/ค่า | เทนเซอร์ | สตริง | ||
_เรียกร้อง | เทนเซอร์ | สตริง | ||
_claim_id | เทนเซอร์ | สตริง | ||
_debate_name | เทนเซอร์ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('_argument_sentences', '_claim')
ตัวอย่าง ( tfds.as_dataframe ):